广西旅游图文检索

多源异构海量旅游信息聚合与智能图文检索服务平台系统建设方案

多源异构海量旅游信息聚合与智能图文检索服务平台系统是一个以实现广西海量旅游信息聚合及旅游信息的智能图文检索服务的平台系统,满足旅游管理部门、景区、旅游公司、游客等对广西海量旅游信息的智能图文检索需求,系统的部署能很好的解决旅游信息多源、异构、分散的问题,提升广西旅游信息化服务水平,系统通过多源分布式并行网络爬虫技术获取初始多源异构的旅游数据集,构建面向主题的多维旅游信息聚合库,利用Elasticsearch搜索引擎,实现文本的信息的快速检索,通过图片特征向量相似性,利用Faiss亿级向量检索匹配得出与待检索图片最相似的图片,实现多标签图像检,基于栈式双模态自编码器和融合多种神经网络的跨模态图文检索模型,使得不同模式的数据之间能够进行相似度的比较和匹配,实现智能图文协同检索。

目前,基于该项目研发构建的多源异构海量旅游信息聚合与智能图文检索服务平台已经应用在资源县智慧旅游信息服务项目上,并产生了一定的经济效益。课题成果将逐步达到产业化目标,能够有效提升桂林乃至广西旅游的智能信息化水平。

系统功能设计

主要功能有:

(1) 分布式并行网络爬虫采集广西旅游基础信息。

(2) 构建多源异构海量旅游文本和图像信息的多维旅游信息聚合库。

(3) PB级文本信息的快速检索服务。

(4) 图像及关联文本的准确匹配与智能图文检索服务。

(5) 多标签图像检索服务。


项目预览广西旅游图文检索