双引擎驱动的多模态数据检索方法、设备及系统技术方案

技术编号：35920943 阅读：19 留言：0更新日期：2022-12-10 11:05

本发明专利技术公开了一种双引擎驱动的多模态数据检索方法、设备及系统，属于多模态数据综合检索领域，包括步骤：S1，以多模态数据为输入，判断多模态数据的语义标签，构建语义标签库；构建统一特征空间，提取不同模态数据在同一特征空间下的特征向量，构建特征向量库；S2，以多模态检索条件为输入，通过多模态数据智能处理方法分别得到检索条件的语义标签和特征向量，基于语义标签库和特征向量库，利用跨模态语义标签检索引擎和跨模态特征向量检索引擎在多模态数据库中完成符合检索条件的多模态数据的查询，经过排序后推送搜索结果。本发明专利技术支持一种模态数据输入检索出包含结果的所有模态数据，能够有效实现不同类型数据中查询结果的全面精准召回。全面精准召回。全面精准召回。

全部详细技术资料下载

【技术实现步骤摘要】
双引擎驱动的多模态数据检索方法、设备及系统

[0001]本专利技术涉及多模态数据综合检索
，更为具体的，涉及一种双引擎驱动的多模态数据检索方法、设备及系统。

技术介绍

[0002]随着互联网上数据规模的不断壮大，数据类型越来越呈现多样化的特点，用户感兴趣的数据模态不再单一，用户的检索需求也越来越呈现出从单一模态到跨模态的发展态势。模态是指数据的表达形式，包括文本、图像、视频和音频等。近年来，用户通常希望以适合自己的方式来获得需求的数据。传统的单模态检索无法解决二者的兼容问题，因为它们只能以相同的方式返回原始数据进行查询，不能满足检索需求。多模态检索可以利用各类数据查询不同形式的信息，执行多模态检索的关键问题是需要考虑到不同形式的数据之间的语义相似性。
[0003]多模态检索是建立不同模态的网络结构，以实现不同模态数据之间的检索，查询和检索结果的模态不一定相同，例如通过图像检索文本、通过音频检索视频等等。与传统的多模态检索不同，现有关于多模态检索的研究关键是将不同模态的数据映射到公共空间并在两者之间建立关系模型。多模态检索研究面临的主要问题是如何填补不同模态数据之间的“语义鸿沟”，以建立多模态数据的通用表示。
[0004]目前，多模态检索大体上分为两种方法，一种是语义标签检索，通过识别文本、图像、视频、音频等不同模态数据，给出文本语义标签并通过哈希编码进行存储，通过对查询条件解析，得到查询条件中的隐含标签信息到库中进行标签查询，进而得到不同模态的检索结果；另一种是特征向量检索，通过将文本、图像、视...

【技术保护点】

【技术特征摘要】
1.一种双引擎驱动的多模态数据检索方法，其特征在于，包括如下步骤：S1，多模态数据智能处理：多模态智能识别，以多模态数据为输入，通过智能识别方法判断多模态数据的语义标签，并通过倒排索引方法构建语义标签库；多模态特征提取，构建统一特征空间，提取不同模态数据在同一特征空间下的特征向量，并构建特征向量库；S2，双引擎跨模态检索：以多模态检索条件为输入，通过多模态数据智能处理方法分别得到检索条件的语义标签和特征向量，基于语义标签库和特征向量库，利用跨模态语义标签检索引擎和跨模态特征向量检索引擎在多模态数据库中完成符合检索条件的多模态数据的查询，经过排序后推送搜索结果。2.根据权利要求1所述的双引擎驱动的多模态数据检索方法，其特征在于，所述跨模态语义标签检索引擎，包括倒排索引构建步骤和语义标签式查询步骤；倒排索引构建通过标签词典构建、倒排列表构建方法形成倒排索引表；语义标签式查询以倒排索引表为基础，结合步骤S1中多模态数据智能处理获得查询条件的语义标签，通过标签哈希编码和标签比对，完成与查询条件相符合的多模态数据搜索。3.根据权利要求1所述的双引擎驱动的多模态数据检索方法，其特征在于，所述跨模态特征向量检索引擎，包括分层可导航图构建步骤和特征向量式查询步骤；分层可导航图构建通过近邻节点数设置、底层近邻图构建、节点层次计算、顶层近邻图构建方法，形成分层导航图，为快速的特征向量检索提供基础；特征向量式查询以分层可导航图为基础，结合步骤S1中多模态数据...

【专利技术属性】
技术研发人员：潘磊，廖泓舟，崔莹，代翔，戴礼灿，
申请(专利权)人：中国电子科技集团公司第十研究所，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人