一种基于局部关联图的跨媒体相似性度量方法和检索方法技术

技术编号：13370757 阅读：223 留言：0更新日期：2016-07-19 18:47

本发明专利技术涉及一种基于局部关联图的跨媒体相似性度量方法和检索方法，包括以下步骤：建立包含多种媒体类型的跨媒体数据集，对其中所有数据进行分块处理，在得到局部分块的同时保留整体数据；对跨媒体数据集中每种媒体类型的整体数据和局部分块，都提取其特征向量；通过训练集中的整体数据，利用跨媒体统一特征表示方法为不同媒体类型学习得到统一特征映射矩阵，将不同媒体类型的整体数据与局部分块都映射到统一空间；在统一空间中构造局部关联图，计算媒体数据间的相似性。本发明专利技术在度量跨媒体数据的相似性时，既使用局部信息来挖掘细粒度的跨媒体关联，又利用整体信息有效屏蔽局部信息带来的噪声，从而优化了跨媒体相似性度量的全面性和准确性。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及多媒体检索领域，具体涉及一种基于局部关联图的跨媒体相似性度量方法和跨媒体检索方法。
技术介绍
随着多媒体技术和互联网技术的飞速发展，网络上的图像、文本、视频、音频等多媒体数据快速增长，多媒体的相关应用也越来越多，用户需要更加灵活有效的信息检索技术。传统的信息检索技术主要是基于文本的检索，即对数据进行人工标注，通过对用户输入文本进行匹配来返回检索结果。这种检索方式耗时耗力，无法应对大规模的多媒体数据。因此，许多学者提出了基于内容的多媒体检索，根据内容的相似性返回相关的检索结果。然而，该方法无法满足用户的跨媒体检索需求，比如对于图像查询，只能返回相关的图像，而无法得到文本、视频等其它媒体的数据，缺少灵活性。跨媒体检索可以描述为：使用任意一种媒体作为查询，得到另外一种(或多种)媒体的相关结果。如输入为一段音频，不仅能够返回音频，也可以根据用户需求返回图像、文本等其它媒体结果，这就大大提高了信息检索的灵活性。实现有效的跨媒体检索系统，不仅能够满足用户日益增长的检索需求，对于互联网多媒体数据的管理、标注与统计等工作也有重要帮助。跨媒体检索的主要问题是如何度量不同媒体之间的相似性。目前一种主要的跨媒体检索方法是基于统一特征表示的跨媒体检索，即通过变换把不同媒体的数据从各自的特征空间中映射到一个统一特征空间，从而进行直接的相似性度量。典型相关分析(CanonicalCorrelationAnalysis，...

【技术保护点】
一种基于局部关联图的跨媒体相似性度量方法，包括以下步骤：(1)建立包含多种媒体类型的跨媒体数据集，对跨媒体数据集中的所有数据进行分块处理，在得到局部分块的同时保留其整体数据；(2)对跨媒体数据集中每种媒体类型的整体数据和局部分块，都提取其特征向量；(3)通过整体数据，利用跨媒体统一特征表示方法为不同媒体类型学习得到统一特征映射矩阵；(4)根据统一特征映射矩阵，将不同媒体类型的整体数据与局部分块都映射到统一空间，在统一空间中构造局部关联图，根据该局部关联图计算媒体数据间的相似性。

【技术特征摘要】
1.一种基于局部关联图的跨媒体相似性度量方法，包括以下步骤：
(1)建立包含多种媒体类型的跨媒体数据集，对跨媒体数据集中的所有数据进行分块处
理，在得到局部分块的同时保留其整体数据；
(2)对跨媒体数据集中每种媒体类型的整体数据和局部分块，都提取其特征向量；
(3)通过整体数据，利用跨媒体统一特征表示方法为不同媒体类型学习得到统一特征映
射矩阵；
(4)根据统一特征映射矩阵，将不同媒体类型的整体数据与局部分块都映射到统一空间，
在统一空间中构造局部关联图，根据该局部关联图计算媒体数据间的相似性。
2.如权利要求1所述的方法，其特征在于，步骤(1)所述的多种媒体类型包括三种媒体类
型：图像、文本和音频。
3.如权利要求1所述的方法，其特征在于，步骤(1)中的分块处理的方法为：图像使用3×3
网格进行固定分块；文本将标点符号作为分隔符，每两个标点符号之间的部分作为一个
局部分块；音频按照固定的时间长度进行分割。
4.如权利要求1所述的方法，其特征在于，步骤(2)中的特征向量具体为：文本数据是提
取隐狄雷克雷分布特征向量；图像数据是提取词袋特征向量；音频数据是提取其梅尔频
率倒谱系数特征向量...

【专利技术属性】
技术研发人员：彭宇新，黄鑫，
申请(专利权)人：北京大学，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人