基于线性泛化回归模型的跨媒体检索方法技术

技术编号：7809463 阅读：238 留言：0更新日期：2012-09-27 08:34

本发明专利技术公开了一种基于线性泛化回归模型的跨媒体检索方法。该方法首先提取不同模态对象的语义特征，再利用线性泛化回归模型建立各个模态特征之间的回归关系，实现不同模态特征的相互转换，接着利用多类Logistic回归算法估计转换后模态对象的后验概率分布，最后利用距离度量的方法来计算测试样本和数据库样本之间的距离，从而输出检索得到的最相似的前N个数据库中的样本。本发明专利技术在跨越不同模态的语义鸿沟时，可以最大限度地防止不同模态媒体在转换时有效信息的泄露，从而保证不同模态信息传递的有效性，进一步提高跨媒体搜索的鲁棒性和准确性，具有良好的运用前景和可观的市场价值。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及模式识别领域，特别涉及一种基于线性泛化回归模型的跨媒体检索方法。
技术介绍
人类如今生活在信息大爆炸时代，人类可以通过互联网搜索引擎如谷歌(http://WWW. google, com)、百度(http://www. baidu. com)等搜寻自己想要的文章、图片、音乐和电影等。然而，目前互联网用户主要还是通过关键字搜索得到所需要的信息，这个限制主要是归结于搜索引擎无法理解异构模态媒体之间的相互关系，从而限制了搜索引擎的发展。众所周知，互联网搜索引擎具有巨大的市场价值，如何增强搜索引擎的性能，以吸引更多的用户和客户，将是下一代搜索引擎发展的关键和生存之道。跨媒体搜索引擎研究得到了国际学术界的重视，我国近年来也开始重点关注该项技术的发展，设立973计划和国家支撑计划对该领域的相关技术进行研发。目前国际上提出的一些方法虽然可以被用于建立不同模态之间的关系，但是仍然存在很多的不合理和不足之处，如信息传递的泄漏问题和信息传递的不均衡问题。其中一种主流方法是基于关联子空间恒等同构的方法。基于关联子空间的典型方法如典型相关分析(CanonicalCorrelation Analysis, CCA),它通过对偶综合变量之间的相关性联合降维的方法,将不同模态的数据降到相同维数的关联子空间，这种方法在压缩模态的同时不可避免地造成了原始模态信息的泄漏，从而丢掉了原始模态特征描述中的一些细节信息；另外，该方法在模态转换时在恒等子空间直接进行信息交互，并没有考虑子空间映射的合理关系，只是运用了子空间映射的特殊情况。后续工作还提出了一些与CAA组合的方法来建立...

【技术保护点】

【技术特征摘要】
1.一种基于线性泛化回归模型的跨媒体检索方法，其特征在于，该方法包括以下步骤步骤1，搜集不同模态的样本，建立跨模态检索数据库，并提取数据库中不同模态样本的特征向量；步骤2，利用线性泛化回归模型来估计不同模态样本特征向量之间的关联矩阵；步骤3，估计数据库中各个样本的特征向量属于某一个类别的后验概率；步骤4，用户输入待检索对象，并根据待检索对象的类型进行相应的特征提取；步骤5，使用所述关联矩阵对提取到的待检索对象的特征进行特征转换；步骤6，计算待检索对象转换后的特征与数据库中对应类别的样本对象的特征之间的相似度；步骤7，根据所述步骤6计算得到的相似度对数据库中对应类别的样本对象进行排序，并返回其中最相似的几个样本对象作为跨媒体检索結果。2.根据权利要求I所述的方法，其特征在于，所述步骤I中，所述不同模态的样本之间为对应。3.根据权利要求I所述的方法，其特征在于，分别使用尺度不变特征变换算法和隐狄雷克雷分布算法对图像和文本进行特征的提取。4.根据权利要求I所述的方法，其特征在于，所述线性泛化回归模型表示为Y= XB+E, 其中，X和Y分别代表两个不同模态的特征向量，B为X和Y之间的关联矩阵，E为残差矩阵。5.根据权利要...

【专利技术属性】
技术研发人员：谭铁牛，王亮，陈永明，
申请(专利权)人：中国科学院自动化研究所，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人