当前位置: 首页 > 专利查询>鲁东大学专利>正文

一种鲁棒离散监督跨媒体哈希检索方法技术

技术编号:21343522 阅读:28 留言:0更新日期:2019-06-13 22:28
本发明专利技术公开了一种鲁棒离散监督跨媒体哈希检索方法,通过学习一个鲁棒的两两样本间相似度矩阵挖掘异构样本间的语义关联,利用该方法可实现基于内容的跨媒体检索,该方法包括以下步骤:建立图像和文本数据集,并对数据集中的图像和文本样本分别提取视觉和文本特征;利用样本的类标签、图像和文本特征分别构建两两样本间相似度矩阵,并利用两两样本间相似度矩阵的低秩和样本噪声的稀疏特性学习一个鲁棒的两两样本间相似度矩阵;进而利用该鲁棒两两样本间相似度矩阵学习区分性更好的哈希码;对哈希函数施加

A Robust Discrete Supervised Cross-Media Hash Retrieval Method

The invention discloses a robust discrete supervised cross-media hash retrieval method, which can realize content-based cross-media retrieval by learning a robust similarity matrix between two samples. The method includes the following steps: establishing image and text data sets, and extracting vision for image and text samples in data sets respectively. The similarity matrix between two samples is constructed by using the class label, image and text features of samples, and a robust similarity matrix between two samples is learned by using the low rank of similarity matrix between two samples and the sparse characteristics of sample noise. plus

【技术实现步骤摘要】
一种鲁棒离散监督跨媒体哈希检索方法
:本专利技术涉及一种鲁棒离散监督跨模态哈希检索方法,属于多媒体检索和机器学习领域。
技术介绍
:近年来,互联网上每天都会产生大量的数据,这给多媒体检索任务带来了巨大的挑战,如何高效和有效查找近似样本成为迫切需求。哈希方法通过学习一组哈希函数将样本从原始特征空间映射到汉明空间,由于其在大规模应用中的计算速度快和节省存储空间,引起了研究者的极大的关注。哈希码比原始特征的存储成本低得多,同时通过汉明空间中利用XOR运算可以快速地计算样本之间的相似度。哈希方法已经得到了广泛的研究,但大多数研究仅关注一种模态,然而在因特网上相同语义的样本通常可表示为多个模态,这导致不同模态之间的异构语义鸿沟。例如,图像可以由视觉和相应的文本特征表示。另外,当用户提交查询样本给搜索引擎时,用户更喜欢搜索引擎返回多种模态的相似样本。因此,跨媒体检索引起了越来越多的关注。跨媒体哈希方法的目标是将异构样本映射到一个共享汉明空间,并在此空间保持样本的相似结构。具体地,对于相似的异构样本,在共享汉明空间中汉明距离要小,反之亦然。根据在训练过程中是否使用类标签,跨媒体哈希方法通常可以分为两类:无监督和监督方法。前者通常通过保持样本的模态内和模态间相似性来学习哈希码,而后者可以进一步结合类标签学习区分性更好的哈希码。最近的工作表明,结合样本的类标签可以提高检索性能。虽然许多监督跨模态哈希方法已经提出,并取得了令人满意的结果,然而仍有一些问题需要进一步解决。首先,在现实世界中,样本可能含有噪音。但是,大多数监督跨模态哈希方法仅使用训练数据的类标签构造两两样本间相似度矩阵,而没有考虑样本中的噪声,例如:离群点。显然,这些噪声样本会严重损害两两样本间相似度矩阵的结构,从而误导哈希码的学习,导致检索性能降低。其次,哈希码的离散约束导致混合整数优化问题通常很难解决,大多数方法首先放松哈希码的离散约束,得到连续解,然后量化生成哈希码。然而,量化会导致信息丢失,使得哈希码的区分性能降低。
技术实现思路
:本专利技术的目的在于克服上述已有技术的不足而提供一种以学习性能更好的哈希码,提升算法的性能,以更好的抵抗噪声,提升了哈希码的区分能力,适用于现实网络数据的跨媒体检索的鲁棒离散监督跨模态哈希检索方法。本专利技术的目的可以提供如下措施来达到:一种鲁棒离散监督跨模态哈希检索方法,其特征在于,该方法包括以下步骤:第一步:搜集含有类标签的图像和文本样本对,构成图像、文本一一对应的跨模态检索的图文数据集;第二步:分别对图像和文本模态样本提取特征,并分别对图像和文本模态样本的特征去均值,使两个模态样本的特征数据均值为0;第三步:将数据集中的所有样本对随机划分为训练集和测试集;第四步:利用训练集中样本对的类标签、图像和文本模态的样本特征分别构造两两样本间相似度矩阵,并利用两两样本间相似度矩阵的低秩特性和噪声样本的稀疏特性,学习一个鲁棒的两两样本间相似度矩阵;训练样本对的特征设为X,X={X(1),X(2)},其中X(1)表示训练集中图像模态的样本特征,X(2)表示训练集中文本模态的样本特征,其中d1和d2分别表示图像和文本模态样本特征的维度,N表示训练集中图像或文本模态样本数量,样本对的类标签用L表示,c表示样本类别的数量,li∈{0,1}c,如果lij=1,表示第i个样本属于第j类;反之,如果lij=0,表示第i个样本不属于第j类;学习鲁棒两两样本间相似度矩阵的目标函数包括以下步骤:(1)利用图像模态的样本特征计算基于图像模态特征的两两样本间的相似度矩阵,定义如下:其中||·||F表示Frobenius范数,S(1)表示图像模态的两两样本间相似度矩阵,表示第i个图像样本和第j个图像样本的相似度,σ1为尺度参数;(2)利用文本模态的样本特征计算基于文本模态特征的两两样本间相似度矩阵,定义如下:其中S(2)表示文本模态的两两样本间相似度矩阵,表示第i个文本样本和第j个文本样本的相似度,σ2为尺度参数;(3)利用样本对的类标签计算基于类标签的两两样本间相似度矩阵,定义如下:其中S(3)表示样本对标签的两两相似度矩阵,表示第i个样本对标签和第j个样本对标签的相似度;(4)学习鲁棒两两样本间相似度矩阵的目标函数定义如下:s.t.S(i)=S+||E(i)||0其中S表示学习的鲁棒样本间两两相似度矩阵,E(i)表示第i个两两相似度矩阵中的噪声,rank(·)表示矩阵的秩,||·||0表示l0范数;(5)由于上述(4)中的目标函数存在离散低秩和l0范数的约束,所以问题很难直接求解,可以放松这两个约束条件,得到问题的近似解,所以上式可改写为s.t.S(i)=S+||E(i)||1其中||·||*表示核范数,||·||1表示l1范数,(6)利用增广拉格朗日乘子法求解这个问题,得到鲁棒两两样本间相似度矩阵;第五步:构造目标函数,具体包括以下步骤:(1)在汉明空间保持基于鲁棒两两样本间相似度矩阵的相似性,并且由于图像文本样本对类标签相同,因此它们的距离应尽量小,所以哈希码学习的目标函数定义如下:其中k表示哈希码的长度,B1为图像模态样本的哈希码,B2为文本模态样本的哈希码,λ为权重参数;(2)利用线性映射作为哈希函数,并利用l2,1范数作为正则项约束图像和文本模态哈希函数的学习,以增强其抵抗噪声的能力,因此各模态哈希函数学习的目标函数定义如下:其中W1,W2分别表示图像模态和文本模态的哈希函数,Reg(·)表示正则项防止过拟合,在这里βi和μ为权重参数;(3)将哈希码和哈希函数学习的目标函数相加即为本方法的目标函数,定义如下:其中βi为权重参数;第六步:由于目标函数包含多个未知变量和哈希码的离散约束,因此目标函数很难求解,但通过观察可以发现,当固定其他变量求解其中某一个变量时是凸优化问题,因此可以利用迭代优化算法求解,求解过程包括以下步骤:(1)固定W1,W2和B2,求解B1:去除常数项,目标函数可写为:由于B1是离散的,问题很难直接求解,在此可以逐样本求解,令b1i表示B1的第i列,b2j表示B2的第j列,去除常数项目标函数可写为:这个问题依然很难直接求解,在此采用循环坐标梯度下降法逐比特求解,设b1im表示b1i的第m比特,表示b1i除了第m比特外的其他比特构成的向量,则b1im可由下式得到:重复上式直至求解完所有图像模态样本的哈希码;(2)固定W1,W2和B1,求解B2:与求解B1类似,可得重复上式直至求解完所有文本模态样本的哈希码;(3)固定W2,B1和B2,求解W1:去除常数项,目标函数可写为:这个问题存在闭合解其中D1为对角阵,(4)固定W1,B1和B2,求解W2:与求解W1类似,W2存在闭合解其中D2为对角阵,(5)重复执行(1)-(4)至算法收敛或达到最大迭代次数;第七步:用户输入查询样本,提取其特征,并对提取的特征去均值;第八步:利用已学习的哈希函数生成查询样本的哈希码:第九步:计算查询样本与目标(训练)集中异构样本的汉明距离,并对汉明距离按升序排列,前r个汉明距离对应的样本即为检索结果。本专利技术同已有技术相比可产生如下积极效果:本专利技术方法通过将类标签、图像和文本模态的特征融入一个框架学习一个鲁棒的两两样本间相似度矩阵,以学习性能更好的哈希码本文档来自技高网
...

【技术保护点】
1.一种鲁棒离散监督跨媒体哈希检索方法,其特征在于,该方法包括如下步骤:第一步:搜集含有类标签的图像和文本样本对,构成图像、文本一一对应的跨模态检索的图文数据集;第二步:分别对图像和文本模态样本提取特征,并分别对图像和文本模态样本的特征去均值,使两个模态样本的特征数据均值为0;第三步:将数据集中的所有样本对随机划分为训练集和测试集;第四步:利用训练集中样本对的类标签、图像和文本模态的样本特征分别构造两两样本间相似度矩阵,并利用两两样本间相似度矩阵的低秩特性和噪声样本的稀疏特性,学习一个鲁棒的两两样本间相似度矩阵;训练样本对的特征设为X,X={X

【技术特征摘要】
1.一种鲁棒离散监督跨媒体哈希检索方法,其特征在于,该方法包括如下步骤:第一步:搜集含有类标签的图像和文本样本对,构成图像、文本一一对应的跨模态检索的图文数据集;第二步:分别对图像和文本模态样本提取特征,并分别对图像和文本模态样本的特征去均值,使两个模态样本的特征数据均值为0;第三步:将数据集中的所有样本对随机划分为训练集和测试集;第四步:利用训练集中样本对的类标签、图像和文本模态的样本特征分别构造两两样本间相似度矩阵,并利用两两样本间相似度矩阵的低秩特性和噪声样本的稀疏特性,学习一个鲁棒的两两样本间相似度矩阵;训练样本对的特征设为X,X={X(1),X(2)},其中X(1)表示训练集中图像模态的样本特征,X(2)表示训练集中文本模态的样本特征,其中d1和d2分别表示图像和文本模态样本特征的维度,N表示训练集中图像或文本模态样本数量,样本对的类标签用L表示,c表示样本类别的数量,li∈{0,1}c,如果lij=1,表示第i个样本属于第j类;反之,如果lij=0,表示第i个样本不属于第j类;学习鲁棒两两样本间相似度矩阵的目标函数包括以下步骤:(1)利用图像模态的样本特征计算基于图像模态特征的两两样本间的相似度矩阵,定义如下:其中||·||F表示Frobenius范数,S(1)表示图像模态的两两样本间相似度矩阵,表示第i个图像样本和第j个图像样本的相似度,σ1为尺度参数;(2)利用文本模态的样本特征计算基于文本模态特征的两两样本间相似度矩阵,定义如下:其中S(2)表示文本模态的两两样本间相似度矩阵,表示第i个文本样本和第j个文本样本的相似度,σ2为尺度参数;(3)利用样本对的类标签计算基于类标签的两两样本间相似度矩阵,定义如下:其中S(3)表示样本对标签的两两相似度矩阵,表示第i个样本对标签和第j个样本对标签的相似度;(4)学习鲁棒两两样本间相似度矩阵的目标函数定义如下:s.t.S(i)=S+||E(i)||0其中S表示学习的鲁棒样本间两两相似度矩阵,E(i)表示第i个两两相似度矩阵中的噪声,rank(·)表示矩阵的秩,||·||0表示l0范数;(5...

【专利技术属性】
技术研发人员:姚涛闫连山吕高焕崔光海岳峻
申请(专利权)人:鲁东大学
类型:发明
国别省市:山东,37

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1