本发明专利技术提出一种基于半监督的中心乘积量化图像检索方法,通过特征提取后将空间切分为若干个子空间,然后对特征向量进行归一化处理,计算余弦距离让子向量能找到相应子空间中最接近的码字。计算过程中使用半监督损失模块减小量化误差,最小化标记数据的经验误差和未标记数据的嵌入误差,最后用码字替代子向量化为二进制码存储到乘积量化查找表中,通过非对称距离计算进行图像检索;本发明专利技术提出的方法具有更强的鲁棒性,提高图像检索的精度。提高图像检索的精度。提高图像检索的精度。
【技术实现步骤摘要】
一种基于半监督的中心乘积量化检索方法
[0001]本专利技术涉及图像检索
,特别是指一种基于半监督的中心乘积量化检索方法。
技术介绍
[0002]随着互联网的快速发展和移动设备的普及,各行各业积累的数据都呈现出爆炸式增长趋势。在这个时代,用户如何在大规模的图像数据中高效而又精准的检索到需要的图像数据信息,成为研究热点。目前已经有许多学者研发出快速准确的检索算法,近似最近邻(ANN)由于具有较高的计算速率和检索精度成为了数据检索中使用最为广泛的技术。
[0003]哈希方法在内存消耗和检索速度方面有着明显的优势,具体来说,该方法将高维图像映射成固定长度的散列值并保持原始空间中的相似性,通过合适的哈希函数将高维数据转换为汉明空间中紧凑的二进制散列码,通过它来建立检索数据库并计算距离。基于二进制哈希的方案使用哈希函数将高维数据映射到Hamming空间后按位异或运算快速测量距离,而不是计算余弦相似度或欧氏距离。然而,基于哈希方法的神经网络搜索精度过度依赖于哈希函数,而且,哈希方法只能产生有限数量的不同值,限制了描述点之间的距离。
[0004]哈希方法根据是否采用有监督的信息又可以分为无监督哈希和有监督哈希,有监督哈希模型利用图像标签等语义信息生成更有效的哈希码,但是高度依赖于标签,相反,未标记的数据数据集数量多又免费,因此无监督哈希模型为更实际的应用提供了一种经济高效的解决方案。现有的无监督散列方法大多采用基于图形的范式,通常会存在“静态图”问题,而且大多只是设计了损失函数保持语义信息,并没有考虑到未标记数据的底层数据结构。
技术实现思路
[0005]本专利技术的主要目的在于克服现有技术中的上述缺陷,提出一种基于半监督的中心乘积量化图像检索方法,通过特征提取后将空间切分为若干个子空间,然后对特征向量进行归一化处理,计算余弦距离让子向量能找到相应子空间中最接近的码字。计算过程中使用半监督损失模块减小量化误差,最小化标记数据的经验误差和未标记数据的嵌入误差,最后用码字替代子向量化为二进制码存储到乘积量化查找表中,通过非对称距离计算进行图像检索;本专利技术提出的方法具有更强的鲁棒性,提高图像检索的精度。
[0006]本专利技术采用如下技术方案:
[0007]一种基于半监督的中心乘积量化检索算法,其包括以下处理步骤:
[0008]步骤1:将未标记图像数据和标记图像数据组成的数据集通过特征提取器生成D维特征,并对特征向量进行归一化处理,将它们约束在一个单位超球面上;
[0009]步骤2:根据步骤1得到的D维特征,通过空间切分分成M份,产生d个子空间,d=D/M,每个子空间中有K个聚类中心,同时特征向量被分为M个子向量,乘积量化表收集M个码本,每个码本有K个码字;
[0010]步骤3:将步骤2得到的子向量预处理后通过余弦相似度距离计算方法映射到最近的码字,并通过半监督损失模块最小化标记数据的经验误差和未标记数据的嵌入误差;
[0011]步骤4:将步骤3中得到的与子向量距离最近的码字替代子向量并格式化为子二进制码,并且将所有子二进制码连接起来形成最终的二进制码存储到乘积量化表中;
[0012]步骤5:输入待检索图像,通过乘积量化查找表加载预计算的距离,并且聚合所有加载的预计算的距离来进行非对称计算,得到最小预计算的距离,实现图像检索,所述预计算的距离为查询图像与数据库中二进制代码的距离。
[0013]具体地,步骤3中子向量预处理后通过余弦相似度距离计算方法映射到最近的码字,还包括根据软量化器得到余弦相似度的距离,计算公式如下:
[0014][0015]式中:α表示软量化器的硬量化因子,k=1,2,3...K,m=1,2,3...M;X
m
为子向量,T
mk
为码本中的码字;S
m
为余弦相似度的距离。
[0016]具体地,步骤3中的,通过半监督损失模块最小化标记数据的经验误差和未标记数据的嵌入误差,还包括到子向量到量化子向量,采用交叉熵损失表征误差,具体为:基于交叉熵损失L
BCE
的目标函数L
PQL
为:
[0017][0018]式中:R
m
表示第m个特征向量和量化后的向量的余弦相似性,W
m
表示第m个量化子向量与码字的相似性,S
m
表示第m个向量所属标签与同一批次的向量标签之间的相似性。
[0019]具体地,步骤3中得到的子向量预处理后通过余弦相似度距离计算方法映射到最近的码字,还包括采用余弦相似度距离的分类器进行分类,通过标准交叉熵损失的目标函数表征分类损失,分类损失的公式如下:
[0020][0021]式中:γ是标准交叉熵损失函数中的比例因子,r是特征向量对应的标签,G是利用标记数据得到的标号预测。
[0022]具体地,步骤3中的计算过程中通过半监督损失模块减小误差,还包括通过子空间熵极大极小损失函数计算标记数据和未标记数据的分布差异引起的误差,采用子空间熵极大极小损失函数的公式如下:
[0023][0024]式中:δ与β是子空间熵极大极小损失函数中的比例因子,H为根据未标记数据得到的余弦距离的预测。
[0025]由上述对本专利技术的描述可知,与现有技术相比,本专利技术具有如下有益效果:
[0026]本专利技术提出了一种基于半监督的中心乘积量化图像检索方法,通过特征提取后将空间切分为若干个子空间,然后对特征向量进行归一化处理,计算余弦距离让子向量能找到相应子空间中最接近的码字。计算过程中使用半监督损失模块减小量化误差,最小化标记数据的经验误差和未标记数据的嵌入误差,最后用码字替代子向量化为二进制码存储到乘积量化查找表中,通过非对称距离计算进行图像检索;本专利技术提出的方法具有更强的鲁棒性,提高图像检索的精度。
附图说明
[0027]图1为本专利技术实施例提供的一种基于半监督的中心乘积量化图像检索方法的流程图;
[0028]以下结合附图和具体实施例对本专利技术作进一步详述。
具体实施方式
[0029]本专利技术提出了一种基于半监督的中心乘积量化图像检索方法,通过特征提取后将空间切分为若干个子空间,然后对特征向量进行归一化处理,计算余弦距离让子向量能找到相应子空间中最接近的码字。计算过程中使用半监督损失模块减小量化误差,最小化标记数据的经验误差和未标记数据的嵌入误差,最后用码字替代子向量化为二进制码存储到乘积量化查找表中,通过非对称距离计算进行图像检索;本专利技术提出的方法具有更强的鲁棒性,提高图像检索的精度。
[0030]本专利技术实施例通过数据集先建立一个半监督的场景,初始目标是学习一个映射函数,它将图像的高维特征编码为二进制代码。
[0031]如图1为本专利技术实施例提供的一种基于半监督的中心乘积量化图像检索方法的流程图,重复步骤S1到步骤S5的过程。
[0032]首先初始化由未标记数据和标记数据组成的检索数据集;
[0033]执行步骤S1本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种基于半监督的中心乘积量化检索算法,其特征在于,其包括以下处理步骤:步骤1:将未标记图像数据和标记图像数据组成的数据集通过特征提取器生成D维特征,并对特征向量进行归一化处理,将它们约束在一个单位超球面上;步骤2:根据步骤1得到的D维特征,通过空间切分分成M份,产生d维子空间,d=D/M,每个子空间中有K个聚类中心,同时特征向量被分为M个子向量,乘积量化表收集M个码本,每个码本有K个码字;步骤3:将步骤2得到的子向量预处理后通过余弦相似度距离计算方法映射到最近的码字,并通过半监督损失模块最小化标记数据的经验误差和未标记数据的嵌入误差;步骤4:将步骤3中得到的与子向量距离最近的码字替代子向量并格式化为子二进制码,并且将所有子二进制码连接起来形成最终的二进制码存储到乘积量化表中;步骤5:输入待检索图像,通过乘积量化查找表加载预计算的距离,并且聚合所有加载的预计算的距离来进行非对称计算,得到最小预计算的距离,实现图像检索,所述预计算的距离为查询图像与数据库中二进制代码的距离。2.如权利要求1所述的基于半监督的中心乘积量化检索算法,其特征在于,步骤3中子向量预处理后通过余弦相似度距离计算方法映射到最近的码字,还包括根据软量化器得到余弦相似度的距离,计算公式如下:式中:α表示软量化器的硬量化因子,k=1,2,3...K,m=1,2,3...M;X
m
为子向量,T
mk
为码本中的码字;S
m
【专利技术属性】
技术研发人员:郭泽添,洪朝群,庄艳辉,周卉芬,范一庆,
申请(专利权)人:厦门理工学院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。