一种基于视觉转语义网络的零样本图像哈希检索方法技术

技术编号：26597885 阅读：13 留言：0更新日期：2020-12-04 21:20

本发明专利技术公开了一种基于视觉转语义网络的零样本图像哈希检索方法，基于视觉转语义网络，将图像特征向量转变为语义特征，再利用语义特征与类别向量语义特征的距离构成目标损失函数，以及语义特征重构的分类损失及哈希损失，共同求解出训练数据集上的最优哈希方法，使得针对未出现的类别，哈希检索方法依旧具有可行性，相比传统哈希算法，具有更好的泛化性和鲁棒性，减少了在数据种类愈发丰富的今天图像检索模型的训练开销，将哈希模型的更新周期放慢，本发明专利技术可以被应用于数据库图片不断扩充的图像检索以及图像溯源等领域。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于视觉转语义网络的零样本图像哈希检索方法
本专利技术属于零样本图像哈希检索技术，具体涉及一种基于视觉转语义网络的零样本图像哈希检索方法。
技术介绍
图像哈希检索是计算机视觉领域的一个重要问题，它的任务是依据输入图片，快速找到了数据库中最相近的图片，并依据相似度进行排序，利用数据库中的图片相关性进行同风格图片搜寻或是对输入图片进行溯源。随着当今数据量的日益扩大，传统方式搜索图片会因为数据库中的图片过多导致搜索速度过慢的问题，无法满足日益扩大的图像检索需求。同时，图像数据量的剧增也必然会带来图像种类的丰富，此时采用监督式学习的图像哈希方法需要引入新种类图片的数据，并重新进行训练，这导致了两部分缺陷，首先是新种类图片的数量必然远远小于传统类别，这会导致监督式训练时，新类别的训练效果不理想，训练得到的哈希网络依旧倾向于学习传统类别特征，其次是当有新类别加入后就需要添加新标签并重新训练，放在变化飞快的现实环境，这会不断带来训练开销，耗时且昂贵。为了使得哈希检索方法适应愈发复杂的图像数据，零样本哈希图像检索方法是图像检索未来发展的重要课题，同时也因为其缺少相关类别的训练数据，设计准确且稳定的零样本图像检索算法仍然是一项具有挑战性的任务。近年来，少样本学习以及零样本学习领域的发展使得零样本的哈希检索方法得到了显著的改善。零样本学习的核心思想在于利用自然语言处理模型将类别标签翻译为特征向量，之后学习从常规类别图像数据到常规类别标签特征向量的映射，同时维持类别间的相对关系，使得零样本类别的数据同样可以映射到正确类别。例如...

【技术保护点】
1.一种基于视觉转语义网络的零样本图像哈希检索方法，其特征在于，包括以下步骤：/n步骤1、对于输入图片I

【技术特征摘要】
1.一种基于视觉转语义网络的零样本图像哈希检索方法，其特征在于，包括以下步骤：
步骤1、对于输入图片Ii，i代表第i张图片，进行图像信息的整合，降低图像信息的维度，生成图像特征向量xi作为哈希算法的输入；
步骤2、将图像特征向量xi输入到视觉转语义网络进行特征重构，将图像特征向量xi转变为语义特征si；
步骤3、计算语义特征si与类别向量语义特征cyi的距离损失函数，即目标损失函数；类别向量语义特征cyi代表第i张图片标签的类别特征向量，yi即第i张图片的标签；
所需求解的距离损失函数为

其中，m为超参数，代表希望图像特征向量xi转语义特征si后与正确类别语义特征以及最近的错误类别语义特征的容许差值；N代表所有图片的数量；即语义特征si到最近错误类别语义特征的距离；为转化后语义特征si到正确类别语义特征的距离；代表目标损失函数，即希望视觉转语义网络能将映射后的语义特征si更靠近正确的类别语义；
步骤4、将语义特征si映射到所有标签类的维度，进行分类判断；具体是利用全连接网络将语义特征si映射到含有标签数量大小L个神经元的输出层，之后利用输出层每个节点计算各个类别的概率，得到概率向量pi，之后计算交叉熵损失函数，即为如下分类损失函数

其中，yi为第i张图片的类别标签单热向量；代表的是分类损失函数，其本质目的是希望经过语义映射得到的语义特征具有更多的信息，并能依靠低纬度下的丰富信息完成分类任务的重构；
步骤5、将语义特征si映射到汉明空间，生成哈希编码，设立如下哈希损失函数

其中，bi代表哈希向量，其为多位二值的特征向量；sij是0,1二值变量，当图片i与图片j为相同类别图片时，该值为1，不同类别时，该值为0；λ为超参数，代表间隔系数；α为超参数，代表惩罚系数；损失函数中第一项sij*||bi-bj||2代表相同类别哈希编码距离，第二项(1-sij)*...

【专利技术属性】
技术研发人员：王祥丰，金博，陈健，祝荣荣，张浩，
申请(专利权)人：苏州智元昇动智能科技有限公司，
类型：发明
国别省市：江苏;32

全部详细技术资料下载我是这个专利的主人