【技术实现步骤摘要】
基于自主进化损失的图像检索与识别方法
[0001]本专利技术属于图像检索领域,具体涉及一种基于自主进化损失的图像检索与识别方法。
技术介绍
[0002]图像检索任务的基本形式是给定一个包含特定实例(例如特定目标、场景、建筑等)的查询图像,之后从数据库图像中找到包含相同实例的图像。深度度量学习是在图像检索任务中被广泛应用的重要方法之一。
[0003]在自主进化的度量学习任务中,深度度量学习(Deep metric learning,DML)旨在学习相似性度量,它可以将样本映射到高维空间。在高维空间中,同一实例的样本越接近,而不同实例的样本距离越远。典型的深度度量学习应用包括图像检索、人员重新识别等。深度度量学习的流行方法包括基于成对的方法和基于Softmax的方法。基于成对的方法侧重于寻找有效的方法来改进现有成对损失(如对比损失和三重损失)的样本加权策略。基于成对的方法直接影响嵌入空间中点对之间的距离,这与DML的目标密切相关。就基于Softmax的方法而言,现有的一些方法认为使用Softmax损失来训练模型,也可以取得良好的性能。与基于成对的方法相比,基于Softmax的方法可以被视为使用代理近似每个类,并使用所有代理为每个训练迭代提供全局上下文。
[0004]现有研究发现,优化基于Softmax的方法对应于基本成对损失的近似界优化器,表明最小化Softmax损失等同于最大化特征和标签之间相互信息的区别视图。实际上,在训练基于Softmax的深度度量学习模型时,没有L2归一化的内积(即最后一个完全连接 ...
【技术保护点】
【技术特征摘要】
1.基于自主进化损失的图像检索与识别方法,其特征在于包括如下步骤:(1)使用ResNet50模型作为主干网络,并在ImageNet大型分类数据集上进行预训练;(2)用广义均值池化代替全局平均池化,在主干网络上添加没有缩放项和偏置项的批归一化层,去掉主干网络中最后一个BN
‑
ReLU模块,使用L2归一化欧氏距离计算测试时的召回率;(3)将所有的输入图像调整为256*256分辨率,并裁剪到224*224分辨率,不对输入的数据进行数据增强操作,只将输入的数据采样到256*256的图像大小;(4)将模型经过100轮次的训练,采用余弦退火算法设定参数学习率,将γ=30设为默认值;(5)对Softmax损失函数使用标签平滑,当Softmax损失函数的返回值小于3时,梯度停止Softmax损失函数开始加入训练;梯度停止Softmax损失函数如下公式(2):其中N为每一次输入批次中的样本数量,c为训练集中的类数量,f
i
为第i个样本的特征,y
i
为第i个样本的标签,W
j
是最后一个全连接层的第j列,对应第j类,表示L2归一化,而表示不允许通过W
j
进行梯度更新,γ是一个预定义的标量;Softplus(x)=log(1+e
x
),(6)固定模型参数,不再通过随机梯度下降算法进行网络参数更新,仅利用网络作为图像特征的提取器;(7)将部署了梯度停止Softmax损失函数并移除BN
‑
ReLU模块的ResNet
‑
50特征提取网络输出特征F;(8)针对查询样例经过模型特征推理后得到特征F
q
,将图像库中所有图像的特征提取出来储存为特征序列{F1,
…
【专利技术属性】
技术研发人员:王鹏,王云龙,张艳宁,吴瑞祺,杨路,
申请(专利权)人:西北工业大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。