System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及计算机视觉图像识别,尤其涉及一种特征回传的行人重识别方法及电子设备。
技术介绍
1、行人重识别(person re-identification,re-id)是计算机视觉领域的一个重要研究方向,旨在识别和匹配在不同摄像头下的同一行人。随着智能监控系统的普及和数据量的激增,行人重识别在安全监控、公共安全、智能交通、商业分析和人机交互等领域的应用日益重要。
2、行人重识别是一个充满挑战性的任务。光照变化、视角变化、背景杂乱及行人外观的多样性(如穿着、姿态、体型等)等都会使得同一行人在不同摄像头下表现出巨大差异。有效地解决这些问题,对于提高系统的智能化水平至关重要。为了解决这些问题,研究者们开始探索各种技术和算法,以提高重识别的准确性和鲁棒性。
3、近年来,行人重识别研究取得了显著进展。目前,基于深度学习的方法在行人重识别领域占主导地位,需要训练一个行人重识别的深度模型来提取行人特征进行分类。训练一个行人重识别的深度学习模型可以分为以下几个步骤,首先,将训练集中的一组行人图像经过处理后输入到深度神经网络,经过大量计算得到一组表征行人的特征向量,再将向量代入设计好的损失函数中计算损失值,然后通过梯度反向传播和优化器来更新模型参数。根据侧重点的不同,研究人员会选择从数据集,表征学习,度量学习,优化排序四个方面进行研究。其中,作为特征提取部分的度量学习是被研究最多的,设计出有效提取行人特征的网络模型至关重要。
4、行人重识别主要从全局特征、局部特征、辅助特征和注意力特征几个方面来进行研究:(
技术实现思路
1、为至少一定程度上解决现有技术中存在的技术问题之一,本专利技术的目的在于提供一种特征回传的行人重识别方法、电子设备及介质。
2、本专利技术所采用的第一技术方案是:
3、一种特征回传的行人重识别方法,包括以下步骤:
4、获取输入图像,对输入图像进行特征锐化处理;
5、将处理后的图像输入训练后的行人重识别模型,输出行人重识别结果;
6、其中,所述行人重识别模型包括transformer编码器和特征回传模块;所述transformer编码器用于进行两轮训练提取行人图像的全局信息;所述特征回传模块用于对第一轮训练的浅层特征进行增强,聚合全局和局部特征并着重增强局部特征,并将特征回传网络进行第二轮训练,以补充强化缺失的详细信息。
7、进一步地,采用特征锐化模块对输入图像进行特征锐化处理;
8、所述特征锐化模块包括深度卷积层、锐化单元和多层感知块;
9、所述特征锐化模块的工作方式如下:
10、对于一张输入图像i∈rh×w×c,其中h代表高度,w代表宽度,c代表通道数,采用长和宽都为p的深度卷积层对输入图像i分别进行逐通道卷积和逐点卷积,得到图像特征i′;将图像特征i′输入锐化单元进行特征锐化,最后进行多层感知操作,公式表示如下:
11、i′=dwconv(i)
12、i″=ms(i′)
13、x=mlp(i″)
14、式中,dwconv(·)代表深度卷积层,ms(·)表示锐化单元,mlp(·)表示多层感知操作。
15、进一步地,所述锐化单元包括分组卷积层、边界增强模块和普通卷积层;
16、所述锐化单元的工作方式如下:
17、首先利用两个具有不同膨胀值的分组卷积层来提取图像特征i′的上下文特征,同时将图像特征i′传递给边界增强模块以获得边界增强特征;最后,沿着通道维度将上下文特征和边界增强特征进行连接,并利用1×1卷积层来获得增强的特征表示,以保证输出图像特征与输入大小不变,获得行人锐化图像特征x∈rh×w×c,公式表示如下:
18、
19、i″2=be(i′)
20、
21、式中,group conv(·)表示分组卷积层,表示相加,be(·)表示边界增强模块,conv(·)表示普通卷积层,表示拼接两个特征向量;i″1表示上下文特征,i″2表示边界增强特征。
22、进一步地,所述边界增强模块的工作方式如下:
23、首先利用深度卷积层将图像特征i′的局部表示进行编码,分别对每个通道中的结构信息进行增强得到特征z,并计算均值得到特征映射的平均响应;为了突出细节,从图像特征i′减去平均响应得到特征y;此外计算特征z的每个通道的空间平均值,并用softmax操作获得特征映射y每个通道的锐化因子s;将锐化因子s与特征y相乘并与特征z相加,得到锐化后的边界增强特征,公式表示如下:
24、z=dw conv(i′)
25、y=i′-c mean(z)
26、s=softmax(s mean(z))
27、
28、式中,c mean(·)表示通道维度计算均值,s mean(·)表示空间维度计算均值,softmax表示归一化操作,⊙表示相加。
29、进一步地,所述transformer编码器用于对行人特征锐化后的图像进行以下处理:
30、使用一个包含c′个长和宽都为p且步长为s卷积核个数的卷积层对输入图像特征x∈rh×w×c进行线性映射,得到n个长度为d的序列i∈1,2,...,n,其中:
31、
32、d=h*w*c
33、生成一个与序列xp长度相等的可学习的cls标记,将cls标记与序列xp组合,并通过可学习的位置编码将空间信息整合到组合中,得到输入序列z0,公本文档来自技高网...
【技术保护点】
1.一种特征回传的行人重识别方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种特征回传的行人重识别方法,其特征在于,采用特征锐化模块对输入图像进行特征锐化处理;
3.根据权利要求2所述的一种特征回传的行人重识别方法,其特征在于,所述锐化单元包括分组卷积层、边界增强模块和卷积层;
4.根据权利要求3所述的一种特征回传的行人重识别方法,其特征在于,所述边界增强模块的工作方式如下:
5.根据权利要求1所述的一种特征回传的行人重识别方法,其特征在于,所述transformer编码器用于对行人特征锐化后的图像进行以下处理:
6.根据权利要求5所述的一种特征回传的行人重识别方法,其特征在于,所述特征回传模块由三个卷积分支,一个池化分支,Squeeze-and-Excitation模块和前馈神经网络组成;
7.根据权利要求6所述的一种特征回传的行人重识别方法,其特征在于,在获得特征X′后,将特征X′进行线性映射,得到序列xP,将cls标记与序列xP组合,并通过可学习的位置编码将空间信息整合到组合中,得到输入序列
8.根据权利要求1所述的一种特征回传的行人重识别方法,其特征在于,所述行人重识别模型在训练的过程中,根据分类结果使用身份损失、三元组损失和中间损失来计算总体损失,并通过反向传播优化整个模型参数。
9.根据权利要求8所述的一种特征回传的行人重识别方法,其特征在于,所述总体损失的计算方式如下:
10.一种电子设备,其特征在于,所述电子设备包括处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行,以实现如权利要求1至9任一所述的方法。
...【技术特征摘要】
1.一种特征回传的行人重识别方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种特征回传的行人重识别方法,其特征在于,采用特征锐化模块对输入图像进行特征锐化处理;
3.根据权利要求2所述的一种特征回传的行人重识别方法,其特征在于,所述锐化单元包括分组卷积层、边界增强模块和卷积层;
4.根据权利要求3所述的一种特征回传的行人重识别方法,其特征在于,所述边界增强模块的工作方式如下:
5.根据权利要求1所述的一种特征回传的行人重识别方法,其特征在于,所述transformer编码器用于对行人特征锐化后的图像进行以下处理:
6.根据权利要求5所述的一种特征回传的行人重识别方法,其特征在于,所述特征回传模块由三个卷积分支,一个池化分支,squeeze-and-excitation模块和前馈神经网络组成;
...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。