基于twins多层级特征的行人重识别方法技术

技术编号：33283787 阅读：9 留言：0更新日期：2022-04-30 23:46

本发明专利技术公开了一种基于twins多层级特征的行人重识别方法，方法流程如图1所示。首先提取twins的第三阶段和第四阶段的特征图，将第三阶段的特征图经过设计的一个Convblock，其中包括二维卷积，均值归一化层，SE注意力层，激活函数层，水平切分得到两局部特征图，再经过池化，降维等操作得到两个特征向量；将第四阶段的特征图经过池化降维等操作得到一个特征向量。将这三个特征向量分别经过三个分类层得到三个预测分类。最后将特征向量送入三元组损失，预测分类送入交叉熵损失和中心损失进行联合训练。训练80个迭代后，模型进入拟合状态，最后用数据集的query集和gallery集来评估模型的性能。的性能。的性能。

全部详细技术资料下载

【技术实现步骤摘要】
基于twins多层级特征的行人重识别方法

[0001]本专利技术属于计算机视觉领域，涉及一种基于Transformer架构的多层级特征提取的多分支行人重识别方法。
技术背景
[0002]行人重识别(Person re
‑
identification)也称行人再识别，是利用计算机视觉技术判断图像或者视频序列中是否存在特定行人的技术。广泛被认为是一个图像检索的子问题。给定一个监控行人图像，检索跨设备下的该行人图像。旨在弥补固定的摄像头的视觉局限，并可与行人检测/行人跟踪技术相结合，可广泛应用于智能视频监控、智能安保等领域。由于不同摄像设备之间的差异，同时行人兼具刚性和柔性的特性，外观易受穿着、尺度、遮挡、姿态和视角等影响，使得行人重识别成为计算机视觉领域中一个既具有研究价值同时又极具挑战性的热门课题。
[0003]行人重识别任务主要包括特征提取和相似度度量两个步骤。在特征提取上，基于 Transformer的主干模型考虑到了输入各个部分的关联性和较低的计算代价，对计算机视觉的各个子任务有了更多的选择和可探讨性，它的蓬勃发展带来了更强大的特征表示，对于行人图像具有更好的分辨力和鲁棒性，这将Re
‑
ID的性能提升到了一个新的水平；在相似度度量上，统一的度量都是采用特征向量间的欧式距离或者是余弦距离作为相似度的度量标准。
[0004]行人图片中包含主要的人物信息和无用的背景信息，为了让模型学习到有用的目标信息，通常使用卷积神经网络或者Transformer来对图片进行特征提取...

【技术保护点】

【技术特征摘要】
1.一种基于twins多层级特征的行人重识别方法，其特征在于，该模型的搭建具体包括以下步骤：步骤一，使用twins
‑
SVT transformer对数据集Market
‑
1501提取行人图片的不同层级特征,对stage3提取后的特征记为特征图f
s3
，f
s3
∈14
×
14
×
256；对stage4提取的特征记为特征图f
s4
，f
s4
∈7
×7×
512；步骤二，将特征图f
s4
经过一个全局平均池化，将多余的维度压缩，得到特征向量f
g
，f
g
∈b
×
512，再将f
g
经过全连接层得到分类预测向量p
g
，p
g
∈b
×
num_classes，其中num_classes表示数据集的总共分类类别数；步骤三，将特征图f
s3
∈b
×
14
×
14
×
256经过一个Convblock模块，得到和主干第四阶段相同通道数的特征图f
′
s3
∈b
×
12
×
12
×
512；步骤四，将f
s3
水平分为两个分支，分别记为part
‑
1，part
‑
2，对应的特征图分别记为这两个特征图的尺寸大小都为6
×
12
×
512，得到b
×6×
12
×
512和对这两个特征图经过全局平均池化和降维得到两个特征向量经过BN层和全连接层分别得到分类预测向量和步骤五，将f
g
，送入三元组损失Tr...

【专利技术属性】
技术研发人员：高云园，翟家豪，张卷卷，张卫，张启忠，
申请(专利权)人：杭州电子科技大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人