一种基于注意力机制的跨域行人重识别方法技术

技术编号：29403288 阅读：49 留言：0更新日期：2021-07-23 22:41

本发明专利技术公开了一种基于注意力机制的跨域行人重识别方法，其技术方案是在基于ResNet50构造的神经网络模型中对输入图像进行处理，通过空间注意力模块和注意力权重融合模块能够将不同阶段的注意力信息进行融合，从而充分了利用不同阶段的语义和位置信息来增强行人显著性特征的提取并抑制背景干扰，由此达到提升模型跨域行人重识别效果的目的。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于注意力机制的跨域行人重识别方法
本专利技术涉及计算机视觉
，尤其涉及一种基于注意力机制的跨域行人重识别方法。
技术介绍
行人重识别(Personre-identification，简称ReID)也称行人再识别，是利用计算机视觉技术在跨设备、时间和地点的条件下判断图像或者视频序列中是否存在特定行人的技术。因其能够对特定人员进行大范围跟踪监控，当前广泛应用于智能监控，智能安保等领域。得益于深度学习算法的快速发展和大规模行人重识别数据集的出现，行人重识别技术在一些标准公开数据集上的测试准确率已经得到了显著提高。但是目前大多数行人重识别模型普遍面临同样一个问题，由于不同摄像头下的行人图像存在遮挡、光照、角度、背景差异等比较多的干扰因素，同时同一行人的外观信息也会因各种原因发生剧烈变化。因此，当训练模型的训练集和评估模型的测试集来自不同的域时，将极大地干扰模型对行人显著性特征的提取，并导致模型的表现明显下降，这意味着把在一个场景下训练得到的模型迁移到另一个新的场景中进行测试时往往难以得到令人满意的效果。进一步的，训练好的模型无法从背景风格完全不同的行人图像中很好地判别行人特征，也会导致跨域行人重识别效果的急剧下降。因此，增强模型对行人显著性特征的提取对跨域行人重识别至关重要。研究表明，抑制背景干扰可以有效提高模型的泛化能力并提高跨域识别率。一方面，将行人与背景分割可有效抑制背景干扰。现有技术中提出了使用行人前景掩膜作为辅助，结合三元组损失和对比损失，使得模型更加关注于前景人体区域，忽略背景区域，以...

【技术保护点】
1.一种基于注意力机制的跨域行人重识别方法，其技术方案为：在基于ResNet50构造的神经网络模型中对输入图像进行特征提取和抑制背景干扰，具体包括如下步骤：/n步骤1：对输入图像进行卷积和池化处理，提取输入图像的特征数据；/n步骤2：将特征数据输入到第一残差块中进行处理得到第一输出特征x

【技术特征摘要】
1.一种基于注意力机制的跨域行人重识别方法，其技术方案为：在基于ResNet50构造的神经网络模型中对输入图像进行特征提取和抑制背景干扰，具体包括如下步骤：
步骤1：对输入图像进行卷积和池化处理，提取输入图像的特征数据；
步骤2：将特征数据输入到第一残差块中进行处理得到第一输出特征x1，使用残差连接的InstanceNormalization层对第一输出特征x1进行归一化处理并得到归一化的特征f1，使用空间注意力模块提取出第一个注意力权重w1，再根据第一个注意力权重w1与使用残差连接得到的特征A得出第二输入特征i1；
步骤3：将第二输入特征i1输入到第二残差块中进行处理得到第二输出特征x2，使用残差连接的InstanceNormalization层对第二输出特征x2进行归一化处理并得到归一化的特征f2，使用空间注意力模块提取出第二个注意力权重w2，使用注意力权重融合模块将第二个注意力权重w2与第一个注意力权重w1进行融合得到第一融合权重w12，再根据第一融合权重w12与使用残差连接得到的特征B得出第三输入特征i2；
步骤4：将第三输入特征i2输入到第三残差块中进行处理得到第三输出特征x3，使用残差连接的InstanceNormalization层对第三输出特征x3进行归一化处理，使用空间注意力模块提取出第三个注意力权重w3，使用注意力权重融合模块将第三个注意力权重w3与第一融合权重w12进行融合得到第二融合权重w23，再根据第二融合权重w23与使用残差连接得到的特征C得出第四输入特征i3；
步骤5：将第四输入特征i3输入到第四残差块中进行处理，得到第四输出特征，再将第四输出特征输入到Head层中处理，处理后即得到抑制了背景干扰的行人特征。

2.根据权利要求1所述的一种基于注意力机制的跨域行人重识别方法，其特征在于：使用InstanceNormalization层进行归一化处理的方法如下：

其中xi，i∈1，2，3分别为第一输出特征x1、第二输出特征x2和第三输出特征x3，μ(·)和σ(·)分别表示每个特征在其各个通道内计算所得的平均值和标准差，γ和β是通过数据训练所学习到的参数。

3.根据权利要求1或2所述的一种基于注意力机制的跨域行人重识别方法，其特征在于：设定空间注意力模块的输入特征为f∈Rc*h*w，提取出对应的注意力权重为w∈R1*h*w，c、h、w分别为输入特征f的通道数、高度和宽度，则使用空间注意力模块提取出注意力权重的方法如下：
S1：沿通道维度分别计算输入特征f的最大值和平均值，生成两个2D特征图；
S2：将生成的两个2D特征图分别沿h维度和w维度计算对应的最大值和平均值，共得到8个特征向量；
S3：将8个特征向量两两...

【专利技术属性】
技术研发人员：殷光强，贾召钱，王文超，候少麒，王治国，
申请(专利权)人：电子科技大学，
类型：发明
国别省市：四川;51

全部详细技术资料下载我是这个专利的主人