行人重识别方法、系统、介质及终端技术方案

技术编号:34712882 阅读:21 留言:0更新日期:2022-08-31 17:54
本发明专利技术提供一种行人重识别方法、系统、介质及终端,包括以下步骤:获取包含行人的每帧图像的基础特征图;获取基础特征图的基础特征向量;获取基础特征向量的注意力分数向量;对注意力分数向量进行上采样,获取与基础特征图相同尺寸的注意力分数图;将每帧图像的基础特征图和注意力分数图组成特征组,将得到的特征组进行两两随机配对生成特征对;对于每个特征对,将两个特征组的基础特征图和注意力分数图交叉相乘,获取加权特征图;获取综合特征向量;获取行人整体表征。本发明专利技术的行人重识别方法、系统、介质及终端能够自动在提取的行人外观特征图中抑制背景环境噪声并更多地保留行人特征,从而在采用较低的计算量的同时,提升行人重识别精度。重识别精度。重识别精度。

【技术实现步骤摘要】
行人重识别方法、系统、介质及终端


[0001]本专利技术涉及计算机视觉的
,特别是涉及一种行人重识别方法、系统、介质及终端。

技术介绍

[0002]行人重识别(Person re

identification)也称行人再识别,是利用计算机视觉技术判断图像或者视频序列中是否存在特定行人的技术,其被广泛认为是一个图像检索的子问题。具体地,行人重识别在跨视域的多个摄像头之间,从其中一个摄像头中识别出之前在另一摄像头中出现过的行人,旨在弥补固定的摄像头的视觉局限,并可与行人检测/行人跟踪技术相结合,可广泛应用于智能视频监控、智能安保等领域。
[0003]然而,现有的行人重识别技术主要依赖行人的外观信息和运动信息对行人进行表征。由于跨区域的多个摄像头所处环境差异巨大,行人在这些不同区域行进时呈现在监控视频中的背景噪声等环境干扰因素千差万别。而这些因素在行人重识别算法对行人进行特征提取时,会造成很大的负面影响,识别精度往往会受较大影响,很难准确地对行人进行重识别。如果通过去除背景等预处理手段,会大幅增加计算量,影响系统处理效率。如果基于行人的全局、局部外观信息及运动信息的方法,也无法很好地解决背景噪声干扰问题。

技术实现思路

[0004]鉴于以上所述现有技术的缺点,本专利技术的目的在于提供一种行人重识别方法、系统、介质及终端,能够基于共同分割注意力机制自动在提取的行人外观特征图中抑制背景环境噪声并更多地保留行人特征,从而在采用较低的计算量的同时,提升行人重识别精度。
[0005]为实现上述目的及其他相关目的,本专利技术提供一种行人重识别方法,包括以下步骤:将包含行人的图像帧序列输入基础特征提取网络,获取每帧图像的基础特征图;基于第一平均池化层获取所述基础特征图的基础特征向量;基于通道注意力模块获取所述基础特征向量的注意力分数向量;对所述注意力分数向量进行上采样,获取与所述基础特征图相同尺寸的注意力分数图;将每帧图像的基础特征图和注意力分数图组成特征组,将得到的特征组进行两两随机配对生成特征对;对于每个特征对,将两个特征组的基础特征图和注意力分数图交叉相乘,获取加权特征图;将每帧图像的加权特征图基于第二平均池化层获取综合特征向量;将所述综合特征向量基于全连接层获取行人整体表征。
[0006]于本专利技术一实施例中,所述基础特征提取网络采用ResNet50网络。
[0007]于本专利技术一实施例中,所述基础特征图中包含多个通道,所述基础特征向量长度与所述基础特征图的通道数相同;所述注意力分数向量长度与所述基础特征向量长度相同,所述注意力分数向量中的分数表示所述基础特征图中每个通道的加权系数。
[0008]于本专利技术一实施例中,所述通道注意力模块包括依次连接的第一全连接层、Tanh激活函数、第二全连接层和Sigmoid激活函数。
[0009]于本专利技术一实施例中,所述注意力分数图与所述基础特征图的尺寸相同。
[0010]于本专利技术一实施例中,还包括计算所述行人整体表征的预测损失,通过反向传播算法优化所述基础特征提取网络、所述通道注意力模块和所述全连接层的网络参数。
[0011]于本专利技术一实施例中,计算所述行人整体表征的预测损失包括以下步骤:
[0012]基于距离度量函数计算两个图像帧的行人整体表征的距离;
[0013]基于所述行人整体表征的距离和损失函数计算所述行人整体表征的预测损失。
[0014]对应地,本专利技术提供一种行人重识别系统,包括基础特征提取网络模块、第一平均池化层模块、通道注意力模块、上采样模块、特征对生成模块、交叉相乘模块、第二平均池化层模块和全连接层模块;
[0015]所述基础特征提取网络模块用于将包含行人的图像帧序列输入基础特征提取网络,获取每帧图像的基础特征图;
[0016]所述第一平均池化层模块用于基于第一平均池化层获取所述基础特征图的基础特征向量;
[0017]所述通道注意力模块用于基于通道注意力模块获取所述基础特征向量的注意力分数向量;
[0018]所述上采样模块用于对所述注意力分数向量进行上采样,获取与所述基础特征图相同尺寸的注意力分数图;
[0019]所述特征对生成模块用于将每帧图像的基础特征图和注意力分数图组成特征组,将得到的特征组进行两两随机配对生成特征对;
[0020]所述交叉相乘模块用于对于每个特征对,将两个特征组的基础特征图和注意力分数图交叉相乘,获取加权特征图;
[0021]所述第二平均池化层模块用于将每帧图像的加权特征图基于第二平均池化层获取综合特征向量;
[0022]所述全连接层模块用于将所述综合特征向量基于全连接层获取行人整体表征。
[0023]本专利技术提供一种存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述的行人重识别方法。
[0024]最后,本专利技术提供一种终端,包括:处理器及存储器;
[0025]所述存储器用于存储计算机程序;
[0026]所述处理器用于执行所述存储器存储的计算机程序,以使所述终端执行上述的行人重识别方法。
[0027]如上所述,本专利技术的行人重识别方法、系统、介质及终端,具有以下有益效果:
[0028](1)与现有的行人重识别方法相比,在不额外进行图像背景噪声去除等预处理的情况下,自动利用经由基础特征提取网络提取的基础特征图自动抑制甚至去除视频序列中图像的背景噪声,同时尽可能多地保留有用的行人及其附属物信息;
[0029](2)在不额外进行图像背景去除等预处理的情况下,以更低的计算量抑制了背景噪声等环境干扰因素,有效提升了行人重识别精度。
附图说明
[0030]图1显示为本专利技术的行人重识别方法于一实施例中的流程图;
[0031]图2显示为本专利技术的行人重识别方法于一实施例中的框架示意图;
[0032]图3显示为本专利技术的通道注意力模块于一实施例中的结构示意图;
[0033]图4显示为本专利技术的行人重识别系统于一实施例中的结构示意图;
[0034]图5显示为本专利技术的终端于一实施例中的结构示意图。
[0035]元件标号说明
[0036]41
ꢀꢀꢀꢀꢀꢀꢀ
基础特征提取网络模块
[0037]42
ꢀꢀꢀꢀꢀꢀꢀ
第一平均池化层模块
[0038]43
ꢀꢀꢀꢀꢀꢀꢀ
通道注意力模块
[0039]44
ꢀꢀꢀꢀꢀꢀꢀ
上采样模块
[0040]45
ꢀꢀꢀꢀꢀꢀꢀ
特征对生成模块
[0041]46
ꢀꢀꢀꢀꢀꢀꢀ
交叉相乘模块
[0042]47
ꢀꢀꢀꢀꢀꢀꢀ
第二平均池化层模块
[0043]48
ꢀꢀꢀꢀꢀꢀꢀ
全连接层模块
[0044]51
ꢀꢀꢀꢀꢀꢀꢀ
处理器
[0045]52
ꢀꢀꢀꢀꢀꢀꢀ<本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种行人重识别方法,其特征在于:包括以下步骤:将包含行人的图像帧序列输入基础特征提取网络,获取每帧图像的基础特征图;基于第一平均池化层获取所述基础特征图的基础特征向量;基于通道注意力模块获取所述基础特征向量的注意力分数向量;对所述注意力分数向量进行上采样,获取与所述基础特征图相同尺寸的注意力分数图;将每帧图像的基础特征图和注意力分数图组成特征组,将得到的特征组进行两两随机配对生成特征对;对于每个特征对,将两个特征组的基础特征图和注意力分数图交叉相乘,获取加权特征图;将每帧图像的加权特征图基于第二平均池化层获取综合特征向量;将所述综合特征向量基于全连接层获取行人整体表征。2.根据权利要求1所述的行人重识别方法,其特征在于:所述基础特征提取网络采用ResNet50网络。3.根据权利要求1所述的行人重识别方法,其特征在于:所述基础特征图中包含多个通道,所述基础特征向量长度与所述基础特征图的通道数相同;所述注意力分数向量长度与所述基础特征向量长度相同,所述注意力分数向量中的分数表示所述基础特征图中每个通道的加权系数。4.根据权利要求1所述的行人重识别方法,其特征在于:所述通道注意力模块包括依次连接的第一全连接层、Tanh激活函数、第二全连接层和Sigmoid激活函数。5.根据权利要求1所述的行人重识别方法,其特征在于:所述注意力分数图与所述基础特征图的尺寸相同。6.根据权利要求1所述的行人重识别方法,其特征在于:还包括计算所述行人整体表征的预测损失,通过反向传播算法优化所述基础特征提取网络、所述通道注意力模块和所述全连接层的网络参数。7.根据权利要求6所述的行人重识别方法,其...

【专利技术属性】
技术研发人员:张富平魏建明
申请(专利权)人:上海工业控制安全创新科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1