System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种特征回传的行人重识别方法及电子设备技术_技高网

一种特征回传的行人重识别方法及电子设备技术

技术编号:44953121 阅读:2 留言:0更新日期:2025-04-12 01:24
本发明专利技术公开了一种特征回传的行人重识别方法及电子设备,其中方法包括:获取输入图像,对输入图像进行特征锐化处理;将处理后的图像输入训练后的行人重识别模型,输出行人重识别结果;行人重识别模型包括transformer编码器和特征回传模块;编码器用于进行两轮训练提取行人图像的全局信息;特征回传模块用于对第一轮训练的浅层特征进行增强,聚合全局和局部特征并着重增强局部特征,并将特征回传网络进行第二轮训练,以补充强化缺失的详细信息。本发明专利技术通过锐化图像数据突出行人特征,并提高对浅层特征的利用,允许模型关注基于先前结果的特定区域来提高准确性,有效地提升了行人重识别模型的性能,可广泛应用于图像识别技术领域。

【技术实现步骤摘要】

本专利技术涉及计算机视觉图像识别,尤其涉及一种特征回传的行人重识别方法及电子设备


技术介绍

1、行人重识别(person re-identification,re-id)是计算机视觉领域的一个重要研究方向,旨在识别和匹配在不同摄像头下的同一行人。随着智能监控系统的普及和数据量的激增,行人重识别在安全监控、公共安全、智能交通、商业分析和人机交互等领域的应用日益重要。

2、行人重识别是一个充满挑战性的任务。光照变化、视角变化、背景杂乱及行人外观的多样性(如穿着、姿态、体型等)等都会使得同一行人在不同摄像头下表现出巨大差异。有效地解决这些问题,对于提高系统的智能化水平至关重要。为了解决这些问题,研究者们开始探索各种技术和算法,以提高重识别的准确性和鲁棒性。

3、近年来,行人重识别研究取得了显著进展。目前,基于深度学习的方法在行人重识别领域占主导地位,需要训练一个行人重识别的深度模型来提取行人特征进行分类。训练一个行人重识别的深度学习模型可以分为以下几个步骤,首先,将训练集中的一组行人图像经过处理后输入到深度神经网络,经过大量计算得到一组表征行人的特征向量,再将向量代入设计好的损失函数中计算损失值,然后通过梯度反向传播和优化器来更新模型参数。根据侧重点的不同,研究人员会选择从数据集,表征学习,度量学习,优化排序四个方面进行研究。其中,作为特征提取部分的度量学习是被研究最多的,设计出有效提取行人特征的网络模型至关重要。

4、行人重识别主要从全局特征、局部特征、辅助特征和注意力特征几个方面来进行研究:(1)基于全局图像的行人重识别方法,是早期主要的研究方法,也较为简单。直接将图像输进cnn网络中进行卷积得到关于行人的服装、体型、姿态等外观全局特征之后进行分类。这样的做法在当初取得了不错的效果,但是在不可避免的下采样过程中,分辨率会逐步降低且不可挽回,使得网络容易忽视掉局部的具有判别行特征,并且直接从整张图像中提取特征容易受到遮挡、背景、人体姿势的干扰,从而影响在这些情况下的识别率。(2)基于局部特征的行人重识别方法,将图像进行区域划分或者姿态估计去提取特征信息,促使网络更加关注到局部区域,网络能够利用到局部信息进行匹配和分类,取得了不错的效果,但在严重遮挡下,即使是局部信息也包含大量的干扰噪音,且对于人物不对齐是无能为力的。(3)基于辅助特征的行人重识别方法,利用一些辅助信息如语义信息,相机信息,gan,信息增强等来增强特征信息。这种策略显著的提升了识别的准确率,但是由于引入了额外的信息,必然导致大量计算力的消耗以及最后的识别率极大程度上依赖于一阶段提取到的行人信息干净程度,存在将行人身上有判别性的细粒度特征当作干扰被归为背景信息,而导致行人关键信息的缺失。(4)基于注意力机制的行人重识别方法,有很多基于卷积操作的注意力机制可以挖掘出行人图像中最具有判别性的区域,但是由于卷积核受限于感受野和下采样导致的分辨率丢失的关系,通常只能聚焦到一个小的区域,无法解决长期依赖的问题。


技术实现思路

1、为至少一定程度上解决现有技术中存在的技术问题之一,本专利技术的目的在于提供一种特征回传的行人重识别方法、电子设备及介质。

2、本专利技术所采用的第一技术方案是:

3、一种特征回传的行人重识别方法,包括以下步骤:

4、获取输入图像,对输入图像进行特征锐化处理;

5、将处理后的图像输入训练后的行人重识别模型,输出行人重识别结果;

6、其中,所述行人重识别模型包括transformer编码器和特征回传模块;所述transformer编码器用于进行两轮训练提取行人图像的全局信息;所述特征回传模块用于对第一轮训练的浅层特征进行增强,聚合全局和局部特征并着重增强局部特征,并将特征回传网络进行第二轮训练,以补充强化缺失的详细信息。

7、进一步地,采用特征锐化模块对输入图像进行特征锐化处理;

8、所述特征锐化模块包括深度卷积层、锐化单元和多层感知块;

9、所述特征锐化模块的工作方式如下:

10、对于一张输入图像i∈rh×w×c,其中h代表高度,w代表宽度,c代表通道数,采用长和宽都为p的深度卷积层对输入图像i分别进行逐通道卷积和逐点卷积,得到图像特征i′;将图像特征i′输入锐化单元进行特征锐化,最后进行多层感知操作,公式表示如下:

11、i′=dwconv(i)

12、i″=ms(i′)

13、x=mlp(i″)

14、式中,dwconv(·)代表深度卷积层,ms(·)表示锐化单元,mlp(·)表示多层感知操作。

15、进一步地,所述锐化单元包括分组卷积层、边界增强模块和普通卷积层;

16、所述锐化单元的工作方式如下:

17、首先利用两个具有不同膨胀值的分组卷积层来提取图像特征i′的上下文特征,同时将图像特征i′传递给边界增强模块以获得边界增强特征;最后,沿着通道维度将上下文特征和边界增强特征进行连接,并利用1×1卷积层来获得增强的特征表示,以保证输出图像特征与输入大小不变,获得行人锐化图像特征x∈rh×w×c,公式表示如下:

18、

19、i″2=be(i′)

20、

21、式中,group conv(·)表示分组卷积层,表示相加,be(·)表示边界增强模块,conv(·)表示普通卷积层,表示拼接两个特征向量;i″1表示上下文特征,i″2表示边界增强特征。

22、进一步地,所述边界增强模块的工作方式如下:

23、首先利用深度卷积层将图像特征i′的局部表示进行编码,分别对每个通道中的结构信息进行增强得到特征z,并计算均值得到特征映射的平均响应;为了突出细节,从图像特征i′减去平均响应得到特征y;此外计算特征z的每个通道的空间平均值,并用softmax操作获得特征映射y每个通道的锐化因子s;将锐化因子s与特征y相乘并与特征z相加,得到锐化后的边界增强特征,公式表示如下:

24、z=dw conv(i′)

25、y=i′-c mean(z)

26、s=softmax(s mean(z))

27、

28、式中,c mean(·)表示通道维度计算均值,s mean(·)表示空间维度计算均值,softmax表示归一化操作,⊙表示相加。

29、进一步地,所述transformer编码器用于对行人特征锐化后的图像进行以下处理:

30、使用一个包含c′个长和宽都为p且步长为s卷积核个数的卷积层对输入图像特征x∈rh×w×c进行线性映射,得到n个长度为d的序列i∈1,2,...,n,其中:

31、

32、d=h*w*c

33、生成一个与序列xp长度相等的可学习的cls标记,将cls标记与序列xp组合,并通过可学习的位置编码将空间信息整合到组合中,得到输入序列z0,公本文档来自技高网...

【技术保护点】

1.一种特征回传的行人重识别方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种特征回传的行人重识别方法,其特征在于,采用特征锐化模块对输入图像进行特征锐化处理;

3.根据权利要求2所述的一种特征回传的行人重识别方法,其特征在于,所述锐化单元包括分组卷积层、边界增强模块和卷积层;

4.根据权利要求3所述的一种特征回传的行人重识别方法,其特征在于,所述边界增强模块的工作方式如下:

5.根据权利要求1所述的一种特征回传的行人重识别方法,其特征在于,所述transformer编码器用于对行人特征锐化后的图像进行以下处理:

6.根据权利要求5所述的一种特征回传的行人重识别方法,其特征在于,所述特征回传模块由三个卷积分支,一个池化分支,Squeeze-and-Excitation模块和前馈神经网络组成;

7.根据权利要求6所述的一种特征回传的行人重识别方法,其特征在于,在获得特征X′后,将特征X′进行线性映射,得到序列xP,将cls标记与序列xP组合,并通过可学习的位置编码将空间信息整合到组合中,得到输入序列z0;

8.根据权利要求1所述的一种特征回传的行人重识别方法,其特征在于,所述行人重识别模型在训练的过程中,根据分类结果使用身份损失、三元组损失和中间损失来计算总体损失,并通过反向传播优化整个模型参数。

9.根据权利要求8所述的一种特征回传的行人重识别方法,其特征在于,所述总体损失的计算方式如下:

10.一种电子设备,其特征在于,所述电子设备包括处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行,以实现如权利要求1至9任一所述的方法。

...

【技术特征摘要】

1.一种特征回传的行人重识别方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种特征回传的行人重识别方法,其特征在于,采用特征锐化模块对输入图像进行特征锐化处理;

3.根据权利要求2所述的一种特征回传的行人重识别方法,其特征在于,所述锐化单元包括分组卷积层、边界增强模块和卷积层;

4.根据权利要求3所述的一种特征回传的行人重识别方法,其特征在于,所述边界增强模块的工作方式如下:

5.根据权利要求1所述的一种特征回传的行人重识别方法,其特征在于,所述transformer编码器用于对行人特征锐化后的图像进行以下处理:

6.根据权利要求5所述的一种特征回传的行人重识别方法,其特征在于,所述特征回传模块由三个卷积分支,一个池化分支,squeeze-and-excitation模块和前馈神经网络组成;

...

【专利技术属性】
技术研发人员:曹晓利梁亚玲
申请(专利权)人:华南理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1