System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术属于监控视频检索,具体涉及一种行人重识别方法、设备及介质。
技术介绍
1、行人重识别旨在从由多个不同的摄像头捕获的大型行人图库中检索出与给定查询图像相匹配的目标行人。随着社会对公共安全需求的日益增长,行人重识别被广泛应用于视频监控、刑事调查、智慧城市建设等多个领域。
2、目前,大多数现有的行人重识别方法主要集中在提高检索准确性上,往往忽视了模型计算效率的重要性。具体而言,这些方法在推理过程中通常没有区分查询的难易程度,而是对所有查询采用相同的网络处理,并使用统一的特征进行检索。这种做法可能会导致在处理困难查询时准确性不足,或者在处理简单查询时浪费不必要的计算资源。我们经过实验发现,不同查询的检索难易程度往往并不相同:一些查询图像具有明显的判别性视觉特征,使用全局特征即可获得较为精准的检索结果。对于这些简单查询,过度依赖细粒度特征可能会导致错误匹配,因为不同行人可能在某些身体部位上具有非常相似的外观,并非所有部位特征都具有判别性。相反,对于一些困难查询,例如由于遮挡、姿态变化或类间差异小而导致识别较为困难的行人图像,则需要细粒度的部分特征来支持进行更精细的匹配。
3、此外,在提取细粒度部分特征时,现有行人重识别方法仍存在一定局限性:一些方法通过引入姿态估计或人体解析模型等外部模型来提取部分特征,但此类方法的性能高度依赖外部模型的准确性,并增加了推理阶段的计算成本;另一些方法将空间相邻的图像块或像素划分为一组来学习部位特征,但未充分考虑人体拓扑先验知识,从而导致部分定位不准确。
4、综上
技术实现思路
1、本专利技术目的在于提供一种行人重识别方法、设备和介质,具体技术方案如下:
2、一种行人重识别方法,包括如下步骤:
3、构建用于实现行人图像重识别的行人重识别算法,包括粗推理阶段、早退策略和细推理阶段。所述粗推理阶段和细推理阶段分别用于提取不同粒度的特征,所述早退策略用于判断查询图像的难易程度,从而决定该查询图像是否进入细推理阶段;
4、训练所述行人重识别算法,对粗推理阶段和细推理阶段进行联合训练,得到行人重识别模型;
5、将待查询的行人图像输入到行人重识别模型中,与图库中的图像进行匹配,以检索图库中的目标行人。
6、可选的,所述粗推理阶段包括粗粒度特征提取,过程如下:
7、将行人图像分割成多个大小固定的块;
8、将所有块展平并通过线性投影函数进行映射,得到块嵌入;
9、在每个块嵌入的前端加入可学习的标记、位置编码嵌入和相机嵌入,得到输入序列;
10、调用编码器处理输入序列,得到全局特征和块特征。
11、可选的,所述早退策略的过程如下:
12、计算全局特征和每个块特征之间的余弦相似度,得到一组相似度得分;
13、对相似度得分进行降序排序,并计算相似度得分的一阶差分,得到一组相似度一阶差分值;
14、以相似度一阶差分值中最大值的下标索引作为分割点,分割点前的块特征视为身体区域,分割点后的块特征视为背景或遮挡区域;
15、设定一个早退阈值,通过阈值判断当前查询图像中包含的属于身体区域的块数量是否可以支持高置信度检索。若当前查询图像中包含足够数量的可见身体区域,则被视为“简单”查询,提前终止后续推理,无需进入计算密集的细推理阶段;否则,为“困难”查询,需要送入细推理阶段提取细粒度部分特征以进行更精细化的检索。
16、可选的,所述细推理阶段遵循混合专家模型的范式,由一个块-部分路由网络和一组部分专家模块组成;
17、块-部分路由网络:
18、计算每个块属于背景或者各个身体部分类别的概率,并融合各个身体部分类别的概率,得到行人前景概率;
19、采取软路由机制,根据得到的概率分布对块特征进行概率加权平均池化,得到一个行人前景特征、一个背景特征、多个身体部分特征;
20、部分专家模块:
21、对身体部分特征采用一维卷积进行不同特征通道间信息的交互,得到第一部分特征;
22、使用多头交叉注意力机制进一步处理,由第一部分特征导出查询矩阵,由前景特征导出键矩阵和值矩阵。根据查询矩阵、键矩阵和值矩阵计算多头交叉注意力;
23、调用全连接层和层归一化,得到新部分特征,所述新部分特征与身体部分特征的维度相同。
24、为了进一步降低计算成本以及更有效地应对背景/遮挡噪声,在推理时基于块-部分路由网络输出的概率分布生成二值化的部分可见性路由权重。当身体部分的可见性路由权重为1时,则在推理时激活对应的部分专家模块;否则,推理时不激活对应的部分专家模块。
25、可选的,训练所述行人重识别算法的过程中,所有的训练图像均经过粗推理阶段和细推理阶段,实现粗推理阶段和细推理阶段的联合训练,细推理阶段中所有的部分专家模块均被激活并参与训练。
26、可选的,训练的总损失包括粗推理阶段损失以及细推理阶段的路由损失和部分专家损失,总损失的表达式如下:
27、;
28、;
29、;
30、;
31、其中,表示粗推理阶段损失,表示路由损失,表示专家损失;表示id损失,表示全局特征;表示交叉熵损失,表示前景特征,表示拼接个身体部分特征后得到的特征,分别表示个身体部分特征,表示带有标签平滑的交叉熵损失,表示的权重参数,表示分离损失函数;表示第个新部分特征,分别表示个新部分特征,表示三元组损失。
32、可选的,两阶段动态检索机制根据查询图像的难易程度动态地选择检索特征的粒度并调整网络处理流程,包括粗推理阶段和细推理阶段。
33、可选的,对于粗推理阶段,直接使用全局特征的欧氏距离来衡量查询和图库样本的相似度。
34、可选的,对于细推理阶段,采用部分-部分匹配策略来衡量查询和图库样本之间的相似度,所述部分与部分匹配策略的过程如下:
35、计算前景特征的距离以及采用身体部分的可见性路由权重值计算的所有身体部分特征之间的距离,得到第一距离;
36、采用身体部分的可见性路由权重值计算所有新部分特征之间的距离,得到第二距离;
37、在细推理阶段中,查询和图库样本之间的距离为第一距离与第二距离之和。
38、另外,一种计算机设备,包括存储器和处理器;
39、所述存储器用于存储可在处理器上运行的计算机程序;
40、所述处理器用于执行所述计算机程序时实现如上述的行人重识别方法的步骤。
41、另外,一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上述的行人重识别方法的步骤。
42、应用本专利技术的技术方案,具有以下有益效果:
43、本专利技术提出了一种行本文档来自技高网...
【技术保护点】
1.一种行人重识别方法,其特征在于,包括如下步骤:
2.根据权利要求1所述的行人重识别方法,其特征在于,所述粗推理阶段包括粗粒度特征提取,过程如下:
3.根据权利要求1所述的行人重识别方法,其特征在于,所述早退策略的过程如下:
4.根据权利要求1所述的行人重识别方法,其特征在于,所述细推理阶段遵循混合专家模型的范式,包括一个块-部分路由网络和一组部分专家模块;
5.根据权利要求1所述的行人重识别方法,其特征在于,训练所述行人重识别算法的过程中,所有的训练图像均经过粗推理阶段和细推理阶段,实现粗推理阶段和细推理阶段的联合训练,细推理阶段中所有的部分专家模块均被激活并参与训练。
6.根据权利要求1所述的行人重识别方法,其特征在于,训练的总损失包括粗推理阶段损失以及细推理阶段的路由损失和部分专家损失,总损失的表达式如下:
7.根据权利要求1所述的行人重识别方法,其特征在于,两阶段动态检索机制根据查询图像的难易程度动态地选择检索特征的粒度并调整网络处理流程,包括粗推理阶段和细推理阶段。
8.根据权利要求7
9.一种计算机设备,其特征在于,包括存储器和处理器;
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至8中任一项所述的行人重识别方法的步骤。
...【技术特征摘要】
1.一种行人重识别方法,其特征在于,包括如下步骤:
2.根据权利要求1所述的行人重识别方法,其特征在于,所述粗推理阶段包括粗粒度特征提取,过程如下:
3.根据权利要求1所述的行人重识别方法,其特征在于,所述早退策略的过程如下:
4.根据权利要求1所述的行人重识别方法,其特征在于,所述细推理阶段遵循混合专家模型的范式,包括一个块-部分路由网络和一组部分专家模块;
5.根据权利要求1所述的行人重识别方法,其特征在于,训练所述行人重识别算法的过程中,所有的训练图像均经过粗推理阶段和细推理阶段,实现粗推理阶段和细推理阶段的联合训练,细推理阶段中所有的部分专家模块均被激活并参与训练。
6.根据权利要求1所述的行人重识...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。