一种基于双尺寸注意力机制的人群过马路运动追踪方法技术

技术编号：34537372 阅读：44 留言：0更新日期：2022-08-13 21:32

本发明专利技术的基于双尺寸注意力机制的人群过马路运动追踪方法，包括以下步骤：S1.基本模型搭建；S2.建立双尺寸注意力机制模块；以及S3.使用双尺寸注意力机制模块改进基本模型。通过使用双尺寸注意力机制模块，针对人群过马路的场景，本发明专利技术能从视频数据中获取包含不同语义信息的全局与局部特征，从而提高人群过马路的运动趋势预测的准确度。此外，本发明专利技术的方法与目前深度学习的算法相比，能大大减少视频数据处理的时间，甚至能达到实时输出的效果；相反，深度学习模型的运算量较大，需花费比较长时间去处理视觉数据。所以，从工业产品落地的角度考虑，本发明专利技术更适合使用于人群过马路运动追踪的算法产品中。的算法产品中。的算法产品中。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于双尺寸注意力机制的人群过马路运动追踪方法

[0001]本专利技术涉及计算机视觉领域，特别地，涉及一种基于双尺寸注意力机制的人群过马路运动追踪方法。

技术介绍

[0002]在计算机视觉领域中，密集人群运动追踪是目标追踪任务的一个重要分支；而对人群过马路的场景下对人群的运动趋势进行预测和追踪，更是有利于防止交通事故的发生。在很多密集人群运动追踪的算法中，其主要的算法流程是从含有密集人群的视频帧中提取相应的特征，再从这些特征中检测出每个目标个体的大概位置。然后，在一段连续视频序列中，识别出每个目标个体的位置变化，就可以把每个目标个体的运动趋势预测出来。
[0003]目前，针对人群运动追踪这个问题，已有不少算法和模型被提出去提高人群运动追踪的准确度。一部分算法在视频帧中提取目标的颜色与轮廓等低级特征，从而用于确定目标在该视频帧中的位置；此外，还有一些算法与模型通过提取视频帧的语义信息和视频序列的时序信息等高级特征来检测出目标在视频中的位置。然而，现有技术存在的主要问题是：在过马路场景中，过马路人群的密度不断增加，仅仅依靠以上算法与模型去提取视频序列中的传统特征不足以在高密度人群场景下精确地检测每个目标的位置。因此，随着具有强大特征提取能力的深度学习模型被广泛应用于计算机视觉领域，也有一部分基于深度学习模型的算法被提出并用于密集人群运动追踪任务。
[0004]而解决上述问题的难度为：虽然深度学习模型具有很强的特征学习与提取能力，但由于它复杂的模型结构导致其在视频数据特征提取上需要花费一定的时间去完成。在...

【技术保护点】

【技术特征摘要】
1.一种基于双尺寸注意力机制的人群过马路运动追踪方法，其特征在于，包括以下步骤：S1.基本模型搭建；S2.建立双尺寸注意力机制模块；以及S3.使用所述双尺寸注意力机制模块改进所述基本模型。2.根据权利要求1所述的基于双尺寸注意力机制的人群过马路运动追踪方法，其特征在于，在步骤S1中，把包含特征模板、高斯混合模型和运动趋势预测算法的所述基本模型应用于人群过马路运动追踪的实际问题中。3.根据权利要求1所述的基于双尺寸注意力机制的人群过马路运动追踪方法，其特征在于，在步骤S1中，通过选取一个运算量不大的密集人群运动追踪框架作为基本模型，在人群过马路场景的实际应用中，对视频数据达到实时、低延时处理的效果。4.根据权利要求1所述的基于双尺寸注意力机制的人群过马路运动追踪方法，其特征在于，在步骤S2中，所述双尺寸注意力机制模块包含两次注意力机制运算以进行语义信息提取，在每次注意力运算中，都采用不同尺寸的特征向量去获取目标个体的特征，以这样的方式获取不同语义信息并把包含不同语义信息的全局特征与局部特征都融合优化生成更高质量特征。5.根据权利要求1所述的基于双尺寸注意力机制的人群过马路运动追踪方法，其特征在于，在步骤S2中，所述双尺寸注意力机制模块的算法为：首先，视频帧被特征模板提取特征后会生成特征图F1；所述特征图F1会被送至两个不同的注意力机制分支：注意力机制分支A和注意力机制分支B；假设所述特征图F1在所述注意力机制分支A上选中区域特征R1的特征的大小为h
11
，则其在所述...

【专利技术属性】
技术研发人员：黎俊良，张世雄，魏文应，陶键源，
申请(专利权)人：深圳龙岗智能视听研究院，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人