本发明专利技术提供了一种基于核分块注意力机制的马拉松场景人群运动追踪方法,包括以下步骤:S1.基本模型搭建,基本模型包含特征模板、高斯混合模型和运动趋势预测算法三个部分;S2.建立核分块注意力机制模块;S3.使用核分块注意力机制模块改进基本模型。本发明专利技术方法通过核分块注意力机制能从视频帧的特征图中提取更有用的语义特征,核分块注意力机制模块通过对作为卷积核的对比向量进行分块处理,从而能在注意力运算中提取更多有效的局部特征信息;此外,把局部特征与全局特征融合起来,从而提高提取特征的质量,生成更高质量的特征图;然后,高斯混合模块则可以通过这些特征图更准确地识别出马拉松每个参赛者的位置,从而提高运动轨迹预测的精准度。动轨迹预测的精准度。动轨迹预测的精准度。
【技术实现步骤摘要】
基于核分块注意力机制的马拉松场景人群运动追踪方法
[0001]本专利技术涉及计算机视觉领域,特别地涉及一种基于核分块注意力机制的马拉松场景人群运动追踪方法。
技术介绍
[0002]在马拉松比赛场景下,为了防止大量参赛者碰撞等事故的发生,对处于密集人群中的参数者进行运动位置追踪与运动趋势预测是很有必要。由于在密集人群场景中,每个目标个体在视频帧中所占面积非常小,为了能更好地提取每个目标个体的特征,需要使用有效的密集人群运动追踪算法去提取每个目标个体的特征并检测出其位置。更仔细地说,很多密集人群运动追踪算法的主要流程是从视频帧中提取出密集人群特征,从中识别出每个目标个体所在的位置;当每个视频帧的目标个体的位置都被检测后,则可以从连续的视频序列数据中预测每个目标个体的运动趋势。
[0003]为了解决相似的密集人群运动追踪问题,有很多能达到高精准度的算法与模型已被提出。为了能有效检测到目标位置,除了一部分可用于提取目标边界与轮廓等低级特征的方法,还有善于获取语义信息与时序信息等高级特征的方法被提出。但是,由于马拉松比赛场景下的人群密度大,仅仅依靠提取人群个体的传统特征不能把每个目标个体都准确地检测出来。另一方面,虽然具有强大特征学习能力的深度学习模型也被应用于密集人群运动追踪问题中,但其复杂的模型结构导致其需花费一定时间去完成特征提取操作。由于在实际应用中,运动追踪算法需要在数据处理中达到实时处理的效果,所以耗费运算时间的深度学习模型并不适用于需要实时处理的马拉松参赛者运动追踪实际应用中。
[0004]由于具有强大的特征提取能力,注意力机制(Attention Mechanism)被广泛用于特征提取操作。因此,本专利技术通过用注意力机制改进人群运动追踪算法,从而使其在马拉松场景中,即使是人群密度大,参赛者数量多的情况中,也能从中获取更多目标个体的特征,从而把人群中的目标个体位置检测出来。本专利技术提出核分块注意力机制模块去从包含马拉松参数者场景的视频数据中获取不同的语义信息,并把包含局部信息与全局信息的特征都结合起来,从而产生更精确的特征。为了实现这个算法,本专利技术采用一个适用于密集人群运动追踪的算法框架为基本模型。该基本模型中主要由特征模板、高斯混合模型和运动趋势预测算法这三部分构成,通过把本专利技术提出的核分块注意力机制加入到该模型中,可提取更高质量的语义特征,进而提高马拉松场景人群运动追踪的精度,便于预测其运动轨迹。
技术实现思路
[0005]本专利技术提供了一种基于核分块注意力机制的马拉松场景人群运动追踪方法,在马拉松场景中能提高运动趋势预测的准确度;包含核分块注意力机制模块的新模型的准确度高于不包含该核分块注意力机制模块的模型的准确度。
[0006]本专利技术的技术方案如下:
[0007]本专利技术的基于核分块注意力机制的马拉松场景人群运动追踪方法,包括以下步
骤:S1.基本模型搭建,基本模型包含特征模板、高斯混合模型和运动趋势预测算法三个部分;S2.建立核分块注意力机制模块;S3.使用核分块注意力机制模块改进基本模型。
[0008]优选地,在上述基于核分块注意力机制的马拉松场景人群运动追踪方法中,在步骤S1中,选取一个高效的密集人群运动追踪算法模型作为基本模型,基本模型包含用于提取特征的特征模板、高斯混合模型和运动趋势预测算法三个部分。
[0009]优选地,在上述基于核分块注意力机制的马拉松场景人群运动追踪方法中,在步骤S2中,核分块注意力机制模块从视频特征图中提取不同的局部信息特征,并把局部信息特征与全局信息特征相融合,从而提取包含不同语义信息的高质量特征图。
[0010]优选地,在上述基于核分块注意力机制的马拉松场景人群运动追踪方法中,在步骤S2中,在核分块注意力机制模块中,作为对比向量的卷积核会通过卷积操作的形式完成注意力特征提取,通过对卷积核进行分块处理,使得分块后的卷积核包含局部特征并分别与视频帧对应的特征图进行注意力机制运算,从而更有效地提取更多局部特征信息。
[0011]优选地,在上述基于核分块注意力机制的马拉松场景人群运动追踪方法中,在步骤S2中,特征模板会对被输入视频帧进行特征提取操作,生成特征图F1,特征图F1会被输入至核分块注意力机制模块中获取更多局部信息。
[0012]优选地,在上述基于核分块注意力机制的马拉松场景人群运动追踪方法中,在步骤S2中,在核分块注意力机制模块中,从特征图F1中截取的特定区域特征R1会被作为卷积核,R1会被平均分成一个小区域块,分别为r1、r2、r3、r4,这些小区域块会在不同注意力操作分支中分别和F1进行卷积操作,从而提取不同的局部特征;在注意力操作分支A、注意力操作分支B、注意力操作分支C和注意力操作分支D中,特征图F1分别与小区域块r1、r2、r3、r4进行卷积操作,其卷积计算结果均被进行归一化处理,从而分别生成特征图F2、F3、F4、F5;随后,特征图F2、F3、F4、F5会进行特征融合,其实现公式如下:
[0013]F6=F2+F3+F4+F5[0014]其中,F6是对F2、F3、F4、F5进行特征融合后的特征图,随后,对特征图F6与特征图F1进行特征融合操作,其实现公式如下:
[0015]F7=F1*α1+F6*β1[0016]其中,F7是对F1与F6进行特征融合后的特征图,α1与β1表示加权平均运算公式中的系数且α1+β1=1,随后,使用特征图F1进一步对特征图F7进行优化,实现公式如下:
[0017]F8=F1*α2+F7*β2[0018]其中,F8是使用F1对F6进行特征优化后的特征图,α
2
与β2表示加权平均运算公式中的系数且α2+β2=1;
[0019]最后,特征图F8会被输入高斯混合模块进而检测每个参赛者的位置。
[0020]优选地,在上述基于核分块注意力机制的马拉松场景人群运动追踪方法中,在步骤S3中,核分块注意力机制模块加入到基本模型的特征提取算法中,从而在特征提取阶段能提取包含不同语义信息的特征。
[0021]根据本专利技术的技术方案,产生的有益效果是:
[0022]本专利技术提出一个新的核分块注意力机制模块,通过核分块注意力机制模块能从视频帧的特征图中提取更有用的语义特征。此外,本专利技术把局部特征与全局特征融合起来,从而提高提取特征的质量,生成更高质量的特征图;然后,高斯混合模型则可以通过这些特征
图更准确地识别出马拉松每个参赛者的位置,从而提高运动轨迹预测的精准度。实验证明,包含核分块注意力机制模块的新模型的准确度高于不包含该模块的模型的准确度。
[0023]另一方面,相比于具备复杂运算规模且耗时的深度学习模型,本专利技术在视频数据处理的过程中,能快速计算出结果,甚至能达到实时处理的效果。因此,从实际应用产品研发的角度出发,本专利技术更适合使用于马拉松场景人群运动追踪的实际产品中。
[0024]为了更好地理解和说明本专利技术的构思、工作原理和专利技术效果,下面结合附图,通过具体实施例,对本专利技术进行详细说明如下:
附图说本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种基于核分块注意力机制的马拉松场景人群运动追踪方法,其特征在于,包括以下步骤:S1.基本模型搭建,所述基本模型包含特征模板、高斯混合模型和运动趋势预测算法三个部分;S2.建立核分块注意力机制模块;S3.使用所述核分块注意力机制模块改进基本模型。2.根据权利要求1所述的基于核分块注意力机制的马拉松场景人群运动追踪方法,其特征在于,在步骤S1中,选取一个高效的密集人群运动追踪算法作为基本模型,所述基本模型包含用于提取特征的特征模板、高斯混合模型和运动趋势预测算法三个部分。3.根据权利要求1所述的基于核分块注意力机制的马拉松场景人群运动追踪方法,其特征在于,在步骤S2中,所述核分块注意力机制模块从视频特征图中提取不同的局部信息特征,并把所述局部信息特征与全局信息特征相融合,从而提取包含不同语义信息的高质量特征图。4.根据权利要求1所述的基于核分块注意力机制的马拉松场景人群运动追踪方法,其特征在于,在步骤S2中,在所述核分块注意力机制模块中,作为对比向量的卷积核会通过卷积操作的形式完成注意力特征提取,通过对卷积核进行分块处理,使得分块后的卷积核包含局部特征并分别与视频帧对应的特征图进行注意力机制运算,从而更有效地提取更多局部特征信息。5.根据权利要求1所述的基于核分块注意力机制的马拉松场景人群运动追踪方法,其特征在于,在步骤S2中,所述特征模板会对被输入视频帧进行特征提取操作,生成特征图F1,所述特征图F1会被输入至所述核分块注意力机制模块中获取更多局部信息。6.根据权利要求1所述的基于核分块注意力机制的马拉松场景人...
【专利技术属性】
技术研发人员:黎俊良,张世雄,魏文应,陶键源,张伟民,肖铁军,
申请(专利权)人:深圳龙岗智能视听研究院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。