当前位置: 首页 > 专利查询>广西科学院专利>正文

一种复杂背景下的运动小目标跟踪方法及系统技术方案

技术编号:38143789 阅读:12 留言:0更新日期:2023-07-08 10:00
本发明专利技术公开了一种复杂背景下的运动小目标跟踪方法及系统,跟踪方法包括获取待跟踪小目标的视频段,将视频段转化为一帧一帧的图像序列;采用尺度自适应残差神经网络对每一帧图像进行特征粗提取,之后采用Transformer对粗提取特征进行多尺度和细粒度特征提取,得到细粒度特征;采用Transformer和多层感知机对细粒度特征中的小目标进行检测,得到细粒度特征中所有小目标的类别和检测框;计算相邻两帧图像中同一类别小目标的检测框之间的相似度,基于相似度确定每帧图像中的跟踪目标。于相似度确定每帧图像中的跟踪目标。于相似度确定每帧图像中的跟踪目标。

【技术实现步骤摘要】
一种复杂背景下的运动小目标跟踪方法及系统


[0001]本专利技术涉及物体跟踪技术,具体涉及一种复杂背景下的运动小目标跟踪方法及系统。

技术介绍

[0002]运动的小目标物体在我们的日常生活中随处可见,比如当前高楼层小区中的高空抛物现象时有发生。通常运动的小目标物体具有旋转、形变、背景干扰、光线变化、遮挡、低分辨率等特点。近年来,随着深度学习技术的不断发展进步,在计算机视觉领域取得了不断的突破,在许多领域得到了应用,计算机视觉的主要任务是使计算机具有一双跟人一样的眼睛。而对图像中小目标物体进行检测和跟踪是一个难点问题。
[0003]当前,随着深度学习的迅速发展,在目标检测领域取得了重大突破,但是检测和跟踪小目标物体仍然存在着很大的不足。现有的运动小目标物体检测和跟踪算法还不能很好的满足在实际的复杂场景中的应用,主要存在如下问题:
[0004]1、小目标物体跟踪的难点在于目标的特征不明显,可利用的特征信息较少,若是图像本身分辨率不高的情况下,小目标通常仅有几个像素,特征不明显。
[0005]2、复杂的背景干扰问题,复杂环境下的运动小目标检测和跟踪会受到光照、遮挡等因素的影响,因此难以将目标与背景或相似物体分割开来,有效实现对小目标的检测和跟踪。

技术实现思路

[0006]针对现有技术中的上述不足,本专利技术提供的一种复杂背景下的运动小目标跟踪方法及系统解决了现有技术不能对复杂场景下的小目标精准识别的问题。
[0007]为了达到上述专利技术目的,本专利技术采用的技术方案为:<br/>[0008]第一方面,提供一种复杂背景下的运动小目标跟踪方法,其包括以下步骤:
[0009]S1、获取待跟踪小目标的视频段,将视频段转化为一帧一帧的图像序列;
[0010]S2、采用尺度自适应残差神经网络对每一帧图像进行特征粗提取,之后采用Transformer对粗提取特征进行多尺度和细粒度特征提取,得到细粒度特征;
[0011]S3、采用Transformer和多层感知机对细粒度特征中的小目标进行检测,得到细粒度特征中所有小目标的类别和检测框;
[0012]S4、计算相邻两帧图像中同一类别小目标的检测框之间的相似度,基于相似度确定每帧图像中的跟踪目标。
[0013]本专利技术的有益效果为:本方案通过残差神经网络超强的特征提取能力和Transformer的逐像素级的提取图像中的特征,可以有效的提取小目标的特征信息,多层感知机进行编码、解码,得以准确的获取到目标的位置信息,可以更为精准的跟踪到移动中的小目标物体,实现复杂背景下的运动小目标的实时跟踪。
[0014]进一步地,所述尺度自适应残差神经网络的残差块中的卷积核采用1*3和3*1的卷
积核。使用更小的卷积核进行卷积操作时候,可以逐像素级的对图像中的小目标进行特征提取,提取的特征更有针对性,且参数量有所减少。
[0015]进一步地,粗提取和提取细粒度特征的计算公式分别为:
[0016]y=SA

Resnet(p
n
+bias)+X
[0017]Q=w*transformer(y,θ)+b
[0018]其中,y为粗提取后的特征;SA

Resnet(
·
)为尺度自适应残差运算,bias为动态的自适应算子;X为卷积核对特征图进行采样的区域;Q为细粒度特征;w为自适应权重值;transformer(
·
)为将视频片段p中获取运动小目标出现在每一帧的图片集,之后再通过卷积算子将图片集的图片逐一做特征变换;θ为Transformer模型的可学习的权重参数;b为网络的偏置项。
[0019]上述技术方案的有益效果为:本方案通过改进提出了一种尺度自适应的残差神经网络,在特征提取能力提升的基础上,网络模型的参数量减少了,并且逐像素级别的提取图像中的特征,在特征粗提取时就提取了图像中丰富的特征,便于后续的编码和解码,获取到小目标物体的定位信息。
[0020]进一步地,所述步骤S3进一步包括:
[0021]S31、采用Transformer编码器中的多头注意力机制对细粒度特征进行编码:
[0022][0023]multi

Head(q,k,v)=Concat(head1,......,head
i
)*W
i
[0024][0025]其中,Q为细粒度特征,q为编码时的查询向量;k为键,v为多头注意力计算的值,分别为键对应的权重值;self

attention(
·
)为自注意力计算,head
i
为一个子空间;n为子空间的总数量;multi

Head(
·
)表示将多头进行合并;W
i
为模型的权值;w
i
为查询向量的权重值,q
transpose
为查询向量的转置;k
transpose
为查询键的矩阵转置,v
transpose
为查询的向量值的转置;
[0026]S32、采用过transformer解码器中的多头注意力机制对查询到图像中实体进行解码;
[0027]S33、采用多层感知机对解码器的输出进行映射,得到图像中所有小目标的类别和检测框:
[0028]class,box
m
=w1*(decoder(encoder(multi

Head(q,k,v))))+b1[0029]其中,class为物体类别;box
n
为小目标物体的检测框;w1为多层感知机的权重;encoder(.)为编码,decoder(.)为解码,b1为偏置项。
[0030]上述技术方案的有益效果为:本方案通过改进提出了一种多头自注意力网络模型,通过在编码和解码时引入自注意力模型,通过获取多个子空间的特征信息,再将多个子空间的特征进行融合,最终获取到小目标物体的准确类别和位置信息。
[0031]进一步地,相似度的计算公式为:
[0032]A=Jaccard_SIM(box
n
,box
n
‑1,T
n
)
[0033]其中,A为相似度;Jaccard_SIM(.)为相似度计算函数;box
n
和box
n
‑1分别为第n帧
和第n

1帧图像中的小目标物体的检测框;T
n
=(t1,t2,...,t
n
)为视频段的时间序列。
[0034]进一步地,运动小目标跟踪方法还包括对运动中小目标物体的实时跟踪结果,实时发出预警信息。
[0035]第二方面,本方案提供一种运动小目标跟踪系统,其包括:
[0036]视频获取模块,用于获取待跟踪小目标的视频段,将视本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种复杂背景下的运动小目标跟踪方法,其特征在于,包括以下步骤:S1、获取待跟踪小目标的视频段,将视频段转化为一帧一帧的图像序列;S2、采用尺度自适应残差神经网络对每一帧图像进行特征粗提取,之后采用Transformer对粗提取特征进行多尺度和细粒度特征提取,得到细粒度特征;S3、采用Transformer和多层感知机对细粒度特征中的小目标进行检测,得到细粒度特征中所有小目标的类别和检测框;S4、计算相邻两帧图像中同一类别小目标的检测框之间的相似度,基于相似度确定每帧图像中的跟踪目标。2.根据权利要求1所述的运动小目标跟踪方法,其特征在于,所述尺度自适应残差神经网络的残差块中的卷积核采用1*3和3*1的卷积核。3.根据权利要求2所述的运动小目标跟踪方法,其特征在于,粗提取和提取细粒度特征的计算公式分别为:y=SA

Resnet(p
n
+bias)+XQ=w*transformer(y,θ)+b其中,y为粗提取后的特征;SA

Resnet(
·
)为尺度自适应残差运算,bias为动态的自适应算子;X为卷积核对特征图进行采样的区域;Q为细粒度特征;w为自适应权重值;transformer(
·
)为将视频片段p中获取运动小目标出现在每一帧的图片集,之后再通过卷积算子将图片集的图片逐一做特征变换;θ为Transformer模型的可学习的权重参数;b为网络的偏置项。4.根据权利要求1所述的运动小目标跟踪方法,其特征在于,所述步骤S3进一步包括:S31、采用Transformer编码器中的多头注意力机制对细粒度特征进行编码:multi

Head(q,k,v)=Concat(head1,
……
,head
i
)*W
i
其中,Q为细粒度特征,q为编码时的查询向量;k为键,v为多头注意力计算的值,分别为键对应的权重值;self

attention(
·
)为自注意力计算,head
i
为一个子空间;n为子空间的总数量;multi

Head(
·
)表示将多头进行合并;W
i
为模型的权值;w
i
为...

【专利技术属性】
技术研发人员:蒋建辉覃晓元昌安杨晓东唐沫岚陈必泉
申请(专利权)人:广西科学院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1