System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 基于时空域的长时目标跟踪方法技术_技高网

基于时空域的长时目标跟踪方法技术

技术编号:40030656 阅读:11 留言:0更新日期:2024-01-16 18:11
本发明专利技术提供了基于时空域的长时目标跟踪方法,包括以下步骤:S1:特征提取;S2:姿态估计;S3:位置估计;S4:Head模块建立以及特征信息输出:将搜索的位置信息与估算的位置信息送入Head模块进行结合,结合主干网络计算的目标特征对目标的边界框、类别、是否可见等信息进行计算;S5:位置锁定;本发明专利技术通过主干网络计算目标特征,结合时间域的前n帧信息对目标姿态进行估计,通过目标特征以及姿态信息在当前帧搜索目标位置以及边界框,并结合前n帧目标的位置信息估算出当前帧目标可能得位置,将搜索的位置信息与估算的位置信息进行结合,从而精确估计目标位置信息,避免多个相似目标存在时出现跟踪混乱,提高了跟踪算法的性能,可实现长时间目标跟踪。

【技术实现步骤摘要】

本专利技术主要涉及计算机视觉,具体涉及基于时空域的长时目标跟踪方法


技术介绍

1、随着深度神经网络的发展,对目标运动或者摄像头运动的智能分析需求也显著增加。各种跟踪算法层出不穷,如基于检测的目标跟踪方法、基于图神经网络的跟踪方法、基于孪生网络的跟踪方法等。这些算法不断优化,使得目标跟踪的精度和稳定性不断提高。

2、而现有基于孪生网络的跟踪方法具有一定不足之处,如复杂环境下,基于孪生网络的目标跟踪方法中分类子网络由于网络结构设计不合理或者特征提取部分能力不强,导致输出分类信息不可信,孪生网络容易跟踪到相似目标而错过正确目标的问题,导致导致跟踪失败。


技术实现思路

1、本专利技术主要提供了基于时空域的长时目标跟踪方法用以解决上述
技术介绍
中提出的技术问题。

2、本专利技术解决上述技术问题采用的技术方案为:

3、基于时空域的长时目标跟踪方法,包括以下步骤:

4、s1:特征提取:使用resnet作为主干网络提取目标的多尺度特征;

5、s2:姿态估计:结合前n帧目标时间域信息特征,预测出当前帧目标姿态,以便与当前帧进行匹配;

6、s3:位置估计:结合前n帧的目标位置信息以及时间信息,通过神经网络学习目标运动模式,然后对下一帧的目标位置进行预测;

7、s4:head模块建立以及特征信息输出:将搜索的位置信息与估算的位置信息送入head模块进行结合,结合主干网络计算的目标特征对目标的边界框、类别、是否可见等信息进行计算;

8、s5:位置锁定:根据目标的模版信息在图像中对目标进行搜索,从而精确估计目标位置信息。

9、进一步的,在本专利技术中,所述s1过程中,特征提取得出特征图,特征图具有残差结构,所述残差结构如下式所示:

10、xl+1=xl+f(xl,wl);

11、其中xl表示第l层特征,f(xl,wl)表示为含有卷积层的block,其卷积核大小为5x5。

12、进一步的,在本专利技术中,所述s2过程中,预测姿态估计特征的公式为:

13、

14、其中表示第n帧的预测姿态估计特征,z_fetatn-1表示第n-1帧的主干网络计算的特征,vtn表示第n帧中目标在图中的是否可见的标志位,δt表示第n帧与n-1帧之间的时间间隔,表示是含有卷积层的特征拟合函数。

15、进一步的,在本专利技术中,所述s3过程中,位置估计的表达式为:

16、

17、其中,表示第t帧估计的目标位置特征图,loct-1表示第t-1帧目标的真实位置,clst-1表示第t-1帧目标对应的类别信息,feat4t表示第t帧主干网络提取的特征图,δt为第t帧与第t-1帧的时间差,函数g(·)表示函数lstm模块的卷积层,可以结合目标历史运动信息推算出最新目标位置。

18、进一步的,在本专利技术中,所述s4和s5过程中,目标类别记作cls,head模块中计算目标类别的表达式为:

19、cls=f(x)cls*f(z)cls;

20、其中,f(z)、f(x)分别表示要查找的目标特征以及搜索图像的特征。

21、进一步的,在本专利技术中,所述s4和s5过程中,目标边界框记作loc,head模块中计算目标边界框的表达式为:

22、loc=h(f(x)loc*f(z)loc,pos_feat);

23、其中,pos_feat表示通过前n帧目标位置信息预测的目标位置信息,h(·)表示含有卷积层的表示式,head模块中用于计算目标位置边界框。

24、进一步的,在本专利技术中,所述s4和s5过程中,目标是否可见的表达式:

25、vis=v(x);

26、v(·)用于计算目标是否可见的卷积层模块。

27、与现有技术相比,本专利技术的有益效果为:

28、本专利技术通过主干网络计算目标特征,结合时间域的前n帧信息对目标姿态进行估计,通过目标特征以及姿态信息在当前帧搜索目标位置以及边界框,并结合前n帧目标的位置信息估算出当前帧目标可能得位置,将搜索的位置信息与估算的位置信息进行结合,从而精确估计目标位置信息,避免多个相似目标存在时出现跟踪混乱,提高了跟踪算法的性能,可实现长时间目标跟踪;

29、同时通过准确跟踪视频或者监控中的目标信息,可以有效地进行安防以及交通指导等;此外,还可以实现监控中的人或者物的自动查找,快速锁定目标,具有广泛的应用价值。

30、以下将结合附图与具体的实施例对本专利技术进行详细的解释说明。

本文档来自技高网...

【技术保护点】

1.基于时空域的长时目标跟踪方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的基于时空域的长时目标跟踪方法,其特征在于,所述S1过程中,特征提取得出特征图,特征图具有残差结构,所述残差结构如下式所示:

3.根据权利要求1所述的基于时空域的长时目标跟踪方法,其特征在于,所述S2过程中,预测姿态估计特征的公式为:

4.根据权利要求1所述的基于时空域的长时目标跟踪方法,其特征在于,所述S3过程中,位置估计的表达式为:

5.根据权利要求1所述的基于时空域的长时目标跟踪方法,其特征在于,所述S4和S5过程中,目标类别记作Cls,Head模块中计算目标类别的表达式为:

6.根据权利要求5所述的基于时空域的长时目标跟踪方法,其特征在于,所述S5和S5过程中,目标边界框记作Loc,Head模块中计算目标边界框的表达式为:

7.根据权利要求6所述的基于时空域的长时目标跟踪方法,其特征在于,所述S4和S5过程中,Head模块中目标是否可见的表达式:

【技术特征摘要】

1.基于时空域的长时目标跟踪方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的基于时空域的长时目标跟踪方法,其特征在于,所述s1过程中,特征提取得出特征图,特征图具有残差结构,所述残差结构如下式所示:

3.根据权利要求1所述的基于时空域的长时目标跟踪方法,其特征在于,所述s2过程中,预测姿态估计特征的公式为:

4.根据权利要求1所述的基于时空域的长时目标跟踪方法,其特征在于,所述s3过程中,位置估计的表达式为:<...

【专利技术属性】
技术研发人员:张天飞周荣强
申请(专利权)人:安徽信息工程学院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1