【技术实现步骤摘要】
目标跟踪方法、装置、计算机设备和存储介质
[0001]本申请涉及计算机
,尤其涉及一种目标跟踪方法、装置、计算机设备和存储介质。
技术介绍
[0002]视觉跟踪技术是计算机视觉中最热门的研究方向之一,给定初始帧中指定目标对象的边界框,视觉跟踪旨在后续帧中持续定位目标对象。得益于深度学习的快速发展,利用深度网络提取的深度特征图代替传统的手工特征用于视觉跟踪中的目标外观表征,极大地提高了跟踪算法的精度。然而,由于深度学习特征高维且庞大的数据使得跟踪算法的计算量极具增加,导致视觉跟踪算法运行速度较慢,对于目标对象的跟踪实时性较差。
技术实现思路
[0003]为了解决跟踪算法计算量较大导致跟踪实时性较差的技术问题,本申请提供了一种目标跟踪方法、装置、计算机设备和存储介质。
[0004]第一方面,本申请提供了一种目标跟踪方法,包括:
[0005]获取视频帧序列,其中,所述视频帧序列包括多个连续的帧图片,所述帧图片包括待跟踪对象;
[0006]基于首帧图片中目标区域相应特征的卷积结果,确定通道修剪参数以及目标区域对应的目标深度特征图,其中,所述首帧图片为所述视频帧序列中位于首位的所述帧图片,所述目标区域为所述帧图片中包含待跟踪对象的区域;
[0007]确定目标帧图片中的目标搜索区域以及所述目标搜索区域对应的第二深度特征图,其中,所述目标帧图片为除所述首帧图片以外的任意一个所述帧图片,所述目标搜索区域包含所述目标区域,所述第二深度特征图包括n个特征通道对应的第二子特征图; />[0008]按照所述通道修剪参数对所述第二深度特征图进行通道修剪,得到相应的第二保留特征图,其中,所述第二保留特征图包括m个特征通道对应的第二子特征图,m小于n,n和m为不同的正整数;
[0009]基于所述第二保留特征图与所述目标深度特征图的卷积结果,确定所述目标区域在所述目标帧图片中的目标定位坐标。
[0010]第二方面,本申请提供了一种目标跟踪装置,包括:
[0011]获取模块,用于获取视频帧序列,其中,所述视频帧序列包括多个连续的帧图片,所述帧图片包括待跟踪对象;
[0012]第一确定模块,用于基于首帧图片中目标区域相应特征的卷积结果,确定通道修剪参数以及目标区域对应的目标深度特征图,其中,所述首帧图片为所述视频帧序列中位于首位的所述帧图片,所述目标区域为所述帧图片中包含待跟踪对象的区域;
[0013]第二确定模块,用于确定目标帧图片中的目标搜索区域以及所述目标搜索区域对应的第二深度特征图,其中,所述目标帧图片为除所述首帧图片以外的任意一个所述帧图
片,所述目标搜索区域包含所述目标区域,所述第二深度特征图包括n个特征通道对应的第二子特征图;
[0014]通道修剪模块,用于按照所述通道修剪参数对所述第二深度特征图进行通道修剪,得到相应的第二保留特征图,其中,所述第二保留特征图包括m个特征通道对应的第二子特征图,m小于n,n和m为不同的正整数;
[0015]定位模块,用于基于所述第二保留特征图与所述目标深度特征图的卷积结果,确定所述目标区域在所述目标帧图片中的目标定位坐标。
[0016]第三方面,本申请提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
[0017]获取视频帧序列,其中,所述视频帧序列包括多个连续的帧图片,所述帧图片包括待跟踪对象;
[0018]基于首帧图片中目标区域相应特征的卷积结果,确定通道修剪参数以及目标区域对应的目标深度特征图,其中,所述首帧图片为所述视频帧序列中位于首位的所述帧图片,所述目标区域为所述帧图片中包含待跟踪对象的区域;
[0019]确定目标帧图片中的目标搜索区域以及所述目标搜索区域对应的第二深度特征图,其中,所述目标帧图片为除所述首帧图片以外的任意一个所述帧图片,所述目标搜索区域包含所述目标区域,所述第二深度特征图包括n个特征通道对应的第二子特征图;
[0020]按照所述通道修剪参数对所述第二深度特征图进行通道修剪,得到相应的第二保留特征图,其中,所述第二保留特征图包括m个特征通道对应的第二子特征图,m小于n,n和m为不同的正整数;
[0021]基于所述第二保留特征图与所述目标深度特征图的卷积结果,确定所述目标区域在所述目标帧图片中的目标定位坐标。
[0022]第四方面,本申请提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
[0023]获取视频帧序列,其中,所述视频帧序列包括多个连续的帧图片,所述帧图片包括待跟踪对象;
[0024]基于首帧图片中目标区域相应特征的卷积结果,确定通道修剪参数以及目标区域对应的目标深度特征图,其中,所述首帧图片为所述视频帧序列中位于首位的所述帧图片,所述目标区域为所述帧图片中包含待跟踪对象的区域;
[0025]确定目标帧图片中的目标搜索区域以及所述目标搜索区域对应的第二深度特征图,其中,所述目标帧图片为除所述首帧图片以外的任意一个所述帧图片,所述目标搜索区域包含所述目标区域,所述第二深度特征图包括n个特征通道对应的第二子特征图;
[0026]按照所述通道修剪参数对所述第二深度特征图进行通道修剪,得到相应的第二保留特征图,其中,所述第二保留特征图包括m个特征通道对应的第二子特征图,m小于n,n和m为不同的正整数;
[0027]基于所述第二保留特征图与所述目标深度特征图的卷积结果,确定所述目标区域在所述目标帧图片中的目标定位坐标。
[0028]基于上述目标跟踪方法,获取需要进行目标对象跟踪定位的视频帧序列,所述视频帧序列包括多个连续的帧图片,所述帧图片包括待跟踪对象,根据视频帧序列中首帧图
片相应特征的卷积结果,确定通道修剪参数以及目标区域对应的目标深度特征图,在目标帧图片中确定目标搜索区域以及目标搜索区域对应的第二深度特征图,目标帧图片为除所述首帧图片以外的任意一个所述帧图片,所述目标搜索区域包含所述目标区域,所述第二深度特征图包括n个特征通道对应的第二子特征图,按照通道修剪参数对第二深度特征图进行通道修剪,得到第二保留特征图,第二保留特征图包括m个特征通道对应的第二子特征图,m小于n,通过通道修剪减少后续参与目标定位坐标计算的数据量,根据通道修剪后的第二保留特征图与目标深度特征图的卷积结果,确定目标区域在各个帧图片中的目标定位坐标,从而加快了目标对象跟踪定位的数据处理速度,提高了对目标对象跟踪的实时性。
附图说明
[0029]此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本专利技术的实施例,并与说明书一起用于解释本专利技术的原理。
[0030]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种目标跟踪方法,其特征在于,所述方法包括:获取视频帧序列,其中,所述视频帧序列包括多个连续的帧图片,所述帧图片包括待跟踪对象;基于首帧图片中目标区域相应特征的卷积结果,确定通道修剪参数以及目标区域对应的目标深度特征图,其中,所述首帧图片为所述视频帧序列中位于首位的所述帧图片,所述目标区域为所述帧图片中包含待跟踪对象的区域;确定目标帧图片中的目标搜索区域以及所述目标搜索区域对应的第二深度特征图,其中,所述目标帧图片为所述视频帧序列中除所述首帧图片以外的任意一个所述帧图片,所述目标搜索区域包含所述目标区域,所述第二深度特征图包括n个特征通道对应的第二子特征图;按照所述通道修剪参数对所述第二深度特征图进行通道修剪,得到相应的第二保留特征图,其中,所述第二保留特征图包括m个特征通道对应的第二子特征图,m小于n,n和m为不同的正整数;基于所述第二保留特征图与所述目标深度特征图的卷积结果,确定所述目标区域在所述目标帧图片中的目标定位坐标。2.根据权利要求1所述的方法,其特征在于,所述基于首帧图片中目标区域相应特征的卷积结果,确定通道修剪参数,包括:按照第一预设尺寸以所述目标区域为中心在所述首帧图片中框选出首帧搜索区域,其中,所述第一预设尺寸大于所述目标区域的第二预设尺寸;通过特征提取分别确定所述目标区域对应的所述第一深度特征图以及所述首帧搜索区域对应的第三深度特征图,其中,所述第一深度特征图包括n个特征通道对应的第一子特征图,所述第三深度特征图包括n个特征通道对应的第三子特征图;对各个所述特征通道对应的所述第一子特征图和所述第三子特征图进行卷积处理,得到各个所述特征通道对应的响应图矩阵,其中,所述响应图矩阵包括多个第一响应元素,各个所述第一响应元素对应所述首帧搜索区域中的不同位置;根据各个所述响应图矩阵中属于背景区域的所述第一响应元素对应数值与元素均值之间的差值,确定各个所述特征通道对应的背景方差,其中,所述通道修剪参数包括各个所述特征通道对应的背景方差,所述背景区域为所述首帧搜索区域中除所述目标区域以外的区域,所述元素均值为所述响应图矩阵中属于所述背景区域的全部所述第一响应元素相应数值的平均值。3.根据权利要求2所述的方法,其特征在于,基于首帧图片中目标区域相应特征的卷积结果,确定目标区域对应的目标深度特征图,包括:按照各个所述特征通道对应的背景方差对所述第三深度特征图进行通道修剪,得到通道修剪后的第三保留特征图,其中,所述第三保留特征图包括m个保留通道对应的第三子特征图,所述保留通道为任意一个所述特征通道,所述第三子特征图的尺寸为所述第一预设尺寸;在各个所述保留通道对应的所述第三子特征图中确定多个样本区域以及所述样本区域相应的回归核参数,其中,所述样本区域的尺寸为所述第二预设尺寸;根据各个所述保留通道所对应的多个所述样本区域相应的回归核参数,确定各个所述
保留通道相应的通道权重;根据各个所述保留通道对应的所述第一子特征图以及各个所述保留通道相应的通道权重,确定所述目标区域对应的目标深度特征图。4.根据权利要求3所述的方法,其特征在于,所述确定目标帧图片中的目标搜索区域以及所述目标搜索区域对应的第二深度特征图,包括:获取所述目标帧图片相邻的上一帧图片中所述目标区域...
【专利技术属性】
技术研发人员:刘志昌,陈键,王栋年,夏广远,邹姗蓉,
申请(专利权)人:珠海格力电器股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。