目标跟踪、网络训练方法、装置、电子设备和存储介质制造方法及图纸

技术编号:18352026 阅读:25 留言:0更新日期:2018-07-02 02:22
本发明专利技术实施例提供了一种目标跟踪、网络训练方法、装置、电子设备和存储介质,其中,所述目标跟踪方法包括:基于神经网络对视频图像进行目标预测,得到所述视频图像中的多个目标预测区域;对所述多个目标预测区域中的至少部分目标预测区域进行预测结果评价检测;确定所述至少部分目标预测区域中检测结果满足设定条件的目标预测区域;在包括所述视频图像的视频帧序列中根据满足设定条件的目标预测区域的位置信息进行目标跟踪。由于上述在目标预测过程中得到的位置信息可直接用于目标跟踪,因此,本发明专利技术实施例降低了目标跟踪的计算量,提高了目标跟踪的效率。

【技术实现步骤摘要】
目标跟踪、网络训练方法、装置、电子设备和存储介质
本专利技术实施例涉及计算机视觉
,尤其涉及一种目标跟踪方法、装置和一种神经网络训练方法、装置以及电子设备和计算机可读存储介质。
技术介绍
在计算机视觉研究中,目标跟踪是指给出目标在跟踪视频某帧中的初始状态(如位置,尺寸),自动估计目标在后续帧中的状态。其中,目标可以为物体、人体等。目标跟踪在很多实际工业场景中有着广泛的应用价值,如安防监控、自助辅助驾驶和机器人导航等。
技术实现思路
本专利技术实施例提供了目标跟踪技术方案。根据本专利技术实施例的第一方面,提供了一种目标跟踪方法,包括:基于神经网络对视频图像进行目标预测,得到所述视频图像中的多个目标预测区域;对所述多个目标预测区域中的至少部分目标预测区域进行预测结果评价检测;确定所述至少部分目标预测区域中检测结果满足设定条件的目标预测区域;在包括所述视频图像的视频帧序列中根据满足设定条件的目标预测区域的位置信息进行目标跟踪。可选地,所述预测结果评价检测包括:预测结果准确性检测,和/或,预测结果错误代价检测。可选地,对所述多个目标预测区域中的至少部分目标预测区域进行预测结果评价检测,包括:针对所述至少部分目标预测区域中的每个目标预测区域,分别检测每个目标预测区域的第一损失代价信息和第二损失代价信息;其中,所述第一损失代价信息表征将目标预测区域预测为包括所述目标的区域的预测结果准确性以及预测结果错误代价,所述第二损失代价信息表征将目标预测区域预测为包括所述目标的最小外包矩形的预测结果准确性以及预测结果错误代价。可选地,所述神经网络包括第一卷积神经网络。可选地,在所述基于神经网络对视频图像进行目标预测之前,所述方法还包括:根据已训练完成的第二卷积神经网络构建待训练的第一卷积神经网络,其中,所述第二卷积神经网络训练用的样本图像的分辨率大于所述待训练的第一卷积神经网络训练用的样本图像的分辨率;基于所述待训练的第一卷积神经网络训练用的样本图像、并以所述第二卷积神经网络的输出为指导信息,调整所述待训练的第一卷积神经网络的网络参数,以得到所述第一卷积神经网络。可选地,根据已训练完成的第二卷积神经网络构建待训练的第一卷积神经网络,包括:删除所述第二卷积神经网络中至少部分用于进行下采样的结构,和/或,减小所述第二卷积神经网络中与下采样相关的参数,得到所述待训练的第一卷积神经网络。可选地,所述用于进行下采样的结构包括池化层;和/或,所述与下采样相关的参数包括卷积层的步长。可选地,删除的所述池化层包括位于所述待训练的第一卷积神经网络浅层的至少一池化层,和/或,步长减小的所述卷积层包括位于所述待训练的第一卷积神经网络浅层的至少一卷积层。根据本专利技术实施例的第二方面,还提供了一种神经网络训练方法,包括:根据已训练完成的第二卷积神经网络构建待训练的第一卷积神经网络,其中,所述第二卷积神经网络训练用的样本图像的分辨率大于所述待训练的第一卷积神经网络训练用的样本图像的分辨率;基于所述待训练的第一卷积神经网络训练用的样本图像、并以所述第二卷积神经网络的输出为指导信息,调整所述待训练的第一卷积神经网络的网络参数,以得到训练完成的第一卷积神经网络。可选地,根据已训练完成的第二卷积神经网络构建待训练的第一卷积神经网络,包括:删除所述第二卷积神经网络中至少部分用于进行下采样的结构,和/或,减小所述第二卷积神经网络中与下采样相关的参数,得到所述待训练的第一卷积神经网络。可选地,所述用于进行下采样的结构包括池化层;和/或,所述与下采样相关的参数包括卷积层的步长。可选地,删除的所述池化层包括位于所述待训练的第一神经网络浅层的至少一池化层,和/或,步长减小的所述卷积层包括位于所述待训练的第一神经网络浅层的至少一卷积层。根据本专利技术实施例的第三方面,还提供了一种目标跟踪装置,包括:目标预测模块,用于基于神经网络对视频图像进行目标预测,得到所述视频图像中的多个目标预测区域;评价检测模块,用于对所述多个目标预测区域中的至少部分目标预测区域进行预测结果评价检测;区域确定模块,用于确定所述至少部分目标预测区域中检测结果满足设定条件的目标预测区域;目标跟踪模块,用于在包括所述视频图像的视频帧序列中根据满足设定条件的目标预测区域的位置信息进行目标跟踪。可选地,所述评价检测模块,包括:准确性检测子模块,用于对所述多个目标预测区域中的至少部分目标预测区域进行预测结果准确性检测,和/或,错误代价检测子模块,用于对所述多个目标预测区域中的至少部分目标预测区域进行预测结果错误代价检测。可选地,所述评价检测模块,用于针对所述至少部分目标预测区域中的每个目标预测区域,分别检测每个目标预测区域的第一损失代价信息和第二损失代价信息;其中,所述第一损失代价信息表征将目标预测区域预测为包括所述目标的区域的预测结果准确性以及预测结果错误代价,所述第二损失代价信息表征将目标预测区域预测为包括所述目标的最小外包矩形的预测结果准确性以及预测结果错误代价。可选地,所述神经网络包括第一卷积神经网络。可选地,所述装置还包括:网络构建模块,用于在所述目标预测模块基于神经网络对视频图像进行目标预测之前,根据已训练完成的第二卷积神经网络构建待训练的第一卷积神经网络,其中,所述第二卷积神经网络训练用的样本图像的分辨率大于所述待训练的第一卷积神经网络训练用的样本图像的分辨率;网络调整模块,用于基于所述待训练的第一卷积神经网络训练用的样本图像、并以所述第二卷积神经网络的输出为指导信息,调整所述待训练的第一卷积神经网络的网络参数,以得到所述第一卷积神经网络。可选地,所述网络构建模块,包括:结构删除子模块,用于删除所述第二卷积神经网络中至少部分用于进行下采样的结构,和/或,参数减小子模块,用于减小所述第二卷积神经网络中与下采样相关的参数,得到所述待训练的第一卷积神经网络。可选地,所述用于进行下采样的结构包括池化层;和/或,所述与下采样相关的参数包括卷积层的步长。可选地,删除的所述池化层包括位于所述待训练的第一神经网络浅层的至少一池化层,和/或,步长减小的所述卷积层包括位于所述待训练的第一神经网络浅层的至少一卷积层。根据本专利技术实施例的第四方面,还提供了一种神经网络训练装置,包括:网络构建模块,用于根据已训练完成的第二卷积神经网络构建待训练的第一卷积神经网络,其中,所述第二卷积神经网络训练用的样本图像的分辨率大于所述待训练的第一卷积神经网络训练用的样本图像的分辨率;网络调整模块,用于基于所述待训练的第一卷积神经网络训练用的样本图像、并以所述第二卷积神经网络的输出为指导信息,调整所述待训练的第一卷积神经网络的网络参数,以得到训练完成的第一卷积神经网络。可选地,所述网络构建模块,包括:结构删除子模块,用于删除所述第二卷积神经网络中至少部分用于进行下采样的结构,和/或,参数减小子模块,用于减小所述第二卷积神经网络中与下采样相关的参数,得到所述待训练的第一卷积神经网络。可选地,所述用于进行下采样的结构包括池化层;和/或,所述与下采样相关的参数包括卷积层的步长。可选地,删除的所述池化层包括位于所述待训练的第一神经网络浅层的至少一池化层,和/或,步长减小的所述卷积层包括位于所述待训练的第一神经网络浅层的至少一卷积层。根据本专利技术实施例的第本文档来自技高网...
目标跟踪、网络训练方法、装置、电子设备和存储介质

【技术保护点】
1.一种目标跟踪方法,其特征在于,包括:基于神经网络对视频图像进行目标预测,得到所述视频图像中的多个目标预测区域;对所述多个目标预测区域中的至少部分目标预测区域进行预测结果评价检测;确定所述至少部分目标预测区域中检测结果满足设定条件的目标预测区域;在包括所述视频图像的视频帧序列中根据满足设定条件的目标预测区域的位置信息进行目标跟踪。

【技术特征摘要】
1.一种目标跟踪方法,其特征在于,包括:基于神经网络对视频图像进行目标预测,得到所述视频图像中的多个目标预测区域;对所述多个目标预测区域中的至少部分目标预测区域进行预测结果评价检测;确定所述至少部分目标预测区域中检测结果满足设定条件的目标预测区域;在包括所述视频图像的视频帧序列中根据满足设定条件的目标预测区域的位置信息进行目标跟踪。2.根据权利要求1所述的方法,其特征在于,所述预测结果评价检测包括:预测结果准确性检测,和/或,预测结果错误代价检测。3.根据权利要求1所述的方法,其特征在于,对所述多个目标预测区域中的至少部分目标预测区域进行预测结果评价检测,包括:针对所述至少部分目标预测区域中的每个目标预测区域,分别检测每个目标预测区域的第一损失代价信息和第二损失代价信息;其中,所述第一损失代价信息表征将目标预测区域预测为包括所述目标的区域的预测结果准确性以及预测结果错误代价,所述第二损失代价信息表征将目标预测区域预测为包括所述目标的最小外包矩形的预测结果准确性以及预测结果错误代价。4.一种神经网络训练方法,其特征在于,包括:根据已训练完成的第二卷积神经网络构建待训练的第一卷积神经网络,其中,所述第二卷积神经网络训练用的样本图像的分辨率大于所述待训练的第一卷积神经网络训练用的样本图像的分辨率;基于所述待训练的第一卷积神经网络训练用的样本图像、并以所述第二卷积神经网络的输出为指导信息,调整所述待训练的第一卷积神经网络的网络参数,以得到训练完成的第一卷积神经网络。5.一种目标跟踪装置,其特征在于,包括:目标预测模块,用于基于神经网络对视频图像进行目标预测,得到所述视频图像中的多个目标预测区域;评价检测模块,用于对所述多个目标预测区域中的至少部分目标预测区域进行预测结果评价检测;区域确定模块,用于确定所述至少部分目标预测区域中检测结果满足设定条件的目标预测区域;目标跟踪模块,用于在包括所述视频图像的视频帧序列中根据满足设定条件的目标预测区域的位置信息进行目标跟踪。6.一种神经网络训练装置,其特征在于,包括:网络构建模块,用...

【专利技术属性】
技术研发人员:任思捷陈晓濠刘建博于志洋孙文秀严琼张瑞戴宇荣
申请(专利权)人:深圳市商汤科技有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1