训练目标跟踪模型和目标跟踪的方法和装置制造方法及图纸

技术编号：36564738 阅读：17 留言：0更新日期：2023-02-04 17:20

本公开提供了训练目标跟踪模型和目标跟踪的方法和装置，涉及人工智能领域，尤其涉及深度学习领域。具体实现方案为：获取样本集，样本包括视频帧和真实框；构建目标跟踪模型，其中，目标跟踪模型的头部包括交并比头，用于计算交并比损失值；执行如下训练步骤：从样本集中选取样本；将选取的样本中的视频帧输入目标跟踪模型，输出预测框；根据选取的样本中的真实框和预测框的差异计算原始损失值和交并比损失值；若原始损失值和交并比损失值的加权和小于预定阈值，则确定出目标跟踪模型训练完成；否则，调整目标跟踪模型的网络参数，继续执行训练步骤。通过该实施方式能够提高生成的目标跟踪模型的跟踪精度和速度。标跟踪模型的跟踪精度和速度。标跟踪模型的跟踪精度和速度。

全部详细技术资料下载

【技术实现步骤摘要】
训练目标跟踪模型和目标跟踪的方法和装置
[0001]相关申请的交叉引用
[0002]本申请为申请日为2021年12月03日，申请号为202111464709.3，专利技术名称为“训练目标跟踪模型和目标跟踪的方法和装置”的中国专利申请的分案申请。

[0003]本公开涉及人工智能领域，尤其涉及深度学习领域，具体涉及训练目标跟踪模型和目标跟踪的方法和装置。

技术介绍

[0004]多目标跟踪技术(Multi
‑
Object Tracking)是给定视频图像序列，定位出多个感兴趣的目标，并在连续帧之间维持个体的ID信息和记录其轨迹。多目标跟踪技术是计算机视觉领域中最重要，且最复杂的任务之一，被应用到如自动驾驶、安防巡检、智慧城市等领域。
[0005]相较于目标检测技术仅针对当前静止时刻输出目标的定位信息，多目标跟踪技术增加了一维目标的个体ID信息，利用这个ID信息可以构建出帧和帧之间的联系，从而识别出相邻帧中的同一物体。从应用场景角度看，更能理解两个任务的差异。物体检测的场景像钢筋计数、工业质检、电力巡检、麦穗检测等，都是只需要检测出物体在某个瞬间某个点某个静止时刻的状态。而目标跟踪的场景像智慧交通、医疗分析、牲畜盘点、军事勘察等，都是需要持续追踪物体的连续运动状态，所以这些任务并不能用目标检测代替去做。

技术实现思路

[0006]本公开提供了一种训练目标跟踪模型和目标跟踪的方法、装置、设备、存储介质以及计算机程序产品。
[0007]根据本公开的第一方面，提供了...

【技术保护点】

【技术特征摘要】
1.一种训练目标跟踪模型的方法，包括：获取样本集，其中，所述样本集中的样本包括视频帧和用于标注所述视频帧中目标对象的真实框；构建目标跟踪模型，其中，所述目标跟踪模型的头部包括交并比头，用于计算交并比损失值；执行如下训练步骤：从所述样本集中选取样本；将选取的样本中的视频帧输入所述目标跟踪模型，输出预测框；根据选取的样本中的真实框和所述预测框的差异计算原始损失值和交并比损失值；若所述原始损失值和所述交并比损失值的加权和小于预定阈值，则确定出所述目标跟踪模型训练完成；否则，调整所述目标跟踪模型的网络参数，继续执行所述训练步骤；其中，所述构建目标跟踪模型，包括：获取原始目标跟踪模型；获取应用所述目标跟踪模型的终端的运算能力；若所述运算能力大于第一预定能力，则使用HarDNet
‑
85替换掉所述原始目标跟踪模型中的骨干网络，得到构建出的目标跟踪模型；使用深度可分离卷积替换所述目标跟踪模型中的头部中的普通卷积。2.根据权利要求1所述的方法，其中，所述构建目标跟踪模型，包括：获取原始目标跟踪模型；获取应用所述目标跟踪模型的终端的运算能力；若所述运算能力小于第二预定能力，则使用HRNetV2
‑
W18替换掉所述原始目标跟踪模型中的骨干网络，并使用深层融合特征金字塔结构替换掉所述原始目标跟踪模型中的颈部，得到构建出的目标跟踪模型。3.根据权利要求2所述的方法，其中，所述构建目标跟踪模型，包括：去除所述目标跟踪模型中的可变形卷积。4.根据权利要求1所述的方法，其中，所述调整所述目标跟踪模型的网络参数，包括：通过同步批量归一化方式和滑动平均方式调整所述目标跟踪模型的网络参数。5.一种目标跟踪方法，包括：获取待检测的视频帧集合；将所述视频帧集合输入根据权利要求1
‑
4中任一项所述的方法训练完成的目标跟踪模型，在每个视频帧中输出至少一个检测框；对于每个视频帧，根据检测框的得分将该视频帧中的检测框划分成高分框集合和低分框集合；对于每个视频帧，将该视频帧的高分框集合与之前已确定的跟踪轨迹进行第一次匹配，将第一次匹配失败的跟踪轨迹与该视频帧的低分框集合进行第二次匹配，得到更新后的跟踪轨迹。6.根据权利要求5所述的方法，其中，所述第一次匹配和所述第二次匹配包括交并比匹配，所述目标跟踪模型输出检测框的阈值小于原始目标跟踪模型输出检测框的阈值。7.一种训练目标跟踪模型的装置，包括：获取单元，被配置成获取样本集，其中，所述样本集中的样本包括视频帧和用于标注所
述视频帧中目标对象的真实框；构建单元，被配置成构建目标跟踪模型，其中，所述目标跟踪模型的头部包括交并比头，用于计算交并比损失值；训练单元，被配置成执行如下训练步骤：从所述样本集...

【专利技术属性】
技术研发人员：倪烽，王冠中，党青青，邓凯鹏，赖宝华，刘其文，于佃海，胡晓光，马艳军，
申请(专利权)人：北京百度网讯科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人