基于多阶段自适应网络的鲁棒目标跟踪方法及系统技术方案

技术编号：32462361 阅读：13 留言：0更新日期：2022-02-26 08:53

本发明专利技术涉及一种基于多阶段自适应网络的鲁棒目标跟踪方法及系统，该方法包括以下步骤：S1、构建离线训练数据集；S2、使用元学习的多步梯度下降训练方法对离线训练数据集进行训练，得到元学习模型；S3、构建多阶段自适应网络，包括领域自适应子网、特征自适应子网和位置自适应子网三个不同自适应子网络，S4、将测试视频中仅已知目标位置的第一帧输入到领域自适应子网，对构建的多阶段自适应网络进行初始化训练；S5、将测试视频中第二帧开始的后续帧依次输入到特征自适应子网中，利用多阶段自适应网络对测试视频进行跟踪。该方法及系统有利于获得更加稳定、鲁棒、准确的跟踪结果。准确的跟踪结果。准确的跟踪结果。

全部详细技术资料下载

【技术实现步骤摘要】
Workshop.2016,pp.850
‑
865.)使用完全卷积孪生网络来估计模板特征和搜索区域特征之间的相似性。此外，还有大量的后续工作，例如，SiamRPN(B.Li,J.Yan,W.Wu,Z.Zhu,X.Hu,High performance visual tracking with siamese region proposal network,in:Proceedings of the IEEE Conference on Computer Vision andPattern Recognition,2018,pp.8971
–
8980.)将跟踪看成单样本局部检测，将区域候选网络加入孪生网络，改进了互相关策略，获得了优越的性能和更准确的目标尺度估计。Ocean(Z.Zhang,H.Peng,J.Fu,B.Li,W.Hu,Ocean:Object
‑
aware anchor
‑
free tracking,in:Proceedings of the European Conference on Computer Vision,Vol.12366,2020,pp.771
–
787.)引入了一个特征对齐模块来适应尺度变化，并学习一个可感知对象的特征来纠正不准确的目标位置，从而动态地适应外观变化。然而，由于缺乏处理外观变化的适应能力，上述的目标跟踪方法并不能很好地泛化到测试任务中。

技术实现思路

[0005]本专利技术的目的在于提供一种基于多阶段自适应...

【技术保护点】

【技术特征摘要】
1.一种基于多阶段自适应网络的鲁棒目标跟踪方法，其特征在于，包括以下步骤：S1、从视频序列数据集中随机抽取两帧图片，第一帧作为支撑集，第二帧作为查询集，重复此操作得到多对支撑集与查询集，以此构建离线训练数据集；S2、使用元学习的多步梯度下降训练方法对离线训练数据集进行训练，得到元学习模型f
θ*
；S3、构建多阶段自适应网络，包括领域自适应子网、特征自适应子网和位置自适应子网三个不同自适应子网络，领域自适应子网利用元学习训练加强跟踪模型对新视频序列的泛化能力，特征自适应子网利用多层多尺度元分类器模块和对抗注意力掩码模块捕获鲁棒和判别特征信息来更新跟踪模型，位置自适应子网对初步结果进行边界框细化以增加跟踪准确度；S4、对构建的多阶段自适应网络进行初始化训练；将测试视频中仅已知目标位置的第一帧输入到领域自适应子网，通过随机梯度下降算法对第一帧和离线训练得到的元学习模型f
θ*
找到适应当前视频序列的最佳参数θ
’
，用于更新元特征提取器，然后将第一帧的目标特征向量输入对抗注意力掩码模块，利用生成的注意力掩码捕获原始特征中鲁棒特征，生成元对抗特征，其生成的损失反向传播用于更新元特征提取器；S5、利用多阶段自适应网络对测试视频进行跟踪；从第二帧开始，将测试视频的当前帧输入特征自适应子网中的多层多尺度元分类器模块获得多个候选目标样本的分类得分，取平均值作为目标置信分数；如果置信分数不大于0，则认为跟踪不成功，执行重采样操作，即扩大采样的搜索区域范围，以之前跟踪成功的目标位置作为当前帧目标中心，并重新采集正负样本；如果置信分数大于0，则将分值最大的候选样本作为目标位置并采集正负样本；然后，执行边界框回归操作，将回归后的结果作为位置自适应子网的输入，通过与第一帧的特征融合操作得到最终的目标跟踪结果；跟踪过程中，每隔设定帧执行一次长时更新，将跟踪结果的特征向量输入对抗注意力掩码模块，通过对抗判别训练得到元对抗特征来计算交叉熵损失；而短时更新在置信分数不大于0时执行，其不执行对抗注意力判别模块，而是利用重新采集的正负样本直接计算交叉熵损失。2.根据权利要求1所述的基于多阶段自适应网络的鲁棒目标跟踪方法，其特征在于，所述步骤S2中，在支撑集上计算每一步损失，获得每一步更新后的参数，进而用更新后参数计算对应查询集上的每一步损失，将查询集上的损失求和进行总的梯度下降，从而找到模型可泛化的初始化参数θ
*
。3.根据权利要求1所述的基于多阶段自适应网络的鲁棒目标跟踪方法，其特征在于，所述步骤S3中，所述领域自适应子网由元学习模型f
θ*
和元特征提取器组成，输入为仅已知目标位置的第一帧图片，输出为第一帧目标的特征向量；所述特征自适应子网由多层多尺度元分类器模块和对抗注意力掩码模块组成，其中多层多尺度元分类器模块由特征预测网络构成，输入为第二帧开始的后续帧，输出为该帧的目标置信分数；对抗注意力掩码模块由元对抗特征生成器构成，输入为目标跟踪结果的特征向量，输出为元对抗特征；位置自适应子网由边界框回归和特征融合操作组成，输入为经过边界框回归之后的初步结果，输出为自适应后精确的目标跟踪结果。4.根据权利要求3所述的基于多阶段自适应网络的鲁棒目标跟踪方法，其特征在于，所述领域自适应子网中，跟踪模型根据输入第一帧图片，对其提取正负样本特征，通过
softmax函数计算出置信分数，然后利用交叉熵损失函数计算出损失，进而求得梯度，通过随机梯度下降算法找到当前视频序列的最佳参数θ
’
，然后用于更新元特征提取器，所提取的特征用于对抗注意力掩码模块中进行对抗训练；利用元学习训练得到的初始化模型进行域适应以减少网络的过度拟合，并更新网络的卷积层参数以快速适应当前序列；通过域适应提高离线训练元学习模型的泛化能力，使模型自适应地根据给定目标调整学习率，然后找到最佳参数；当前视频序列的最佳参数通过以...

【专利技术属性】
技术研发人员：陈思，王立波，王大寒，朱顺痣，吴芸，
申请(专利权)人：厦门理工学院，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人