一种基于自监督学习的视频目标分割方法技术

技术编号：28874437 阅读：19 留言：0更新日期：2021-06-15 23:08

本发明专利技术公开了一种基于自监督学习的视频目标分割方法，所述方法包括以下步骤：步骤1，建立视频目标分割网络；步骤2，对视频目标分割网络进行训练，所述建立的视频目标分割网络包括记忆检索子网络和协作优化子网络，其中，所述记忆检索子网络用于学习视频帧的特征嵌入，执行逐像素对应关系并将目标掩膜传播到后续帧；所述协作优化子网络用于汇总参考帧和查询帧的信息，并学习参考帧与查询帧之间的协作关系，以优化传播的目标掩膜。本发明专利技术公开的基于自监督学习的视频目标分割方法显著提高了预测结果的精度，降低了噪声影响。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于自监督学习的视频目标分割方法
本专利技术属于计算机视觉
，具体涉及用于自监督视频目标分割的协作优化网络，尤其涉及一种基于自监督学习的视频目标分割方法。
技术介绍
视频目标分割是计算机视觉中的一项基本任务，有许多重要的应用，例如：视频编辑、机器人技术和自动驾驶汽车等，其旨在从整个视频的背景中分割出感兴趣的目标。现有技术中的大多数视频目标分割(VOS)方法都需要大量带有逐像素标注的视频序列，以构建健壮的模型。然而，收集如此大量的具有完整标注的视频序列既昂贵又费时。针对上述情况，研究人员提出了自我监督方法，尝试在训练阶段利用几乎无限的未标记视频数据来学习视频特征表示，尽管它们受到各种动机的驱动，但是这些方法在很大程度上都依赖于像素点之间的匹配关系。为了以自监督的方式学习特征表示，研究人员提出了两种辅助任务——视频着色和循环一致性跟踪。但是，由于视频的不连续性(例如遮挡、快速运动和运动模糊)，像素级匹配策略并不是最优的预测方法，经常会导致预测结果中产生大量噪声。因此，有必要提供一种预测结果噪声小、准确性高的基于自监督学习的视频目标分割方法。
技术实现思路
为了克服上述问题，本专利技术人进行了锐意研究，设计出一种基于自监督学习的视频目标分割方法，该方法采用记忆检索子网络基于像素级对应关系将mask传播到后续帧，采用协作优化子网络融合参考帧和查询帧信息，并学习参考帧与查询帧之间的协作关系以优化传播的mask；具体使用视频着色任务来训练记忆检索子网络，使用循环一致性区域跟踪来训练协...

【技术保护点】
1.一种基于自监督学习的视频目标分割方法，其特征在于，所述方法包括以下步骤：/n步骤1，建立视频目标分割网络；/n步骤2，对视频目标分割网络进行训练。/n

【技术特征摘要】
1.一种基于自监督学习的视频目标分割方法，其特征在于，所述方法包括以下步骤：
步骤1，建立视频目标分割网络；
步骤2，对视频目标分割网络进行训练。

2.根据权利要求1所述的基于自监督学习的视频目标分割方法，其特征在于，所述建立的视频目标分割网络包括记忆检索子网络和协作优化子网络，
其中，所述记忆检索子网络用于学习视频帧的特征嵌入，执行逐像素对应关系并将目标掩膜传播到后续帧；
所述协作优化子网络用于汇总参考帧和查询帧的信息，并学习参考帧与查询帧之间的协作关系，以优化传播的目标掩膜。

3.根据权利要求1所述的基于自监督学习的视频目标分割方法，其特征在于，步骤2包括训练记忆检索子网络和训练协作优化子网络；
所述记忆检索子网络的训练包括以下步骤：
步骤2-1，对视频帧进行预处理；
步骤2-2，获得查询帧与参考帧的相似度矩阵；
步骤2-3，重建参考帧。

4.根据权利要求3所述的基于自监督学习的视频目标分割方法，其特征在于，
步骤2-1中，所述预处理包括将视频RGB帧转换为LAB颜色空间的步骤。

5.根据权利要求3所述的基于自监督学习的视频目标分割方法，其特征在于，所述协作优化子网络的训练按照包括以下步骤的方法进行：
步骤I，在视频帧序列中采样两个帧，在第一帧上初始化目标掩膜；
步骤II，在上述两个帧上执行向前和向后跟踪，将最后预测的目标掩膜与初...

【专利技术属性】
技术研发人员：洪德祥，李国荣，苏荔，黄庆明，
申请(专利权)人：中国科学院大学，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人