模型训练、视频处理方法，装置，设备以及存储介质制造方法及图纸

技术编号：30766630 阅读：28 留言：0更新日期：2021-11-10 12:27

本公开提供了模型训练、视频处理方法，装置，设备以及存储介质，涉及人工智能领域，具体涉及计算机视觉和深度学习技术领域，具体可用于智慧城市和智能交通场景下。具体实现方案为：从样本视频集合中抽取出第一视频片段、第二视频片段以及第三视频片段，第一视频片段与第二视频片段外观相似，第二视频片段与第三视频片段播放速度相同；利用目标模型分别提取第一视频片段、第二视频片段以及第三视频片段的特征，得到第一特征、第二特征以及第三特征；根据第一特征与第二特征之间的第一距离、第二特征和第三特征之间的第二距离，确定损失函数；根据损失函数，训练目标模型。本实现方式可以提高提取的特征的质量，提升了下游任务的性能。能。能。

全部详细技术资料下载

【技术实现步骤摘要】
模型训练、视频处理方法，装置，设备以及存储介质

[0001]本公开涉及人工智能领域，具体涉及计算机视觉和深度学习
，尤其涉及模型训练、视频处理方法，装置，设备以及存储介质，具体可用于智慧城市和智能交通场景下。

技术介绍

[0002]视频表征学习，即一种帮助系统自动地从原始视频中学习具有判别能力的特征的技术。随着智能手机的兴起，录制视频变得前所未有的容易。视频分析已经成为当前最活跃的研究热点之一。然而，想要获得高质量的视频标签，需要大量的人工标注工作，需要耗费大量人力物力财力。相比之下，数百万无标签的视频可以在互联网上免费获得。因此，从无标签的视频中学习有意义的视频表征对于视频内容理解至关重要。

技术实现思路

[0003]本公开提供了一种模型训练、视频处理方法，装置，设备以及存储介质。
[0004]根据第一方面，提供了一种模型训练方法，包括：从样本视频集合中抽取出第一视频片段、第二视频片段以及第三视频片段，其中，第一视频片段与第二视频片段外观的相似度大于第一预设阈值，第二视频片段与第三视频片段播放速度相同；利用目标模型分别提取第一视频片段、第二视频片段以及第三视频片段的特征，得到第一视频片段的第一特征、第二视频片段的第二特征以及第三视频片段的第三特征；根据第一特征与第二特征之间的第一距离、第二特征和第三特征之间的第二距离，确定损失函数；根据损失函数，训练目标模型。
[0005]根据第二方面，提供了一种视频处理方法，包括：获取目标视频；利用通过如第一方面所描述的模型训练方法训练得到的...

【技术保护点】

【技术特征摘要】
1.一种模型训练方法，包括：从样本视频集合中抽取出第一视频片段、第二视频片段以及第三视频片段，其中，所述第一视频片段与所述第二视频片段外观的相似度大于第一预设阈值，所述第二视频片段与所述第三视频片段播放速度相同；利用目标模型分别提取所述第一视频片段、所述第二视频片段以及所述第三视频片段的特征，得到所述第一视频片段的第一特征、所述第二视频片段的第二特征以及所述第三视频片段的第三特征；根据所述第一特征与所述第二特征之间的第一距离、所述第二特征和所述第三特征之间的第二距离，确定损失函数；根据所述损失函数，训练所述目标模型。2.根据权利要求1所述的方法，其中，所述从样本视频集合中抽取出第一视频片段、第二视频片段以及第三视频片段，包括：从所述样本视频集合中选取出第一样本视频和第二样本视频，所述第一样本视频和所述第二样本视频的外观相似度大于第二预设阈值；从所述第一样本视频中抽取出所述第一视频片段和所述第二视频片段；从所述第二样本视频中抽取出所述第三视频片段。3.根据权利要求2所述的方法，其中，所述从所述第一样本视频中抽取出所述第一视频片段和所述第二视频片段，包括：从所述第一样本视频中选取连续的多个视频帧；将所述多个视频帧划分为数量相同的两个视频片段，得到所述第一视频片段和所述第二视频片段。4.根据权利要求2或3所述的方法，其中，所述从所述第二样本视频中抽取出所述第三视频片段，包括：确定所述第二视频片段的每秒显示帧数；以所述每秒显示帧数对所述第二样本视频进行采样，得到所述第三视频片段。5.根据权利要求1所述的方法，其中，所述利用目标模型分别提取所述第一视频片段、所述第二视频片段以及所述第三视频片段的特征，得到所述第一视频片段的第一特征、所述第二视频片段的第二特征以及所述第三视频片段的第三特征，包括：对所述第一视频片段和所述第二视频片段进行数据增强；利用所述目标模型对数据增强后的第一视频片段、数据增强后的第二视频片段和所述第三视频片段进行特征提取，得到所述第一特征、所述第二特征和第三特征。6.根据权利要求1所述的方法，其中，所述方法还包括：根据下游任务的样本数据，对训练好的目标模型进行微调。7.一种视频处理方法，包括：获取目标视频；利用通过权利要求1
‑
6任一项所述的模型训练方法训练得到的目标模型提取所述目标视频的特征，确定所述目标视频的目标特征；根据所述目标特征，对所述目标视频进行处理。8.一种模型训练装置，包括：
视频片段抽取单元，被配置成从样本视频集合中抽取出第一视频片段、第二视频片段以及第三视频片段，其中，所述第一视频片段与所述第二视频片段外观的相似度大于第一预设阈值，所述第二视频片段与所述第三视频片段播放速度相同；视频特征提取单元，被配置成利用目标模型分别提取所述第一视频片段...

【专利技术属性】
技术研发人员：吴文灏，黄登，
申请(专利权)人：北京百度网讯科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人