一种视频分类模型的训练方法及视频分类方法技术

技术编号：37621806 阅读：35 留言：0更新日期：2023-05-18 12:13

本发明专利技术提供一种视频分类模型的训练方法及视频分类方法，包括：获取训练视频以及其对应的视频标签；根据预设数量对所述训练视频进行分割，获得与所述预设数量对应的分割结果；其中，所述预设数量为训练超参数，且其通过预设的优化算法进行最优数量寻优确定；基于所述分割结果，并利用预先构建的视频分类模型进行前向推理，获得与所述预设数量对应的分类结果，从所述分类结果中确定目标分类结果；根据所述目标分类结果以及所述视频标签进行损失计算，利用计算得到的损失值对所述预先构建的视频分类模型进行参数更新，以获得训练好的视频分类模型。本发明专利技术能够大大提升视频分类模型的精度。的精度。的精度。

全部详细技术资料下载

【技术实现步骤摘要】
一种视频分类模型的训练方法及视频分类方法

[0001]本专利技术涉及计算机视觉
，尤其涉及一种视频分类模型的训练方法及视频分类方法。

技术介绍

[0002]目前，通过视频分类模型对视频进行分类打标已经成为提高下游视频分发效率的一种重要方式。视频分类模型通常基于深度学习算法对神经网络进行训练得到。
[0003]通常情况下，训练数据是有分类标签的视频数据，但是由于标注难度大、成本高等原因，训练数据的标签只有分类标签，即每个视频只有类别标注(该视频是否为特定类别的视频)，但是没有具体发生时间段的标注，也就是没有视频中哪几秒属于特定类别的标注信息。在这种情况下，模型训练的每个视频中，大部分时间都与特定类别任务不相关，只有小部分时间与特定类别任务相关，这样训练得到的视频分类模型，相应分类结果的置信度分数非常分散，精度会受到较大影响，且对于较短时间的视频分类很不敏感。

技术实现思路

[0004]本专利技术提供一种视频分类模型的训练方法及视频分类方法，用以解决上述问题。
[0005]本专利技术提供一种视频分类模型的训练方法，包括：
[0006]获取训练视频以及其对应的视频标签；
[0007]根据预设数量对所述训练视频进行分割，获得与所述预设数量对应的分割结果；其中，所述预设数量为训练超参数，且其通过预设的优化算法进行最优数量寻优确定；
[0008]基于所述分割结果，并利用预先构建的视频分类模型进行前向推理，获得与所述预设数量对应的分类结果，从所述分类结果中确定目标分类结

【技术保护点】

【技术特征摘要】
1.一种视频分类模型的训练方法，其特征在于，包括：获取训练视频以及其对应的视频标签；根据预设数量对所述训练视频进行分割，获得与所述预设数量对应的分割结果；其中，所述预设数量为训练超参数，且其通过预设的优化算法进行最优数量寻优确定；基于所述分割结果，并利用预先构建的视频分类模型进行前向推理，获得与所述预设数量对应的分类结果，从所述分类结果中确定目标分类结果；根据所述目标分类结果以及所述视频标签进行损失计算，利用计算得到的损失值对所述预先构建的视频分类模型进行参数更新，以获得训练好的视频分类模型。2.根据权利要求1所述的视频分类模型的训练方法，其特征在于，预设数量通过预设的优化算法进行最优数量寻优确定，包括：S1，利用预定的优化算法进行参数初始化，获得初始数量；S2，按照所述初始数量对所述训练视频进行分割，获得与初始数量对应的分割结果；S3，基于所述分割结果，并利用预先构建的视频分类模型进行前向推理，获得与所述初始数量对应的分类结果，从所述分类结果中确定目标分类结果；S4，根据所述目标分类结果以及所述视频标签进行损失计算，利用计算得到的损失值对所述预先构建的视频分类模型进行参数更新，以获取更新后的视频分类模型及其对应的模型性能；S5，基于所述模型性能，利用所述预定的优化算法对所述初始数量进行优化，获得优化后数量；S6，按照优化后数量对所述训练视频进行分割，获得与优化后数量对应的分割结果；S7，重复所述S3
‑
S6，直到所述模型性能满足预设的精度要求或达到预设的循环次数，以获得最优数量，用于视频分类模型的训练过程。3.根据权利要求1所述的视频分类模型的训练方法，其特征在于，所述根据预设数量对所述训练视频进行分割，获得与所述预设数量对应的分割结果，包括：将所述训练视频按照所述预设数量进行分割，获得与所述预设数量对应的视频片段；相应地，所述基于所述分割结果，并利用预先构建的视频分类模型进行前向推理，获得与所述预设数量对应的分类结果，包括：将所述视频片段输入至所述预先构建的视频分类模型进行前向推理，获得与所述预设数量对应的分类结果。4.根据权利要求1所述的视频分类模型的训练方法，其特征在于，所述根据预设数量对所述训练视频进行分割，获得与所述预设数量对应的分割结果，包括：将所述训练视频输入至预先构建的视频分类模型中，利用所述预先构建的视频分类模型中的各个网络层进行前向推理；在前向推理过程中，选取任一网络层输出的特征图作为目标特征图，并按照所述预设数量对所述目标特征图进行分割，以获得与所述预设数量对应的子特征；相应地，所述基于所述分割结果，并利用预先构建的视频分类模型进行前向推理，获得与所述预设数量对应的分类结果，包括：基于所述子特征，获取与所述预设数量对应的分类结果。5.根据权利要求4所述的视频分类模型的训练方法，其特征在于，所述预先构建的视频
分类模型包括特征提取主干网络以及检测网络；相应地，所述选取任一网络层输出的特征图作为目标特征图，包括：选取所述特...

【专利技术属性】
技术研发人员：宋佳兴，
申请(专利权)人：嬴彻星创智能科技上海有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人