一种视频分类模型的训练方法及视频分类方法技术

技术编号:37621806 阅读:18 留言:0更新日期:2023-05-18 12:13
本发明专利技术提供一种视频分类模型的训练方法及视频分类方法,包括:获取训练视频以及其对应的视频标签;根据预设数量对所述训练视频进行分割,获得与所述预设数量对应的分割结果;其中,所述预设数量为训练超参数,且其通过预设的优化算法进行最优数量寻优确定;基于所述分割结果,并利用预先构建的视频分类模型进行前向推理,获得与所述预设数量对应的分类结果,从所述分类结果中确定目标分类结果;根据所述目标分类结果以及所述视频标签进行损失计算,利用计算得到的损失值对所述预先构建的视频分类模型进行参数更新,以获得训练好的视频分类模型。本发明专利技术能够大大提升视频分类模型的精度。的精度。的精度。

【技术实现步骤摘要】
一种视频分类模型的训练方法及视频分类方法


[0001]本专利技术涉及计算机视觉
,尤其涉及一种视频分类模型的训练方法及视频分类方法。

技术介绍

[0002]目前,通过视频分类模型对视频进行分类打标已经成为提高下游视频分发效率的一种重要方式。视频分类模型通常基于深度学习算法对神经网络进行训练得到。
[0003]通常情况下,训练数据是有分类标签的视频数据,但是由于标注难度大、成本高等原因,训练数据的标签只有分类标签,即每个视频只有类别标注(该视频是否为特定类别的视频),但是没有具体发生时间段的标注,也就是没有视频中哪几秒属于特定类别的标注信息。在这种情况下,模型训练的每个视频中,大部分时间都与特定类别任务不相关,只有小部分时间与特定类别任务相关,这样训练得到的视频分类模型,相应分类结果的置信度分数非常分散,精度会受到较大影响,且对于较短时间的视频分类很不敏感。

技术实现思路

[0004]本专利技术提供一种视频分类模型的训练方法及视频分类方法,用以解决上述问题。
[0005]本专利技术提供一种视频分类模型的训练方法,包括:
[0006]获取训练视频以及其对应的视频标签;
[0007]根据预设数量对所述训练视频进行分割,获得与所述预设数量对应的分割结果;其中,所述预设数量为训练超参数,且其通过预设的优化算法进行最优数量寻优确定;
[0008]基于所述分割结果,并利用预先构建的视频分类模型进行前向推理,获得与所述预设数量对应的分类结果,从所述分类结果中确定目标分类结果;
[0009]根据所述目标分类结果以及所述视频标签进行损失计算,利用计算得到的损失值对所述预先构建的视频分类模型进行参数更新,以获得训练好的视频分类模型。
[0010]根据本专利技术提供的一种视频分类模型的训练方法,预设数量通过预设的优化算法进行最优数量寻优确定,包括:
[0011]S1,利用预定的优化算法进行参数初始化,获得初始数量;
[0012]S2,按照所述初始数量对所述训练视频进行分割,获得与初始数量对应的分割结果;
[0013]S3,基于所述分割结果,并利用预先构建的视频分类模型进行前向推理,获得与所述初始数量对应的分类结果,从所述分类结果中确定目标分类结果;
[0014]S4,根据所述目标分类结果以及所述视频标签进行损失计算,利用计算得到的损失值对所述预先构建的视频分类模型进行参数更新,以获取更新后的视频分类模型及其对应的模型性能;
[0015]S5,基于所述模型性能,利用所述预定的优化算法对所述初始数量进行优化,获得优化后数量;
[0016]S6,按照优化后数量对所述训练视频进行分割,获得与优化后数量对应的分割结果;
[0017]S7,重复所述S3

S6,直到所述模型性能满足预设的精度要求或达到预设的循环次数,以获得最优数量,用于视频分类模型的训练过程。
[0018]根据本专利技术提供的一种视频分类模型的训练方法,所述根据预设数量对所述训练视频进行分割,获得与所述预设数量对应的分割结果,包括:
[0019]将所述训练视频按照所述预设数量进行分割,获得与所述预设数量对应的视频片段;
[0020]相应地,所述基于所述分割结果,并利用预先构建的视频分类模型进行前向推理,获得与所述预设数量对应的分类结果,包括:
[0021]将所述视频片段输入至所述预先构建的视频分类模型进行前向推理,获得与所述预设数量对应的分类结果。
[0022]根据本专利技术提供的一种视频分类模型的训练方法,所述根据预设数量对所述训练视频进行分割,获得与所述预设数量对应的分割结果,包括:
[0023]将所述训练视频输入至预先构建的视频分类模型中,利用所述预先构建的视频分类模型中的各个网络层进行前向推理;
[0024]在前向推理过程中,选取任一网络层输出的特征图作为目标特征图,并按照所述预设数量对所述目标特征图进行分割,以获得与所述预设数量对应的子特征;
[0025]相应地,所述基于所述分割结果,并利用预先构建的视频分类模型进行前向推理,获得与所述预设数量对应的分类结果,包括:
[0026]基于所述子特征,获取与所述预设数量对应的分类结果。
[0027]根据本专利技术提供的一种视频分类模型的训练方法,所述预先构建的视频分类模型包括特征提取主干网络以及检测网络;
[0028]相应地,所述选取任一网络层输出的特征图作为目标特征图,包括:
[0029]选取所述特征提取主干网络或所述检测网络中任一网络层输出的特征图作为目标特征图。
[0030]根据本专利技术提供的一种视频分类模型的训练方法,所述分类结果为所述分割结果所属类别的概率;
[0031]相应地,所述从所述分类结果中确定目标分类结果,包括:
[0032]将概率值最大的分类结果作为目标分类结果。
[0033]根据本专利技术提供的一种视频分类模型的训练方法,所述预设的优化算法至少为蚁群算法、遗传算法、模拟退火算法、禁忌搜索算法或粒子群算法中的一种。
[0034]本专利技术还提供一种视频分类方法,包括:获取待分类视频;
[0035]根据预设数量对所述待分类视频进行分割,获得与所述预设数量对应的分割结果;其中,所述预设数量为预先训练好的视频分类模型中的超参数,且其在视频分类模型训练过程中通过预设的优化算法对最优数量寻优确定;
[0036]基于所述分割结果,并利用预先训练好的视频分类模型进行分类预测,获得与所述预设数量对应的预测结果,从所述预测结果中确定目标预测结果,将其作为所述待分类视频的最终预测结果;其中,所述预先训练好的视频分类模型为通过上述任一项所述的视
频分类模型的训练方法得到。
[0037]本专利技术还提供一种视频分类模型的训练装置,包括:
[0038]视频与标签获取模块,用于获取训练视频以及其对应的视频标签;
[0039]分割模块,用于根据预设数量对所述训练视频进行分割,获得与所述预设数量对应的分割结果;其中,所述预设数量为训练超参数,且其通过预设的优化算法进行最优数量寻优确定;
[0040]分类模块,用于基于所述分割结果,并利用预先构建的视频分类模型进行前向推理,获得与所述预设数量对应的分类结果,从所述分类结果中确定目标分类结果;
[0041]模型更新模块,用于根据所述目标分类结果以及所述视频标签进行损失计算,利用计算得到的损失值对所述预先构建的视频分类模型进行参数更新,以获得训练好的视频分类模型。
[0042]本专利技术还提供一种视频分类装置,包括:
[0043]待分类视频获取模块,用于获取待分类视频;
[0044]待分类视频分割模块,用于根据预设数量对所述待分类视频进行分割,获得与所述预设数量对应的分割结果;其中,所述预设数量为预先训练好的视频分类模型中的超参数,且其在视频分类模型训练过程中通过预设的优化算法进行最优数量寻优确定;
...

【技术保护点】

【技术特征摘要】
1.一种视频分类模型的训练方法,其特征在于,包括:获取训练视频以及其对应的视频标签;根据预设数量对所述训练视频进行分割,获得与所述预设数量对应的分割结果;其中,所述预设数量为训练超参数,且其通过预设的优化算法进行最优数量寻优确定;基于所述分割结果,并利用预先构建的视频分类模型进行前向推理,获得与所述预设数量对应的分类结果,从所述分类结果中确定目标分类结果;根据所述目标分类结果以及所述视频标签进行损失计算,利用计算得到的损失值对所述预先构建的视频分类模型进行参数更新,以获得训练好的视频分类模型。2.根据权利要求1所述的视频分类模型的训练方法,其特征在于,预设数量通过预设的优化算法进行最优数量寻优确定,包括:S1,利用预定的优化算法进行参数初始化,获得初始数量;S2,按照所述初始数量对所述训练视频进行分割,获得与初始数量对应的分割结果;S3,基于所述分割结果,并利用预先构建的视频分类模型进行前向推理,获得与所述初始数量对应的分类结果,从所述分类结果中确定目标分类结果;S4,根据所述目标分类结果以及所述视频标签进行损失计算,利用计算得到的损失值对所述预先构建的视频分类模型进行参数更新,以获取更新后的视频分类模型及其对应的模型性能;S5,基于所述模型性能,利用所述预定的优化算法对所述初始数量进行优化,获得优化后数量;S6,按照优化后数量对所述训练视频进行分割,获得与优化后数量对应的分割结果;S7,重复所述S3

S6,直到所述模型性能满足预设的精度要求或达到预设的循环次数,以获得最优数量,用于视频分类模型的训练过程。3.根据权利要求1所述的视频分类模型的训练方法,其特征在于,所述根据预设数量对所述训练视频进行分割,获得与所述预设数量对应的分割结果,包括:将所述训练视频按照所述预设数量进行分割,获得与所述预设数量对应的视频片段;相应地,所述基于所述分割结果,并利用预先构建的视频分类模型进行前向推理,获得与所述预设数量对应的分类结果,包括:将所述视频片段输入至所述预先构建的视频分类模型进行前向推理,获得与所述预设数量对应的分类结果。4.根据权利要求1所述的视频分类模型的训练方法,其特征在于,所述根据预设数量对所述训练视频进行分割,获得与所述预设数量对应的分割结果,包括:将所述训练视频输入至预先构建的视频分类模型中,利用所述预先构建的视频分类模型中的各个网络层进行前向推理;在前向推理过程中,选取任一网络层输出的特征图作为目标特征图,并按照所述预设数量对所述目标特征图进行分割,以获得与所述预设数量对应的子特征;相应地,所述基于所述分割结果,并利用预先构建的视频分类模型进行前向推理,获得与所述预设数量对应的分类结果,包括:基于所述子特征,获取与所述预设数量对应的分类结果。5.根据权利要求4所述的视频分类模型的训练方法,其特征在于,所述预先构建的视频
分类模型包括特征提取主干网络以及检测网络;相应地,所述选取任一网络层输出的特征图作为目标特征图,包括:选取所述特...

【专利技术属性】
技术研发人员:宋佳兴
申请(专利权)人:嬴彻星创智能科技上海有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1