【技术实现步骤摘要】
视频内容的完整度识别方法、装置、设备及存储介质
[0001]本申请涉及深度学习领域,特别涉及一种视频内容的完整度识别方法、装置、设备及存储介质。
技术介绍
[0002]短视频是指视频时长在几秒至几分钟不等的视频,短视频通常在应用程序中以消息来源(Feeds)流的形式呈现在用户的面前。
[0003]短视频创作者将短视频上传至短视频平台,短视频平台对上传的短视频进行审核,审核通过的短视频根据相关的推荐算法推荐至用户对应的客户端。在一些情况下,短视频创作者为了提升收益,会发布大量类似或者重复的视频内容,这些视频内容很多是通过视频剪辑工具自动剪辑产生的,使得短视频的质量得不到保障。示意性的,在这些短视频中可能包含一些不完整的音频内容,如,短视频中的歌声戛然而止,短视频平台对此类短视频的审核结果为视频内容不完整,不允许视频发布在短视频平台上。
[0004]在上述情况中,以人工审核的方式,需要审核人员观看每个上传至短视频平台的短视频,审核过程耗时较长,审核效率较低。
技术实现思路
[0005]本申请实施例提供了一种视频内容的完整度识别方法、装置、设备及存储介质。通过对视频文件对应的音频特征和文本特征拼接后的向量进行识别,综合多个维度的特征确定视频内容的完整度,使得视频完整度审核的准确率提高。所述技术方案包括:
[0006]根据本申请的一方面,提供了一种视频内容的完整度识别方法,所述方法包括:
[0007]获取视频文件和所述视频文件的视频发布信息,所述视频发布信息表示在发布所述视频文 ...
【技术保护点】
【技术特征摘要】
1.一种视频内容的完整度识别方法,其特征在于,所述方法包括:获取视频文件和所述视频文件的视频发布信息,所述视频发布信息表示在发布所述视频文件对应的视频内容时所提供的信息;从所述视频文件中分离出音频数据;从所述音频数据中提取音频特征,从所述视频发布信息中提取文本特征;将所述音频特征和所述文本特征进行拼接,得到拼接后的特征;对所述拼接后的特征进行识别,得到所述视频文件对应的视频内容的完整度。2.根据权利要求1所述的方法,其特征在于,所述对所述拼接后的特征进行识别,得到所述视频文件对应的视频内容的完整度,包括:调用视频完整度识别模型对所述拼接后的特征进行识别,得到所述视频文件对应的视频内容属于完整视频内容的预测概率;根据所述预测概率得到所述视频文件对应的视频内容的完整度。3.根据权利要求2所述的方法,其特征在于,所述视频完整度识别模型是通过如下方式获得的:获取样本视频文件和所述样本视频文件的样本视频发布信息,所述样本视频文件对应的样本视频标注有视频内容完整度,所述样本视频发布信息表示在发布所述样本视频文件对应的视频内容时所提供的信息;从所述样本视频对应的音频数据中提取样本音频特征,从所述样本视频发布信息中提取样本文本特征;将所述样本音频特征和所述样本文本特征进行拼接,得到拼接后的样本特征;对所述拼接后的样本特征进行识别,得到所述样本视频文件对应的样本视频的内容预测完整度;根据所述内容预测完整度和所述样本视频标注的视频内容完整度对所述视频完整度识别模型进行训练,得到训练后的视频完整度识别模型。4.根据权利要求3所述的方法,其特征在于,所述根据所述内容预测完整度和所述样本视频标注的视频内容完整度对所述视频完整度识别模型进行训练,得到训练后的视频完整度识别模型,包括:计算所述内容预测完整度和所述视频内容完整度的误差损失;根据所述误差损失对所述视频完整度识别模型进行训练,得到所述训练后的视频完整度识别模型。5.根据权利要求4所述的方法,其特征在于,所述计算所述内容预测完整度和所述视频内容完整度的误差损失,包括:获取所述视频完整度识别模型对应的激活函数;根据所述激活函数、所述内容预测完整度和所述视频内容完整度,得到用于二分类的交叉熵损失函数;根据所述用于二分类的交叉熵损失函数计算所述内容预测完整度和所述视频内容完整度的误差损失。6.根据权利要求4所述的方法,其特征在于,所述根据所述误差损失对所述视频完整度识别模型进行训练,得到所述训练后的视频完整度识别模型,包括:
通过用于二分类的交叉熵损失函数计算所述误差损失,所述用于二分类的交叉熵损失函数是通过所述视频完整度识别模型对应的激活函数、所述内容预测完整度和所述视频内容完整度得到的;响应于所述误差损失收敛,得到所述视频完整度识别模型对应的权重矩阵和偏移向量,所述权重矩阵用于表征所述样本视频文件对所述视频完整度识别模型输出所述内容预测完整度的影响程度,所述...
【专利技术属性】
技术研发人员:刘刚,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。