一种基于音频特征的短视频预告片自动生成方法及系统技术方案

技术编号：33020754 阅读：31 留言：0更新日期：2022-04-15 08:53

本发明专利技术涉及视频处理技术领域，具体公开了一种基于音频特征的短视频预告片自动生成方法及系统，其中方法包括如下步骤：解码步骤：将原视频拆分为多个片段，并进行解码；切分步骤：解码后根据每帧在HSV色彩空间中的距离切分镜头，并计算每帧的HLS特征；特征提取步骤：使用目标检测器每隔预设时间提取一次目标特征；音频特征提取步骤：提取短期音频特征和中期音频特征；得分预测步骤：统计每个镜头的最终精彩程度预测得分；输出步骤：选出得分最高的若干个镜头，按时间排序镜头，合并相邻镜头，返回起止时间；根据镜头的起止时间以及设置的时长自动截取并拼接成对应的短视频预告片。采用本发明专利技术的技术方案能够保留视频中精彩镜头。明的技术方案能够保留视频中精彩镜头。明的技术方案能够保留视频中精彩镜头。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于音频特征的短视频预告片自动生成方法及系统

[0001]本专利技术涉及视频处理
，特别涉及一种基于音频特征的短视频预告片自动生成方法及系统。

技术介绍

[0002]自上世纪以来，人类积攒了海量高质量影视资源，涵盖了电影、综艺节目、电视剧等影视类型。随着影视技术和设备的发展，已有大量视频的时长接近甚至超过一小时。近年来，随着生活节奏的加快，用户更喜欢把时间花在更紧凑的短视频上，短视频分享平台也越来越受欢迎。互联网上大批创作者也开始使用短视频为电影、电视剧等时长较长的影视资源引流。
[0003]短视频虽然短小，但内容完整，且包含大量精彩内容，因而短视频的制作需要耗费大量精力。现阶段的将影视资源制作成短视频主要采用人工剪辑的方式，然而影视资源时长可能达数小时，并且其中包含了大量平凡无趣的镜头，这无疑占用了创作者的大量时间用于筛选片段。随着人工智能技术的发展，计算机理解并自动编辑视频成为了可能，这便催生了短视频自动生成的需求，但是如何去掉大量平凡无趣的镜头，只保留精彩的，对大部分用户具有吸引力镜头成了需要解决的问题。
[0004]为此，需要一种能够保留视频中精彩镜头的基于音频特征的短视频预告片自动生成方法及系统。

技术实现思路

[0005]本专利技术提供了一种基于音频特征的短视频预告片自动生成方法，能够保留视频中精彩镜头。
[0006]为了解决上述技术问题，本申请提供如下技术方案：
[0007]一种基于音频特征的短视频预告片自动生成方法，包括如下步骤：
[0...

【技术保护点】

【技术特征摘要】
1.一种基于音频特征的短视频预告片自动生成方法，其特征在于，包括如下步骤：解码步骤：将原视频拆分为多个片段，并进行解码；切分步骤：解码后根据每帧在HSV色彩空间中的距离切分镜头，并计算每帧的HLS特征；特征提取步骤：使用目标检测器每隔预设时间提取一次目标特征；音频特征提取步骤：提取短期音频特征和中期音频特征；得分预测步骤：对短期音频特征求密度得到短期音频的精彩程度预测得分；根据HLS特征和目标特征进行投票得到视频的精彩程度得分；根据中期音频特征进行投票得到中期音频的精彩程度预测得分；统计每个镜头的三类得分作为镜头的最终精彩程度预测得分；输出步骤：选出得分最高的若干个镜头，按时间排序镜头，合并相邻镜头，返回起止时间；根据镜头的起止时间以及设置的时长自动截取并拼接成对应的短视频预告片。2.根据权利要求1所述的基于音频特征的短视频预告片自动生成方法，其特征在于：所述得分预测步骤中，使用滑动汉明窗口对短期音频特征求密度得到短期音频的精彩程度预测得分；使用若干个异常检测器根据HLS特征和目标特征进行投票得到视频的精彩程度得分；使用若干个异常检测器根据中期音频特征进行投票得到中期音频的精彩程度预测得分；统计每个镜头的三类得分作为镜头的最终精彩程度预测得分。3.根据权利要求1所述的基于音频特征的短视频预告片自动生成方法，其特征在于：所述输出步骤前，还包括边界确定步骤：使用汉明窗平滑短期音频的能量特征波形，找到镜头边界邻域内能量波形的极小值点，若...

【专利技术属性】
技术研发人员：王晶，
申请(专利权)人：空间视创重庆科技股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人