一种用于非编工程中的音乐节拍提取方法技术

技术编号：30074032 阅读：85 留言：0更新日期：2021-09-18 08:28

本发明专利技术公开了一种用于非编工程中的音乐节拍提取方法，包括以下步骤：步骤一：音频数据样本预处理，对原始音频数据样本进行预处理，将原始音频数据样本打包为音频帧格式的音频数据样本；步骤二：音频数据样本节奏评估，对音频帧格式的音频数据样本进行节奏评估，获得音频数据样本的每分钟节拍数；步骤三：音频数据样本节拍位置评估，利用音频数据样本的每分钟节拍数进行节拍位置评估，定位出音频数据样本中每个节拍的出现的具体时间位置。本发明专利技术通过对音频数据进行预处理，并评估预处理后的音频数据的每分钟节拍数，利用节拍数评估出音频样本中每个节拍的出现的具体时间位置，实现音乐节拍提取，提高了关键点位的定位精度。提高了关键点位的定位精度。提高了关键点位的定位精度。

全部详细技术资料下载

【技术实现步骤摘要】
一种用于非编工程中的音乐节拍提取方法

[0001]本专利技术涉及视频编辑
，尤其涉及一种用于非编工程中的音乐节拍提取方法。

技术介绍

[0002]近年来随网速不断提升，伴随着短视频的兴起，特别是针对短视频中的卡点剪辑模式，如何让视频切片能够快速精准对齐音频鼓点，让输出画面更加符合音乐节拍的功能，受到短视频制作者的追捧。
[0003]目前常用的音频卡点剪辑方法，是由剪辑人员在对音频切片试听过程中，通过人工对音频切片打点的方式来获取关键点位，再引入其它素材切片去对应点位，这种方式虽然也能满足实际应用，但精准度低下，且用户在使用过程中的体验较差。
[0004]如申请号为CN201910619907.9的专利申请公开了一种生成多媒体的方法及装置、电子设备、存储介质，该方法包括：根据为多媒体所选定的音频，获得音频中各音频帧的频谱；根据音频中各音频帧的频谱进行差分计算，获得音频帧的频谱通量；根据音频帧的频谱通量进行峰值检测，定位音频中鼓点所在的音频帧；根据为多媒体所选定的视频素材生成对齐至鼓点的视频片段；按照所述视频片段所对齐的鼓点进行视频片段和音频的合成，获得多媒体，所述多媒体适配于所述音频中的鼓点进行所对应视频片段的切换。方案虽然能提高多媒体的生成速度，但是还存在音频鼓点的定位精度不高的问题。

技术实现思路

[0005]本专利技术的目的在于克服现有技术的不足，提供一种用于非编工程中的音乐节拍提取方法，通过对音频数据进行预处理，并评估预处理后的音频数据的每分钟节拍数，利用节拍数评估出音频样...

【技术保护点】

【技术特征摘要】
1.一种用于非编工程中的音乐节拍提取方法，其特征在于，包括以下步骤：步骤一：音频数据样本预处理，对原始音频数据样本进行预处理，将原始音频数据样本打包为音频帧格式的音频数据样本；步骤二：音频数据样本节奏评估，对音频帧格式的音频数据样本进行节奏评估，获得音频数据样本的每分钟节拍数；步骤三：音频数据样本节拍位置评估，利用音频数据样本的每分钟节拍数进行节拍位置评估，定位出音频数据样本中每个节拍的出现的具体时间位置。2.根据权利要求1所述的一种用于非编工程中的音乐节拍提取方法，其特征在于，所述步骤一具体包括：S101，音频样本通道合并，采用将多通道样本进行平均或者仅选择其中一个声道的样本作为后续处理的样本f(t)；S102，音频样本下采样，以8KHz的采样频率fq对样本f(t)进行下采样，下采样后的样本记为S(n)，其中n为样本数据的索引编号；S103，音频样本打包，将下采样样本S(n)按照预设音频帧格式打包为音频帧。3.根据权利要求1所述的一种用于非编工程中的音乐节拍提取方法，其特征在于，所述步骤二具体包括：S201，频谱分析，利用频谱分析方法分析出不同音频帧中不同时刻与人耳听觉相适应的频谱强度；S202，建立节奏样本，根据不同时刻的频谱强度，利用音乐节拍提取方法提取出音频帧中的节拍数；S203，BPM评估，对音频强度进行自相关运算来获取音频帧的BPM。4.根据权利要求1所述的一种用于非编工程中的音乐节拍提取方法，其特征在于，所述步骤三具体包括：将音频帧的BPM作为参数生成高斯...

【专利技术属性】
技术研发人员：马萧萧，张博文，黄平，雷锴，赵越，
申请(专利权)人：成都东方盛行电子有限责任公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人