一种用于非编工程中的音乐节拍提取方法技术

技术编号:30074032 阅读:59 留言:0更新日期:2021-09-18 08:28
本发明专利技术公开了一种用于非编工程中的音乐节拍提取方法,包括以下步骤:步骤一:音频数据样本预处理,对原始音频数据样本进行预处理,将原始音频数据样本打包为音频帧格式的音频数据样本;步骤二:音频数据样本节奏评估,对音频帧格式的音频数据样本进行节奏评估,获得音频数据样本的每分钟节拍数;步骤三:音频数据样本节拍位置评估,利用音频数据样本的每分钟节拍数进行节拍位置评估,定位出音频数据样本中每个节拍的出现的具体时间位置。本发明专利技术通过对音频数据进行预处理,并评估预处理后的音频数据的每分钟节拍数,利用节拍数评估出音频样本中每个节拍的出现的具体时间位置,实现音乐节拍提取,提高了关键点位的定位精度。提高了关键点位的定位精度。提高了关键点位的定位精度。

【技术实现步骤摘要】
一种用于非编工程中的音乐节拍提取方法


[0001]本专利技术涉及视频编辑
,尤其涉及一种用于非编工程中的音乐节拍提取方法。

技术介绍

[0002]近年来随网速不断提升,伴随着短视频的兴起,特别是针对短视频中的卡点剪辑模式,如何让视频切片能够快速精准对齐音频鼓点,让输出画面更加符合音乐节拍的功能,受到短视频制作者的追捧。
[0003]目前常用的音频卡点剪辑方法,是由剪辑人员在对音频切片试听过程中,通过人工对音频切片打点的方式来获取关键点位,再引入其它素材切片去对应点位,这种方式虽然也能满足实际应用,但精准度低下,且用户在使用过程中的体验较差。
[0004]如申请号为CN201910619907.9的专利申请公开了一种生成多媒体的方法及装置、电子设备、存储介质,该方法包括:根据为多媒体所选定的音频,获得音频中各音频帧的频谱;根据音频中各音频帧的频谱进行差分计算,获得音频帧的频谱通量;根据音频帧的频谱通量进行峰值检测,定位音频中鼓点所在的音频帧;根据为多媒体所选定的视频素材生成对齐至鼓点的视频片段;按照所述视频片段所对齐的鼓点进行视频片段和音频的合成,获得多媒体,所述多媒体适配于所述音频中的鼓点进行所对应视频片段的切换。方案虽然能提高多媒体的生成速度,但是还存在音频鼓点的定位精度不高的问题。

技术实现思路

[0005]本专利技术的目的在于克服现有技术的不足,提供一种用于非编工程中的音乐节拍提取方法,通过对音频数据进行预处理,并评估预处理后的音频数据的每分钟节拍数,利用节拍数评估出音频样本中每个节拍的出现的具体时间位置,实现音乐节拍提取,提高了关键点位的定位精度。
[0006]本专利技术的目的是通过以下技术方案来实现的:
[0007]一种用于非编工程中的音乐节拍提取方法,包括以下步骤:
[0008]步骤一:音频数据样本预处理,对原始音频数据样本进行预处理,将原始音频数据样本打包为音频帧格式的音频数据样本;
[0009]步骤二:音频数据样本节奏评估,对音频帧格式的音频数据样本进行节奏评估,获得音频数据样本的每分钟节拍数;
[0010]步骤三:音频数据样本节拍位置评估,利用音频数据样本的每分钟节拍数进行节拍位置评估,定位出音频数据样本中每个节拍的出现的具体时间位置。
[0011]具体的,步骤一具体包括:
[0012]S101,音频样本通道合并,采用将多通道样本进行平均或者仅选择其中一个声道的样本作为后续处理的样本f(t);
[0013]S102,音频样本下采样,以8KHz的采样频率fq对样本f(t)进行下采样,下采样后的
样本记为S(n),其中n为样本数据的索引编号;
[0014]S103,音频样本打包,将下采样样本S(n)按照预设音频帧格式打包为音频帧。
[0015]具体的,步骤二具体包括:
[0016]S201,频谱分析,利用频谱分析方法分析出不同音频帧中不同时刻与人耳听觉相适应的频谱强度;
[0017]S202,建立节奏样本,根据不同时刻的频谱强度,利用音乐节拍提取方法提取出音频帧中的节拍数;
[0018]S203,BPM评估,对音频强度进行自相关运算来获取音频帧的BPM。
[0019]具体的,步骤三具体包括:将音频帧的BPM作为参数生成高斯窗对;对音频强度进行滤波获得节拍评分Ga(fn);对节拍评分进行局部极值点查找,获得音频帧索引号为fn且满足预设的查找条件的节拍时刻序列T(n);将节拍时刻序列T(n)中末尾dn时刻的节拍评分Ga(fn)最大值作为音频节拍的结束时刻t
end
;由结束时刻t
end
向前每次在节拍评分Ga(fn)回溯dn时刻,即在节拍时刻序列T(n)中找出处于[t
end

dn,t
end
]时间段内的时刻所对应的节拍评分Ga(fn)最大值对应的样本索引号fn;并根据公式t=fn/fm计算出节拍时刻t,从而定位出音频数据样本中每个节拍的出现的具体时间位置。
[0020]具体的,步骤S201具体包括以下子步骤:
[0021]S2011,利用汉明窗函数对音频帧进行加汉明窗处理;
[0022]S2012,将经过加汉明窗处理的音频帧进行快速傅里叶变换,得到每一帧的傅里叶频谱强度;
[0023]S2013,利用矩阵变换方法将傅里叶频谱强度转换为梅尔频谱;
[0024]S2014,利用梅尔声谱换算公式将梅尔频谱换算为分贝幅度的梅尔声谱强度。
[0025]具体的,步骤S202具体包括以下子步骤:
[0026]S2021,通过阀值操作将梅尔声谱强度中低分贝的谱强度进行截断,剔除梅尔声谱中的低分贝的声音;
[0027]S2022,计算音谱强度增量,将每个音频帧的音频强度增量进行求和;
[0028]S2023,利用IIR滤波器将求和后的音频强度增量进行IIR滤波,去除直流分量。
[0029]本专利技术的有益效果:本专利技术通过对音频数据进行预处理,并评估预处理后的音频数据的每分钟节拍数,利用节拍数评估出音频样本中每个节拍的出现的具体时间位置,实现音乐节拍提取,提高了关键点位的定位精度,改善了音频卡点的剪辑体验。
附图说明
[0030]图1是本专利技术的方法流程图。
[0031]图2是本专利技术的音频数据样本预处理流程图。
[0032]图3是本专利技术的频谱分析流程图。
[0033]图4是本专利技术的节奏样本构建流程图。
[0034]图5是本专利技术的BPM评估流程图。
[0035]图6是本专利技术的节拍位置评估流程图。
具体实施方式
[0036]为了对本专利技术的技术特征、目的和效果有更加清楚的理解,现对照附图说明本专利技术的具体实施方式。
[0037]本实施例中,如图1所示,一种用于非编工程中的音乐节拍提取方法,包括以下步骤:
[0038](1)音频数据样本预处理,该过程具体包括:
[0039](1.1)音频样本通道合并,可采用将多通道样本进行平均或者仅选择其中一个声道的样本作为后续处理的样本f(t)。
[0040](1.2)样本下采样到较低的采样频率fq,可选的采样频率为8KHz,下采样方法可选最近邻或线性下采样方法,下采样后的样本记为S(n),其中n为样本数据的索引编号。
[0041](1.3)将样本打包为音频帧格式。音频帧计算公式为
[0042]SF(fn,n)=S(fn
·
(fz

hz)+n)
[0043]其中,fz表示一个音频帧中所包含的样本数量;hz表示音频帧之间的重叠样本的数量;fn表示音频帧索引号,音频帧索引号取值范围为n表示音频帧中的样本数据索引号,样本数据索引号取值范围为0≤n<fz;则音频帧对应的频率fm为
[0044](2)节奏评估
[0045]节奏评估用来评估音乐的每分钟节拍数(BPM,B本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用于非编工程中的音乐节拍提取方法,其特征在于,包括以下步骤:步骤一:音频数据样本预处理,对原始音频数据样本进行预处理,将原始音频数据样本打包为音频帧格式的音频数据样本;步骤二:音频数据样本节奏评估,对音频帧格式的音频数据样本进行节奏评估,获得音频数据样本的每分钟节拍数;步骤三:音频数据样本节拍位置评估,利用音频数据样本的每分钟节拍数进行节拍位置评估,定位出音频数据样本中每个节拍的出现的具体时间位置。2.根据权利要求1所述的一种用于非编工程中的音乐节拍提取方法,其特征在于,所述步骤一具体包括:S101,音频样本通道合并,采用将多通道样本进行平均或者仅选择其中一个声道的样本作为后续处理的样本f(t);S102,音频样本下采样,以8KHz的采样频率fq对样本f(t)进行下采样,下采样后的样本记为S(n),其中n为样本数据的索引编号;S103,音频样本打包,将下采样样本S(n)按照预设音频帧格式打包为音频帧。3.根据权利要求1所述的一种用于非编工程中的音乐节拍提取方法,其特征在于,所述步骤二具体包括:S201,频谱分析,利用频谱分析方法分析出不同音频帧中不同时刻与人耳听觉相适应的频谱强度;S202,建立节奏样本,根据不同时刻的频谱强度,利用音乐节拍提取方法提取出音频帧中的节拍数;S203,BPM评估,对音频强度进行自相关运算来获取音频帧的BPM。4.根据权利要求1所述的一种用于非编工程中的音乐节拍提取方法,其特征在于,所述步骤三具体包括:将音频帧的BPM作为参数生成高斯...

【专利技术属性】
技术研发人员:马萧萧张博文黄平雷锴赵越
申请(专利权)人:成都东方盛行电子有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1