音频节奏确定方法、装置、存储介质和电子设备制造方法及图纸

技术编号:25954545 阅读:22 留言:0更新日期:2020-10-17 03:47
本申请提供了一种音频节奏确定方法、装置和电子设备,其中,方法包括:获取音频文件的多个音频特征;确定所述多个音频特征中每个音频特征对应的音频节奏信息;在所述每个音频特征对应的音频节奏信息中获取优选节奏信息,将所述优选节奏信息确定为所述音频文件的节奏信息。采用本申请实施例,可使最终确定的节奏信息较准确地表征出音频文件的节奏信息。

【技术实现步骤摘要】
音频节奏确定方法、装置、存储介质和电子设备
本申请涉及音频处理
,具体而言,涉及一种音频节奏确定方法、装置、存储介质和电子设备。
技术介绍
针对音频文件的节奏分析已被广泛的应用在与音视频相关的多个领域中。如对短视频拍摄的配乐进行节奏分析,可以创建出更具感官冲击的专场卡点视频。又如根据音频文件的节奏特性可对用户的手机乐库进行风格分类,并进行音乐推荐等。
技术实现思路
为了解决上述问题,本申请实施例提供了一种音频节奏确定方法、装置、存储介质和电子设备,可以较准确地识别出音频文件的节奏信息。第一方面,本申请实施例提供了一种音频节奏确定方法,包括以下步骤:获取音频文件的多个音频特征;确定所述多个音频特征中每个音频特征对应的音频节奏信息;在所述每个音频特征对应的音频节奏信息中获取优选节奏信息,将所述优选节奏信息确定为所述音频文件的节奏信息。第二方面,本申请实施例提供了一种音频节奏确定装置,包括:特征获取单元,用于获取音频文件的多个音频特征;第一信息确定单元,用于确定所述多个音频特征中每个音频特征对应的音频节奏信息;第二信息确定单元,用于在所述每个音频特征对应的音频节奏信息中获取优选节奏信息,将所述优选节奏信息确定为所述音频文件的节奏信息。第三方面,本申请实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述方法的步骤。第四方面,本申请实施例提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述任一项方法的步骤。在本申请实施例中,获取音频文件的多个音频特征;确定所述多个音频特征中每个音频特征对应的音频节奏信息;在所述每个音频特征对应的音频节奏信息中获取优选节奏信息,将所述优选节奏信息确定为所述音频文件的节奏信息。较全面地考虑了基于多个音频特征的多个节奏信息,从多个节奏信息中选择出可较准确地对应于音频文件的优选节奏信息,并且以该优选节奏信息作为音频文件的节奏信息。因此,最终确定的节奏信息可较准确地表征出音频文件的节奏信息。附图说明图1为本申请实施例提供的一种音频节奏确定方法的流程示意图;图2为本申请实施例提供的另一种音频节奏确定方法的流程示意图;图3为本申请实施例提供的一种音频节奏确定方法的架构示意图;图4为本申请实施例提供的一种计算音频节奏信息的互信息的方法示意图;图5a为本申请实施例提供的一种时间误差的概率分布示意图;图5b为本申请实施例提供的一种时间误差的概率分布示意图;图6为本申请实施例提供的一种音频节奏的应用示意图;图7为本申请实施例提供的一种音频节奏确定装置的结构示意图;图8为本申请实施例所涉及的一种电子设备的结构示意图。具体实施方式下面结合附图和实施例对本申请进行进一步的介绍。在下述介绍中,术语“第一”、“第二”仅为用于描述的目的,而不能理解为指示或暗示相对重要性。下述介绍提供了本申请的多个实施例,不同实施例之间可以替换或者合并组合,因此本申请也可认为包含所记载的相同和/或不同实施例的所有可能组合。因而,如果一个实施例包含特征A、B、C,另一个实施例包含特征B、D,那么本申请也应视为包括含有A、B、C、D的一个或多个所有其他可能的组合的实施例,尽管该实施例可能并未在以下内容中有明确的文字记载。下面的描述提供了示例,并且不对权利要求书中阐述的范围、适用性或示例进行限制。可以在不脱离本申请内容的范围的情况下,对描述的元素的功能和布置做出改变。各个示例可以适当省略、替代或添加各种过程或组件。例如所描述的方法可以以所描述的顺序不同的顺序来执行,并且可以添加、省略或组合各种步骤。此外,可以将关于一些示例描述的特征组合到其他示例中。可采用基于记录固有属性或是基于一定的音频特征对音频文件的节奏进行分析。但无论是基于记录固有属性的分析方式还是基于一定的音频特征分析的算法层面的分析方式都存在一定的问题。首先如果淡出只基于记录固有属性,在相对复杂的和弦或者旋律出现的时候,单纯的记录分析方式肯定达不到通过算法分析音频特征的稳定性,而对于基于单一音频特征来分析音频节奏特性的方式也会存在一定的问题,目前主要的问题是不同的特征来自不同的信息维度所以会对衡量得到的音频节奏特性精度有一定的影响,如何能从不同的信息维度中获取相对最准确衡量音频节奏特性的特征信息则是现有方法都没有考虑到的关键问题。下面结合具体实施例进行说明。参见图1,图1是本申请实施例提供的一种音频节奏确定方法的流程示意图,在本申请实施例中,所述方法包括:S101、获取音频文件的多个音频特征。音频特征用于表征音频文件的特征。音频特征包括但不限于:能量流(EnergyFlux,EF)、频谱变迁(SpectralFlux,SF)、复谱差(ComplexSpectralDifference,CSD)及节拍强调函数(BeatEmphasisFunction,BEF)。可根据不同音频文件的属性信息和需求选择音频特征。以下就以EF、SF、CSD及BEF这四个音频特征为例,进行介绍。关于EF的计算方法:通过使用2048的窗口大小和512的hop-size(对应于11.6ms的输入特征分辨率)计算短时傅立叶变换帧来计算。其中,hop-size用于表征两个相邻窗口之间错开的样本数。hop-size越小,则说明时序解析度越高,计算成本也越高。hop-size通常为buffer-size的一半或四分之一。从这些帧中,将每个输入特征样本计算为当前短时傅立叶变换帧与其前身之间的均方根(RMS)值的差的大小,其中,Xn(k)为当前输入样本的短时傅里叶变换帧,Xn-1(k)为前一输入样本的短时傅里叶变换帧。EF的计算公式为:EF(n)=|RMS(Xn(k))-RMS(Xn-1(k))|关于SFX的计算方法:通过使用2048的窗口大小和512的hopsize(对应于11.6ms的输入特征分辨率)计算短时傅立叶变换(STFT)帧来计算的。从这些帧中,每个输入特征样本被计算为在大小上当前STFT的每个频率仓变换帧和它的前身之间的正差的总和,其中,Xn(k)为当前输入样本的短时傅里叶变换帧,Xn-1(k)为前一输入样本的短时傅里叶变换帧。SFX的计算公式为:关于CSD的计算方法:CSD是通过对512个样本跃点大小的1024个样本帧进行短时傅立叶变换而得出的,分辨率为11.6ms。如果幅度或与预期相位值的偏差发生显着变化(与仅计算频率幅度变化的频谱通量不同),则此功能会产生较大的值。是当前帧的预期目标幅度和相位,并且是根据前两个帧的值(假设幅度和相位变化率恒定)估算的。其中,Xn(k)为当前输入样本的短时傅里叶变换帧,Xn-1(k)为前一输入样本的短时傅里叶变换帧。CSD的计算公式为关于BEF的计算方法:BEF定义为子带复谱差函数本文档来自技高网...

【技术保护点】
1.一种音频节奏确定方法,其特征在于,所述方法包括:/n获取音频文件的多个音频特征;/n确定所述多个音频特征中每个音频特征对应的音频节奏信息;/n在所述每个音频特征对应的音频节奏信息中获取优选节奏信息,将所述优选节奏信息确定为所述音频文件的节奏信息。/n

【技术特征摘要】
1.一种音频节奏确定方法,其特征在于,所述方法包括:
获取音频文件的多个音频特征;
确定所述多个音频特征中每个音频特征对应的音频节奏信息;
在所述每个音频特征对应的音频节奏信息中获取优选节奏信息,将所述优选节奏信息确定为所述音频文件的节奏信息。


2.根据权利要求1所述的方法,其特征在于,所述在所述每个音频特征对应的音频节奏信息中获取优选节奏信息,包括:
获取每个所述音频节奏信息对应的互信息度量值;
确定所述每个所述音频节奏信息对应的互信息度量值中的最大互信息度量值,将所述最大互信息度量值指示的音频节奏信息确定为所述优选节奏信息。


3.根据权利要求2所述的方法,其特征在于,所述获取每个所述音频节奏信息对应的互信息度量值,包括:
计算所述音频节奏信息中当前音频节奏信息与其余音频节奏信息之间的互信息值;
计算所述互信息值的第一平均值,将所述第一平均值作为所述当前音频节奏信息的目标互信息度量值,并生成包含所述目标互信息度量值的每个所述音频节奏信息对应的互信息度量值。


4.根据权利要求2所述的方法,其特征在于,所述确定所述每个所述音频节奏信息对应的互信息度量值中的最大互信息度量值,包括:
计算每个所述音频节奏信息对应的互信息度量值的第二平均值,将所述第二平均值确定为节奏检测的置信度;
若所述置信度大于或者等于所述第一置信度阈值,确定所述每个所述音频节奏信息对应的互信息度量值中的最大互信息度量值。


5.根据权利要求4所述的方法,其特征在于,所述若所述置信度大于或者等于所述第一置信度阈值,确定所述每个所述音频节奏信息对应的互信息度量值中的最大互信息度量值,包括:
若所述置信度大于或者等于所述第一置信度阈值且小于第二置信度阈值,将所述多个音频特征识别为第一准确度级别,并确定所述每个所述音频节奏信息对应的互信息度量值中的最大互信息...

【专利技术属性】
技术研发人员:谭皓
申请(专利权)人:OPPO广东移动通信有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1