基于音频频谱特征分析的演唱音色明亮度客观评测方法技术

技术编号:4330927 阅读:393 留言:0更新日期:2012-04-11 18:40
本发明专利技术提供一种基于音频频谱特征分析的演唱音色明亮度的客观评测方法,包括如下步骤:1)选取需要度量音色明亮度的演唱片段音频信号;2)对所选取的演唱片段音频信号进行“演唱/间隙”判断;3)对步骤2)得到的演唱片段,计算得到三种频谱特征测度:2K-3KHz能量和、频谱能量总和以及频率加权的谱能量和;4)根据步骤3)得到的频谱特征,计算得到最终的客观度量参数指标:平均2K-3KHz能量比、平均谱重心,利用求出的参数指标对演唱音色的明亮度进行评测。本发明专利技术的评测方法,通过对演唱片段的频谱特征分析,利用计算机算法给出可以量化的客观评测参数指标,不受其他人为因素影响,并且具有稳定性、客观性以及便利性等优点。

【技术实现步骤摘要】

本专利技术涉及一种度量演唱音色明亮度的客观方法,更具体地说,本专利技术涉及一种基于音频频谱特征分析的演唱音色明亮度的客观评测方法。
技术介绍
音色明亮度是指一种用于评价唱歌者演唱水平的主观指标, 一般定义为对唱歌者歌声的一种明亮、高昂、温暖的主观感知。主观评价人感觉唱歌者的歌声越明亮、高昂,则认为唱歌者的演唱音色明亮度越高,反之,则认为演唱音色明亮度越低。这里的主观评价人, 一般指的是声乐专家,比如声乐老师和资深音乐家。而唱歌者可以是专业的歌手、声乐系学生,也可以是普通人。目前,演唱评价基本还是处于完全依靠专家主观评价的阶段,并没有成熟的客观评价系统能够对演唱水平或演唱水平的某个方面进行度量和评价。演唱音色明亮程度的评价也完全依赖专家的主观感知,目前还没有客观度量的方法或者辅助主观评价的客观指标。虽然国外一些研究调査发现音色明亮度的评价和频谱能量分布、共振峰位置、能量等有关,但是并没有具体的、定义明确的客观度量方法出现。例如,文献1提出音色明亮度与频谱能量分布有关,但是并没有给出具体的计算方法。另外,演唱水平的评价与旋律音高的准确性相关,演唱者音高的提取,我们采用了参考文献2中提出的方法,该方法通过求取每帧数据频谱谐波和最大值对应的基频作为每帧的音高值。这里,需要说明的是,该方法得到的音高值仅仅作为计算音色的一个基本参数值,与本专利的独特性无关。另外,主观演唱评价方法不可避免的具有以下几个缺点第一,不可重复性。因为各种各样因素的影响,对于同样一个演唱片段,两次主观评价之间或多或少的都会出现差异,而这种差异在理想情况下是不应该存在的。第二,主观偏向性。因为每个评价人都有各自不同的喜好,所以对于同一个演唱片段,每个评价人都有各自不同的评价,都有各自的偏向性。第三,费用昂贵,可获得性差。对于一般的普通人来说(不是专业的声乐学校的学生),要获得声乐专家的主观评价,是很困难的或费用高昂的。参考文献1: E. Ekholm, G. Papagiannis, and F. Chagnon, Relating ObjectiveMeasurements to Expert Evaluation of Voice Quality in Western Classical Singing:Critical Perceptual Parameters, Journal of Voice, vol.12, no.2, pp. 182—196, 1998.参考文献2: C. Cao, M. Li,丄Liu, and Y. Yan, Singing Melody Extraction inPolyphonic Music by Harmonic Tracking, Proc.她International Conference on MusicInformation Retrieval (ISMIR), pp. 373—374, 2007.
技术实现思路
因此,鉴于上述现状,本专利技术的目的在于提供一种基于音频频谱特征分析的演唱音色明亮度的客观评测方法,通过对演唱片段的频谱特征分析,给出可以量化的客观评测参数指标。为实现上述专利技术目的,本专利技术提供的基于音频频谱特征分析的演唱音色明亮度的客观评测方法,包括如下步骤-1) 选取需要度量音色明亮度的演唱片段音频信号;2) 对上述所选取的演唱片段音频信号进行演唱/间隙判断;3) 对上述步骤2)中得到的演唱片段,计算得到三种频谱特征测度2K-3KHz能量和、频谱能量总和以及频率加权的谱能量和;4) 根据上述步骤3)中得到的频谱特征,计算得到最终的音色明亮度的客观度量参数指标平均2K-3KHz能量比、平均谱重心,然后利用求出的参数指标对演唱音色的明亮度进行评测。其中,上述步骤4)中,在利用求出的参数指标对演唱音色的明亮度进行评测时,可以单独基于所述平均2K-3KHz能量比或者平均谱重心进行评价,也可以将所述平均2K-3KHz能量比和平均谱重心相结合来进行评价。另外,所述步骤2)中的判断方法包括基于能量的语音活动检测算法以及基于基频检测算法的voice/nonvoice判断机制。与现有的主观评价的方法相比,本专利技术提及的两种客观度量方法具有以下优点稳定性、客观性、便利性。由于是基于音频信号频谱特征的客观评价方法,只要输入的演唱音频信号一致,则度量结果保持不变,不受其他人为因素影响。同时,计算机算法的便利程度较声乐专家主观评价的方式有很大改进,只需将录制的演唱片段输入,算法即可以给出客观度量参数。附图说明图1是本专利技术的音色明亮度客观评测方法的流程图。具体实施例方式下面结合附图及具体实施方式对本专利技术的基于音频频谱特征分析的演唱音色明亮度的客观评测方法做进一步详细描述。图1是本专利技术的音色明亮度客观评测方法的流程图。如图1所示,本专利技术提供的,包括如下步骤1) 选取需要度量音色明亮度的演唱片段音频信号该步骤l)中,首先输入演唱片段的音频数据。在本专利技术的基于演唱频谱特征分析的音色明亮度的客观评测方法中,音频数据的格式可以采用16K 16Bit Windows PCM格式等任何一种采样率来进行处理。作为一个实施例,我们采用16K采样率的音频数据格式,每个采样点用16Bit数来表示。2) 对上述所选取的演唱片段音频信号进行演唱/间隙判断在该演唱/间隙判断步骤中,可以采用多种方法,例如基于能量的语音活动检测(VAD: Voice Activity Detection)算法等。这里,以采用基于基频检测算法的voice/nonvoice判断机制为例进行说明。具体地说,使用基于谐波和的基频提取算法,该方法通过计算归一化谐波和谱对信号基频/。序列进行估计,每个浊音帧输出一个基频估计值。基频的具体计算方法与参考文献2中描述基本一致,通过求取每帧数据频谱谐波和最大值对应的基频获得。将具有有效基频值的帧视为演唱部分,而将其余部分视为间隙部分。3) 对上述步骤2)中得到的演唱片段,计算得到三种频谱特征测度2K-3KHz能量和、频谱能量总和以及频率加权的谱能量和通过步骤2)确定了演唱部分位置之后,接着进行频谱特征(2K-3KHz能量和、频谱能量总和、频率加权的谱能量和)的测度计算。第一个特征2K-3KHz能量和。2K-3KHz能量和指的是每个演唱帧中62KHz 3KHz部分频谱能量的总和,其计算方法为-3《其中S(/)为该帧的快速傅立叶变换(FFT)能量谱。第二个特征频谱能量总和,即整个频谱的能量总和,其计算公式为-第三个特征频率加权的谱能量和,即用频率值来对频谱能量值进行加权,其 计算方法为4)根据上述步骤3)中得到的频谱特征,计算得到最终的音色明亮度的客观度 量参数指标平均2K-3KHz能量比以及平均谱重心。在获得了 2K-3KHz能量和、频谱能量总和之后,计算出平均2K-3KHz能量比作为演唱音色明亮度的客观度量指标。平均2K-3KHz能量比的计算对于任何演唱帧,其2K-3KHz能量比的计算公式为' 一五r —平均2K-3KHz能量比》就是该演唱音频信号中所有演唱帧2K-3KHz能量比《 的算术平均值。在本专利技术中,平均2K-3KHz能量比即可作为演唱音色明亮度的一个 客观度量,取值范围为0 1,平均2K-3KHz能量比越大,说本文档来自技高网
...

【技术保护点】
一种基于音频频谱特征分析的演唱音色明亮度的客观评测方法,包括如下步骤: 1)选取需要度量音色明亮度的演唱片段音频信号; 2)对上述所选取的演唱片段音频信号进行“演唱/间隙”判断; 3)对上述步骤2)中得到的演唱片段,计算得 到三种频谱特征测度:2K-3KHz能量和、频谱能量总和以及频率加权的谱能量和; 4)根据上述步骤3)中得到的频谱特征,计算得到最终的音色明亮度的客观度量参数指标:平均2K-3KHz能量比、平均谱重心,然后利用求出的参数指标对演唱音色的 明亮度进行评测。

【技术特征摘要】
1、一种基于音频频谱特征分析的演唱音色明亮度的客观评测方法,包括如下步骤1)选取需要度量音色明亮度的演唱片段音频信号;2)对上述所选取的演唱片段音频信号进行“演唱/间隙”判断;3)对上述步骤2)中得到的演唱片段,计算得到三种频谱特征测度2K-3KHz能量和、频谱能量总和以及频率加权的谱能量和;4)根据上述步骤3)中得到的频谱特征,计算得到最终的音色明亮度的客观度量参数指标平均2K-3KHz能量比、平均谱重心,然后利用求出的参数指标对演唱音色的明亮度进行评测。2、 如权利要求1所述的基于音频频谱特征分析的演唱音色明亮度的客观评测方 法,其特征在于,所述步骤4)中,在利用求出的参数指标对演唱音色的明亮度进行 评测时,单独基于所述平均2K-3KHz能量比或者平均谱重心进行评价,或者将所述 平均2K-3KHz能量比和平均谱重心相结合进行评价。3、 如权利要求1或2所述的基于音频频谱特征分析的演唱音色明亮度的客观评 测方法,其特征在于,所述步骤2)中的判断方法包括基于能量的语音活动检测算 法以及基于基频检测算法的voice/nonvoice判断机制。4、 如权利要求1或2所述的基于音频频谱特征分析的演唱音色明亮度的客观评 测方法,其特征在于,所述步骤3)中各频谱特征测度的计...

【专利技术属性】
技术研发人员:颜永红潘接林刘建李明曹川
申请(专利权)人:中国科学院声学研究所北京中科信利技术有限公司
类型:发明
国别省市:11[]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1