基于音频频谱特征分析的演唱音色明亮度客观评测方法技术

技术编号：4330927 阅读：417 留言：0更新日期：2012-04-11 18:40

本发明专利技术提供一种基于音频频谱特征分析的演唱音色明亮度的客观评测方法，包括如下步骤：１）选取需要度量音色明亮度的演唱片段音频信号；２）对所选取的演唱片段音频信号进行“演唱／间隙”判断；３）对步骤２）得到的演唱片段，计算得到三种频谱特征测度：２Ｋ－３ＫＨｚ能量和、频谱能量总和以及频率加权的谱能量和；４）根据步骤３）得到的频谱特征，计算得到最终的客观度量参数指标：平均２Ｋ－３ＫＨｚ能量比、平均谱重心，利用求出的参数指标对演唱音色的明亮度进行评测。本发明专利技术的评测方法，通过对演唱片段的频谱特征分析，利用计算机算法给出可以量化的客观评测参数指标，不受其他人为因素影响，并且具有稳定性、客观性以及便利性等优点。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及一种度量演唱音色明亮度的客观方法，更具体地说，本专利技术涉及一种基于音频频谱特征分析的演唱音色明亮度的客观评测方法。
技术介绍
音色明亮度是指一种用于评价唱歌者演唱水平的主观指标，一般定义为对唱歌者歌声的一种明亮、高昂、温暖的主观感知。主观评价人感觉唱歌者的歌声越明亮、高昂，则认为唱歌者的演唱音色明亮度越高，反之，则认为演唱音色明亮度越低。这里的主观评价人，一般指的是声乐专家，比如声乐老师和资深音乐家。而唱歌者可以是专业的歌手、声乐系学生，也可以是普通人。目前，演唱评价基本还是处于完全依靠专家主观评价的阶段，并没有成熟的客观评价系统能够对演唱水平或演唱水平的某个方面进行度量和评价。演唱音色明亮程度的评价也完全依赖专家的主观感知，目前还没有客观度量的方法或者辅助主观评价的客观指标。虽然国外一些研究调査发现音色明亮度的评价和频谱能量分布、共振峰位置、能量等有关，但是并没有具体的、定义明确的客观度量方法出现。例如，文献1提出音色明亮度与频谱能量分布有关，但是并没有给出具体的计算方法。另外，演唱水平的评价与旋律音高的准确性相关，演唱者音高的提取，我们采用了参考文献2中提出的方法，该方法通过求取每帧数据频谱谐波和最大值对应的基频作为每帧的音高值。这里，需要说明的是，该方法得到的音高值仅仅作为计算音色的一个基本参数值，与本专利的独特性无关。另外，主观演唱评价方法不可避免的具有以下几个缺点第一，不可重复性。因为各种各样因素的影响，对于同样一个演唱片段，两次主观评价之间或多或少的都会出现差异，而这种差异在理想情况下是不应该存在的。第二，主观偏向性。因...

【技术保护点】
一种基于音频频谱特征分析的演唱音色明亮度的客观评测方法，包括如下步骤：　１）选取需要度量音色明亮度的演唱片段音频信号；　２）对上述所选取的演唱片段音频信号进行“演唱／间隙”判断；　３）对上述步骤２）中得到的演唱片段，计算得到三种频谱特征测度：２Ｋ－３ＫＨｚ能量和、频谱能量总和以及频率加权的谱能量和；　４）根据上述步骤３）中得到的频谱特征，计算得到最终的音色明亮度的客观度量参数指标：平均２Ｋ－３ＫＨｚ能量比、平均谱重心，然后利用求出的参数指标对演唱音色的明亮度进行评测。

【技术特征摘要】
1、一种基于音频频谱特征分析的演唱音色明亮度的客观评测方法，包括如下步骤1)选取需要度量音色明亮度的演唱片段音频信号；2)对上述所选取的演唱片段音频信号进行“演唱/间隙”判断；3)对上述步骤2)中得到的演唱片段，计算得到三种频谱特征测度2K-3KHz能量和、频谱能量总和以及频率加权的谱能量和；4)根据上述步骤3)中得到的频谱特征，计算得到最终的音色明亮度的客观度量参数指标平均2K-3KHz能量比、平均谱重心，然后利用求出的参数指标对演唱音色的明亮度进行评测。2、如权利要求1所述的基于音频频谱特征分析的演唱音色明亮度的客观评测方法，其特征在于，所述步骤4)中，在利用求出的参数指标对演唱音色的明亮度进行评测时，单独基于所述平均2K-3KHz能量比或者平均谱重心进行评价，或者将所述平均2K-3KHz能量比和平均谱重心相结合进行评价。3、如权利要求1或2所述的基于音频频谱特征分析的演唱音色明亮度的客观评测方法，其特征在于，所述步骤2)中的判断方法包括基于能量的语音活动检测算法以及基于基频检测算法的voice/nonvoice判断机制。4、如权利要求1或2所述的基于音频频谱特征分析的演唱音色明亮度的客观评测方法，其特征在于，所述步骤3)中各频谱特征测度的计...

【专利技术属性】
技术研发人员：颜永红，潘接林，刘建，李明，曹川，
申请(专利权)人：中国科学院声学研究所，北京中科信利技术有限公司，
类型：发明
国别省市：11[]

全部详细技术资料下载我是这个专利的主人