基于谐波加噪声模型的残差激励信号合成及语音转换方法技术

技术编号：7760178 阅读：322 留言：0更新日期：2012-09-14 03:23

本发明专利技术公开一种基于谐波加噪声模型的残差激励信号合成及语音转换方法，属于语音信号处理领域，包含以下步骤：预处理与清浊音判断；谐波参数的提取；声道谱参数的计算；建立声道谱转换规则；特征参数的转换；残差激励的预测；语音合成与残差补偿。本发明专利技术在建立激励信号时，在经HNM分析提取出的浊音帧谐波信号的残差信号的基础上线性叠加上适度的HNM分析同时产生的剩余信号作为预测的激励源信号，从而有效的增强激励源中含有的说话人超音段特征，同时避免传统方法人为修改激励信号引入的失真；在合成阶段，在合成出的语音中再次逐帧叠加上适度的HNM分析出的目标浊音帧谐波信号的残差，使转换出的语音更具目标说话人个性，改善语音质量。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及语音转换技术，特别涉及，属于语音信号处理

技术介绍
语音转换是语音信号处理领域近年来新兴的研究分支，是在说话人识别和语音合成的研究基础上进行的，同时也是这两个分支内涵的丰富和延拓，但是又不完全隶属于说话人识别和语音合成的范畴。语音转换的目标是在保证其中的语义信息保持不变的条件下，改变源说话人语音中的个性特征信息，使之具有目标说话人的个性特征，从而使转换后的语音听起来就像是目标说话人的声音。语音转换的实现可以分为训练阶段和转换阶段。在训练阶段，系统对源说话人和目标说话人进行训练，分析他们的參数，建立转换规则。在转换阶段，先对源语音进行分析并提取语音特征，再根据由训练阶段得到的语音转换规则进行转换得到目标语首特征。语音信号的特征分为音段信息和超音段信息两类。音段特征描述的是语音的音色特征，主要包括声道共振峰的位置、共振峰的带宽、频谱倾斜、基音频率等。超音段特征描述的是语音的韵律特征及激励源信息，特征參数主要包括音素的时长、能量、周期的变化轮廓以及谱包络的变化等动态特征等。语音转换的关键问题在于说话人个性特征的提取以及转换规则的建立，经过近二十年的发展，涌现出大量的研究成果。目前对语音特征參数的研究主要集中与语音信号的音段特征，而对语音信号激励源超音段特征涉及的不多。当前对语音信号激励源估计的主要方法有基于线性预测编码(Linear Prediction Coding, LPC)模型的残差预测法。但是线性预测技术得到的残差信号(Residual signal)作为激励时，含有的目标说话人个性较少，并且残差信号中能量较低，造成转换后语音质...

【技术保护点】

【技术特征摘要】

【专利技术属性】
技术研发人员：解伟超，张玲华，吴丽芳，
申请(专利权)人：南京邮电大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人