一种基于鲁棒非负矩阵分解和数据融合的无监督语音增强方法技术

技术编号：11281249 阅读：136 留言：0更新日期：2015-04-09 14:54

本发明专利技术公开了一种基于鲁棒非负矩阵分解和数据融合的无监督语音增强方法，该方法对输入的时域信号经过加窗、分帧后，经傅里叶变换并取模得到该语句的幅度谱；估计得到稀疏的语音成分和噪声基矩阵W(n)；估计出语音分量和噪声分量后得到增强语音的估计；将鲁棒非负矩阵分解所得到的估计，与来自谱减SS和最小均方误差MMSE的估计，经过几何均值滤波模块融合，得到最终的幅度谱估计；利用幅度谱估计和含噪语音的相位重构出增强语音的时域信号。本发明专利技术不局限于语音内容所属的语言、不受限于说话人的变化、不受限于噪声的种类，与经典的基于平稳性假设的谱估计算法SS和MMSE相比，本发明专利技术不再依赖于这种平稳性假设，可以较准确的估计出平稳或突变噪声的频谱。

全部详细技术资料下载

【技术实现步骤摘要】
【专利摘要】本专利技术公开了，该方法对输入的时域信号经过加窗、分帧后，经傅里叶变换并取模得到该语句的幅度谱；估计得到稀疏的语音成分和噪声基矩阵W(n)；估计出语音分量和噪声分量后得到增强语音的估计；将鲁棒非负矩阵分解所得到的估计，与来自谱减SS和最小均方误差MMSE的估计，经过几何均值滤波模块融合，得到最终的幅度谱估计；利用幅度谱估计和含噪语音的相位重构出增强语音的时域信号。本专利技术不局限于语音内容所属的语言、不受限于说话人的变化、不受限于噪声的种类，与经典的基于平稳性假设的谱估计算法SS和MMSE相比，本专利技术不再依赖于这种平稳性假设，可以较准确的估计出平稳或突变噪声的频谱。【专利说明】一种基于鲁棒非负矩阵分解和数据融合的无监督语音増强方法
本专利技术属于语音信号处理领域，尤其涉及一种基于鲁棒非负矩阵分解和数据融合的无监督语音增强方法。
技术介绍
语音增强无论对于提高语音信号的听觉效果，还是作为前端处理提高语音识别器的性能，都具有重要的意义。语音增强实施中的一个关键问题是噪声估计。为了估计噪声的频谱，人们提出了一些经典的算法，如谱减（SpectrumSubtraction,SS)、最小均方误差 (MinimumMeanSquareError,MMSE)等，并已经广泛应用在语音通信中。然而，这些方法一般基于噪声的平稳性假设，对于非平稳突变噪声的频谱估计效果很差。为了估计突变噪声的频谱，近年来基于字典学习的噪声估计模型不断涌现，考虑到功率谱或幅度谱的非负性，非负字典学习成为噪声估计的一种热门方法。然而，非负噪...
一种基于鲁棒非负矩阵分解和数据融合的无监督语音增强方法

【技术保护点】
一种基于鲁棒非负矩阵分解和数据融合的无监督语音增强方法，其特征在于，所述的基于鲁棒非负矩阵分解和数据融合的无监督语音增强方法包括：步骤一、对输入的时域信号y(n)，经过加窗、分帧后，对每帧实施短时傅里叶变换并取模得到该语句的幅度谱Y；步骤二、利用鲁棒非负矩阵分解模块，估计得到稀疏的语音成分和噪声基矩阵W(n)；步骤三、将加权，与含噪语音幅度谱Y和噪声基矩阵W(n)一起输入到分块非负矩阵分解模块中，估计出语音分量W(s)H(s)和噪声分量W(n)H(n)，经过维纳滤波后得到增强语音的估计步骤四、将鲁棒非负矩阵分解所得到的估计，与来自谱减SS和最小均方误差MMSE的估计，经过几何均值滤波模块融合，得到最终的幅度谱估计；步骤五、利用所得的幅度谱估计和含噪语音的相位，重构出增强语音的时域信号

【技术特征摘要】

【专利技术属性】
技术研发人员：孙蒙，张雄伟，李轶南，
申请(专利权)人：中国人民解放军理工大学，
类型：发明
国别省市：江苏;32

全部详细技术资料下载我是这个专利的主人