语音识别系统中基于快速噪声估计的特征补偿方法技术方案

技术编号：8490383 阅读：199 留言：0更新日期：2013-03-28 13:15

本发明专利技术公开一种语音识别系统中基于快速噪声估计的特征补偿方法，其主要特点是将特征补偿中的噪声参数估计和纯净语音估计分离开来，噪声估计和纯净语音估计用不同的高斯混合模型实现。一个含有较少高斯单元的高斯混合模型GMM用于从含噪测试语音中提取噪声参数；另一个含有较多高斯单元的高斯混合模型GMM用于与估得的单高斯噪声模型进行模型组合，得到与当前测试环境匹配的含噪GMM；最后用含噪GMM计算含噪测试语音的后验概率，用最小均方误差方法从含噪测试语音中估计纯净语音特征向量。本发明专利技术可以在减小计算量的同时，保证纯净语音估计的精度。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及一种，具体涉及到用一个含有较少高斯单元的高斯混合模型快速估计噪声参数，用一个含有较多高斯单元的高斯混合模型从含噪测试语音中估计纯净语音特征向量的特征补偿方法，属于语音识别技术领域。
技术介绍
目前，语音识别系统在实验室理想环境下已经取得了很好的性能。然而，在实际环境中，背景噪声和信道失真往往是不可避免的，它们会导致实际应用环境中提取的特征向量与预先训练的声学模型严重失配，识别器的性能会急剧恶化，甚至有可能完全失效。因此，研究语音识别的环境补偿技术，减小环境失配对语音识别系统的影响，提高语音识别系统在实际环境中的性能，具有非常重要的意义。一般来说，环境补偿技术可划分为前端特征补偿和后端模型补偿。特征补偿对测试环境下的语音特征进行补偿，使之与训练环境下的声学模型相匹配。模型补偿对训练环境下的声学模型进行调整，使之与测试环境相匹配，直接对测试语音进行识别。与后端模型补偿相比，前端特征补偿技术具有计算量小、实现灵活、与后端识别器无关的优点，因而其应用范围更为广泛。在实际应用中，难以保证每段测试语音都有足够多的静音帧来估计噪声参数。为了及时跟踪环境的变化，往往需要从含噪测试语音中提取噪声参数。然而，训练环境与测试环境之间的环境变换关系是非线性的，噪声参数没有闭式解。矢量泰勒级数(VTS = Vector Taylor Series)是一种有效的噪声鲁棒技术,可以很好地逼近由噪声导致的非线性环境变换关系。但是基于VTS的噪声参数估计涉及较多的矩阵运算，其计算量与语音模型的高斯单元数目成正比。由于在特征补偿中，用于噪声估计的...

【技术保护点】
一种语音识别系统中基于快速噪声估计的特征补偿方法，其特征在于，包括如下步骤：(1)采用美尔频率倒谱系数作为语音识别系统的特征参数，特征补偿的目的是从含噪测试语音中提取纯净语音MFCC；(2)在训练阶段，用高斯混合模型对语音的分布进行建模，用全部训练语音生成两个GMM：第一GMM和第二GMM；(3)用单高斯模型对背景噪声进行建模，为了实时跟踪环境的变化，单高斯噪声模型的均值向量和协方差矩阵从含噪测试语音中提取；(4)用第一GMM从含噪测试语音MFCC中提取噪声参数，包括噪声的高斯均值向量和协方差矩阵；(5)用估得的噪声参数对第二GMM2的均值和方差进行参数变换，即对单高斯噪声模型和第二GMM进行模型组合，得到第二GMM的含噪语音均值和方差；(6)用第二GMM的含噪语音均值和方差计算含噪测试语音的后验概率，用最小均方误差方法估计纯净语音MFCC；(7)纯净语音特征向量的一阶动态系数和二阶动态系数不直接从含噪测试语音中估计，而是通过对估得的静态系数作时域差分得到。

【技术特征摘要】

【专利技术属性】
技术研发人员：吕勇，
申请(专利权)人：河海大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人