噪声降低方法、程序产品和装置制造方法及图纸

技术编号：10750519 阅读：204 留言：0更新日期：2014-12-10 20:31

本发明专利技术的目的在于提供一种在语音识别中的基于模型的噪声降低的创新技术。本发明专利技术在基于模型的噪声补偿中生成概率模型，该概率模型被表示为具有观测值y作为因数的失配向量g(或干净语音x)的概率分布和具有针对每个频带的置信度指数β作为因数的失配向量g(或干净语音x)的概率分布的乘积，在概率模型上执行MMSE估计，以及估计干净语音估计值x^。因此，每个频带以根据它的置信度级别的贡献程度来影响MMSE估计的结果。进一步地，观测语音的S/N比率越高，输出值越加变得偏移到观测值。因此，前端的输出被优化。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】噪声降低方法和装置
本专利技术涉及语音识别技术，并且更具体地，涉及噪声降低技术。
技术介绍
在语音识别技术中，背景噪声的影响的移除是令人关注的问题，它对于提高话语(utterance)识别的准确性是重要的。当背景噪声相对小时，相关领域的滤波技术(诸如谱相减(spectralsubtraction)方法和维纳(Wiener)滤波)具有一定程度的成功，但是在大的背景噪声上无法获得所期望的结果，因为目标语音陷入在该噪声中。因此，近年来已经将注意力放在使用干净语音(cleanspeech)(没有任何噪声被叠加在其上的话语语音)的概率模型的方法。这些基于模型的噪声降低方法已经被报道为甚至是在大的背景噪声上也显示出高的性能。关于这个方面，日本专利申请公开第2008-298844号(专利文献1)公开了一种采用基于模型的噪声降低的语音识别系统。[引用列表][专利引用][专利引用1]日本专利申请公开第2008-298844号
技术实现思路
[技术问题]本专利技术的目的在于提供一种被应用于语音识别前端的创新的噪声降低方法。[对问题的技术方案]专利技术人已经努力地实验出一种被应用于语音识别前端的创新的噪声降低方法，并且因此构思出一种配置，该配置利用包括针对观测语音的每个频带的置信度指数的因数模型，从而完成了本专利技术。也就是，根据本专利技术，提供了一种噪声降低方法，该方法包括：基于观测语音的频谱而生成针对每个频带的置信度指数的步骤；生成概率模型的步骤，所述概率模型被表示为具有针对每个频带的维度的混合多维度正态分布，每个正态分布被表示为第一正态分布和第二正态分布的乘积；以及通过在所述...
<a href="http://www.xjishu.com/zhuanli/21/201380012027.html" title="噪声降低方法、程序产品和装置原文来自X技术">噪声降低方法、程序产品和装置</a>

【技术保护点】
一种噪声降低方法，所述方法包括：基于观测语音的频谱而生成针对每个频带的置信度指数的步骤；生成概率模型的步骤，所述概率模型被表示为具有针对每个频带的维度的混合多维度正态分布，每个正态分布被表示为第一正态分布和第二正态分布的乘积；以及通过在所述概率模型上执行MMSE估计来估计失配向量估计值、以及基于所述失配向量估计值来获得干净语音估计值的步骤，其中所述第一正态分布是基于所述观测语音而生成的失配向量的概率分布，并且其中所述第二正态分布具有零的均值和如下的方差，所述方差被定义为随着所述置信度指数变得更大而输出更小的值的函数。

【技术特征摘要】
【国外来华专利技术】2012.03.09 JP 2012-0525651.一种噪声降低方法，所述方法包括：基于观测语音的频谱而生成针对每个频带的置信度指数的步骤；生成概率模型的步骤，所述概率模型被表示为具有针对每个频带的维度的混合多维度正态分布，每个正态分布被表示为第一正态分布和第二正态分布的乘积；以及通过在所述概率模型上执行MMSE估计来估计失配向量估计值、以及基于所述失配向量估计值来获得干净语音估计值的步骤，其中所述第一正态分布是基于所述观测语音而生成的失配向量的概率分布，并且其中所述第二正态分布具有零的均值和如下的方差，所述方差被定义为随着所述置信度指数变得更大而输出更小的值的函数。2.一种噪声降低方法，所述方法包括：基于观测语音的频谱而生成针对每个频带的置信度指数的步骤；生成概率模型的步骤，所述概率模型被表示为具有针对每个频带的维度的混合多维度正态分布，每个正态分布被表示为第一正态分布和第二正态分布的乘积；以及通过在所述概率模型上执行MMSE估计来获得干净语音估计值的步骤，其中所述第一正态分布是基于所述观测语音而生成的干净语音的概率分布，并且其中所述第二正态分布具有以观测值作为均值并且具有如下的方差，所述方差被定义为随着所述置信度指数变得更大而输出更小的值的函数。3.根据权利要求1或2所述的方法，其中所述置信度指数是表示所述观测语音的谐波结构的显著性的指数。4.根据权利要求1或2所述的方法，其中生成置信度指数的所述步骤包括：从所述观测语音的所述频谱提取谐波结构并且归一化所述谐波结构的步骤；在梅尔刻度上平滑经归一化的值的步骤；以及将经平滑的所述值归一化为从0到1的步骤。5....

【专利技术属性】
技术研发人员：市川治，S·J·伦尼，
申请(专利权)人：国际商业机器公司，
类型：发明
国别省市：美国;US

全部详细技术资料下载我是这个专利的主人