改进的语音可懂度制造技术

技术编号：14314110 阅读：53 留言：0更新日期：2016-12-30 16:08

本文公开了一种包括处理器和存储器的装置。存储器包括从采样环境噪声计算噪声频谱估值的噪声频谱估计器，从输入语音计算语音频谱估值的语音频谱估计器，使用在语音频谱中检测的每个共振峰内的噪声频谱估值和语音频谱估值计算SNR估值的共振峰信噪比(SNR)估计器。存储器还包括共振峰升高估计器，其计算一组增益因数并将该组增益因数应用到输入语音的每个频率分量，使得在每个共振峰内的所得SNR达到预选目标值。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及一种包括处理器和存储器的装置。
技术介绍
在移动装置中，降噪技术大大改进音频质量。为改进在嘈杂环境中的语音可懂度，对于耳机，主动噪声消除(ANC)是有吸引力的提议并且ANC的确在某种程度改进在嘈杂环境中的音频再现。然而，当移动电话在没有ANC耳机的情况下使用时，ANC方法很少或没有益处。此外，ANC方法在可被消除的频率上受到限制。然而，在嘈杂环境中，难以消除所有噪声分量。为了在存在噪声的情况下使语音信号更可懂，ANC方法不对语音信号进行操作。语音可懂度可通过提升共振峰来改善。共振峰提升可使用大约表示，通过增加匹配共振峰的共振获得。接着共振可以出自线性预测编码(LPC)系数的参数形式获得。然而，共振意味着使用计算上昂贵的多项式求根算法。为降低计算复杂度，这些共振可通过线谱对表示法(LSP)来操控。增强共振主要在于使自回归传递函数的极点更接近单位圆移动。这种解决方案还遇到相互作用的问题，其中由于彼此接近的共振相互作用，所以它们难以单独操控。因此，需要可计算上昂贵的迭代方法。但是即使小心进行，增强共振使其带宽变窄，这产生人工发声的语音。
技术实现思路
提供此
技术实现思路
以简化形式介绍在下文的具体实施方式中另外描述的概念选择。该
技术实现思路
不旨在识别所要求保护的主题的关键特征或基本特征，也不旨在用于限制所要求保护的主题的范围。本文中所描述的实施例解决在存在独立噪声源的情况下改进待再现的语音信号的可懂度的问题。举例来说，位于嘈杂环境中的用户正在通过电话收听对话者。在其中不可能对噪声操作情况下，语音信号可被改进以使其在存在噪声的情况下更可懂。本文公开了一种...
改进的语音可懂度

【技术保护点】
一种装置，其特征在于，包括：处理器；存储器，其中，所述存储器包括：噪声频谱估计器，其从采样环境噪声计算噪声频谱估值；语音频谱估计器，其从输入语音计算语音频谱估值；共振峰信噪比(SNR)估计器，其使用在所述输入语音中所检测的每个共振峰内的所述噪声频谱估值和语音频谱估值计算SNR估值；以及共振峰提升估计器，其计算一组增益因数并将所述组增益因数应用到所述输入语音的每个频率分量，使得在每个共振峰内的所得SNR达到预选的目标值。

【技术特征摘要】
2015.06.17 EP 15290161.71.一种装置，其特征在于，包括：处理器；存储器，其中，所述存储器包括：噪声频谱估计器，其从采样环境噪声计算噪声频谱估值；语音频谱估计器，其从输入语音计算语音频谱估值；共振峰信噪比(SNR)估计器，其使用在所述输入语音中所检测的每个共振峰内的所述噪声频谱估值和语音频谱估值计算SNR估值；以及共振峰提升估计器，其计算一组增益因数并将所述组增益因数应用到所述输入语音的每个频率分量，使得在每个共振峰内的所得SNR达到预选的目标值。2.根据权利要求1所述的装置，其特征在于，所述噪声频谱估计器被配置成通过使用通过采样噪声的离散傅里叶变换获得的平滑参数和过去频谱幅值求平均值来计算噪声频谱估值。3.根据权利要求1或2所述的装置，其特征在于，所述语音频谱估计器被配置成使用低阶线性预测滤波器计算所述语音频谱估值。4.根据权利要求3所述的装置，其特征在于，所述低阶线性预测滤波器使用莱文森-德宾算法。5.根据在前的任一项权利要求所述的装置，其特征在于，所述共振峰SNR估计器被配置成使用中心定在共振峰中心频率上的关键波段上的语音与噪声的频谱幅度估值平方的总和的比率计算所述共振峰SNR估值，其中所述关键波段是听觉滤波器的频率带宽。6.根据在前的任一项权利要求所述的装置，其特征在于，所述组增益因数通过在所述输入语音中的每个共振峰分段乘以预选因数计算。7.根据在前的任一项权利要求所述的装置，其特征在于，另外包括输出限制混频器，其中所述共振峰提升估计器产生滤波器以过滤所述输入语音并且与所述输入语音组合的所述滤波器的输出被传递...

【专利技术属性】
技术研发人员：阿德里安·丹尼尔，
申请(专利权)人：恩智浦有限公司，
类型：发明
国别省市：荷兰;NL

全部详细技术资料下载我是这个专利的主人