本文公开了一种包括处理器和存储器的装置。存储器包括从采样环境噪声计算噪声频谱估值的噪声频谱估计器,从输入语音计算语音频谱估值的语音频谱估计器,使用在语音频谱中检测的每个共振峰内的噪声频谱估值和语音频谱估值计算SNR估值的共振峰信噪比(SNR)估计器。存储器还包括共振峰升高估计器,其计算一组增益因数并将该组增益因数应用到输入语音的每个频率分量,使得在每个共振峰内的所得SNR达到预选目标值。
【技术实现步骤摘要】
本专利技术涉及一种包括处理器和存储器的装置。
技术介绍
在移动装置中,降噪技术大大改进音频质量。为改进在嘈杂环境中的语音可懂度,对于耳机,主动噪声消除(ANC)是有吸引力的提议并且ANC的确在某种程度改进在嘈杂环境中的音频再现。然而,当移动电话在没有ANC耳机的情况下使用时,ANC方法很少或没有益处。此外,ANC方法在可被消除的频率上受到限制。然而,在嘈杂环境中,难以消除所有噪声分量。为了在存在噪声的情况下使语音信号更可懂,ANC方法不对语音信号进行操作。语音可懂度可通过提升共振峰来改善。共振峰提升可使用大约表示,通过增加匹配共振峰的共振获得。接着共振可以出自线性预测编码(LPC)系数的参数形式获得。然而,共振意味着使用计算上昂贵的多项式求根算法。为降低计算复杂度,这些共振可通过线谱对表示法(LSP)来操控。增强共振主要在于使自回归传递函数的极点更接近单位圆移动。这种解决方案还遇到相互作用的问题,其中由于彼此接近的共振相互作用,所以它们难以单独操控。因此,需要可计算上昂贵的迭代方法。但是即使小心进行,增强共振使其带宽变窄,这产生人工发声的语音。
技术实现思路
提供此
技术实现思路
以简化形式介绍在下文的具体实施方式中另外描述的概念选择。该
技术实现思路
不旨在识别所要求保护的主题的关键特征或基本特征,也不旨在用于限制所要求保护的主题的范围。本文中所描述的实施例解决在存在独立噪声源的情况下改进待再现的语音信号的可懂度的问题。举例来说,位于嘈杂环境中的用户正在通过电话收听对话者。在其中不可能对噪声操作情况下,语音信号可被改进以使其在存在噪声的情况下更可懂。本文公开了一种包括处理器和存储器的装置。存储器包括从采样的环境噪声计算噪声频谱估值的噪声频谱估计器、从输入语音计算语音频谱估值的语音频谱估计器、使用在输入语音中所检测到的每个共振峰内的噪声频谱估值和语音频谱估值计算SNR估值的共振峰信噪比(SNR)估计器以及共振峰提升估计器,其计算一组增益因数并将该组增益因数应用到输入语音的每个频率分量,使得在每个共振峰内的所得SNR达到预选的目标值。在一些实施例中,噪声频谱估计器被配置成通过使用通过采样环境噪声的离散傅里叶变换获得的平滑参数和过去频谱幅度值求平均值计算噪声频谱估值。在一个例子中,语音频谱估计器被配置成使用低阶线性预测滤波器计算语音频谱估值。低阶线性预测滤波器可使用莱文森-德宾(Levinson-Durbin)算法。在一个例子中,共振峰SNR估计器被配置成使用在中心定在共振峰中心频率上的关键波段上的语音与噪声频谱幅度估值平方的总和的比率计算共振峰SNR估值。关键波段是听觉滤波器的频率带宽。在一些例子中,该组增益因数通过在输入语音中的每个共振峰分段乘以预选因数计算。在一个实施例中,该装置还可包括输出限制混频器,以将通过共振峰提升估计器形成的滤波器的输出限制为预选的最大均方根水平或峰值水平。共振峰提升估计器产生过滤输入语音的滤波器,并且与输入语音组合的滤波器的输出穿过输出限制混频器。在语音输入中的每个共振峰通过共振峰分段模块检测,其中共振峰分段模块将语音频谱估值分割成多个共振峰。在另一个实施例中,公开了一种用于执行改进语音可懂度的操作方法。此外,公开了一种对应的计算机程序产品。所述操作包括接收输入语音信号、接收采样环境噪声、从采样环境噪声计算噪声频谱估值、从输入语音计算语音频谱估值、从这些估值计算共振峰信噪比(SNR)、分割在语音频谱估值中的共振峰并基于计算的共振峰提升估值计算用于共振峰中的每个共振峰的共振峰提升因数。在一些例子中,噪声频谱估值的计算包括通过使用通过采样环境噪声的离散傅里叶变换获得的平滑参数和过去频谱幅度值求平均值。噪声频谱估值的计算还可包括使用低阶线性预测滤波器。低阶线性预测滤波器可使用莱文森-德宾算法。附图说明为了可详细地理解本专利技术的上述特征的方式,可通过参考实施例添加上文简要地概括的本专利技术的更特定描述,所述实施例中的一些实施例在附图中示出。然而,应注意,附图仅示出本专利技术的典型实施例,且因此不应被视为限制本专利技术的范围,因为本专利技术可准许其它同样有效的实施例。对于结合附图阅读本说明书的本领域的技术人员而言,所要求保护的主题的优点将变得显而易见,其中相同的附图标号已用于指代相同的元件,其中:图1是根据本公开的一或多个实施例的装置的一部分的示意图;图2是根据本公开的一或多个实施例的装置的存储器的一部分的逻辑描述;图3描绘根据本公开的一或多个实施例的装置的各模块之间的相互作用;图4示出了根据本公开的更多实施例中的一个实施例的共振峰分段模块的操作;以及图5示出了根据本公开的更多实施例中的一个实施例的共振峰提升估算模块的操作。具体实施方式当用户在嘈杂场所中接收移动电话呼叫或收听从电子装置输出的声音时,语音变得不可懂。本公开的各种实施例通过改善语音可懂度和再现质量提高用户体验。本文中所描述的实施例可用于包括语音再现的移动装置和其它电子装置中,诸如包括声音方向的GPS接收器、收音机、音频书、播客等。声道在被称作共振峰的语音信号-频谱峰值中的特定频率产生共振,其被听觉系统使用以在元音之间区分。然后,在可懂度中的重要因素是频谱对比:在频谱峰值和频谱谷值之间的能量差异。本文中所描述的实施例改进输入语音信号在噪声中的可懂度同时保持其自然度。在本文中所描述的方法仅适用于有声分段。背后的主要推理在于单独频谱峰值应以所解遮蔽特定水平而不是频谱谷值为目标。谷值可得到提升,因为解遮蔽增益被应用于其环绕峰值,但是所述方法不应尝试专门解遮蔽谷值(否则,共振峰结构可被破坏)。此外,不管噪声如何,本文中所描述的方法增加频谱对比,这已被证明改进可懂度。本文中所描述的实施例可用于静态模式而与噪声采样无任何相关性,以根据预定义提升策略改善频谱对比。另选地,噪声采样可用于改进语音可懂度。本文所述的一或多个实施例提供低复杂度无失真的解决方案,其允许频谱解遮蔽在噪声中再现的有声语音分段。这些实施例适用于实时应用,诸如电话对话。为解遮蔽关于噪声特性的在嘈杂环境中再现的语音,可使用时域或频域方法的任一个。时域方法遇到噪声的频谱特性的不良适应性。频域方法依赖于允许独立放大频率分量的的语音和噪声两者频域表示法,由此定向特定频谱信噪比(SNR)。然而,共同困难是语音频谱结构失真的风险-即,涉及获得允许小心操作此类修改的语音表示法的语音共振峰和计算复杂度。图1是无线通信装置100的示意图。如上所述,本文中所描述的实施例的应用不限于无线通信装置。再现语音的任何装置可得益于由本文所述的一或多个实施例所产生的改进的语音可懂度。无线通信装置100仅作为例子使用。以免混淆本文中所描述的实施例,无线通信装置100的许多部件未示出。无线通信装置100可为移动电话或能够与另一个通信装置建立音频/视频通信链路的任何移动装置。无线通信装置100包括处理器102、存储器104、收发器114和天线112。应注意,如图所示的天线112仅为图示。天线112可为内部天线或外部天线且可为与所示不同的形状。此外,在一些实施例中,可存在多个天线。收发器114包括在单个半导体芯片中的发射器和接收器。在一些实施例中,发射器和接收器可彼此分开实现。处理器102包括合适的逻辑和编程指令(可存储在存储器10本文档来自技高网...

【技术保护点】
一种装置,其特征在于,包括:处理器;存储器,其中,所述存储器包括:噪声频谱估计器,其从采样环境噪声计算噪声频谱估值;语音频谱估计器,其从输入语音计算语音频谱估值;共振峰信噪比(SNR)估计器,其使用在所述输入语音中所检测的每个共振峰内的所述噪声频谱估值和语音频谱估值计算SNR估值;以及共振峰提升估计器,其计算一组增益因数并将所述组增益因数应用到所述输入语音的每个频率分量,使得在每个共振峰内的所得SNR达到预选的目标值。
【技术特征摘要】
2015.06.17 EP 15290161.71.一种装置,其特征在于,包括:处理器;存储器,其中,所述存储器包括:噪声频谱估计器,其从采样环境噪声计算噪声频谱估值;语音频谱估计器,其从输入语音计算语音频谱估值;共振峰信噪比(SNR)估计器,其使用在所述输入语音中所检测的每个共振峰内的所述噪声频谱估值和语音频谱估值计算SNR估值;以及共振峰提升估计器,其计算一组增益因数并将所述组增益因数应用到所述输入语音的每个频率分量,使得在每个共振峰内的所得SNR达到预选的目标值。2.根据权利要求1所述的装置,其特征在于,所述噪声频谱估计器被配置成通过使用通过采样噪声的离散傅里叶变换获得的平滑参数和过去频谱幅值求平均值来计算噪声频谱估值。3.根据权利要求1或2所述的装置,其特征在于,所述语音频谱估计器被配置成使用低阶线性预测滤波器计算所述语音频谱估值。4.根据权利要求3所述的装置,其特征在于,所述低阶线性预测滤波器使用莱文森-德宾算法。5.根据在前的任一项权利要求所述的装置,其特征在于,所述共振峰SNR估计器被配置成使用中心定在共振峰中心频率上的关键波段上的语音与噪声的频谱幅度估值平方的总和的比率计算所述共振峰SNR估值,其中所述关键波段是听觉滤波器的频率带宽。6.根据在前的任一项权利要求所述的装置,其特征在于,所述组增益因数通过在所述输入语音中的每个共振峰分段乘以预选因数计算。7.根据在前的任一项权利要求所述的装置,其特征在于,另外包括输出限制混频器,其中所述共振峰提升估计器产生滤波器以过滤所述输入语音并且与所述输入语音组合的所述滤波器的输出被传递...
【专利技术属性】
技术研发人员:阿德里安·丹尼尔,
申请(专利权)人:恩智浦有限公司,
类型:发明
国别省市:荷兰;NL
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。