一种语音去噪的方法及装置制造方法及图纸

技术编号：14780569 阅读：160 留言：0更新日期：2017-03-09 21:33

本发明专利技术实施例公开了一种语音去噪的方法及装置。该方法包括：对带噪语音信号进行语音检测，以区分出语音帧和非语音帧；分别对语音帧和非语音帧进行噪声估计，得到噪声功率谱融合估计值，其中，所述噪声功率谱融合估计值为语音帧噪声功率谱估计值与非语音帧噪声功率谱估计值的融合值；根据所述噪声功率谱融合估计值对所述带噪语音信号进行去噪处理。本发明专利技术实施例通过采用上述技术方案，对语音帧和非语音帧均进行了噪声估计，并综合两者的噪声估计结果对带噪语音信号进行去噪处理，可有效改善现有语音去噪方案的去噪效果，提高了语音质量。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术实施例涉及语音信号处理技术，尤其涉及一种语音去噪的方法及装置。
技术介绍
在实时语音通信过程中，会遇到各种噪声干扰问题，特别是对于手机等移动设备来说，语音噪声问题显得尤为突出。此外，在通过扬声器播放声音的情况下，由于存在回声问题，所以相对于远距离录音来说，该情况下语音的音质极易受到外在环境噪音和非线性残余回声的影响。为了提高语音通信质量，需要对语音进行去噪处理，以提高语音的清晰度。传统的语音去噪算法通常假设噪声是加性的及平稳的，使用语音活动检测(VoiceActivityDetection，VAD)技术将带噪语音区分为语音部分和非语音部分(即无声段)，非语音部分主要表现为噪声特性，然后再通过某种统计方法对非语音部分进行处理，即可获得背景噪声特性的近似估计。然而，语音部分中的噪声与非语音部分的噪声可能存在区别，尤其是在受到残余回声影响的情况下(存在乘性的噪音)，仅根据对非语音部分的噪声估计结果来对整体语音信号进行去噪处理的效果不佳。
技术实现思路
本专利技术实施例提供了一种语音去噪的方法及装置，以改善现有语音去噪方案的去噪效果。第一方面，本专利技术实施例提供了一种语音去噪的方法，该方法包括：对带噪语音信号进行语音检测，以区分出语音帧和非语音帧；分别对语音帧和非语音帧进行噪声估计，得到噪声功率谱融合估计值，其中，所述噪声功率谱融合估计值为语音帧噪声功率谱估计值与非语音帧噪声功率谱估计值的融合值；根据所述噪声功率谱融合估计值对所述带噪语音信号进行去噪处理。第二方面，本专利技术实施例还提供了一种语音去噪的装置，该装置包括：语音检测模块，用于对带噪语音信号进...
一种语音去噪的方法及装置

【技术保护点】
一种语音去噪的方法，其特征在于，包括：对带噪语音信号进行语音检测，以区分出语音帧和非语音帧；分别对语音帧和非语音帧进行噪声估计，得到噪声功率谱融合估计值，其中，所述噪声功率谱融合估计值为语音帧噪声功率谱估计值与非语音帧噪声功率谱估计值的融合值；根据所述噪声功率谱融合估计值对所述带噪语音信号进行去噪处理。

【技术特征摘要】
1.一种语音去噪的方法，其特征在于，包括：对带噪语音信号进行语音检测，以区分出语音帧和非语音帧；分别对语音帧和非语音帧进行噪声估计，得到噪声功率谱融合估计值，其中，所述噪声功率谱融合估计值为语音帧噪声功率谱估计值与非语音帧噪声功率谱估计值的融合值；根据所述噪声功率谱融合估计值对所述带噪语音信号进行去噪处理。2.根据权利要求1所述的方法，其特征在于，对带噪语音信号进行语音检测，以区分出语音帧和非语音帧，包括：提取带噪语音信号的语音特征，其中，所述语音特征包括梅尔倒谱系数MFCC、线性预测编码残差和频谱质心Centroid；根据所提取的语音特征利用分类器训练生成语音模型和噪声模型，以区分出语音帧和非语音帧。3.根据权利要求2所述的方法，其特征在于，所述语音特征还包括频谱平坦度Flatness、频谱偏移量Rolloff和频谱扰动度Zcr中的至少一个。4.根据权利要求1所述的方法，其特征在于，分别对语音帧和非语音帧进行噪声估计，得到噪声功率谱融合估计值，包括：根据如下公式得出语音帧噪声功率谱估计值：λd(n,k)＝Quantiles(X(n,k)2)n＝0,1,2...,M根据如下公式得出非语音帧噪声功率谱估计值：λd(n,k)＝a*X(n,k)2+(1-a)*Quantiles(X(n,k)2)n＝0,1,2...,M根据如下公式得出噪声功率谱融合估计值：λlast(n,k)=Σn=0L-1λd(n,k)L]]>其中，M表示帧数，X(n,k)表示第n帧第k个频点的语音频谱分量，Quantiles()表示取分位数，L表示噪声平滑区间长度，a表示权重系数，λd(n,k)表示语音帧噪声功率谱估计值或非语音帧噪声功率谱估计值，λlast(n,k)表示噪声功率谱融合估计值。5.根据权利要求1所述的方法，其特征在于，所述根据所述噪声功率谱融合估计值对所述带噪语音信号进行去噪处理，包括：根据所述噪声功率谱融合估计值对所述带噪语音信号进行平稳噪声抑制、非语音噪声抑制以及非平稳噪声抑制。6.根据权利要求5所述的方法，其特征在于，根据所述噪声功率谱融合估计值对所述带噪语音信号进行平稳噪声抑制、非语音噪声抑制以及非平稳噪声抑制，包括：根据所述噪声功率谱融合估计值生成平稳噪声、非语音噪声及非平稳噪声的融合噪声抑制因子；根据所述融合噪声抑制因子对所述带噪语音信号进行平稳噪声抑制、非语音噪声抑制以及非平稳噪声抑制。7.根据权利要求6所述的方法，其特征在于，所述融合噪声抑制因子为：Q(n,k)=|X(n,k)|*g(n,k)*coeff(n,k)|X(n,k)|*g(n,k)*coeff(n,k)+θ]]>其中，X(n,k)表示第n帧第k个频点的语音频谱分量，g(n,k)表示维纳抑制因子，coeff(n,k)表示非语音抑制因子，θ表示非平稳噪声抑制因子。8.根据权利要求6所述的方法，其特征在于，所述融合噪声抑制因子为：Q(n,k)=(|X(n,k)|*g(n,k)*coeff(n,k))2(|X(n,k)|*g(n,k)*coeff(n,k))2+θ]]>其中，X(n,k)表示第n帧第k个频点的语音频谱分量，g(n,k)表示维纳抑制因子，coeff(n,k)表示非语音抑制因子，θ表示非平稳噪声抑制因子。9.根据权利要求7或8所述的方法...

【专利技术属性】
技术研发人员：吴威麒，张凯磊，
申请(专利权)人：上海谦问万答吧云计算科技有限公司，
类型：发明
国别省市：上海;31

全部详细技术资料下载我是这个专利的主人