本发明专利技术提供一种噪声抑制信噪比估计方法和用户终端,该方法可包括:估计当前音频帧的预估先验信噪比;根据所述预估先验信噪比,计算所述当前音频帧的所述预估先验信噪比对应的MMSE的估计值;计算所述当前音频帧的语音存在概率;结合所述语音存在概率和所述估计值估计所述当前音频帧的最终先验信噪比。本发明专利技术实施例可以实现估算的先验信噪比与当前音频帧的相关性更高,从而有利于当前音频帧的噪声抑制。
【技术实现步骤摘要】
一种噪声抑制信噪比估计方法和用户终端
本专利技术涉及语音
,尤其涉及一种噪声抑制信噪比估计方法和用户终端。
技术介绍
目前用户终端中通常采用单麦克风降噪方法对音频信号进行降噪,该方法中主要包括如下步骤:将带噪语音使用快速傅氏变换(FastFourierTransformation,FFT)或者其他变换方法,将带噪语音在频域分解频域信号Y;估计频域信号Y的噪声方差;基于上述噪声方差推算先验信噪比和后验信噪比;根据先验信噪比和后验信噪比计算出适合的增益;对频域信号Y的每个频域乘以上述增益,以得到降噪后的频域信号;将降噪后的频域信号通过快速傅氏逆变换(InverseFastFourierTransform,IFFT)变换成时域信号。然而,上述技术中,先验信噪比是采用直接判决方法估计的,即通过如下公式进行估计的:其中,表示当前帧的先验信噪比的估计值,α通常需要取接近1的平滑数,具体为0.95~1的值,表示前一帧的降噪处理结果,表示噪声方差,表示当前帧的后验信噪比估计值。通过上述公式可以看出,后验信噪比的估计值严重偏向于前一帧的降噪处理结果而可以看成是前一帧语音方差的瞬时值。所以,通过上述公式最终估计到的先验信噪比ξ并非是估计当前帧的信噪比ξ(m),可以视为估计前一帧的先验信噪比ξ(m-1)。可见,目前估算当前音频帧的先验信噪比存在与当前音频帧的相关性较差,不利于当前音频帧的噪声抑制的问题。
技术实现思路
本专利技术的目的在于提供一种噪声抑制信噪比估计方法和用户终端,解决了估算当前音频帧的先验信噪比存在与当前音频帧的相关性较差,不利于当前音频帧的噪声抑制的问题。为了达到上述目的,本专利技术实施例提供一种先验信噪比估计方法,包括:估计当前音频帧的预估先验信噪比;根据所述预估先验信噪比,计算所述当前音频帧的所述预估先验信噪比对应的最小均方误差(MinimumMeanSquareError,MMSE)的估计值;计算所述当前音频帧的语音存在概率;结合所述语音存在概率和所述估计值估计所述当前音频帧的最终先验信噪比。可选的,所述估计当前音频帧的预估先验信噪比,包括:基于所述当前音频帧的后验信噪比估计值估计当前音频帧的预估先验信噪比。可选的,所述基于所述当前音频帧的后验信噪比估计值估计当前音频帧的预估先验信噪比,包括:通过如下公式估计当前音频帧的预估先验信噪比:其中,表示所述预估先验信噪比,α为平滑数,表示前一帧的降噪处理结果,表示噪声方差,表示所述当前音频帧的后验信噪比估计值;或者,通过如下公式估计当前音频帧的预估先验信噪比:其中,表示所述预估先验信噪比,α为平滑数,为前一帧的先验信噪比,表示当前帧的后验信噪比估计值。可选的,所述方法还包括:通过如下公式调整估计所述预估先验信噪比时所需要的平滑数:其中,a1和a2为预设的两个平滑数,且a1>a2,γth和ξth为两个经验阈值。可选的,所述基于所述语音存在概率估计值估计当前音频帧的预估先验信噪比的步骤,进一步还包括:通过如下公式进一步估计所述当前音频帧的预估先验信噪比:或者其中,表示所述预估先验信噪比,和分别表示平滑数为a1时所述当前音频帧的预估先验信噪比和平滑数为a2时所述当前音频帧的预估先验信噪比,p(H1|Y)表示所述语音存在概率,pth为预设阈值。可选的,所述根据所述预估先验信噪比,计算所述当前音频帧的所述预估先验信噪比对应,包括:根据所述预估先验信噪比,通过如下公式计算所述当前音频帧的所述预估先验信噪比对应的最小均方误差的估计值:其中,表示所述预估先验信噪比对应的最小均方误差的估计值,表示所述预估先验信噪比,表示所述当前音频帧的后验信噪比估计值。可选的,所述计算所述当前音频帧的语音存在概率,包括:通过如下公式计算所述当前音频帧的语音存在概率:或者其中,p(H1|Y)表示所述语音存在概率,p(H1)和p(H0)分别表示先验语音存在概率和先验无语音概率,为某一固定值,表示所述当前音频帧的后验信噪比估计值,exp()为指数函数,γmin和γmax为两个经验值,且γmin<γmax,pmax和pmin为两个经验值,且pmin<pmax。可选的,所述结合所述语音存在概率和所述估计值估计所述当前音频帧的最终先验信噪比,包括:通过如下公式估计所述当前音频帧的最终先验信噪比:其中,所述当前音频帧的最终先验信噪比,表示所述预估先验信噪比的最小均方误差的估计值,p(H1|Y)表示所述语音存在概率,ξmin为某一小数值。本专利技术实施例还提供一种用户终端,包括:第一估计模块,用于估计当前音频帧的预估先验信噪比;第一计算模块,用于根据所述预估先验信噪比,计算所述当前音频帧的所述预估先验信噪比对应的MMSE的估计值;第二计算模块,用于计算所述当前音频帧的语音存在概率;第二估计模块,用于结合所述语音存在概率和所述估计值估计所述当前音频帧的最终先验信噪比。可选的,所述第一估计模块用于基于所述当前音频帧的后验信噪比估计值估计当前音频帧的预估先验信噪比。可选的,所述第一估计模块用于通过如下公式估计当前音频帧的预估先验信噪比:其中,表示所述预估先验信噪比,α为平滑数,表示前一帧的降噪处理结果,表示噪声方差,表示所述当前音频帧的后验信噪比估计值;或者,所述第一估计模块用于通过如下公式估计当前音频帧的预估先验信噪比:其中,表示所述预估先验信噪比,α为平滑数,为前一帧的先验信噪比,表示当前帧的后验信噪比估计值。可选的,所述用户终端还包括:调整模块,用于通过如下公式调整估计所述预估先验信噪比时所需要的平滑数:其中,a1和a2为预设的两个平滑数,且a1>a2,γth和ξth为两个经验阈值。可选的,所述第一估计模块还用于通过如下公式进一步估计所述当前音频帧的预估先验信噪比:或者其中,表示所述预估先验信噪比,和分别表示平滑数为a1时所述当前音频帧的预估先验信噪比和平滑数为a2时所述当前音频帧的预估先验信噪比,p(H1|Y)表示所述语音存在概率,pth为预设阈值。可选的,所述第一计算模块用于根据所述预估先验信噪比,通过如下公式计算所述当前音频帧的所述预估先验信噪比对应的MMSE的估计值:其中,表示所述预估先验信噪比对应的最小均方误差的估计值,表示所述预估先验信噪比,表示所述当前音频帧的后验信噪比估计值。可选的,所述第二计算模块用于通过如下公式计算所述当前音频帧的语音存在概率:或者其中,p(H1|Y)表示所述语音存在概率,p(H1)和p(H0)分别表示先验语音存在概率和先验无语音概率,为某一固定值,表示所述当前音频帧的后验信噪比估计值,exp()为指数函数,γmin和γmax为两个经验值,且γmin<γmax,pmax和pmin为两个经验值,且pmin<pmax。可选的,所述第二估计模块用于通过如下公式估计所述当前音频帧的最终先验信噪比:其中,所述当前音频帧的最终先验信噪比,表示所述预估先验信噪比的最小均方误差的估计值,p(H1|Y)表示所述语音存在概率,ξmin为某一小数值。本专利技术的上述技术方案至少具有如下有益效果:本专利技术实施例,估计当前音频帧的预估先验信噪比;根据所述预估先验信噪比,计算所述当前音频帧的所述预估先验信噪比对应的MMSE的估计值;计算所述当前音频帧的语音存在概率;结合所述语音存在概率和所述估计值估计所本文档来自技高网...

【技术保护点】
一种噪声抑制信噪比估计方法,其特征在于,包括:估计当前音频帧的预估先验信噪比;根据所述预估先验信噪比,计算所述当前音频帧的所述预估先验信噪比对应的最小均方误差的估计值;计算所述当前音频帧的语音存在概率;结合所述语音存在概率和所述估计值估计所述当前音频帧的最终先验信噪比。
【技术特征摘要】
1.一种噪声抑制信噪比估计方法,其特征在于,包括:估计当前音频帧的预估先验信噪比;根据所述预估先验信噪比,计算所述当前音频帧的所述预估先验信噪比对应的最小均方误差的估计值;计算所述当前音频帧的语音存在概率;结合所述语音存在概率和所述估计值估计所述当前音频帧的最终先验信噪比。2.如权利要求1所述的方法,其特征在于,所述估计当前音频帧的预估先验信噪比,包括:基于所述当前音频帧的后验信噪比估计值估计当前音频帧的预估先验信噪比。3.如权利要求2所述的方法,其特征在于,所述基于所述当前音频帧的后验信噪比估计值估计当前音频帧的预估先验信噪比,包括:通过如下公式估计当前音频帧的预估先验信噪比:其中,表示所述预估先验信噪比,α为平滑数,表示前一帧的降噪处理结果,表示噪声方差,表示所述当前音频帧的后验信噪比估计值;或者,通过如下公式估计当前音频帧的预估先验信噪比:其中,表示所述预估先验信噪比,α为平滑数,为前一帧的先验信噪比,表示当前帧的后验信噪比估计值。4.如权利要求3所述的方法,其特征在于,所述方法还包括:通过如下公式调整估计所述预估先验信噪比时所需要的平滑数:其中,a1和a2为预设的两个平滑数,且a1>a2,γth和ξth为两个经验阈值。5.如权利要求4所述的方法,其特征在于,所述基于所述语音存在概率估计值估计当前音频帧的预估先验信噪比的步骤,进一步还包括:通过如下公式进一步估计所述当前音频帧的预估先验信噪比:或者其中,表示所述预估先验信噪比,和分别表示平滑数为a1时所述当前音频帧的预估先验信噪比和平滑数为a2时所述当前音频帧的预估先验信噪比,p(H1|Y)表示所述语音存在概率,pth为预设阈值。6.如权利要求1-5中任一项所述的方法,其特征在于,所述根据所述预估先验信噪比,计算所述当前音频帧的所述预估先验信噪比对应的最小均方误差的估计值,包括:根据所述预估先验信噪比,通过如下公式计算所述当前音频帧的所述预估先验信噪比对应的最小均方误差的估计值:其中,表示所述预估先验信噪比对应的最小均方误差的估计值,表示所述预估先验信噪比,表示所述当前音频帧的后验信噪比估计值。7.如权利要求1-5中任一项所述的方法,其特征在于,所述计算所述当前音频帧的语音存在概率,包括:通过如下公式计算所述当前音频帧的语音存在概率:或者其中,p(H1|Y)表示所述语音存在概率,p(H1)和p(H0)分别表示先验语音存在概率和先验无语音概率,为某一固定值,表示所述当前音频帧的后验信噪比估计值,exp()为指数函数,γmin和γmax为两个经验值,且γmin<γmax,pmax和pmin为两个经验值,且pmin<pmax。8.如权利要求1-5中任一项所述的方法,其特征在于,所述结合所述语音存在概率和所述估计值估计所述当前音频帧的最终先验信噪比,包括:通过如下公式估计所述当前音频帧的最终先验信噪比:其中,所述当前音频帧的最终先验信噪比,表示所述预估先验信噪比的最小...
【专利技术属性】
技术研发人员:谢单辉,
申请(专利权)人:电信科学技术研究院,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。