一种基于双耳信息的语音增强方法技术

技术编号:14354825 阅读:187 留言:0更新日期:2017-01-07 18:06
本发明专利技术涉及一种基于双耳信息的语音增强方法,包括:将左右耳麦克风信号从时域变换到频域,然后做频带分解,根据频带分解的结果划分低频区域和高频区域;根据左右耳麦克风信号的能量比值,将能量高的一侧作为干扰噪声源所在的一侧;在低频区域利用双耳时间差估计语音功率谱,在高频区域利用双耳声级差估计语音功率谱以及语音的相干函数;将语音功率谱和相干函数联合起来计算干扰噪声的冲击响应比值;根据冲击响应比值、语音功率谱以及两个麦克风的能量差计算维纳滤波器的两个增益,所述维纳滤波器的两个增益分别对应左耳麦克风与右耳麦克风;利用维纳滤波器的两个增益分别对左耳麦克风信号与右耳麦克风信号进行处理,得到增强后的语音信号。

【技术实现步骤摘要】

本专利技术涉及一种语音信号处理方法,特别是涉及一种基于双耳信息的语音增强方法
技术介绍
在实际生活中,语音信号总是受到各种噪声源的干扰,助听器、人工耳蜗佩戴者对噪声的容忍程度比正常听力人更低。现有的单耳助听器广泛采用双麦克风,目的是双麦克风能够抑制方向性干扰噪声,使得助听器、人工耳蜗佩戴者能够更好的专注于前方声音,即面对面交流场景。但是,很多听力患者都有双耳听力损失情况的出现,如果长期单耳佩戴,会使另外一只耳朵听力损失越来越严重,而且,传统的单耳佩戴不能获得声音的立体信号,听力患者没有声源定位能力,这在一定程度上降低了语音的可懂度。随着无线连接技术的快速发展,双耳助听器、人工耳蜗得以实现,利用先进的无线连接技术,左右耳的两个麦克风可以互相通信。这为基于双耳信息的语音增强方法的实现提供了现实可行性。现有技术中具有语音增强方法,如在参考文献1“KlasenT,DocloS,denBogaertT.V.Binauralmulti-channelwinerfilteringforhearingaids:preservinginterauraltimeandleveldifferences.In:IEEEInternationalConferenceonAcoustics,speechandsignalprocessing(ICASSP),2006:145-148”中所披露的多通道维纳滤波法,在参考文献2“RoohollahA,AhmadA,MohsenR.Two-microphonebinarymaskspeechenhancementapplicationtodiffuseanddorectionlnoisefields.IEEE.ETRIjournal,2014;36(5):772-781”中所披露的二值掩码法,在参考文献3“LiJ,SakamotoS,HongoS,AkagiM,SuzukiY.Two-stagebinauralspeechenhancementwithWienerfilterbasedonequalization-cancellationmodel.In:IEEEWorkshoponApplicationsofSignalProcessingtoAudioandAcoustics(WASPAA),2009:133–136”中所披露的基于均衡抵消模型算法等。现有技术中的语音增强方法各自存在一定的缺陷,如多通道维纳滤波法对非平稳噪声抑制效果差;二值掩码法容易产生音乐噪声;基于均衡抵消模型算法要求预先准确知道目标语音方位信息,存在一定局限性。
技术实现思路
本专利技术的目的在于克服已有技术中的语音增强方法所存在的缺陷,从而提供一种有效滤除非平稳噪声,并保持目标语音未失真的语音增强方法。为了实现上述目的,本专利技术提供了一种基于双耳信息的语音增强方法,包括:步骤1)、将左右耳麦克风信号从时域变换到频域,然后做频带分解,根据频带分解的结果划分低频区域和高频区域;步骤2)、根据左右耳麦克风信号的能量比值,将能量高的一侧作为干扰噪声源所在的一侧;步骤3)、在低频区域利用双耳时间差估计语音功率谱,在高频区域利用双耳声级差估计语音功率谱以及语音的相干函数;步骤4)、将步骤3)计算得到的语音功率谱和相干函数联合起来计算干扰噪声的冲击响应比值;步骤5)、根据步骤4)计算得到的冲击响应比值、步骤3)得到的语音功率谱以及两个麦克风的能量差计算维纳滤波器的两个增益,所述维纳滤波器的两个增益分别对应左耳麦克风与右耳麦克风;步骤6)、利用步骤5)所得到的维纳滤波器的两个增益分别对左耳麦克风信号与右耳麦克风信号进行处理,得到增强后的语音信号。上述技术方案中,所述步骤3)进一步包括:步骤3-1)、在高频区域,利用双耳声级差估计语音功率谱以及语音的相干函数;假设干扰噪声来自于左右两侧中的某一侧,则对高频区域的每个频率点执行如下步骤:步骤3-1-1)、计算双耳声级差,如果双耳声级差ΔPLD<Φmin,则能量差很小,表明该频率点位于语音段,由此更新语音功率谱以及语音的相干函数;其中,双耳声级差的计算公式为:ΔPLD=PX1X1-PX2X2PX1X1+PX2X2;]]>其中,PX1X1代表干扰噪声所在一侧的信号自功率谱,PX2X2代表与干扰噪声所在一侧相反的另一侧的信号自功率谱;语音功率谱的计算公式为:PS(λ,μ)=α1*PS(λ-1,μ)+(1-α1)*|X1(λ,μ)|2其中,λ和μ分别表示所在的帧和该帧的频率点;α1为平滑因子,X1为干扰噪声所在一侧的麦克风信号;语音的相干函数的计算公式为:ΓS(λ,μ)=αΓ*ΓS(λ-1,μ)+(1-αΓ)*Γx(λ,μ);αΓ为平滑因子;Γs、Γx分别表示语音的相干函数以及混合信号的相干函数;步骤3-1-2)、如果双耳声级差ΔPLD>Φmax,此时表明能量差很大,频率点位于干扰噪声段,此时不更新语音功率谱与语音的相干函数,即:PS(λ,μ)=PS(λ-1,μ),ΓS(λ,μ)=ΓS(λ-1,μ);步骤3-1-3)、如果Φmin<ΔPLD<Φmax,即此时能量差介于不大不小之间,则此时的语音功率谱用信噪比高的那一端的信号来估计,语音的相干函数不更新,即:PS(λ,μ)=α2*PS(λ-1,μ)+(1-α2)*|X2(λ,μ)|2;ΓS(λ,μ)=ΓS(λ-1,μ);其中,α2为平滑因子;步骤3-2)、在低频区域,首先将语音的相干函数设为1,然后利用双耳时间差估计语音功率谱,假设干扰噪声来自于左右两侧中的某一侧,则对低频区域的每个频率点执行如下步骤:步骤3-2-1)、计算双耳时间差,如果双耳时间差ITD(λ,k)<Tmin,则表明该频率点无时延差,此时位于语音段,更新语音功率谱;其中,计算双耳时间差的公式为:ITD(λ,μ)=|1wk∠(PX1X2(λ,μ))|;]]>其中,∠代表两个通道信号的相位差,wk代表角频率,PX1X2代表两个通道的互功率谱,λ和μ分别表示所在的帧和该帧的频率点;语音功率谱的计算公式为:PS(λ,μ)=α1*PS(λ-1,μ)+(1-α1)*|X1(λ,μ)|2步骤3-2-2)、如果双耳时间差ITD(λ,k)>Tmax,则表明该频率点位于干扰噪声段,此时不更新语音功率谱,即:PS(λ,μ)=PS(λ-1,μ);步骤3-2-3)、如果Tmin<ITD(λ,k)<Tmax,即此时能量差介于不大不小之间,则利用信噪比高的一端的麦克风信号进行语音功率谱的更新,即:PS(λ,μ)=α2*PS(λ-1,μ)+(1-α2)*|X2(λ,μ)|2上述技术方案中,所述Φmin在0.1-0.3之间,所述Φmax在0.7-0.9之间;所述Tmin在100us-200us之间,所述Tmax在300us-400us之间。上述技术方案中,在步骤4)中,干扰噪声的冲击响应比值的计算公式为:H12=PX1X2-PS1S2PX1-PS1,]]>其中,H12为干扰噪声的冲击响应比值;PS1S2=ΓS*PS,PS为步骤3)得到的语音功率谱,ΓS为步骤3)得到的语音的相干函数;PX1X2代表两个通道的互功率谱,本文档来自技高网
...
一种基于双耳信息的语音增强方法

【技术保护点】
一种基于双耳信息的语音增强方法,包括:步骤1)、将左右耳麦克风信号从时域变换到频域,然后做频带分解,根据频带分解的结果划分低频区域和高频区域;步骤2)、根据左右耳麦克风信号的能量比值,将能量高的一侧作为干扰噪声源所在的一侧;步骤3)、在低频区域利用双耳时间差估计语音功率谱,在高频区域利用双耳声级差估计语音功率谱以及语音的相干函数;步骤4)、将步骤3)计算得到的语音功率谱和相干函数联合起来计算干扰噪声的冲击响应比值;步骤5)、根据步骤4)计算得到的冲击响应比值、步骤3)得到的语音功率谱以及两个麦克风的能量差计算维纳滤波器的两个增益,所述维纳滤波器的两个增益分别对应左耳麦克风与右耳麦克风;步骤6)、利用步骤5)所得到的维纳滤波器的两个增益分别对左耳麦克风信号与右耳麦克风信号进行处理,得到增强后的语音信号。

【技术特征摘要】
1.一种基于双耳信息的语音增强方法,包括:步骤1)、将左右耳麦克风信号从时域变换到频域,然后做频带分解,根据频带分解的结果划分低频区域和高频区域;步骤2)、根据左右耳麦克风信号的能量比值,将能量高的一侧作为干扰噪声源所在的一侧;步骤3)、在低频区域利用双耳时间差估计语音功率谱,在高频区域利用双耳声级差估计语音功率谱以及语音的相干函数;步骤4)、将步骤3)计算得到的语音功率谱和相干函数联合起来计算干扰噪声的冲击响应比值;步骤5)、根据步骤4)计算得到的冲击响应比值、步骤3)得到的语音功率谱以及两个麦克风的能量差计算维纳滤波器的两个增益,所述维纳滤波器的两个增益分别对应左耳麦克风与右耳麦克风;步骤6)、利用步骤5)所得到的维纳滤波器的两个增益分别对左耳麦克风信号与右耳麦克风信号进行处理,得到增强后的语音信号。2.根据权利要求1所述的基于双耳信息的语音增强方法,其特征在于,所述步骤3)进一步包括:步骤3-1)、在高频区域,利用双耳声级差估计语音功率谱以及语音的相干函数;假设干扰噪声来自于左右两侧中的某一侧,则对高频区域的每个频率点执行如下步骤:步骤3-1-1)、计算双耳声级差,如果双耳声级差ΔPLD<Φmin,则能量差很小,表明该频率点位于语音段,由此更新语音功率谱以及语音的相干函数;其中,双耳声级差的计算公式为:ΔPLD=PX1X1-PX2X2PX1X1+PX2X2;]]>其中,PX1X1代表干扰噪声所在一侧的信号自功率谱,PX2X2代表与干扰噪声所在一侧相反的另一侧的信号自功率谱;语音功率谱的计算公式为:PS(λ,μ)=α1*PS(λ-1,μ)+(1-α1)*|X1(λ,μ)|;其中,λ和μ分别表示所在的帧和该帧的频率点;α1为平滑因子,X1为干扰噪声所在一侧的麦克风信号;语音的相干函数的计算公式为:ΓS(λ,μ)=αΓ*ΓS(λ-1,μ)+(1-αΓ)*Γx(λ,μ);αΓ为平滑因子;Γs、Γx分别表示语音的相干函数以及混合信号的相干函数;步骤3-1-2)、如果双耳声级差ΔPLD>Φmax,此时表明能量差很大,频率点位于干扰噪声段,此时不更新语音功率谱与语音的相干函数,即:PS(λ,μ)=PS(λ-1,μ),ΓS(λ,μ)=ΓS(λ-1,μ);步骤3-1-3)、如果Φmin<ΔPLD<Φmax,即此时能量差介于不大不小之间,则此时的语音功率谱用信噪比高的那一端的信号来估计,语音的相干函数不更新,即:PS(λ,μ)=α2*PS(λ-1,μ)+(1-α2)*|X2(λ,μ)|2;ΓS(λ,μ)=ΓS(λ-1,μ);其中,α2为平滑因子;步骤3-2)、在低频区域,首先将语音的相干函数设为1,然后利用双耳时间差估计语音功率谱,假设干扰噪声来自于左右两侧中的某一侧,则对低频区域的每个频率点执行如下步骤:步骤3-2-1)、计算双耳时间差,如果双耳时间差ITD(λ,k)<Tmin,则表明该频率点无时延差,此时...

【专利技术属性】
技术研发人员:冯海泓方义陈友元刘畅
申请(专利权)人:中国科学院声学研究所
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1