一种降低语音泄露的鲁棒阻塞矩阵方法技术

技术编号:15507983 阅读:117 留言:0更新日期:2017-06-04 02:27
本发明专利技术公开了一种降低语音泄露的鲁棒阻塞矩阵方法,包括:输入声音信号;利用固定波束模块从声音信号中获取目标语音信号;利用阻塞矩阵模块从声音信号中消除目标语音信号,得到噪声信号;利用固定波束模块估计噪声信号中存在目标语音信号的先验概率;阻塞矩阵模块根据先验概率更新噪声信号,消除噪声信号中存在的目标语音信号,得到更新后的噪声信号;利用消除模块从固定波束模块输出的目标语音信号中消除阻塞矩阵模块输出的噪声信号,形成输出信号并予以输出。本发明专利技术在利用消除模块消除目标语音信号中残留的噪声信号之前,预先更新阻塞矩阵模块的阻塞矩阵参数,以消除噪声信号中遗漏的目标语音信号,增强阻塞矩阵模块的消除目标语音信号的功能。

A robust blocking matrix method for reducing speech leakage

The invention discloses a method for reducing blocking matrix, robust voice leak includes an input sound signal; acquiring the target speech signal from the audio signal using the fixed beam module; the module of target speech signal blocking matrix elimination from the sound signal, noise signal; a priori probability estimation of target speech signal noise in the signal by fixed beam module; block matrix module according to the prior probability updating noise signal, eliminate the noise in the signal of speech signal, noise signal updated by eliminating the noise elimination module; signal blocking matrix module output from the target speech signal output module fixed beam, the formation of the output signal and to output. The cancellation module to eliminate signal noise residual target speech signal in advance before updating the blocking matrix parameters of block matrix module, to eliminate the missing target speech signal noise, enhance the blocking matrix module to eliminate target speech function.

【技术实现步骤摘要】
一种降低语音泄露的鲁棒阻塞矩阵方法
本专利技术涉及语音识别领域,尤其涉及一种降低语音泄露的鲁棒阻塞矩阵方法。
技术介绍
基于麦克风阵列的语音增强技术已经广泛应用于通信、人机交互、语音识别系统等中,其中广义旁瓣消除(GSC)方法应用最广,这种方法易于实现且性能很好。其中GSC分成上下两个通路,上通路是固定波束模块(FBF)用于估计目标语音的参考信号,下通路是阻塞矩阵模块(BM)和消除模块(MC),用于消除固定波束中的残留的噪声,其中阻塞矩阵模块用于消除目标语音信号而得到噪声信号。从诸多实践系统来看,最容易让GSC的性能下降的就是BM模块中的语音泄露,也就是BM没有将目标语音信号阻塞,导致与FBF中的语音信号相减而抵消掉泄露的语音信号。传统的BM设计常用自适应BM或者直接用差分矩阵。因为麦克风阵列系统的误差,或者目标方向的估计出现误差,那么差分矩阵性能将大打折扣,而自适应BM要受到自适应权值更新步长的影响,自适应的收敛性是一个比较大的问题。
技术实现思路
本专利技术所要解决的技术问题是提供一种降低语音泄露的鲁棒阻塞矩阵方法,能大幅度的减少语音泄露情况。为实现上述技术效果,本专利技术公开了一种降低语音泄露的鲁棒阻塞矩阵方法,包括步骤:提供一声音信号;将所述声音信号输入至广义旁瓣对消结构的固定波束模块和阻塞矩阵模块中,所述广义旁瓣对消结构具有并联的第一通路和第二通路,所述固定波束模块位于所述第一通路,所述阻塞矩阵模块位于所述第二通路;所述第二通路还设有消除模块,所述消除模块的输入与所述阻塞矩阵模块的输出相连,所述消除模块的输出与所述固定波束模块的输出相连;利用所述固定波束模块从输入的所述声音信号中获取目标语音信号,并输出所述目标语音信号;利用所述阻塞矩阵模块从输入的所述声音信号中消除目标语音信号,以得到噪声信号;利用所述固定波束模块估计所述噪声信号中存在目标语音信号的先验概率;所述阻塞矩阵模块根据所述先验概率更新所述噪声信号,消除所述噪声信号中存在的目标语音信号,得到更新后的噪声信号并输出更新后的所述噪声信号;利用所述消除模块从所述固定波束模块输出的所述目标语音信号中消除所述阻塞矩阵模块输出的所述噪声信号,形成输出信号并予以输出。本专利技术由于采用了以上技术方案,使其具有以下有益效果:在利用消除模块对固定波束模块输出的目标语音信号和阻塞矩阵模块输出的噪声信号进行对消,以消除目标语音信号中残留的噪声信号之前,预先对阻塞矩阵模块输出的噪声信号进行存在目标语音信号的概率先验,更新阻塞矩阵模块的阻塞矩阵参数,以消除噪声信号中遗漏的目标语音信号,增强阻塞矩阵模块的消除目标语音信号的功能,避免因阻塞矩阵模块没有将目标语音信号阻塞完全,导致其与固定波束模块中的目标语音信号相减而抵消掉泄露的目标语音信号,达到大幅度减少语音泄露的情况。所述降低语音泄露的鲁棒阻塞矩阵方法进一步的改进在于,所述声音信号的语音双态模型为:H0:X=NH1:X=S+N(式一)其中,H0状态表示只存在噪声的状态,N表示噪声信号,H1状态表示存在噪音信号和目标语音信号的状态,S为目标语音信号。所述降低语音泄露的鲁棒阻塞矩阵方法进一步的改进在于,所述声音信号为麦克风输入信号,所述固定波束模块从输入的麦克风输入信号中获取目标语音信号并予以输出;所述固定波束模块的输出YFBF为:其中,M是麦克风数目,xi是第i个麦克风输入信号,w是固定波束模块的权重,wi是第i个固定波束的权重。所述降低语音泄露的鲁棒阻塞矩阵方法进一步的改进在于,采用延迟求和方法或最小旁瓣类方法计算得到所述固定波束模块的权重w。所述降低语音泄露的鲁棒阻塞矩阵方法进一步的改进在于,所述阻塞矩阵模块从输入的所述麦克风输入信号中消除目标语音信号,以得到噪声信号并予以输出;所述阻塞矩阵模块的输出Z为:Z=B*X(式三)其中,Z=[z1z2…zN],是阻塞矩阵模块的输出信号;X=[x1x2…xM],是麦克风输入信号;B是阻塞矩阵模块的阻塞矩阵。所述降低语音泄露的鲁棒阻塞矩阵方法进一步的改进在于,利用所述固定波束模块的输出YFBF中的条件先验概率估计出噪声信号Z中存在目标语音信号的先验概率,包括步骤:用控制递归平均算法估计出YFBF中存在目标语音信号的概率P(H1|YFBF),以求出Z中存在目标语音信号的先验概率P(H1):P(H1)k=λP(H1)k-1+(1-λ)P(H1|YFBF)(式四)其中,H1是语音存在状态,λ是平滑系数,k是帧数;则Z中不存在目标语音信号的先验概率P(H0),由以下方程求得P(H0)=1-P(H1)。(式六)所述降低语音泄露的鲁棒阻塞矩阵方法进一步的改进在于,所述阻塞矩阵模块根据所述先验概率更新所述噪声信号,消除所述噪声信号中存在的目标语音信号,得到更新后的噪声信号的过程,包括步骤:步骤一:求解Z中存在目标语音信号的条件先验概率P(H1|Z)a、求解后验信噪比γ其中,是噪声信号的估计;b、采用判决引导方法求解先验信噪比ε其中,η是平滑系数,取值0.92,γold是前一帧的后验信噪比,GH1是H1状态下的语音增益,MAX是取大函数;c、求解语音存在似然度GLR其中,d、求解条件先验概率P(H1|BM)步骤二:修正信噪比和更新语音增益a、利用先验概率P(H1)修正信噪比其中,是修正后的后验信噪比,是修正后的先验信噪比;b、更新语音增益GH1,其中,exp是指数运算符,e是自然常数,x是积分变量;步骤三:估计动态噪声平滑系数其中,α取值为0.92;步骤四:估计噪声其中,E是期望操作,采用如下方程估计:其中,k是帧数,ε代表先验信噪比,P(H0|BM)=1-P(H1|BM);步骤五:计算语音增益采用最优修正的对数幅度谱估计方法估计更新后的语音增益Gain其中,Gmin是语音不存在时的增益下限约束,Gmin取值为0.01,是在H1状态时候的语音增益,是在H0状态时候的语音增益;步骤六:计算得到更新后的噪声信号Z′Z′=Z*(1-Gain)。(式十七)附图说明图1为本专利技术一种降低语音泄露的鲁棒阻塞矩阵方法的功能模块示意图。具体实施方式以下通过特定的具体实例说明本专利技术的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本专利技术的其他优点与功效。本专利技术还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本专利技术的精神下进行各种修饰或改变。语音增强技术的主要任务是抑制背景噪声和干扰,从而增强后续处理对于输入噪声的鲁棒性。在传统的单通道语音增强算法中,由于只有单路模拟信号输入,无任何参考信号,只能利用含噪语音信号在时域和频域的统计特性来抑制噪声、增强语音。但语音信号在时域和频域上往往都被淹没于噪声和干扰当中,难以准确与之分离,因此算法效果提升的空间相对较小。麦克风阵列的引入为语音增强技术打开了一个崭新的思路,它利用目标语音和干扰在空间位置上的差异,以及各个麦克风信号彼此之间的相关性,通过波束形成算法对来波方向上和语音分离的背景噪声和干扰进行抑制,从而增强语音,已逐渐成为语音增强领域研究的热点。现有的波束形成算法中,采用广义旁瓣对消(GeneralizedSidelobeCanceller,简称GSC)结构的自适应波束形成算法占有重要的地位。下面结本文档来自技高网...
一种降低语音泄露的鲁棒阻塞矩阵方法

【技术保护点】
一种降低语音泄露的鲁棒阻塞矩阵方法,包括步骤:提供一声音信号;将所述声音信号输入至广义旁瓣对消结构的固定波束模块和阻塞矩阵模块中,所述广义旁瓣对消结构具有并联的第一通路和第二通路,所述固定波束模块位于所述第一通路,所述阻塞矩阵模块位于所述第二通路;所述第二通路还设有消除模块,所述消除模块的输入与所述阻塞矩阵模块的输出相连,所述消除模块的输出与所述固定波束模块的输出相连;利用所述固定波束模块从输入的所述声音信号中获取目标语音信号,并输出所述目标语音信号;利用所述阻塞矩阵模块从输入的所述声音信号中消除目标语音信号,以得到噪声信号;利用所述固定波束模块估计所述噪声信号中存在目标语音信号的先验概率;所述阻塞矩阵模块根据所述先验概率更新所述噪声信号,消除所述噪声信号中存在的目标语音信号,得到更新后的噪声信号并输出更新后的所述噪声信号;利用所述消除模块从所述固定波束模块输出的所述目标语音信号中消除所述阻塞矩阵模块输出的所述噪声信号,形成输出信号并予以输出。

【技术特征摘要】
1.一种降低语音泄露的鲁棒阻塞矩阵方法,包括步骤:提供一声音信号;将所述声音信号输入至广义旁瓣对消结构的固定波束模块和阻塞矩阵模块中,所述广义旁瓣对消结构具有并联的第一通路和第二通路,所述固定波束模块位于所述第一通路,所述阻塞矩阵模块位于所述第二通路;所述第二通路还设有消除模块,所述消除模块的输入与所述阻塞矩阵模块的输出相连,所述消除模块的输出与所述固定波束模块的输出相连;利用所述固定波束模块从输入的所述声音信号中获取目标语音信号,并输出所述目标语音信号;利用所述阻塞矩阵模块从输入的所述声音信号中消除目标语音信号,以得到噪声信号;利用所述固定波束模块估计所述噪声信号中存在目标语音信号的先验概率;所述阻塞矩阵模块根据所述先验概率更新所述噪声信号,消除所述噪声信号中存在的目标语音信号,得到更新后的噪声信号并输出更新后的所述噪声信号;利用所述消除模块从所述固定波束模块输出的所述目标语音信号中消除所述阻塞矩阵模块输出的所述噪声信号,形成输出信号并予以输出。2.如权利要求1所述的降低语音泄露的鲁棒阻塞矩阵方法,其特征在于,所述声音信号的语音双态模型为:H0:X=NH1:X=S+N(式一)其中,H0状态表示只存在噪声的状态,N表示噪声信号,H1状态表示存在噪音信号和目标语音信号的状态,S为目标语音信号。3.如权利要求2所述的降低语音泄露的鲁棒阻塞矩阵方法,其特征在于,所述声音信号为麦克风输入信号,所述固定波束模块从输入的麦克风输入信号中获取目标语音信号并予以输出;所述固定波束模块的输出YFBF为:其中,M是麦克风数目,xi是第i个麦克风输入信号,w是固定波束模块的权重,wi是第i个固定波束的权重。4.如权利要求3所述的降低语音泄露的鲁棒阻塞矩阵方法,其特征在于:采用延迟求和方法或最小旁瓣类方法计算得到所述固定波束模块的权重w。5.如权利要求3所述的降低语音泄露的鲁棒阻塞矩阵方法,其特征在于,所述阻塞矩阵模块从输入的所述麦克风输入信号中消除目标语音信号,以得到噪声信号并予以输出;所述阻塞矩阵模块的输出Z为:Z=B*X(式三)其中,Z=[z1z2…zN],是阻塞矩阵模块的输出信号;X=[x1x...

【专利技术属性】
技术研发人员:曹裕行
申请(专利权)人:上海语知义信息技术有限公司
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1