振幅抑制量计算部(20)计算作为当前帧的噪声抑制水平的振幅抑制量,听觉权重模式调整部(21)决定频谱相减量及频谱振幅抑制量的听觉权重分配模式,听觉权重修正部(7)根据频带SN比修正由听觉权重分配模式提供的频谱相减量和频谱振幅抑制量,频谱相减部(8)根据振幅谱、噪声谱及被修正了的频谱相减量求出噪声消除频谱,频谱抑制部(9)根据噪声消除频谱和被修正了的频谱振幅抑制量求出噪声抑制频谱。(*该技术在2022年保护过期,可自由使用*)
【技术实现步骤摘要】
本专利技术涉及在各种噪声环境下使用的语音通信系统及语音识别系统等中,抑制目的信号以外噪声的噪声抑制装置。
技术介绍
作为通过从混入了噪声的输入信号抑制作为目的外信号的噪声,强调作为目的信号的语音信号等的噪声抑制装置,在比如特开2000-347688公报中有披露。其以如文献(Steven F.Boll,“Suppressionof Acoustic noise in speech using spectral subtraction利用频谱相减抑制语音中的噪声”,IEEE Trans.ASSP,Vol.ASSP-27,No.2,April 1979)所示的通过从振幅谱减去另外估算的平均噪声谱进行噪声抑制的所谓频谱相减法为基本。图1是表示特开2000-347688公报中公开的现有的噪声抑制装置构成的方框图,图中,1是输入端子,2是时间·频率转换部,3是噪声相似度分析部,4是噪声谱估算部,5是频带SN比计算部,6是听觉权重计算部,7是听觉权重修正部,8是频谱相减部,9是频谱抑制部,10是频率·时间转换部,11是输出端子。此外在图1的噪声相似度分析部3中,12是低通滤波器,13是反向滤波器,14是自相关分析部,15是线性预测分析部,16是更新速度决定部。以下对动作作以说明。混入了噪声的输入信号S[t]被按规定的取样频率(比如8kHz)取样,在规定的帧周期(比如20ms)被帧分割并被输入。时间·频率转换部2利用比如256点FFT(Fast Fourier Transform高速傅立叶变换),对输入信号s[t]进行频率分析,转换为振幅谱S[f]及相位谱P[f]。此外由于FFT是周知的方法,因而省略说明。在噪声相似度分析部3中,首先,由低通滤波器12进行输入信号s[t]的滤波处理,得到低通滤波信号s1[t]。接下来,由线性预测分析部15进行低通滤波信号s1[t]的线性预测分析,得到比如10次的α参数的线性预测系数及帧功率POWfr。反向滤波器13利用线性预测系数对低通滤波信号s1[t]进行反向滤波处理,输出低通线性预测残余信号(以下简称为低通残余信号)res[t]。接着,由自相关分析部14进行低通残余信号res[t]的自相关分析,从自相关系数系列rac[t]求出自相关系数的正的峰值,将其设为RACmax。更新速度决定部16使用比如自相关系数的正峰值RACmax和低通残余信号res[t]的功率POWres、帧功率POWfr,决定噪声相似度信号Noise,并决定与所决定的噪声相似度信号Noise对应的噪声谱更新速度系数r并输出。图2是表示噪声相似度信号Noise与噪声谱更新速度系数r的关系的附图。更新速度决定部16从比如图2所示的5个量级中决定1个噪声相似度信号Noise,决定出与所决定的噪声相似度信号Noise对应的噪声谱更新速度系数r并输出。噪声谱估算部4从噪声相似度分析部3输出的噪声谱更新系数r、时间·频率转换部2输出的振幅谱S[f]、内部保存的过去的平均噪声谱Nold[f],如下列式(1)所示进行噪声谱N[f]的更新。N[f]=(1-r)·Nold[f]+r·S[f] (1)频带SN比计算部5从时间·频率转换部2输出的振幅谱S[f]和噪声谱估算部4输出的噪声谱N[f],根据下列式(2)计算每个频带f的信噪比(频带SN比)SNR[f]。但在SNR[f]为负值的场合下设为0。SNR[f]=20·log10(S[f]/N[f]) (dB);S[f]>N[f]=0(dB);上述以外 (2)听觉权重计算部6输入规定的常数α、α′(比如α=1.2,α′=0.5)、β,β′(比如β=0.8,β′=0.1)以及γ,γ′(比如γ=0.25,γ′=0.4),根据下列式(3)计算在频率方向被加权了的第1听觉权重αw(f)、第2听觉权重βw(f)及第3听觉权重γw[f]。此外式(3)中的Fc是尼奎斯特频率。αw[f]=(α′-α)·f/fc+αβw[f]=(β′-β)·f/fc+βγw[f](γ′-γ)·f/fc+γ (3)听觉权重修正部7对第1听觉权重αw[f]及第2听觉权重βw[f],基于频带SN比计算部5输出的频带SN比SNR[f],通过比如下列式(4),在频带SN比SNR[f]小的场合下,将第1听觉权重αw[f]、第2听觉权重βw[f]修正为小值,按照随频带SN比SNR[f]的增大而增大的原则,修正为与各频带的SN比对应的值,把修正后的第1听觉权重αc[f]和第3听觉权重γw[f]向频谱相减部8输出,把修正后的第2听觉权重βc[f]向频谱抑制部9输出。αc[f]=αw(f)·SNR[f]-MIN_GAINαβc[f]=βw(f)·SNR[f]-MIN_GAINβ(4)此外在上述式(4)中,MIN_GAINα,MIN_GAINβ是规定的常数,分别表示第1听觉权重αw(f)、第2听觉权重βw(f)的最大抑制量[dB]。图3是表示后述的频谱相减及频谱振幅抑制用的第1听觉权重αc[f]及第2听觉权重βc[f]的频率方向加权控制一例的附图,图中,101表示作为第1听觉权重的频谱相减量αc[f],102表示作为第2听觉权重的频谱振幅抑制量βc[f],103表示语音频谱,104表示噪声谱。听觉权重修正部7在下列式(5)所示的当前帧的平均SN比SNRave高的场合下,按照αc与αc[fc]值之差增大的原则设定。即,图3中的αc[f]的斜率变大。此外听觉权重修正部7在平均SN比SNRave高的场合下,按照βc[f]缩小βc与βc[fc]之差的原则设定。即,图3中的βc[f]的斜率变小。这样,随着当前帧的平均SN比SNRave变小,减小αc与αc[fc]之差,即αc[f]的斜率变小,反之βc与βc[fc]之差变大,即βc[f]的斜率变大。SNRave=∑(SNR[f])/fc,f=0,……,fc(5)频谱相减部8对噪声谱N[f]乘以被修正了的第1听觉权重αc[f],按下列式(6)进行振幅谱S[f]的相减,输出噪声消除频谱Ss[f]。此外在作为频谱相减的结果,噪声消除频谱Ss[f]为负值的场合下,进行置换为对比如输入信号的振幅谱S[f]相乘了第3听觉权重γw[f]的频谱,并将其设为噪声消除频谱Ss[f]的回填处理。Ss[f]=S[f]-αc[f]·N[f];S[f]>αc[f]·N[f]=γw[f]·S[f];上述以外的场合 (6)频谱抑制部9根据下列式(7),对噪声消除频谱Ss[f]乘以被修正了的第2听觉权重βc[f],输出减小了噪声振幅的噪声抑制频谱Sr[f]。Sr[f]=10^(-βc[f])·Ss[f] (7) 这里,10^(-βc[f])=10-βc[f]。频率·时间转换部10采用与上述的时间·频率转换部2所进行的处理相反的顺序,进行比如反向FFT,利用噪声抑制频谱Sr[f]及时间·频率转换部2输出的相位谱P[f]转换为时间信号,进行与前帧的部分时间信号成分叠加的处理,从输出信号端子11输出噪声抑制信号sr[t]。这样,现有的噪声抑制装置在基于频带SN比SNR[f]修正的同时,基于当前帧的平均SN比SNRave利用在频率方向上被加权了的第1听觉权重αc[f]及第2听觉权重βc[f]进行频谱相减及频谱振幅抑制本文档来自技高网...
【技术保护点】
一种噪声抑制装置,其特征在于:具备了时间.频率转换部,其对输入信号进行频率分析,转换为振幅谱和相位谱;噪声相似度分析部,其在从上述输入信号判定噪声相似度,输出噪声相似度信号的同时,输出与该噪声相似度信号对应的噪声谱更新速度系数; 噪声谱估算部,其从上述噪声谱更新系数、上述振幅谱、在内部保存的过去的平均噪声谱来更新噪声谱并输出;频带SN比计算部,其从上述振幅谱及上述噪声谱计算作为每个频带的信噪比的频带SN比;振幅抑制量计算部,其从上述噪声相似度信号及上述噪声谱 计算作为当前帧的噪声抑制水平的振幅抑制量;听觉权重模式调整部,其从上述振幅抑制量及上述噪声相似度信号决定作为第1听觉权重的频谱相减量与作为第2听觉权重的频谱振幅抑制量的频率特性分配模式即听觉权重分配模式;听觉权重修正部,其依据上述频 带SN比对由上述听觉权重分配模式提供的作为第1听觉权重的频谱相减量与作为第2听觉权重的频谱振幅抑制量进行修正,输出被修正了的频谱相减量和被修正了的频谱振幅抑制量;频谱相减部,其从上述振幅谱减去对上述噪声谱相乘了上述被修正了的频谱相减量的 频谱,求出噪声消除频谱;频谱抑制部,其对上述噪声消除频谱乘以上述被修正了的频谱振幅抑制量,求出噪声抑制频谱;频率.时间转换部,其依据上述相位谱把上述噪声抑制频谱转换为时间信号,输出噪声抑制信号。...
【技术特征摘要】
JP 2001-6-6 171584/011.一种噪声抑制装置,其特征在于具备了时间·频率转换部,其对输入信号进行频率分析,转换为振幅谱和相位谱;噪声相似度分析部,其在从上述输入信号判定噪声相似度,输出噪声相似度信号的同时,输出与该噪声相似度信号对应的噪声谱更新速度系数;噪声谱估算部,其从上述噪声谱更新系数、上述振幅谱、在内部保存的过去的平均噪声谱来更新噪声谱并输出;频带SN比计算部,其从上述振幅谱及上述噪声谱计算作为每个频带的信噪比的频带SN比;振幅抑制量计算部,其从上述噪声相似度信号及上述噪声谱计算作为当前帧的噪声抑制水平的振幅抑制量;听觉权重模式调整部,其从上述振幅抑制量及上述噪声相似度信号决定作为第1听觉权重的频谱相减量与作为第2听觉权重的频谱振幅抑制量的频率特性分配模式即听觉权重分配模式;听觉权重修正部,其依据上述频带SN比对由上述听觉权重分配模式提供的作为第1听觉权重的频谱相减量与作为第2听觉权重的频谱振幅抑制量进行修正,输出被修正了的频谱相减量和被修正了的频谱振幅抑制量;频谱相减部,其从上述振幅谱减去对上述噪声谱相乘了上述被修正了的频谱相减量的频谱,求出噪声消除频谱;频谱抑制部,其对上述噪声消除频谱乘以上述被修正了的频谱振幅抑制量,求出噪声抑制频谱;频率·时间转换部,其依据上述相位谱把上述噪声抑制频谱转换为时间信号,输出噪声抑制信号。2.权利要求1中记载的噪声抑制装置,其特征在于听觉权重修正部在频带SN比大的低频带,在增大作为第1听觉权重的频谱相减量的同时,减小作为第2听觉权重的频谱振幅抑制量,在上述频带SN比小的高频带,在减小作为上述第1听觉权重的频谱相减量的同时,增大作为上述第2听觉权重的频谱振幅抑制量。3.权利要求1中记载的噪声抑制装置,其特征在于听觉权重模式调整部具备听觉权重基本分配模式,其由成为用于决定听觉权重分配模式的基本的、与噪声相似度信号对应的多个频率特性模式组成,从该听觉权重基本分配模式中选择与由噪声相似度分析部输出的噪声相似度信号对应的频率特性模式,决定听觉权重分配模式。4.权利要求3中记载的噪声抑制装置,其特征在于听觉权重模式调整部具备了听觉权重基本分配模式,其由根据使...
【专利技术属性】
技术研发人员:古田训,
申请(专利权)人:三菱电机株式会社,
类型:发明
国别省市:JP[日本]
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。