声音降噪算法及其系统技术方案

技术编号:24689997 阅读:104 留言:0更新日期:2020-06-27 09:50
本发明专利技术公开了一种声音降噪算法及其系统,该算法包括如下步骤:(A)将声音信号帧转换成初始频域信号;(B)计算初始频域信号的初始能量谱;(C)将初始能量谱合并成新能量谱;首先提取能量特征值,其次选取噪声帧,最后计算连续噪声帧的平均能量谱作为噪声能量谱;(D)利用谱减法得到初始增益(E)将初始增益进行扩展得到最终增益;(F)对初始频域信号各频带施加对应的最终增益,获得新频域信号;(G)将新频域信号变换到新时域信号,获得降噪后的声音信号帧。该声音降噪算法及其系统通过实时侦测环境噪声进而对声音信号进行降噪处理,提高了在噪声环境下声音信号中语音的清晰度、识别率,从而改善了使用者的使用体验。

Noise reduction algorithm and system

【技术实现步骤摘要】
声音降噪算法及其系统
本专利技术涉及一种声音降噪算法及其系统,尤其涉及一种适用于人工耳蜗或助听器的声音降噪算法及其系统。
技术介绍
人工耳蜗是目前世界公认的能使双侧重度或极重度感音神经性耳聋患者恢复听觉的唯一有效方法及装置。现有的人工耳蜗运作流程为:声音先由麦克风采集转换为电信号,经过特殊的数字化处理,再按照一定的策略编码,通过载在耳后的发射线圈传送到体内,植入体的接收线圈感应到信号后,经过解码芯片解码,使植入体的刺激电极产生电流,从而刺激听神经产生听觉。由于使用环境的限制,声音中必然掺杂着环境噪声,需要对声音信号进行一定的降噪处理,以达到最佳的听觉效果。
技术实现思路
有鉴于现有技术的上述缺陷,本专利技术所要解决的技术问题是提供一种声音降噪算法及其系统,其能实时侦测环境噪声进而对声音信号进行降噪处理。为实现上述目的,本专利技术提供了一种声音降噪算法,其包括如下步骤:(A)通过WOLA分析滤波器组将声音信号帧从初始时域信号转换成初始频域信号;(B)计算初始频域信号各频带的能量值,得到相应的初始能量谱;(C)将初始能量谱的多个频带合并至一定频带数量的新能量谱,并转为dB值;同时,首先根据初始能量谱计算能量特征值,并转为dB值,其次利用能量特征值选取噪声帧,最后计算最近一定数量的连续噪声帧的平均能量谱作为当下的噪声能量谱;(D)利用谱减法得到初始增益;(E)将初始增益扩展至与初始频域信号频带数对应的个数,作为最终增益;(F)对初始频域信号各频带施加对应的最终增益,获得新频域信号;(G)通过WOLA分析的反向操作WOLA合成函数将新频域信号变换到新时域信号,获得降噪后的声音信号帧。在步骤(C)中,合并的方式为:首先根据需求制定分配表,然后利用分配表选大的方式合并。在步骤(C)中,能量特征值为初始能量谱各频带能量值的平均值。在步骤(C)中,噪声帧的选取方法:设置一个波谷曲线,当能量特征值高于波谷曲线时,波谷曲线开始线性增长,当能量特征值低于波谷曲线时,波谷曲线会持续更新,并跟随能量特征值下降,波谷曲线的局部谷点对应时间点的声音信号帧为噪声帧。在步骤(D)中,首先计算出当下声音信号帧的新能量谱与当下噪声能量谱的差值,得到信噪比,然后将信噪比与设定的阈值做对比,当信噪比小于阈值时,将信噪比减去阈值再乘以增益倍数得到dB增益,将dB增益转成线性后,得到初始增益,当信噪比大于等于阈值时,dB增益设为0,即初始增益为1。进一步,低频频带中设增益倍数为2,高频频带中设增益倍数为1。本专利技术还提供了一种声音降噪系统,包括WOLA分析程序模块,初始能量谱计算程序模块,增益参数计算程序模块,增益计算程序模块,增益扩展程序模块,增益施加程序模块,及其WOLA合成程序模块,其中,该WOLA分析程序模块进行WOLA分析处理,该初始能量谱计算程序模块进行初始能量谱计算处理,该增益参数计算程序模块进行增益参数计算处理,其包括新能量谱计算程序模块及其噪声能量谱计算程序模块,该增益计算程序模块进行增益计算处理,该增益扩展程序模块进行增益扩展处理,该增益施加程序模块进行增益施加处理,该WOLA合成程序模块进行WOLA合成处理。本专利技术声音降噪算法及其系统通过实时侦测环境噪声进而对声音信号进行降噪处理,提高了在噪声环境下声音信号中语音的清晰度、识别率,从而改善了使用者的使用体验,而且可适用于低功耗的处理器,应用场景广泛。以下将结合附图对本专利技术的构思、具体结构及产生的技术效果作进一步说明,以充分地了解本专利技术的目的、特征和效果。附图说明图1是本专利技术声音降噪算法的流程图。图2是本专利技术噪声能量谱计算的流程图。图3是本专利技术动态追踪噪声的示意图。图4是本专利技术信噪比对dB增益的映射关系图。具体实施方式如图1所示,本专利技术提供了一种声音降噪算法,其包括WOLA(WeightedOverlapAdd)分析,初始能量谱计算,增益参数计算,增益计算,增益扩展,增益施加及其WOLA合成七个步骤。WOLA分析:通过WOLA分析滤波器组将声音信号帧从初始时域信号转换成初始频域信号,其中,WOLA分析滤波器组是DFT(DiscreteFourierTransform)滤波器组的高效实现方式,可将声音信号分解为从0到频率Fs/2不同频率的窄带信号,获得声音信号帧频谱的数据,适合对音频信号进行快速处理。初始能量谱计算:计算初始频域信号各频带的能量值,得到相应的能量分布,即初始能量谱。增益参数计算包括新能量谱计算及其噪声能量谱计算。新能量谱计算:为了减轻后续谱减法中增益计算的运算量,根据需求制定分配表,利用分配表选大的方式,将初始能量谱的多个频带合并至一定频带数量的新能量谱,并转为dB值,为后续谱减法做准备。如图2所示,噪声能量谱计算:首先能量特征值计算,其次噪声帧判断,最后噪声能量谱更新。能量特征值计算:取初始能量谱各频带能量值的平均值作为声音信号帧的能量特征值,并转为dB值,后续用能量特征值判断声音信号帧是否为无语音的噪声帧。噪声帧判断:采用能量特征值曲线的谷底追踪算法,动态追踪噪声,类似于RC电路中信号包络/峰值侦测的概念,即,当瞬间输入电压大于需要供应电压时,电容开始充电,反之,当电压下降时,电容会进入放电循环,设置一个波谷曲线,当声音信号帧的能量特征值高于波谷曲线时,波谷曲线开始线性增长(对应电容放电原理),当声音信号帧的能量特征值低于波谷曲线时,波谷曲线会持续更新,并跟随能量特征值下降(对应电容充电原理),谷底追踪算法能准确追踪声音信号中能量特征值的变化趋势及谷底区域。环境噪声的能量特征虽然会随时间变化,但相较于纯净语音信号,平均能量一般较低,虽然环境噪声平时和语音相容在一起,但语音是有间隙和停顿的,如果我们能够判断当下声音信号帧的能量特征值曲线是否处于整体趋势的谷底区,便可追踪语音的间隙或停顿,知道此声音信号帧是否为无语音的噪声帧。如图3所示,实线为声音信号能量特征值根据时间的变化,整体趋势上数值突增的部分为包含语音信息的部分;虚线为波谷曲线根据时间的变化,黑点代表波谷曲线的局部谷点,即追踪到的能量特征值的谷底区域,其对应时间点的声音信号帧即是无语音的噪声帧。噪声能量谱更新:计算最近一定数量的连续噪声帧的平均能量谱作为当下的噪声能量谱,比如,设置多个缓冲器,每个缓冲器负责储存一个噪声帧的能量谱,如果当下声音信号帧被判断为噪声帧,最早被更新的缓冲器就会换为储存当下声音信号帧的能量谱,最早被更新的缓冲器由一个缓冲器指针负责追踪。增益计算:利用谱减法得到降噪用的施加于初始频域信号的初始增益,首先计算出当下声音信号帧的新能量谱与当下噪声能量谱的差值,得到信噪比,然后将信噪比与设定的阈值做对比,当信噪比小于阈值时,根据信噪比对dB增益的映射关系式得到dB增益,即信噪比减去阈值再乘以增益倍数得到dB增益,将dB增益转成线性后,得到初始增益,当信噪比大于等于阈值时,dB增益设为0,即初始增益为1。本文档来自技高网...

【技术保护点】
1.一种声音降噪算法,其包括如下步骤:(A)通过WOLA分析滤波器组将声音信号帧从初始时域信号转换成初始频域信号;(B)计算初始频域信号各频带的能量值,得到相应的初始能量谱;(C)将初始能量谱的多个频带合并至一定频带数量的新能量谱,并转为dB值;同时,首先根据初始能量谱计算能量特征值,并转为dB值,其次利用能量特征值选取噪声帧,最后计算最近一定数量的连续噪声帧的平均能量谱作为当下的噪声能量谱;(D)利用谱减法得到初始增益;(E)将初始增益扩展至与初始频域信号频带数对应的个数,作为最终增益;(F)对初始频域信号各频带施加对应的最终增益,获得新频域信号;(G)通过WOLA分析的反向操作WOLA合成函数将新频域信号变换到新时域信号,获得降噪后的声音信号帧。/n

【技术特征摘要】
1.一种声音降噪算法,其包括如下步骤:(A)通过WOLA分析滤波器组将声音信号帧从初始时域信号转换成初始频域信号;(B)计算初始频域信号各频带的能量值,得到相应的初始能量谱;(C)将初始能量谱的多个频带合并至一定频带数量的新能量谱,并转为dB值;同时,首先根据初始能量谱计算能量特征值,并转为dB值,其次利用能量特征值选取噪声帧,最后计算最近一定数量的连续噪声帧的平均能量谱作为当下的噪声能量谱;(D)利用谱减法得到初始增益;(E)将初始增益扩展至与初始频域信号频带数对应的个数,作为最终增益;(F)对初始频域信号各频带施加对应的最终增益,获得新频域信号;(G)通过WOLA分析的反向操作WOLA合成函数将新频域信号变换到新时域信号,获得降噪后的声音信号帧。


2.如权利要求1所述的声音降噪算法,其特征在于:在步骤(C)中,合并的方式为:首先根据需求制定分配表,然后利用分配表选大的方式合并。


3.如权利要求1所述的声音降噪算法,其特征在于:在步骤(C)中,能量特征值为初始能量谱各频带能量值的平均值。


4.如权利要求1所述的声音降噪算法,其特征在于:在步骤(C)中,噪声帧的选取方法:设置一个波谷曲线,当能量特征值高于波谷曲线时,波谷曲线开始线性增长,当能量特征值低...

【专利技术属性】
技术研发人员:蔡宜庭赖飞帆郭宇瑜其他发明人请求不公开姓名
申请(专利权)人:上海力声特医学科技有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1