语音增强方法/系统、计算机可读存储介质及电子设备技术方案

技术编号:19554063 阅读:22 留言:0更新日期:2018-11-24 22:29
本发明专利技术提供一种语音增强方法/系统、计算机可读存储介质及电子设备,语音增强方法包括:对麦克风阵列的输入信号进行短时傅里叶变换形成频域输入信号;生成一优化的超增益波束形成器,以通过超增益波束形成器处理频域输入信号,以形成超增益波束处理输出信号;对超增益波束处理输出信号进行低频白噪声增益修正,以确定低频白噪声增益修正结果是超增益波束处理输出信号,还是延迟相加波束处理输出信号;对低频白噪声增益修正结果进行低频降噪补偿,以输出低频降噪补偿后的频域信号。本发明专利技术可以控制白噪声放大的问题,且在一定程度上增强了低频降干扰能力。不仅如此,采用本发明专利技术后,对角加载因子的选择范围缩小,且鲁棒性增强,有利于实际应用。

Speech Enhancement Method/System, Computer Readable Storage Media and Electronic Equipment

The invention provides a speech enhancement method/system, a computer readable storage medium and an electronic device. The speech enhancement method includes: performing short-time Fourier transform on the input signal of a microphone array to form a frequency domain input signal; generating an optimized super-gain beamformer to process the frequency domain through a super-gain beamformer. Input signal to form super-gain beam to process output signal; low-frequency white noise gain correction of super-gain beam processing output signal to determine whether the correction result of low-frequency white noise gain is super-gain beam processing output signal or delay-plus beam processing output signal; and the correction result of low-frequency white noise gain is advanced. Line low frequency noise reduction compensation to output low frequency noise reduction compensated frequency domain signal. The invention can control the problem of white noise amplification, and to a certain extent enhances the ability of low frequency interference reduction. Moreover, after adopting the present invention, the selection range of the diagonal loading factor is reduced, and the robustness is enhanced, which is conducive to practical application.

【技术实现步骤摘要】
语音增强方法/系统、计算机可读存储介质及电子设备
本专利技术属于音频处理
,涉及一种增强方法和系统,特别是涉及一种语音增强方法/系统、计算机可读存储介质及电子设备。
技术介绍
传统的单麦克风技术提供的信息仅限于时/频信息,因此其降噪性能并不理想。而麦克风阵列可以提供空域和时/频信息,能够更好的解决该问题。麦克风阵列信号处理的一个核心技术是波束形成技术,即将麦克风阵列的接收信号通过一定的加权,使阵列方向图在期望信号方向的增益最大,而系统总的输出功率最小,从而完成空域滤波。根据实现方式不同,现有的波束形成技术可以分为固定波束形成技术和自适应波束形成技术。固定波束形成技术一般都与接收到的数据有关,并且其滤波器系数不随时间的变化而变化,或者说滤波器所形成的波束是固定不变的。自适应的波束形成技术相对于固定波束形成技术而言,其自适应特性表现在滤波系数是随着输入信号统计特性的变化而变化的。延时相加波束形成和超增益波束形成是较为常用的固定波束形成方法。其中,延时相加波束形成不能抑制任何方向入射的低频噪声源。与其它方法相比,经过超增益波束形成处理,阵列的阵增益达到最大,即麦克风阵列获得最大的指向性。但超增益波束形成存在白噪声放大的问题,尤其是低频段。但在实际应用中,常用的方法是通过在归一化自相关矩阵的主对角线元素上增加一个很小的常数(称对角加载因子),来实现增加白噪声增益约束的目的。但是,控制白噪声增益和保持降干扰能力两者是矛盾的,因此增加白噪声增益约束必然导致超增益波束形成的降干扰能力下降。且该常数因子取值范围是从零到无穷,因此该因子很难选择,不利于实际应用。因此,如何提供一种语音增强方法/系统、计算机可读存储介质及电子设备,以解决现有技术是通过在归一化自相关矩阵的主对角线元素上增加一个对角加载因子,来实现增加白噪声增益约束的目的,但是控制白噪声增益和保持降干扰能力两者相互矛盾,增加白噪声增益约束必然导致超增益波束形成的降干扰能力下降;且对角加载因子取值范围是从零到无穷,由于该因子很难选择,不利于实际应用等缺陷,实以成为本领域技术人员亟待解决的技术问题。
技术实现思路
鉴于以上所述现有技术的缺点,本专利技术的目的在于提供一种语音增强方法/系统、计算机可读存储介质及电子设备,用于解决现有技术中是通过在归一化自相关矩阵的主对角线元素上增加一个对角加载因子,来实现增加白噪声增益约束的目的,但是控制白噪声增益和保持降干扰能力两者相互矛盾,增加白噪声增益约束必然导致超增益波束形成的降干扰能力下降;且对角加载因子取值范围是从零到无穷,由于该因子很难选择,不利于实际应用的问题。为实现上述目的及其他相关目的,本专利技术一方面提供一种语音增强方法,应用于电子设备,在所述电子设备内设置麦克风阵列;所述语音增强方法包括以下步骤:步骤一,对所述麦克风阵列的输入信号进行短时傅里叶变换形成频域输入信号;步骤二,在保证所述麦克风阵列在期望方向上信号不失真的约束条件下,生成一优化的超增益波束形成器,以通过所述超增益波束形成器处理所述频域输入信号,以形成超增益波束处理输出信号;步骤三,在预存的延迟相加波束形成器对所述频域输入信号的处理,而形成的延迟相加波束处理输出信号的基础上,对所述超增益波束处理输出信号进行低频白噪声增益修正,以确定低频白噪声增益修正结果是所述超增益波束处理输出信号,还是所述延迟相加波束处理输出信号;步骤四,对所述低频白噪声增益修正结果进行低频降噪补偿,以输出低频降噪补偿后的频域信号。于本专利技术的一实施例中,所述步骤二中生成超增益波束形成器的步骤包括:根据麦克风阵列的几何结构,构造各向同性噪声的归一化自相关矩阵;在所述归一化自相关矩阵中加入对角加载因子,以通过所述对角加载因子控制白噪声增益;在保证所述麦克风阵列在期望方向信号不失真的约束条件下,根据最小化的输出功率,以生成优化的超增益波束形成器。于本专利技术的一实施例中,保证所述麦克风阵列在期望方向上信号不失真的约束条件是指未加入所述对角加载因子的超增益波束形成器的共轭转置与麦克风阵列在期望方向上的响应向量的点乘等于1。于本专利技术的一实施例中,所述步骤三包括:从所述超增益波束处理输出信号和所述延迟相加波束处理输出信号中选出频率低于预设低频限的各频点;计算从所述超增益波束处理输出信号选出的频点的频点能量,和从所述延迟相加波束处理输出信号选出的频点的频点能量;将从所述超增益波束处理输出信号选出的频点的频点能量与从所述延迟相加波束处理输出信号选出的频点的频点能量进行比较,若所述超增益波束处理输出信号选出的频点的频点能量大于从所述延迟相加波束处理输出信号选出的频点的频点能量,则判定该频点处为非相干噪声占主体,确定低频白噪声增益修正结果为所述延迟相加波束处理输出信号;若所述超增益波束处理输出信号选出的频点的频点能量小于等于从所述延迟相加波束处理输出信号选出的频点的频点能量,则判定该频点处为语音干扰占主体,确定低频白噪声增益修正结果为所述超增益波束处理输出信号。于本专利技术的一实施例中,所述步骤四包括:统计所述低频白噪声增益修正结果中高频段内的能量,及延迟相加波束处理输出信号中高频段内的能量,并将两者进行能量比较;若所述低频白噪声增益修正结果中高频段内的能量大于等于延迟相加波束处理输出信号中高频段内的能量,则表示无需进行低频降噪补偿,直接输出低频白噪声增益修正结果;若所述低频白噪声增益修正结果中高频段内的能量小于延迟相加波束处理输出信号中高频段内的能量,则继续进行低频降噪补偿,以输出低频降噪补偿后的频域信号。于本专利技术的一实施例中,对所述低频白噪声增益修正结果进行低频降噪补偿的步骤包括:统计所述频域输入信号中高频内的能量;从所述超增益波束处理输出信号选出干扰性能下降一性能阈值的频率点,以作为低频降噪补偿的最高频率点;计算中高频综合降噪因子和中高频降干扰因子;根据所述中高频综合降噪因子和中高频降干扰因子,计算低频降噪补偿增益;基于所述低频降噪补偿增益,对所述超增益波束处理输出信号中的不同频点进行补偿增益计算,以获取各频点的补偿增益;根据所获取的各频点的补偿增益处理所述低频白噪声增益修正结果,以获取低频降噪补偿后频域信号,予以输出。本专利技术另一专利技术提供一种语音增强系统,应用于电子设备,在所述电子设备内设置麦克风阵列;所述语音增强系统包括:傅里叶变换模块,用于对所述麦克风阵列的输入信号进行短时傅里叶变换形成频域输入信号;处理模块,用于在保证所述麦克风阵列在期望方向上信号不失真的约束条件下,生成一优化的超增益波束形成器,以通过所述超增益波束形成器处理所述频域输入信号,以形成超增益波束处理输出信号;修正模块,用于在预存的延迟相加波束形成器对所述频域输入信号的处理,而形成的延迟相加波束处理输出信号的基础上,对所述超增益波束处理输出信号进行低频白噪声增益修正,通过预存的延迟相加波束形成器处理所述频域输入信号,以形成延迟相加波束处理输出信号,以确定低频白噪声增益修正结果是所述超增益波束处理输出信号,还是所述延迟相加波束处理输出信号;补偿模块,用于对所述低频白噪声增益修正结果进行低频降噪补偿,以输出低频降噪补偿后的频域信号。于本专利技术的一实施例中,所述处理模块用于根据麦克风阵列的几何结构,构造各向同性噪声的归一化自相关矩阵;在本文档来自技高网
...

【技术保护点】
1.一种语音增强方法,其特征在于,应用于电子设备,在所述电子设备内设置麦克风阵列;所述语音增强方法包括以下步骤:步骤一,对所述麦克风阵列的输入信号进行短时傅里叶变换形成频域输入信号;步骤二,在保证所述麦克风阵列在期望方向上信号不失真的约束条件下,生成一优化的超增益波束形成器,以通过所述超增益波束形成器处理所述频域输入信号,以形成超增益波束处理输出信号;步骤三,在预存的延迟相加波束形成器对所述频域输入信号的处理,而形成的延迟相加波束处理输出信号的基础上,对所述超增益波束处理输出信号进行低频白噪声增益修正,以确定低频白噪声增益修正结果是所述超增益波束处理输出信号,还是所述延迟相加波束处理输出信号;步骤四,对所述低频白噪声增益修正结果进行低频降噪补偿,以输出低频降噪补偿后的频域信号。

【技术特征摘要】
1.一种语音增强方法,其特征在于,应用于电子设备,在所述电子设备内设置麦克风阵列;所述语音增强方法包括以下步骤:步骤一,对所述麦克风阵列的输入信号进行短时傅里叶变换形成频域输入信号;步骤二,在保证所述麦克风阵列在期望方向上信号不失真的约束条件下,生成一优化的超增益波束形成器,以通过所述超增益波束形成器处理所述频域输入信号,以形成超增益波束处理输出信号;步骤三,在预存的延迟相加波束形成器对所述频域输入信号的处理,而形成的延迟相加波束处理输出信号的基础上,对所述超增益波束处理输出信号进行低频白噪声增益修正,以确定低频白噪声增益修正结果是所述超增益波束处理输出信号,还是所述延迟相加波束处理输出信号;步骤四,对所述低频白噪声增益修正结果进行低频降噪补偿,以输出低频降噪补偿后的频域信号。2.根据权利要求1所述的语音增强方法,其特征在于:所述步骤二中生成超增益波束形成器的步骤包括:根据麦克风阵列的几何结构,构造各向同性噪声的归一化自相关矩阵;在所述归一化自相关矩阵中加入对角加载因子,以通过所述对角加载因子控制白噪声增益;在保证所述麦克风阵列在期望方向信号不失真的约束条件下,根据最小化的输出功率,以生成优化的超增益波束形成器。3.根据权利要求2所述的语音增强方法,其特征在于:保证所述麦克风阵列在期望方向上信号不失真的约束条件是指未加入所述对角加载因子的超增益波束形成器的共轭转置与麦克风阵列在期望方向上的响应向量的点乘等于1。4.根据权利要求1所述的语音增强方法,其特征在于:所述步骤三包括:从所述超增益波束处理输出信号和所述延迟相加波束处理输出信号中选出频率低于预设低频限的各频点;计算从所述超增益波束处理输出信号选出的频点的频点能量,和从所述延迟相加波束处理输出信号选出的频点的频点能量;将从所述超增益波束处理输出信号选出的频点的频点能量与从所述延迟相加波束处理输出信号选出的频点的频点能量进行比较,若所述超增益波束处理输出信号选出的频点的频点能量大于从所述延迟相加波束处理输出信号选出的频点的频点能量,则判定该频点处为非相干噪声占主体,确定低频白噪声增益修正结果为所述延迟相加波束处理输出信号;若所述超增益波束处理输出信号选出的频点的频点能量小于等于从所述延迟相加波束处理输出信号选出的频点的频点能量,则判定该频点处为语音干扰占主体,确定低频白噪声增益修正结果为所述超增益波束处理输出信号。5.根据权利要求4所述的语音增强方法,其特征在于:所述步骤四包括:统计所述低频白噪声增益修正结果中高频段内的能量,及延迟相加波束处理输出信号中高频段内的能量,并将两者进行能量比较;若所述低频白噪声增益修正结果中高频段内的能量大于等于延迟相加波束处理输出信号中高频段内的能量,则表示无需进行低频降噪补偿,直接输出低频白噪声增益修正结果;若所述低频白噪声增益修正结果中高频段内的能量小于延迟相加波束处理输出信号中高频段内的能量,则继续进行低频降噪补偿,以输出低频降噪补偿后的频域信号。6.根据权利要求5所述的语音增强方法,其特征在于:对所述低频白噪声增益修正结果进行低频降噪补偿的步骤包括:统计所述频域输入信号中高频内的能量;从所述超增益波束处理输出信号选出干扰性能下降一性能阈值的频率点,以作为低频降噪补偿的最高频率点;计算中高频综合降噪因子和中高频降干扰因子;根据所述中高频综合降噪因子和中高频降干扰因子,计算低频降噪补偿增益;基于所述低频降噪补偿增益,对所...

【专利技术属性】
技术研发人员:张益萍
申请(专利权)人:福州瑞芯微电子股份有限公司
类型:发明
国别省市:福建,35

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1