System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种参数约束自适应的语音增强方法技术_技高网

一种参数约束自适应的语音增强方法技术

技术编号:42075272 阅读:15 留言:0更新日期:2024-07-19 16:55
本发明专利技术公开了一种参数约束自适应的语音增强方法,涉及语音增强技术领域;其包括如下步骤,获得带噪语音信号,计算获得带噪语音信号的功率谱,基于带噪语音信号的功率谱,结合当前帧的噪声功率谱估计,计算获得后验信噪比,计算约束自适应的平滑参数,估计当前帧的先验信噪比,求解约束自适应的递归参数,得到递归平均的先验信噪比,计算小带宽和大带宽对应每一频点的语音存在条件概率和基于所有频点平均后的语音存在条件概率等;其通过将固定的先验信噪比平滑因子以及递归因子改进为根据先验信噪比波动而自适应变化的参数并阈值约束,抑制了音乐噪声,能快速适应先验信噪比波动,有效估计先验信噪比,准确估计纯净语音信号,语音增强效果更好。

【技术实现步骤摘要】

本专利技术涉及语音增强,尤其涉及一种参数约束自适应的语音增强方法


技术介绍

1、在语音信号处理系统中,语音增强部分常常作为预处理模块,是不可或缺的部分。在现实环境中存在各种噪声干扰,语音质量和清晰度会有所降低,不利于感知和识别语音信号中的关键信息。语音增强技术旨在噪声背景下尽可能的提取纯净的语音信号,从而提高语音质量和语音可懂度。

2、目前语音信号处理系统中常用的语音增强算法主要分为谱减处理法、子空间方法,基于统计模型的方法等几类。早期的谱减方法将带噪语音信号的幅度谱或功率谱减去相应的噪声估计的谱值,并利用带噪信号的相位作为纯净语音信号的相位恢复纯净信号,该方法简单且易于实时实现,但由于半波整流的非线性处理方式往往会引入音乐噪声,并且残留的干扰噪声较大。子空间增强方法的核心原理是将带噪语音信号在高维空间分解为包含语音信息的信号子空间和包含噪声成分的噪声子空间,从而分离出纯净语音信号,该方法依赖于对噪声特性的准确估计,在噪声特性变化如非平稳噪声情况下噪声抑制效果不佳,并且子空间分解和投影运算涉及到复杂的矩阵运算,在硬件资源受限的情况下不利于系统的实时处理。

3、基于统计模型的方法通常假设噪声和语音信号具有特定的统计特性,通过最大化后验概率或最小化代价函数来估计纯净语音信号,该类方法对噪声的适应性强,增强效果较好。基于统计模型的主要方法有维纳滤波法、最小均方误差估计mmse和对数谱最小均方误差估计方法mmse-lsa,其中mmse以及mmse-lsa方法能够显著抑制噪声,有较高的语音保真度。随后,在语音存在性的二值假设模型下,基于最优修正对数谱的最小均方误差方法mmse-omlsa被提出,相较于上述方法,该方法的语音增强效果更好。然而,在mmse-omlsa方法中,估计先验信噪比时平衡前帧和当前帧先验信噪比的平滑因子、以及估计先验语音不存在概率时先验信噪比的递归因子均为经验固定值,不能较好的适应语音变化,影响语音增强性能。

4、第一现有技术方案:冯谦,余勤,雒瑞森,等.基于改进噪声估计的mmse-lsa语音增强算法[j].计算机应用与软件,2022,39(11):141-147。

5、第二现有技术方案:王金明,周坤,尹海明,等.一种改进的lsa语音增强算法[j].解放军理工大学学报(自然科学版),2015,16(04):310-315。

6、第三现有技术方案:具有相位补偿的改进log-mmse语音增强算法[j].电声技术,2020,44(04):85-91.doi:10.16311/j.audioe.2020.04.025。

7、第四现有技术方案:冯谦.基于改进噪声估计的mmse-lsa语音增强方法[p].四川省:cn202011119852.4,2021-01-08。

8、第五现有技术方案:毛婷婷.一种语音增强处理方法、装置、电子设备及介质[p].广东省:cn202310773974.2,2023-09-15。


技术实现思路

1、本专利技术提供一种参数约束自适应的语音增强方法,解决语音增强效果较差的技术问题。

2、为解决上述技术问题,本专利技术所采取的技术方案在于如下方面:

3、一种参数约束自适应的语音增强方法,包括如下步骤,步骤s1:获得带噪语音信号y(n);步骤s2:对带噪语音信号y(n)进行分频加窗,傅里叶变换变换,计算获得带噪语音信号的功率谱|y(l,k)|2;步骤s3:基于带噪语音信号的功率谱|y(l,k)|2,结合当前帧的噪声功率谱估计λd(l,k),计算获得后验信噪比;步骤s4:计算约束自适应的平滑参数,估计当前帧的先验信噪比;步骤s5:求解约束自适应的递归参数,得到递归平均的先验信噪比;步骤s6:计算小带宽和大带宽对应每一频点的语音存在条件概率和基于所有频点平均后的语音存在条件概率;步骤s7:求得语音不存在的先验概率;步骤s8:计算语音存在的条件概率;步骤s9:求解对数幅度谱增益,与频域带噪语音信号相乘,得到频域估计的纯净语音信号。

4、进一步的技术方案在于:还包括在所述步骤s9之后的步骤s10,步骤s10:对频域估计的纯净语音信号进行逆傅里叶变换获得语音增强后的信号;在所述步骤s1中,通过语音采集模块对带噪语音信号进行采集,获得带噪语音信号y(n)。

5、进一步的技术方案在于:在所述步骤s2中,对带噪语音信号y(n)进行分帧加窗处理,每一帧分为n个样本,相邻帧之间有1/2的样本点重叠,窗函数采用n点的汉明窗;将分帧加窗后的带噪语音信号进行傅里叶变换,即计算获得带噪语音的频域信号y(l,k);

6、

7、式(1)中,y(l,k)为带噪语音的频域信号,l表示的是带噪语音信号经过分帧后的帧序号,k表示的是频率分量,即k=0,1,…,n-1,n表示每帧的样本点数,y(nl+n)为y(n)分帧后的数据,w(n)为汉明窗函数,

8、|y(l,k)|2=|x(l,k)|2+|d(l,k)|2    (2)

9、式(2)中,|y(l,k)|2为带噪语音信号的功率谱,|x(l,k)|2为纯净语音功率谱,|d(l,k)|2为噪声功率谱。

10、进一步的技术方案在于:在所述步骤s3中,根据式(3)计算获得后验信噪比,

11、

12、式(3)中,γ(l,k)为后验信噪比,λd(l,k)表示噪声功率谱,由前一帧得到。

13、进一步的技术方案在于:在所述步骤s4中,根据后验信噪比,结合前一帧估计的先验信噪比,估计当前帧信噪比;

14、

15、式(4)中,为先验信噪比,|x(l-1,k)|2是前一帧估计的纯净信号功率谱,λd(l-1,k)是前一帧估计的噪声功率谱估计,γ(l,k)为当前帧的后验信噪比估计,ξmin为先验信噪比估计的下限阈值;α(l,k)为平衡前一帧先验信噪比以及当前帧先验信噪比的平滑参数,记

16、根据最小均方误差准则,计算mmse最优的平滑参数;

17、

18、式(5)中,为自适应后的平滑参数;

19、对平滑参数进行上、下限阈值约束;

20、

21、式(6)中,α(l,k)为约束自适应的平滑参数,αmin为平滑参数的下限阈值,αmax为平滑参数的上限阈值。

22、进一步的技术方案在于:在所述步骤s5中,对先验信噪比进行递归平均计算,对固定递归因子进行自适应处理,对递归因子进行最小均方误差推导,从而使得递归因子能够根据语音变化实时进行动态调整,并对递归因子进行了上限阈值约束;

23、

24、式(7)中,为递归平均的先验信噪比,表示前一帧递归平均后的先验信噪比,是前一帧估计的先验信噪比,β(l,k)为约束自适应的递归参数;

25、β(l,k)表示为:

26、

27、式(8)中,βmax表示为β(l,k)的上限阈值约束。

...

【技术保护点】

1.一种参数约束自适应的语音增强方法,其特征在于:包括如下步骤,步骤s1:获得带噪语音信号y(n);步骤S2:对带噪语音信号y(n)进行分频加窗,傅里叶变换变换,计算获得带噪语音信号的功率谱|Y(l,k)|2;步骤s3:基于带噪语音信号的功率谱|Y(l,k)|2,结合当前帧的噪声功率谱估计λd(l,k),计算获得后验信噪比;步骤S4:计算约束自适应的平滑参数,估计当前帧的先验信噪比;步骤S5:求解约束自适应的递归参数,得到递归平均的先验信噪比;步骤S6:计算小带宽和大带宽对应每一频点的语音存在条件概率和基于所有频点平均后的语音存在条件概率;步骤S7:求得语音不存在的先验概率;步骤S8:计算语音存在的条件概率;步骤S9:求解对数幅度谱增益,与频域带噪语音信号相乘,得到频域估计的纯净语音信号。

2.根据权利要求1所述的一种参数约束自适应的语音增强方法,其特征在于:还包括在所述步骤S9之后的步骤s10,步骤S10:对频域估计的纯净语音信号进行逆傅里叶变换获得语音增强后的信号;在所述步骤S1中,通过语音采集模块对带噪语音信号进行采集,获得带噪语音信号y(n)。

3.根据权利要求1所述的一种参数约束自适应的语音增强方法,其特征在于:在所述步骤S2中,对带噪语音信号y(n)进行分帧加窗处理,每一帧分为N个样本,相邻帧之间有1/2的样本点重叠,窗函数采用N点的汉明窗;将分帧加窗后的带噪语音信号进行傅里叶变换,即计算获得带噪语音的频域信号Y(l,k);

4.根据权利要求1所述的一种参数约束自适应的语音增强方法,其特征在于:在所述步骤S3中,根据式(3)计算获得后验信噪比,

5.根据权利要求1所述的一种参数约束自适应的语音增强方法,其特征在于:在所述步骤S4中,根据后验信噪比,结合前一帧估计的先验信噪比,估计当前帧信噪比;

6.根据权利要求1所述的一种参数约束自适应的语音增强方法,其特征在于:在所述步骤S5中,对先验信噪比进行递归平均计算,对固定递归因子进行自适应处理,对递归因子进行最小均方误差推导,从而使得递归因子能够根据语音变化实时进行动态调整,并对递归因子进行了上限阈值约束;

7.根据权利要求1所述的一种参数约束自适应的语音增强方法,其特征在于:在所述步骤S6中,通过在频域对递归后的先验信噪比分别使用小带宽和大带宽的汉宁窗进行平滑,计算频域平滑后的每一频点先验信噪比,小带宽为局部的带宽,大带宽为全局的带宽;

8.根据权利要求1所述的一种参数约束自适应的语音增强方法,其特征在于:在所述步骤S7中,根据步骤S6得到的小带宽对应每一频点的语音存在条件概率、大带宽对应每一频点的语音存在条件概率和语音存在条件概率,从而求得语音不存在的先验概率q(l,k);

9.根据权利要求1所述的一种参数约束自适应的语音增强方法,其特征在于:在所述步骤S8中,基于步骤S7获得的语音不存在的先验概率,根据贝叶斯准则,利用估计的后验信噪比和先验信噪比,计算获得语音存在的条件概率p(l,k);

10.根据权利要求1所述的一种参数约束自适应的语音增强方法,其特征在于:在所述步骤S9中,基于步骤S8获得的语音存在条件概率,结合语音存在时的条件增益以及语音不存在的条件增益计算总的谱增益函数,计算获得语音存在时的条件增益函数;

...

【技术特征摘要】

1.一种参数约束自适应的语音增强方法,其特征在于:包括如下步骤,步骤s1:获得带噪语音信号y(n);步骤s2:对带噪语音信号y(n)进行分频加窗,傅里叶变换变换,计算获得带噪语音信号的功率谱|y(l,k)|2;步骤s3:基于带噪语音信号的功率谱|y(l,k)|2,结合当前帧的噪声功率谱估计λd(l,k),计算获得后验信噪比;步骤s4:计算约束自适应的平滑参数,估计当前帧的先验信噪比;步骤s5:求解约束自适应的递归参数,得到递归平均的先验信噪比;步骤s6:计算小带宽和大带宽对应每一频点的语音存在条件概率和基于所有频点平均后的语音存在条件概率;步骤s7:求得语音不存在的先验概率;步骤s8:计算语音存在的条件概率;步骤s9:求解对数幅度谱增益,与频域带噪语音信号相乘,得到频域估计的纯净语音信号。

2.根据权利要求1所述的一种参数约束自适应的语音增强方法,其特征在于:还包括在所述步骤s9之后的步骤s10,步骤s10:对频域估计的纯净语音信号进行逆傅里叶变换获得语音增强后的信号;在所述步骤s1中,通过语音采集模块对带噪语音信号进行采集,获得带噪语音信号y(n)。

3.根据权利要求1所述的一种参数约束自适应的语音增强方法,其特征在于:在所述步骤s2中,对带噪语音信号y(n)进行分帧加窗处理,每一帧分为n个样本,相邻帧之间有1/2的样本点重叠,窗函数采用n点的汉明窗;将分帧加窗后的带噪语音信号进行傅里叶变换,即计算获得带噪语音的频域信号y(l,k);

4.根据权利要求1所述的一种参数约束自适应的语音增强方法,其特征在于:在所述步骤s3中,根据式(3)计算获得后验信噪比,<...

【专利技术属性】
技术研发人员:万志良张胜谢海圣
申请(专利权)人:苏州声学产业技术研究院有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1