System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及音频处理的,特别涉及一种智能降回声音频处理方法及系统。
技术介绍
1、音频通信系统作为现代信息交流的重要媒介,在远程会议、智能助手和语音控制设备中得到了广泛应用。随着音频交互技术的快速发展和用户体验要求的不断提高,如何有效消除回声干扰,提升音频质量和交流清晰度,成为了研究的重点之一。现有的回声消除技术往往只采用单一的处理方法,例如简单的线性滤波或固定参数的频谱抑制,而忽略了实际声学环境的复杂性以及多路径传播对回声形成的综合影响。这种简化的方法可能会导致回声消除效果不佳,特别是在非线性失真和环境动态变化条件下,从而显著影响音频系统的整体性能和用户体验。
技术实现思路
1、本专利技术的主要目的为提供一种智能降回声音频处理方法及系统,够更精准地识别和过滤基本回声成分,从而提高了回声消除的初始效果。
2、为实现上述目的,本专利技术提供一种智能降回声音频处理方法,包括:
3、获取声场信号和扬声器参考信号,并进行信号分帧和短时傅里叶变换,得到时频谱音频数据;
4、对所述时频谱音频数据进行线性回声消除处理,并动态调整收敛速度,得到初步过滤信号;
5、对所述初步过滤信号进行非线性残差回声消除,并进行多反射路径生成,得到非线性消除信号;
6、对所述非线性消除信号执行多模态残留抑制,通过子带划分与联合判决进行频谱处理,得到回声抑制信号;
7、获取实时环境声场变化数据,对所述回声抑制信号进行声学增强,得到目标降回声音频
8、进一步地,所述获取声场信号和扬声器参考信号,进行信号分帧和短时傅里叶变换,得到时频谱音频数据,包括:
9、根据预设采样率和位深对所述声场信号和所述扬声器参考信号进行同步数字化采样,得到数字域原始信号;
10、根据预设帧长和帧移参数对所述数字域原始信号进行时间帧切分,得到分帧序列;
11、依据预设的汉宁窗函数对所述分帧序列进行频谱泄漏优化,得到加窗信号帧;
12、对所述加窗信号帧执行快速傅里叶变换,得到复数频域系数;
13、根据所述复数频域系数计算幅度谱和相位谱,并进行频带能量分析,得到频带能量分布矩阵;
14、对所述频带能量分布矩阵进行梅尔频率刻度映射,得到梅尔滤波器组系数;
15、将所述梅尔滤波器组系数与所述复数频域系数进行三维特征构建,得到所述时频谱音频数据。
16、进一步地,所述对所述时频谱音频数据进行线性回声消除处理,并动态调整收敛速度,得到初步过滤信号,包括:
17、对所述时频谱音频数据进行多子带分解,得到多个频率子带信号;
18、对所述多个频率子带信号进行回声路径分析,得到线性回声路径信号;
19、对所述声场信号与所述扬声器参考信号进行瞬时失调度量计算,得到收敛状态参数;
20、根据所述收敛状态参数进行步长参数调整,得到优化步长值;
21、对所述优化步长值进行上下阈值设定映射,得到稳定步长参数;
22、根据所述稳定步长参数对所述时频谱音频数据进行频域滤波,得到线性回声估计信号;
23、根据所述线性回声估计信号对所述时频谱音频数据进行信号优化,并进行残余相关性补偿,得到所述初步过滤信号。
24、进一步地,所述对所述初步过滤信号进行非线性残差回声消除,并进行多反射路径生成,得到非线性消除信号,包括:
25、对所述初步过滤信号进行非线性残差基底构建,得到耦合特征矩阵;
26、根据所述耦合特征矩阵构建volterra核扩展空间,并对所述初步过滤信号进行实时更新,得到优化滤波器参数;
27、基于所述优化滤波器参数进行多反射路径分析,得到对抗性反射路径集合;
28、将所述对抗性反射路径集合与所述初步过滤信号进行时频域叠加,得到多路径抑制信号;
29、对所述多路径抑制信号进行子带能量分布分析,并根据预设门限值生成动态时频掩蔽矩阵;
30、依据所述动态时频掩蔽矩阵对所述多路径抑制信号进行逐点乘积运算,得到所述非线性消除信号。
31、进一步地,所述根据所述耦合特征矩阵构建volterra核扩展空间,并对所述初步过滤信号进行实时更新,得到优化滤波器参数,包括:
32、对所述耦合特征矩阵进行奇异值分解,得到降维特征空间;
33、对所述降维特征空间进行分离分量构建,得到分离向量组;
34、根据所述分离向量组构建volterra核函数的二阶展开项,并进行展开项加权求和,得到二阶核扩展矩阵;
35、根据所述分离向量组与所述二阶核扩展矩阵进行三阶交叉项构建,并进行张量积运算,得到三阶核扩展张量;
36、将所述二阶核扩展矩阵与所述三阶核扩展张量进行内积运算构建,得到空间映射函数;
37、根据所述空间映射函数对所述初步过滤信号进行非线性投影,得到投影系数向量;
38、对所述投影系数向量进行最小二乘迭代优化,得到所述优化滤波器参数。
39、进一步地,所述对所述非线性消除信号执行多模态残留抑制,通过子带划分与联合判决进行频谱处理,得到回声抑制信号,包括:
40、对所述非线性消除信号执行子带分解,得到非均匀子带表示;
41、对所述非均匀子带表示进行多模态特征提取整合,得到多模态特征集;
42、根据所述多模态特征集进行交叉熵与互信息计算,得到子带分组结构;
43、根据所述子带分组结构对所述非均匀子带表示进行自适应分组,得到多组子带集合;
44、对所述多组子带集合分别进行判决规则评估,得到多个抑制决策值;
45、对所述多个抑制决策值进行联合判决处理,得到目标抑制策略;
46、根据所述目标抑制策略对所述多组子带集合进行差异化处理,得到模态协同抑制信号;
47、对所述模态协同抑制信号进行变分分解相位补偿,得到相位协调信号;
48、对所述相位协调信号进行非对称奇异值分解重构,得到所述回声抑制信号。
49、进一步地,所述获取实时环境声场变化数据,对所述回声抑制信号进行声学增强,得到目标降回声音频输出,包括:
50、获取环境传感器数据,依据所述声场信号对所述环境传感器数据进行空间频谱分解和子带分析,得到环境声场频谱特征;
51、对所述环境声场频谱特征与所述环境传感器数据进行声学参数变化计算,得到所述实时环境声场变化数据;
52、根据所述实时环境声场变化数据对所述回声抑制信号进行多阶段级联滤波处理,得到初步增强信号;
53、对所述初步增强信号进行相位校正和频谱平滑处理,根据所述实时环境声场变化数据调整增益因子,得到频域增强信号;
54、将所述频域增强信号与所述实时环境声场变化数据进行残余噪声选择性抑制,得到噪声抑制信号;<本文档来自技高网...
【技术保护点】
1.一种智能降回声音频处理方法,其特征在于,包括:
2.根据权利要求1所述的智能降回声音频处理方法,其特征在于,所述获取声场信号和扬声器参考信号,进行信号分帧和短时傅里叶变换,得到时频谱音频数据,包括:
3.根据权利要求1所述的智能降回声音频处理方法,其特征在于,所述对所述时频谱音频数据进行线性回声消除处理,并动态调整收敛速度,得到初步过滤信号,包括:
4.根据权利要求1所述的智能降回声音频处理方法,其特征在于,所述对所述初步过滤信号进行非线性残差回声消除,并进行多反射路径生成,得到非线性消除信号,包括:
5.根据权利要求4所述的智能降回声音频处理方法,其特征在于,所述根据所述耦合特征矩阵构建Volterra核扩展空间,并对所述初步过滤信号进行实时更新,得到优化滤波器参数,包括:
6.根据权利要求1所述的智能降回声音频处理方法,其特征在于,所述对所述非线性消除信号执行多模态残留抑制,通过子带划分与联合判决进行频谱处理,得到回声抑制信号,包括:
7.根据权利要求1所述的智能降回声音频处理方法,其特征在于,所述获
8.根据权利要求7所述的智能降回声音频处理方法,其特征在于,所述将所述频域增强信号与所述实时环境声场变化数据进行残余噪声选择性抑制,得到噪声抑制信号,包括:
9.一种智能降回声音频处理系统,其特征在于,应用于上述权利要求1-8任意一项所述的智能降回声音频处理方法,包括:
...【技术特征摘要】
1.一种智能降回声音频处理方法,其特征在于,包括:
2.根据权利要求1所述的智能降回声音频处理方法,其特征在于,所述获取声场信号和扬声器参考信号,进行信号分帧和短时傅里叶变换,得到时频谱音频数据,包括:
3.根据权利要求1所述的智能降回声音频处理方法,其特征在于,所述对所述时频谱音频数据进行线性回声消除处理,并动态调整收敛速度,得到初步过滤信号,包括:
4.根据权利要求1所述的智能降回声音频处理方法,其特征在于,所述对所述初步过滤信号进行非线性残差回声消除,并进行多反射路径生成,得到非线性消除信号,包括:
5.根据权利要求4所述的智能降回声音频处理方法,其特征在于,所述根据所述耦合特征矩阵构建volterra核扩展空间,并对所述初步...
【专利技术属性】
技术研发人员:沈生猛,张平,胡赛伟,韦启方,张军波,
申请(专利权)人:东莞市华泽电子科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。