一种多通道远场语音增强方法技术

技术编号：23988058 阅读：25 留言：0更新日期：2020-04-29 14:33

本发明专利技术公开了一种多通道远场语音增强方法，包括：对多通道远场语音时域信号处理得到多通道远场语音频域信号，再通过加权预测误差算法处理得到抑制晚期混响后的多通道远场语音频域信号并估计出干扰；使用干扰协方差矩阵和抑制晚期混响后的多通道远场语音频域信号，通过协方差白化的方法计算相对早期传输函数作为导向矢量；利用干扰协方差矩阵和导向矢量对抑制晚期混响后的多通道远场语音频域信号依次进行最小方差无失真响应波束形成处理和单通道维纳滤波处理得到单通道语音频域信号，在其为单通道目标语音频域信号时进行逆傅里叶变换，得到目标语音时域信号。本方法可以同时有效抑制远场语音中的噪声和混响的干扰并保持目标声源的完整。

A multi-channel far-field speech enhancement method

全部详细技术资料下载

【技术实现步骤摘要】
一种多通道远场语音增强方法
本专利技术涉及语音增强
，尤其涉及一种多通道远场语音增强方法。
技术介绍
目前，语音增强技术主要是去除语音信号中噪声以及混响的干扰，提高语音识别系统的性能。在以多通道语音为输入的增强技术中，通过利用时频域中语音和噪声的不同特性可以抑制噪声，利用通道间目标语音的空间信息可以抑制混响。在远场环境噪声和混响同时存在的情况下，大多数传统的以多通道为输入的语音增强方法无法提供较好的噪声和混响抑制效果，对于两者同时存在的环境情况没有特殊处理，并且距离较远的远场环境处理效果欠佳。
技术实现思路
本专利技术的目的是为了克服上述技术问题，提供一种多通道远场语音增强方法，该多通道远场语音增强方法能够同时有效地抑制噪声和混响，并且能够完整地保留目标信号，从而提高了目标信号的清晰度、可懂度和舒适度。为达到上述目的，本专利技术提供一种多通道远场语音增强方法，所述多通道远场语音增强方法包括：对多通道远场语音时域信号分别进行处理得到多通道远场语音频域信号，其中，所述多通道远场语音时域信号为受到噪声和混响干扰的语音信号且每个通道中均包含待增强的目标语音时域信号；将所述多通道远场语音频域信号通过加权预测误差算法进行处理，得到抑制晚期混响后的多通道远场语音频域信号，并利用加权预测误差解混响算法估计出干扰，计算干扰协方差矩阵；使用所述干扰协方差矩阵和所述抑制晚期混响后的多通道远场语音频域信号，通过协方差白化的方法计算相对早期传输函数作为导向矢量；利用所述干扰协方差矩阵和所述导向矢量对所述抑制晚...

【技术保护点】
1.一种多通道远场语音增强方法，其特征在于，所述多通道远场语音增强方法包括：/n对多通道远场语音时域信号分别进行处理得到多通道远场语音频域信号，其中，所述多通道远场语音时域信号为受到噪声和混响干扰的语音信号且每个通道中均包含待增强的目标语音时域信号；/n将所述多通道远场语音频域信号通过加权预测误差算法进行处理，得到抑制晚期混响后的多通道远场语音频域信号，并利用加权预测误差解混响算法估计出干扰，计算干扰协方差矩阵；/n使用所述干扰协方差矩阵和所述抑制晚期混响后的多通道远场语音频域信号，通过协方差白化的方法计算相对早期传输函数作为导向矢量；/n利用所述干扰协方差矩阵和所述导向矢量对所述抑制晚期混响后的多通道远场语音频域信号依次进行最小方差无失真响应波束形成处理和单通道维纳滤波处理，得到单通道语音频域信号；/n在所述单通道语音频域信号为单通道目标语音频域信号时，对所述单通道目标语音频域信号进行逆傅里叶变换，得到目标语音时域信号。/n

【技术特征摘要】
1.一种多通道远场语音增强方法，其特征在于，所述多通道远场语音增强方法包括：
对多通道远场语音时域信号分别进行处理得到多通道远场语音频域信号，其中，所述多通道远场语音时域信号为受到噪声和混响干扰的语音信号且每个通道中均包含待增强的目标语音时域信号；
将所述多通道远场语音频域信号通过加权预测误差算法进行处理，得到抑制晚期混响后的多通道远场语音频域信号，并利用加权预测误差解混响算法估计出干扰，计算干扰协方差矩阵；
使用所述干扰协方差矩阵和所述抑制晚期混响后的多通道远场语音频域信号，通过协方差白化的方法计算相对早期传输函数作为导向矢量；
利用所述干扰协方差矩阵和所述导向矢量对所述抑制晚期混响后的多通道远场语音频域信号依次进行最小方差无失真响应波束形成处理和单通道维纳滤波处理，得到单通道语音频域信号；
在所述单通道语音频域信号为单通道目标语音频域信号时，对所述单通道目标语音频域信号进行逆傅里叶变换，得到目标语音时域信号。

2.根据权利要求1所述的多通道远场语音增强方法，其特征在于，所述单通道语音频域信号为受到噪声和/或混响干扰的语音信号，所述多通道远场语音增强方法还包括：
将所述单通道语音频域信号的功率更新到所述加权预测误差算法，将所述多通道远场语音频域信号通过更新的所述加权预测误差算法进行处理，得到更新的所述抑制晚期混响后的多通道远场语音频域信号；
利用所述干扰协方差矩阵和所述导向矢量对更新的所述抑制晚期混响后的多通道远场语音频域信号依次进行所述最小方差无失真响应波束形成处理和所述单通道维纳滤波处理，得到所述单通道目标语音频域信号。

3.根据权利要求1所述的多通道远场语音增强方法，其特征在于，所述多通道远场语音频域信号为：
X(k，f)＝ge(f)S(k，f)+R(k，f)+V(k，f)，
其中，k为语音帧，f为频点，ge(f)为相对早期传输函数，S(k，f)为声源频域信号，即目标语音频域信号；R(k，f)...

【专利技术属性】
技术研发人员：李军锋，宋思远，颜永红，
申请(专利权)人：中国科学院声学研究所，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人