一种语音分离方法技术

技术编号:30270042 阅读:21 留言:0更新日期:2021-10-09 21:24
本发明专利技术公开了一种语音分离方法。现有方法对于盲源分离算法的残留的其他通道的人声残留不做处理。本发明专利技术方法首先将多个通道的语音信号通过盲源分离模块处理后,得到多路分离后的语音信号,每路分离后的语音信号包含其它通道残留的语音信号;然后通过残留选择模块处理后,得到多路残留输出信号;残留输出信号通过残留抑制模块滤波处理得到期望残留信号,盲源分离模块输出的每路分离后的语音信号与对应的期望残留信号相减作为残差信号,即为该路最终的输出语音信号;残留抑制模块的自适应滤波器利用残差信号,采用迭代算法更新滤波器系数。本方法能够分离其他通道的人声残留信号,并减少人声残留的能量,而且不损伤期望信号,提高了语音分离质量。提高了语音分离质量。

【技术实现步骤摘要】
一种语音分离方法


[0001]本专利技术属于语音处理领域,具体涉及一种分离语音的方法。

技术介绍

[0002]在噪声环境下语音的提取,以及在多声源的及环境下的语音提取是一项关键技术。在使用多麦克风的场景下,独立分量分析(ICA)是一项成熟的方法。美国专利No.5706402中最早讨论了ICA。假设各路麦克风信号是多路独立语音信号的混合,独立分量分析迭代去混(un

mixing)矩阵,去混矩阵乘以混合信号,从而产生分离的信号。独立分量分析迭代的目标是这些信号的相关熵最大,从而将信息冗余度最小化。ICA不需要各信号源的信息,也是盲源分离法(BSS)的一种。
[0003]但是ICA算法不能完全分离麦克风所记录的信号。ICA算法的每一路输出信号即包括期望目标对象的信号外也包括较小幅度的其它路的非期望语音的信号能量。由于人的听力系统是极高灵敏度的系统,非期望语音的信号能量即使被大幅度抑制,其依然可以被人清晰可听见。ICA的输出信号进行降噪等后处理后,可以进一步减少非期望语音的信号能量,但是这通常带来期望信号的损伤。
[0004]专利号为200380109681.5的专利技术专利公开了一种用于将音频信号的混合物分离成期望音频信号和噪音信号的系统和方法。该方法设置麦克风使其接收混合音频信号,并且独立分量分析ICA使用稳定性约束,处理声音混合物。ICA过程使用期望语音信号的预定特征,识别和分离目标声音信号。用学习规则来使滤波器系数适应,并稳定滤波器权重更新动态,从而协助收敛到稳定的分离ICA信号结果。使用后处理和预处理技术和信息,对分离的信号进行辅助处理,以进一步降低噪音影响。
[0005]专利号为201110117022.2的专利技术专利公开了一种卷积语音信号的频域盲分离排序算法。对于卷积混叠语音信号,首先由时序转换到频域,在每个频带上使用频域ICA算法进行盲分离,然后通过排序算法进行排序。排序方法是:首先选取基准频带进行对准,然后根据已经排序好的基准频带对剩余频带进行排序,标记可能出现排序错误的频带,利用基于分离矩阵的DOA估计进行补充性对准。
[0006]专利号为201610866508.9的专利技术专利公开了一种盲音分离方法、结构及语音控制系统和电器总成。该方法对实际工作环境,做出线性瞬间系统假设,针对线性瞬时混合系统,提出基于ICA的盲源分离技术,达到语音信号降噪的效果。盲音分离方法包括:对检测的语音信号进行降噪预处理,语音信号为同时间多个信号源语音信息的线性叠加信号;以非高斯度量,对预处理后的语音信号构建目标函数;通过迭代算法估计所述目标函数期望最大的分离矩阵。

技术实现思路

[0007]本专利技术的目的就是针对现有盲源分离法的特点,提供一种具有更高性能的语音分离方法,减少不期望信号的残留。
[0008]本专利技术方法首先将N个通道的语音信号通过盲源分离模块处理后,得到N路分离后的语音信号,分离后的语音信号包含其它通道残留的语音信号,N≥2;然后通过残留选择模块处理后,得到N路残留输出信号;残留输出信号通过残留抑制模块滤波处理得到期望残留信号,盲源分离模块输出的包含其它通道残留的语音信号与期望残留信号相减作为残差信号,第n路残差信号即为最终的第n路输出语音信号,n=1,2,

,N

,1≤N

≤N。
[0009]N个通道的语音信号输入盲源分离模块,盲源分离模块输出N路语音输出信号,N为大于1的自然数;盲源分离模块采用包括ICA在内的盲源分离算法,对N路输入语音信号进行分离,输出N路包含其它通道信号残留的语音信号。
[0010]残留选择模块内包含N

路选择处理通道,第n路选择处理通道将盲源分离模块输出的N路全部分离后的语音信号作为输入,并以第n路分离后的语音信号作为主信号,第n路选择处理通道计算每一时刻主信号是目标语音信号的概率:概率大于等于设定阈值时,该时刻输出幅度为0的语音信号;概率小于设定阈值时,输出当前时刻的主信号,作为残留选择模块的第n路残留输出信号;N

路选择处理通道输出N

路残留输出信号;计算目标语音的概率采用相位比较或信号幅度比较方法。
[0011]残留抑制模块内包含N

路抑制处理通道,第n路抑制处理通道将盲源分离模块输出的第n路语音输出信号和残留选择模块输出的第n路残留输出信号作为输入,进行残留抑制,输出语音信号作为最终第n路输出语音信号。
[0012]残留抑制模块内的第n路抑制处理通道包括一个自适应滤波器,自适应滤波器对输入的对应的残留输出信号进行滤波,得到期望残留信号;盲源分离模块第n路语音输出信号与期望残留信号相减作为残差信号,自适应滤波器利用残差信号,采用迭代算法更新滤波器系数;当残留抑制模块接收的残留输出信号为0时,自适应滤波器不更新滤波器系数。第n路残差信号即为最终的第n路输出语音信号。
[0013]现有后处理算法关注减少盲源分离算法的残留的噪声信号,对于盲源分离算法的残留的其他通道的人声残留不做处理。本方法通过自适应滤波器减少盲源分离算法的残留的其他通道的人声残留的信号,减少了人声残留被人听见的能量,而且不带来期望信号的损伤,提高了语音分离质量。
具体实施方式
[0014]以下以三路语音信号为例,说明本专利技术的语音分离方法。
[0015]三个通道的语音信号输入盲源分离模块,盲源分离模块采用ICA算法进行语音信号分离,输出三路分离后的语音信号B1、B2和B3,每路分离后的语音信号包含其它通道残留的语音信号,其中第一路语音信号B1包含B2和B3的残留,第二路语音信号B2包含B1和B3的残留,第三路语音信号B3包含B1和B2的残留。
[0016]残留选择模块内包含三路选择处理通道,每一路选择处理通道都是将语音信号B1、B2和B3作为输入,并分别以第1、2、3路分离后的语音信号B1、B2、B3作为主信号,每一路选择处理通道计算每一时刻主信号是目标语音信号的概率,概率通过幅度差计算:对于第一路选择处理通道,对语音信号B1、B2、B3做傅里叶变换,其中语音信号B1作为主信号,在每个时频点上比较语音信号B1与语音信号B2的幅度差异,以及语音信号B1与语音信号B3的幅度差,如果两个幅度差都大于等于幅度差阈值D1(设为0),则该时刻输出的语音信号的幅度
为0;如果两个幅度差不都大于等于幅度差阈值D1,则输出当前时刻的主信号。
[0017]残留抑制模块内包含三路抑制处理通道。以第一路为例,第一路抑制处理通道将盲源分离模块输出的第一路语音输出信号B1和残留选择模块的第一路残留输出信号作为输入,进行残留抑制,输出一路语音信号作为最终第一路输出语音信号。
[0018]残留抑制模块内的第一路抑制处理通道包括一个长度为K(K为自然数)的自适应滤波器,自适应滤波器对输入的对应的残留输出信号进行滤波,得到期望残留信号;盲源分离模块第一路语音输出信号B1与期望残留信号相减作为残差本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种语音分离方法,其特征在于:首先将N个通道的语音信号通过盲源分离模块处理后,得到N路分离后的语音信号,每路分离后的语音信号包含其它通道残留的语音信号,N≥2;然后通过残留选择模块处理后,得到N路残留输出信号;残留输出信号通过残留抑制模块滤波处理得到期望残留信号,盲源分离模块输出的每路分离后的语音信号与对应的期望残留信号相减作为残差信号,即为该路最终的输出语音信号;残留抑制模块的自适应滤波器利用残差信号,采用迭代算法更新滤波器系数。2.如权利要求1所述的一种语音分离方法,其特征在于:N个通道的语音信号输入盲源分离模块,盲源分离模块采用的盲源分离算法,对N路输入语音信号进行分离,输出N路包含其它通道信号残留的语音信号。3.如权利要求1所述的一种语音分离方法,其特征在于:所述的残留选择模块内包含N

路选择处理通道,第n路选择处理通道将盲源分离模块输出的N路全部分离后的语音信号作为输入,并以第n路分离后的语音信号作为主信号,第n路选择处理通道计算每一时刻主信号是目标语音信号的概率,n=1,2,

,N

,1≤N

≤N:概率大于等于设定阈值时,该时刻输出幅度为0的语音信...

【专利技术属性】
技术研发人员:梁骏沈旭东叶丰卢燕姚欢
申请(专利权)人:杭州国芯科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1