在稳定性约束下使用独立分量分析的语音处理系统和方法技术方案

技术编号:3045989 阅读:165 留言:0更新日期:2012-04-11 18:40
一种在声音环境中分离期望语音信号的方法,包括:    接收多个输入信号,所述输入信号是响应于所述期望语音信号和其他声音信号而产生的;    在稳定性约束下使用独立分量分析(ICA)或盲源分离(BSS),处理所接收到的输入信号;以及    将所接收到的输入信号分离成一个或多个期望音频信号和一个或多个噪音信号。(*该技术在2023年保护过期,可自由使用*)

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及音频信号处理系统和方法,尤其涉及在声音环境中提高语音质量的系统和方法。
技术介绍
在日常通信的很多区域中,尤其是在那些存在大量噪音的区域中,语音信号处理是非常重要的。现实世界中的噪音来自多种来源,包括明显的单源噪音,它们在现实世界中转换为具有回声和混响(reverberation)的多种声音。除非进行分离和隔离,否则很难从背景噪音中提取出想要的声音。背景噪音包括普通环境产生的多种噪音信号、其他人的背景谈话产生的信号以及从这些信号中的每一种信号中产生的回声、反射和混响。对于用户经常在噪音环境中谈话的通信,所希望的是,将用户的语音信号从背景噪音中分离出来。诸如蜂窝电话、免提电话、头戴式耳机、助听器、无绳电话、电话会议、CB电台、对讲机、计算机电话应用、计算机和汽车语音指挥应用以及其他免持应用、内部通信联络系统、麦克风系统等语音通信手段可以利用语音信号处理,从而将想要的语音信号从背景噪音中分离出来。过去已经研究出很多种将想要的声音信号从背景噪音信号中分离出来的方法。现有技术噪音滤波器将具有预定特征的信号识别为白噪声信号,然后从输入信号中减去这些信号。虽然这些方法对于实时处理声音信号是足够简单和快速的,但却不容易适应不同的声音环境,并且会导致待分辨语音信号的明显恶化。噪音特征的预定假设可能涵盖过广,也可能涵盖不足。结果,这些方法可能会将个人语音的某些部分视为“噪音”,并因此将其从输出语音信号中除去,同时,这些方法可能会将背景噪音的某些部分,例如音乐或谈话,视为非噪音,并因此将其包含在输出语音信号中。最近开发的其他方法,例如独立分量分析(“ICA”),提供相对准确和灵活的方法,用于将背景噪音从语音信号中分离出来。例如,PCT公开WO 00/41441公开了使用特定ICA技术来处理输入音频信号从而降低输出音频信号中的噪音。ICA是一种用于分离混合源信号(分量)的技术,其中,假设这些信号是相互独立的。在其简化形式中,独立分量分析将权重的“去混合(un-mixing)”矩阵应用在混合信号上,例如,将该矩阵乘以混合信号,从而产生分离的信号。给这些权重分配初始值,然后调整它们,使这些信号的相关熵最大,从而将信息冗余度最小化。重复权重调整和熵增加过程,直到将这些信号的信息冗余度减小到最小。由于该技术不需要各信号源的有关信息,所以被称为“盲源分离”法(BSS)。盲分离问题指的是将来自多个独立源的混合信号进行分离的思想。TonyBell在美国专利No.5706402中最早讨论了ICA,这引起了更深入的研究。现在有很多不同的ICA技术或算法。可以在ICA相关图书和参考资料中找到对使用最广泛的算法和技术进行的总结,例如,Te-Won Lee编著的、波士顿的Kluwer Academic Publishers出版的《Independent Component AnalysisTheory and Applications》(1998年9月)、Hyvarinen等编著的、Wiley-Interscience出版的《IndependentComponentAnalysis》第一版(2001年5月18日)、Mark Girolami在《Perspectives in Neural Computing》中的“Self-Organizing NeuralNetworksIndependent Component Analysis and Blind SourceSeparation”(Springer Verlag,September 1999)以及Mark Girolami(编辑)在《Perspectives in Neural Computing》中的“Advances inIndependent Component Analysis”(Springer Verlag August 2000)。Simon Haykin编著的、新泽西的Prentice-Hall出版的《Adaptive FilterTheory》第三版(1996)中公开了奇异值分解(Singular valuedecomposition)算法。过去已研究出很多常用的ICA算法以优化它们的性能,包括对只在10年前存在的算法进行过重大修改的算法。例如,通常不以其专利形式使用A.J.Bell和TJ Sejnowski的《Neural Computation》71129-1159(1995)和Bell,A.J.的美国专利No.5706402中描述的工作成果。相反,为了优化性能,该算法经历了多个不同实体的数次再创造。一种这样的改变包括使用Amari,Cichocki,Yang(1996)描述的“自然梯度”。其他常用的ICA算法包括计算诸如累积量之类的高阶统计量的方法(Cardoso,1992;Comon,1994;Hyvaerinenand Oja,1997)。但是,很多公知的ICA算法不能有效地分离在中记录的信号,真实环境本来就包括回声,例如由于房屋反射而导致的回声。应当强调的是,迄今为止的方法只限于分离由源信号的线性平稳(stationary)混合所导致的信号。直接路径信号及其回声信号相加所导致的现象被称为混响,是仿真语音增强和识别系统中的主要问题。现在,ICA算法需要包括能够分离那些延时和回声信号的长滤波器,这样排除了有效的实时使用。附图说明图1示出了现有技术ICA信号分离系统100的一个实施例。在这种现有技术系统中,作为神经网络的滤波器网络用于从输入该滤波器网络的任何数量的混合信号中分辨出单个信号。如图1所示,系统100包括两个输入信道110和120,它们接收输入信号X1和X2。对于信号X1,应用ICA直接滤波器W1和ICA交叉滤波器C2;对于信号X2,应用ICA直接滤波器W2和ICA交叉滤波器C1。直接滤波器W1和W2为直接调整而通信。交叉滤波器为反馈滤波器,将它们各自的滤波信号与由直接滤波器所滤波的信号进行合并。在ICA滤波器收敛之后,所产生的输出信号U1和U2表示分离的信号。Torkkola等的美国专利No.5675659提出了用于对延时和滤波的信号源进行盲分离的方法和装置。Torkkola提出了一种将分离输出的熵最大化的ICA系统,但使用的是去混合滤波器,而不是如在Bell专利中的静态系数。然而,当存在具有时变输入能量的输入信号(如语音信号)时,Torkkola中所述的用于计算相关熵和调整交叉滤波器权重的ICA计算,在数学上是不稳定的,并且将混响效应引入到分离的输出信号中。因此,所提出的滤波方案无法实现真实语音信号的稳定和感知上可接受的盲源分离。典型的ICA实现还面临其他障碍,如需要很强的计算能力,以重复计算信号的相关熵和调整滤波器的权重。很多ICA实现还需要多轮反馈滤波器以及滤波器的直接关联。结果,难以实时地完成语音的ICA滤波和使用大量的麦克风来分离大量的混合源信号。在源源自在空间上为局部化的位置的情况下,可用数量合理的滤波器抽头和录音麦克风来计算去混合滤波器系数。然而,如果源信号分布在空间中,如源自振动的背景噪音、风声或背景谈话,那么在麦克风位置处记录的信号从多个不同的方向发射,需要非常长和复杂的滤波器结构或大量的麦克风。由于任何现本文档来自技高网...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种在声音环境中分离期望语音信号的方法,包括接收多个输入信号,所述输入信号是响应于所述期望语音信号和其他声音信号而产生的;在稳定性约束下使用独立分量分析(ICA)或盲源分离(BSS),处理所接收到的输入信号;以及将所接收到的输入信号分离成一个或多个期望音频信号和一个或多个噪音信号。2.根据权利要求1所述的方法,其中,所述期望音频信号中的一个是所述期望语音信号。3.根据权利要求1所述的方法,其中,所述ICA或BSS处理包括通过近似直接地或间接地将交互信息的数学表示最小化或最大化。4.根据权利要求1所述的方法,还包括通过协调ICA权重适应动态来稳定所述ICA处理的步骤。5.根据权利要求1所述的方法,还包括通过使用自适应比例因子调整ICA输入以约束权重适应速度来稳定所述ICA处理的步骤。6.根据权利要求1所述的方法,还包括通过在时域和频域中过滤学到的滤波器权重以避免混响效果来稳定所述ICA处理的步骤。7.根据权利要求1所述的方法,其中,以不同的程度,将辅助处理技术应用在所述输入和分离信号上。8.根据权利要求1所述的方法,还包括利用预处理技术或信息来提高分离的性能。9.根据权利要求8所述的方法,还包括改进应用在所述输入信号上的混合情景的调整。10.根据权利要求2所述的方法,还包括利用所述期望语音信号的特征信息来识别包含所述分离期望语音信号的信道。11.根据权利要求10所述的方法,其中,所述特征信息是空间、频谱或时间信息。12.根据权利要求1所述的方法,其中,后处理技术用来利用所述噪音信号中的至少一个或所述输入信号中的至少一个来提高所述期望信号的质量。13.根据权利要求12所述的方法,还包括使用所述分离的噪音信号以进一步分离和增强所述期望语音信号的步骤。14.根据权利要求13所述的方法,其中,所述使用步骤包括使用所述噪音信号来估计噪音滤波器的噪音频谱。15.根据权利要求1所述的方法,还包括将至少两个麦克风分开;以及在每个相应麦克风处产生所述输入信号之一。16.根据权利要求15所述的方法,其中,所述分开步骤包括将所述麦克风分开大约1毫米与大约1米之间的距离。17.根据权利要求15所述的方法,其中,所述分开步骤包括将所述麦克风在电话听筒、头戴式耳机或免持套件上分开。18.根据权利要求15所述的方法,其中,所述ICA处理包括连接到第一输出信道和第二输入信道的第一自适应独立分量分析(ICA)滤波器,通过涉及将非线性有界sign函数应用到所述噪音信号信道的递归学习规则,使所述第一滤波器适应;连接到第一输入信道和第二输出信道的第二自适应独立分量分析滤波器,通过涉及将非线性有界sign函数应用到所述期望语音信号信道的递归学习规则,使所述第二滤波器适应;其中,重复应用所述第一滤波器和所述第二滤波器,以产生所述期望的语音信号。19.根据权利要求18所述的方法,其中,(a)反馈由所述第一自适应独立分量分析滤波器递归滤波的所述期望语音信道,并将其添加到来自所述第二麦克风的所述输入信道,从而产生所述噪音信号信道;以及(b)反馈由所述第二自适应独立分量分析滤波器递归滤波的所述噪音信号信道,并将其添加到来自所述第一麦克风的所述输入信道,从而产生所述期望语音信号信道。20.根据权利要求19所述的方法,其中,通过根据递归方程计算出的作为所述输入信号能量函数的自适应比例因子,按比例缩小所述输入信道信号。21.根据权利要求18所述的方法,其中,通过在时间上平滑所述滤波器系数,稳定所述第一自适应ICA交叉滤波器的所述滤波器权重学习规则,并且其中,通过在时间上平滑所述滤波器系数,稳定所述第二自适应ICA交叉滤波器的所述滤波器权重学习规则。22.根据权利要求18所述的方法,其中,在频域中过滤所述第一自适应ICA交叉滤波器权重,并且其中,在频域中过滤所述第二自适应ICA交叉滤波器权重。23.根据权利要求18所述的方法,还包括连接到所述期望语音信号的后处理模块,其应用包括语音活动检测的单或多信道语音增强模块,并且其中,不将所述后处理的输出反馈给所述输入信道。24.根据权利要求18所述的方法,其中,在一个定点精度环境中实现所述ICA处理,其中,在每个采样点应用所述自适应ICA交叉滤波器,但在所述采样点的倍数处,更新滤波器系数,并且,可变尺寸的滤波器长度用于适合可用的计算能力。25.根据权利要求18所述的方法,还包括使用所述噪音信号,对所述期望语音信号进行后处理,所述后处理模块根据所述噪音信...

【专利技术属性】
技术研发人员:埃里克·维瑟李泰远
申请(专利权)人:索夫塔马克斯公司
类型:发明
国别省市:

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1