个人通信中降噪和回波消除时的噪声估计制造技术

技术编号:9766676 阅读:139 留言:0更新日期:2014-03-15 14:33
本发明专利技术涉及个人通信中降噪和回波消除时的噪声估计,其中音频信号处理方法包括步骤:在一个或多个子频带中,接收M个通信信号;用一组波束形成器系数处理通信信号以获得波束形成器输出信号;处理通信信号以获得N个目标消除的信号;处理通信信号以获得目标不存在信号;将目标消除的信号的N阶协方差矩阵估计为平均值;估计N阶的、目标消除的协方差矩阵的逆矩阵;依据目标消除的协方差矩阵的逆矩阵和N个目标消除的信号确定实值换算因子;将波束形成器输出信号中的噪声功率的初始估计量确定为平均值;使初始噪声估计量乘以换算因子以获得波束形成器输出信号中噪声功率的精确估计量。本发明专利技术具有声音质量得以提高及不想要的信号分量得以减少的优点。

【技术实现步骤摘要】
个人通信中降噪和回波消除时的噪声估计
本申请涉及音频处理,尤其涉及语音增强,特别是提高嘈杂环境中目标语音信号的信号质量。本专利技术涉及嵌入在从存在于包括一个或多个目标声源和多个不受欢迎的噪声源的声环境中的多个传声器获得的多通道音频信号中的噪声的传声器间谱相关矩阵的估计。本专利技术例如可用于获得谱信噪比估计量并形成将应用于波束形成器输出信号以获得增强信号的谱权重,其中保留目标语音内容及噪声分量得以大大减小。谱权重例如可用于进一步减小已从回波消除系统的初始级逸出的残留回波信号。本专利技术例如可用在下述应用中:耳机、助听器、有源耳朵保护系统、移动电话、远程会议系统、卡拉OK系统、广播系统、移动通信装置、免提通信装置、话音控制系统、汽车音频系统、导航系统、音频捕获、摄像机、和视频电话。
技术介绍
背景噪声、回响和回波信号为个人通信系统中及包括有声命令的自动识别的系统中所出现问题的典型原因。背景噪声和房间回响可严重降低声音质量及所需要语音信号的可懂度。在声音识别系统中,背景噪声和回响增大出错率。另外,在一些通信系统中,扬声器系统将已知的音频信号传到环境,其由传声器阵列拾取。例如,对于声控电视机,当捕获声音命令时,可能希望无视传到扬声器的电视伴音信号的回波。类似地,在电话/有声通信设置中,远端语音信号传给一个或多个本地扬声器,这产生由本地传声器拾取为不想要的回波的音频信号。该回波应在近端语音信号传给远端之前消除。类似地,声控系统受益于回波分量的消除。解决背景噪声的常规方法包括波束形成和单通道降噪。波束形成使能通过采用空间滤波器即信号增益取决于声音相对于传声器阵列的空间方向的滤波器来区分声源。多传声器增强方法可看作波束形成器算法和单通道降噪算法的结合;因此,除由独立的单通道系统提供的时频滤波之外,多传声器方法还可执行空间滤波。常规的回波消除方法基于自适应估计从每一扬声器信号到每一传声器信号的传递函数并从传声器信号减去回波估计量。然而,回波信号的某些分量不能通过这样的方法得以足够衰减,尤其在具有长回响时间的房间中更是如此。与延迟回响相关联的回波信号部分通常与环境噪声类似,因为两个声场实际上通常均为弥散场。这是多传声器谱降噪系统也可用于消除回波信号的残留回响部分的主要原因。用于语音增强的多通道维纳滤波器(MWF)(例如参见参考文献[3]Chapter3.2)在目标信号的均方误差意义上为最佳的线性估计器,假定传声器信号由具有附加无关联噪声的目标信号组成。MWF可分解为最小方差无失真响应(MVDR)波束形成器和单通道维纳后滤波器的结合。在这两个系统理论上一样的同时,分解后的系统在实践中对MWF滤波器的强力实施是有利的。具体地,可利用空间信号统计量(需要进行估计以实施MVDR波束形成器)在不同于信号统计量(需要进行估计以实施后滤波器)的速率下(通常更慢)随时间变化。大多数后滤波器依赖于进入后滤波器的噪声和不想要的回响信号的功率谱密度(PSD)的估计。将多传声器降噪系统考虑为波束形成器和后滤波器的结合,显然可使用众所周知的单通道噪声追踪算法(例如参见参考文献[4]SeCtionII,Eq.(1)-(3))从波束形成器的输出信号直接估计噪声PSD。然而,总的来说,当估计进入后滤波器的噪声的PSD时,通过利用具有多个可用传声器信号的情形可获得更好的性能。使用多个传声器信号用于估计进入后滤波器的噪声的PSD的想法并非新想法。在参考文献[10](图1)中,Zelinski使用多个传声器信号估计在传声器处观察到的噪声PSD,假定噪声序列在传声器之间无关联,即传声器间噪声协方差矩阵为对角矩阵。McCowan (参考文献[I I],图1)和Lefkimmiatis (参考文献[12],图1)用噪声场的弥散(同质、迷向)模型代替该通常不切实际的模型。最近,Wolff (参考文献[9],图1)在广义旁瓣消除器(GSC)结构中考虑波束形成器,并使用阻塞矩阵的输出,与话音活动检测(VAD)算法结合,以计算进入后滤波器的噪声的PSD的估计量。
技术实现思路
在此提出一种估计时变和随频率而变的传声器间噪声协方差矩阵的方法和相应装置,与先前公开的方法和装置不同,其在最大似然意义上最佳。在所描述的实施例中,噪声协方差矩阵可用于降噪、语音增强及残留回波信号的衰减,或用于提高话音控制系统中的识别率。本专利技术的优点在于噪声得以准确估计,这可导致增强后的音频信号中声音质量的提高,或可提高自动话音控制系统的识别率。在实施例中,谱关联矩阵可用于估计波束形成器输出处的噪声级,其对多通道音频信号如从两个以上传声器的阵列获得的信号起作用。该噪声估计量可用于估计波束形成器输出处的信噪比,其可用于计算将应用于波束形成器输出的后滤波的随频率而变的增益权重。在描述的另一实施例中,对多通道`音频信号起作用的波束形成器输出处的、估计的噪声级连同波束形成器输出信号一起用于自动话音命令识别。用于噪声功率估计的最大似然方法的推导在下面部分,导出噪声功率推算式。使对第m个传声器起作用的嘈杂信号由下式给出:ym(n) = xm (n) +vm (η), m = 1...M其中,yffl(n)、Xffl(η)和vm(n)分别表示嘈杂目标信号、纯净目标信号和噪声信号的信号样本,M为可用传声器信号的数量,及其中为方便起见,已忽略模数转换并简单地使用离散时间指数η。为数学上方便,假定观察数据为零平均值高斯随机过程的实现,及噪声过程统计上独立于目标过程。每一传声器信号可通过离散傅里叶变换(DFT)滤波器组,导致复DFT系数本文档来自技高网
...

【技术保护点】
一种音频信号处理方法,包括步骤:在一个或多个子频带中,接收时间帧中包括目标信号(Xm(l,k))和噪声信号(Vm(l,k))的M个通信信号(Ym(l,k)),其中M≥2;在每一子频带中,用一组波束形成器系数(w(l,k)204,304,404)处理M个子频带通信信号(Ym(l,k))以获得波束形成器输出信号(Yw(l,k));在每一子频带中,在N个线性独立的目标消除波束形成器(B(l,k),203,303,403)中处理M个子频带通信信号(Ym(l,k)),其中1≤N<M,以获得N个目标消除的信号(Z(l,k)),其中目标信号(Xm(l,k))相对于噪声信号(Vm(l,k))被抑制;用目标不存在检测器(309)处理通信信号(Ym(l,k))以获得目标不存在信号(T(l,k));在每一子频带中,将目标消除的信号(Z(l,k))的N阶协方差矩阵(ΦZZ(l,k))估计为平均值,其中各个时间帧按目标不存在信号的函数(T(l,k))进行加权;在每一子频带中,估计N阶的、目标消除的协方差矩阵的逆矩阵(310,410);在每一子频带中,依据目标消除的协方差矩阵的逆矩阵和N个目标消除的信号(Z(l,k))确定实值换算因子在每一子频带中,将波束形成器输出信号(Yw(l,k))中的噪声功率的初始估计量(φVV0(l,k)311,411)确定为平均值,其中各个时间帧使用所述目标不存在信号的函数(T(l,k))进行加权;在每一子频带中,使初始噪声估计量(φVV0(l,k))乘以换算因子以获得波束形成器输出信号(Yw(l,k))中噪声功率的精确估计量(φVV(l,k),417)。FDA0000371535140000011.jpg,FDA0000371535140000012.jpg,FDA0000371535140000013.jpg,FDA0000371535140000014.jpg...

【技术特征摘要】
2012.08.24 EP 12181723.31.一种音频信号处理方法,包括步骤: 在一个或多个子频带中,接收时间帧中包括目标信号(Xm(l,k))和噪声信号(Vm(l,k))的M个通信信号(Ym(l,k)),其中M≥2 ; 在每一子频带中,用一组波束形成器系数(w(l,k) 204,304,404)处理M个子频带通信信号(Ym(l,k))以获得波束形成器输出信号(Yw(l,k)); 在每一子频带中,在N个线性独立的目标消除波束形成器(B(l,k),203,303,403)中处理M个子频带通信信号(Ym (I,k)),其中I≤N < M,以获得N个目标消除的信号(Z (I,k)),其中目标信号(Xm(l,k))相对于噪声信号(Vm(l,k))被抑制; 用目标不存在检测器(309)处理通信信号(Ym(l,k))以获得目标不存在信号(T(l,k)); 在每一子频带中,将目标消除的信号(Z(l,k))的N阶协方差矩阵(ΦΖΖ(1Λ))估计为平均值,其中各个时间帧按目标不存在信号的函数(T(l,k))进行加权; 在每一子频带中,估计N阶的、目标消除的协方差矩阵的逆矩阵((1)益(;丨?) (310,410); 在每一子频带中,依据目标消除的协方差矩阵的逆矩阵/0)和N个目标消除的信号(Z(l,k))确定实值换算因子(C^a/O,312,412); 在每一子频带中,将波束形成器输出信号(Yw(l,k))中的噪声功率的初始估计量(Φ.(1,k)311,411)确定为平均值,其中各个时间帧使用所述目标不存在信号的函数(T(l,k))进行加权; 在每一子频带中,使初始噪声估计量(Φ.(1,k))乘以换算因子A:))以获得波束形成器输出信号(Yw(l,k))中噪声功率的精确估计量(Φνν(1,10,417)。2.根据权利要求1的方法,其中: 确定波束形成器输出信号(Yw(l,k))中噪声功率的初始估计量(Φνν(ι(1Λ)311,411)包括依据所述的一组波束形成器系数(w(I,k) 204,304,404)确定波束形成器输出信号(Yw(l,k))中噪声功率的初始估计量(Φνν(ι(1,1θ311,411)。3.根据权利要求1或2的方法,其中: 在一个或多个子频带中,波束形成器输出信号(Yw(l,k),204,304,404)使用从目标消除的协方差矩阵的逆矩阵(Φ益(7,/0.),和N个目标消除的信号(Z(l,k))推导的至少一自适应滤波器产生。4.根据权利要求1-3任一所述的方法,其中: 在一个或多个子频带中,N个线性独立的目标消除波束形成器(B(l,k),203,303,403)从M个通信信号的分析自适应计算(415)。5.根据权利要求4的方法,其中: 在一个或多个子频带中,N个线性独立的目标消除波束形成器(B(l,k),203,303,403)从一视向量(d(l,k),414)自适应确定,所述视向量从在目标存在的最近帧期间估计的M阶混合协方差矩阵(413)和 在目标不存在的最近帧期间估计的通信信号的M阶噪声协方差矩阵(409)的分析推导。6.根据权利要求5的方法,其中: 在一个或多个子频带中,所述分析包括所述混合协方差矩阵和所述噪声协方差矩阵之间的差的特征向量分析,及将与最大特征值相关联的特征向量选择为视向量(d(l,k))。7.根据权利要求5的方法,其中: 在一个或多个子频带中,所述分析包括所述噪声协方差矩阵乘以所述混合协方差矩阵的逆矩阵的广义特征向量分析,并使用与最大特征值相关联的特征向量获得视向量(d(l,k))。8.根据权利要求1-7任一所述的...

【专利技术属性】
技术研发人员:U·克耶姆斯J·詹森
申请(专利权)人:奥迪康有限公司瑞图恩DSP公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1