使用语音信号的谐波估计噪声的方法和设备技术

技术编号:3044431 阅读:234 留言:0更新日期:2012-04-11 18:40
公开了一种使用语音信号的谐波估计噪声的方法和设备。所述方法包括在输入声音信号的帧中估计谐波分量;使用估计的谐波分量,计算关于输入的声音信号的帧的语音存在概率(VPP);根据计算的VPP确定估计噪声频谱所需的等式的权值;使用确定的权值和估计噪声频谱所需的等式,估计噪声频谱并更新所述噪声频谱。

【技术实现步骤摘要】

本专利技术涉及声音信号处理,更具体地说,涉及一种用于估计包括在声音 信号中的噪声的方法和设备。
技术介绍
在用于语音通信或需要语音增强的语音识别的声音信号处理中,估计并 去除包括在语音信号中的噪声很重要。因此,已经提出并使用用于估计噪声 的方案。例如,为了估计噪声, 一个方案首先在一定的时间间隔(即,时间 段)估计噪声,在所述一定的时间间隔,在输入语音之前语音不存在,并且 一旦输入语音,用于减少估计的噪声的信号被施加。在另一方案中,通过使用语音激活检测(VAD)将非语音和语音区进行区分,并随后在非语音时间 段估计噪声。还存在一种基于最小统计量的噪声估计方案,其中,基于在语 音时间段中的语音频i普能量大于噪声的频谱能量以及语音字的发音时间段与 0.7秒至1.3秒相应的特性,在给定时间段中表示最小能量的值被估计为是噪 声。在另一方案中通过关于语音是否存在的概率进行近似确定,以在语音存 在概率(VPP)较大的时间段期间估计噪声,相反,在VPP较小的时间段期 间不估计噪声。然而,上述传统噪声估计方案的缺陷在于它们不能够检测非平稳噪声的 改变,以反映噪声估计的改变。例如,不能有效地估计具有较短持续时间、 但是还具有与语音能量类似的大能量的错误噪声(诸如,在实际生活中突然 产生的周围的音频声音或包括关门时产生的声音、脚步声等的噪声)。因此, 出现的问题在于错误噪声估计导致残留噪声的问题。残留噪声导致在语音通 信中用户收听不方便或语音识别装置的故障,这使语音识别产品的性能下降。传统噪声估计方案具有上述问题的原因在于当参照在先前处理的语音 时间段中的结果处理随后语音信号的方案时,在相关时间段可存在与先前噪 声不同的噪声,当通过近似预测噪声存在的时间段仅在相关时间段期间估计 噪声的方案时,准确地估计噪声存在的时间段存在限制。而且,由于通过使用各个信号的能量大小之间的差与信噪比(SNR)对语音和非语音进行区分 的方案,即,当如果诸如各个信号的能量大小之间的差与信噪比(SNR)的 值较大,则识别时间段为语音时间段的方案时,以及当如果该值较小,则将 时间段看作非语音时间段的方案时,如果具有与语音的能量的大小类似的大 小的能量的周围噪声被输入,则噪声估计没有被实现,因此,噪声频谱没有 被更新。
技术实现思路
因此,本专利技术致力于解决上述发生在传统方法中的问题,并且本专利技术提 供一种在语音信号处理中估计非平稳噪声并去除估计的非平稳噪声的方法和 设备。而且,本专利技术提供一种用于估计具有与语音能量的大小类似的大小的能量的噪声并去除估计的噪声的方法和设备。此外,本专利技术提供一种有效地估计噪声并去除估计的噪声的方法和设备。根据本专利技术的一方面,提供一种通过使用语音信号的谐波来估计噪声的方法,包括在输入声音信号的帧中估计谐波分量;使用估计的谐波分量,计算关于输入的声音信号的帧的语音存在概率(VPP);根据计算的VPP,确定如下定义的估计噪声频语所需的等式的权值;以及使用确定的权值和估计噪声频语所需的等式,估计噪声频谱,并更新噪声频i普, N(k, t) = (x(k, t)N(k, t-1) + (1 - a(k, t))Y(k, t),其中,N(k,t)表示噪声频谱,Y(k,t)表示输入信号的频谱,索引k表示频 率索引,索引t表示帧索引,以及a(k,t)表示权值。根据本专利技术的另 一方面,提供一种通过使用语音信号的谐波估计噪声的设备,包括谐波估计单元,估计在输入声音信号的帧中的谐波分量,并输出估计的谐波分量;语音估计单元,使用估计的谐波分量,计算关于输入声音信号的帧的语音存在概率(VPP),并输出计算的VPP;权值确定单元,根据计算的VPP,确定如下定义的估计噪声谱所需的等式的权值,并输出确定的权值;以及噪声频谱更新单元,使用确定的权值和估计噪声频谱所需的等式,估计噪声频镨,并更新噪声频语,N(k, t) = a(k, t)N(k, t—1) + (1 — a(k, t))Y(k, t),其中,N(k,t)表示噪声频谱,Y(k,t)表示输入信号的频谱,索引k表示频率索引,索引t表示帧索引,以及CC(k,t)表示权值。附图说明通过下面结合附图的详细描述,本专利技术的上述和其他示例性特点、方面和优点将会变得更加清楚,其中图1是示出根据本专利技术的实施例的用于估计噪声的设备的配置的框图;图2是示出根据本专利技术的实施例的估计噪声的处理的流程图;图3A、图3B和图3C分别示出根据本专利技术的实施例的功率频语、线性预测系数(LPC )频谱和谐波频语图的示例;图4是根据本专利技术实施例的估计噪声频谱所需的等式的权值的坐标图;以及图5A至图5D分别示出从以现有方案和根据本专利技术实施例实现的噪声频 谱估计获得的频率示图的示例。具体实施方式以下,参照附图来详细说明本专利技术的示例性实施例。下一描述包括诸如 特定配置组件的细节,提出这些细节以支持对本专利技术的更加全面的理解,并 且本领域普通技术人员将清楚,可对本专利技术的范围中的细节做出形式上的指 定改变和修改。此外,在本专利技术的以下描述中,省略合并与此的已知的功能 和结构的详细描述,以避免使得本专利技术的主体不清楚。人类为了发出元音,必须产生声带的振动,并且振动在频域以谐波的形 式出现。而且,谐波的分量具有以下特性即使在噪声环境下,谐波的分量 的大部分属性都保留。在本专利技术中,通过使用元音和谐波的特性,根据多少 谐波分量存在于声音信号,来估计合适的噪声频语,并且更新噪声频语的值。此时,使用等式(1 )估计噪声频谱。<formula>formula see original document page 6</formula>在此,N(k, t)表示噪声频语,Y(k,t)表示输入信号的频谱,k表示频率索 引,t表示帧索引。上述等式(1)与在最小值控制的递归平均(MCRA)噪 声估计方案中用于估计噪声频语的等式相应。在本专利技术中,基于通过使用在 输入的声音信号中检测的谐波来估计的语音存在概率(VPP),调整上述等式 (1 )的权值a(k, t),接着估计噪声频镨。下面参照图1描述以这种方式应用本专利技术的用于估计噪声的设备。如图 1所示,用于估计噪声的设备(即,噪声估计设备)包括声音信号输入单元10、谐波估计单元20、语音估计单元30、权值确定单元40和噪声频语更新 单元50。通过使用具有预定长度的汉明窗,声音信号输入单元10将输入声音信号 划分为帧。例如,通过使用长度为32毫秒的汉明窗,声音信号可被划分为帧, 此时,汉明窗的移动时间段可被设置为16毫秒。由声音信号输入单元10划 分为帧的声音信号输出到谐波估计单元20。谐波估计单元20从以帧为单位的输入的声音信号提取谐波分量,并将提 取的谐波分量输出到语音估计单元30。如上指示,为了发出元音,产生声带 的振动,并且该振动在频域内以谐波的形式出现。为了找到谐波,必须去除 与确定人类发出的元音的类型的声道形状有关的分量。对元音来说,相应于 声带的振动信号和声道的形状,元音被表示为脉冲响应的巻积,并且在频域 以乘法的形式容易地表示脉沖响应的巻积。从而谐波估计单元20可基于元音 的特性估计在输入声音信号中的谐波,根据本专利技术的实施例,谐波估计单元 20包括LPC频谱单元21 、功率频i普单元22本文档来自技高网
...

【技术保护点】
一种通过使用语音信号的谐波估计噪声的方法,所述方法包括步骤:    (a)在输入声音信号的帧中估计谐波分量;    (b)使用估计的谐波分量,计算关于输入的声音信号的帧的VPP;    (c)根据计算的VPP确定估计噪声频谱所需的等式的权值:    N(k,t)=α(k,t)N(k,t-1)+(1-α(k,t))Y(k,t),    其中,N(k,t)表示噪声频谱,Y(k,t)表示输入声音信号的频谱,k表示频率索引,t表示帧索引,以及α(k,t)表示权值;以及    d通过使用确定的权值和等式来估计噪声频谱,并更新所述噪声频谱。

【技术特征摘要】
KR 2007-3-22 10-2007-00283101、一种通过使用语音信号的谐波估计噪声的方法,所述方法包括步骤(a)在输入声音信号的帧中估计谐波分量;(b)使用估计的谐波分量,计算关于输入的声音信号的帧的VPP;(c)根据计算的VPP确定估计噪声频谱所需的等式的权值N(k,t)=α(k,t)N(k,t-1)+(1-α(k,t))Y(k,t),其中,N(k,t)表示噪声频谱,Y(k,t)表示输入声音信号的频谱,k表示频率索引,t表示帧索引,以及α(k,t)表示权值;以及d通过使用确定的权值和等式来估计噪声频谱,并更新所述噪声频谱。2、 如权利要求l所述的方法,其中,在步骤(c)中,如果VPP大于特 定表示值,则权值被确定为具有近似为'T,的值,如果VPP小于特定表示 值,则权值被确定为具有近似为0的值。3、 如权利要求2所述的方法,其中,在步骤(b)中,谐波分量用于计 算LVPP和GVPP,从而计算VPP 。4、 如权利要求3所述的方法,其中,权值由下式确定()_ 1 _ 1 + exp(— 20 x (丄KP尸(A:, 0 + 0.5) x (0.3 — GKPP(A, O))。5、 ...

【专利技术属性】
技术研发人员:金炫秀高汉锡安盛柱裴正勋尹现珍
申请(专利权)人:三星电子株式会社高丽大学校产学协力团
类型:发明
国别省市:KR[韩国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利