频带分离部(5)对时间/频率变换部(2)所变换的多个功率谱进行频带分割而汇总到子带,频带代表分量生成部(6)将子带内的多个功率谱中的具有最大值的功率谱设为代表功率谱。噪音抑制量生成部(7)使用代表功率谱和噪音谱来计算子带的噪音抑制量,噪音抑制部(9)根据噪音抑制量来抑制功率谱的振幅。
【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及一种对重叠于声音信号的噪音进行抑制的噪音抑制装置。
技术介绍
噪音抑制装置主要输入在声音信号中重叠了噪音的时域的信号而作为输入信号,将该输入信号变换为作为频域的信号的功率谱之后,从输入信号的功率谱推定噪音的平均的功率谱,并从输入信号的功率谱减去所推定的噪音的功率谱而得到进行了噪音抑制的输入信号的功率谱,将其恢复为原来的时域的信号,从而进行噪音抑制处理。作为这种以往的噪音抑制装置,例如公开了专利文献I。在专利文献I公开的噪音抑制装置中,以非专利文献I公开的技术为基础,在噪音谱推定和抑制量的计算时求出输入信号的多个功率谱分量的平均值,从得到的一个平均值进行噪音谱推定和抑制量计算,并将它们共同地应用于多个功率谱分量中。 专利文献I :日本专利4172530号公报(第8 12页、图2)非专利文献I :Y. Ephraim, D. Malah, “Speech Enhancement Using a MinimumMean-Square Error Short-Time Spectral Amplitude Estimator,,,IEEE Trans. ASSP,Vol. 32,No. 6,pp.1109-1121,Dec.198
技术实现思路
以往的噪音抑制装置如以上那样构成,因此存在下面所述的课题。在以往的噪音抑制装置中,在用于噪音抑制的抑制量计算中,需要对输入信号的每个功率谱分量进行贝塞尔函数等复杂的计算,处理量非常大。因此在专利文献I公开的以往的噪音抑制装置中,通过将多个谱分量进行汇总而平均化,并将平均化的谱分量作为各谱分量的代表谱分量进行计算,从而进行处理量的削减。然而,在该方法中,即使谱分量中存在振幅大的分量(即,认为是声音分量),通过进行平均化,声音分量会被处理得过小,其结果,声音信号被抑制而使声音的湮灭感增大,具有音质变差的课题。本专利技术是为了解决上述课题而作出的,其目的在于提供一种能够以少的处理量进行高品质的噪音抑制的噪音抑制装置。本专利技术的噪音抑制装置具备代表分量生成部,该代表分量生成部将时间/频率变换部所变换的多个功率谱汇总到I组,优先选择该组内的多个功率谱中的值大的功率谱而设为代表功率谱,噪音抑制量生成部使用代表功率谱来计算噪音抑制量。根据本专利技术,使用代表功率谱来计算噪音抑制量,因此处理量较少也可以,并且,在该代表功率谱中使用组内的值大的功率谱,因此在噪音抑制量计算时输入信号的声音分量不会被评价得过小,其结果不会抑制声音信号而能够进行高品质的噪音抑制。附图说明图I是表示与本专利技术的实施方式I有关的噪音抑制装置的结构的框图。图2是表示频带分离部的功率谱的频带分割的一个例子的图。图3示意性地示出频带代表分量生成部的处理效果,图3的(a)是输入信号的功率谱的图,图3的(b)是以子带(Subband)内的功率谱的平均值为代表的情况(以往方法),图3的(c)是以子带内的功率谱的最大值为代表的情况(本专利技术)。图4是表示噪音抑制量生成部的详细结构的框图。具体实施方 式下面,为了更详细地说明本专利技术,根据附图说明用于实施本专利技术的方式。实施方式I.图I所示的噪音抑制装置具备输入端子I、时间/频率变换部2、声音相似度推定部3、噪音谱推定部4、频带分离部5、频带代表分量生成部(代表分量生成部)6、噪音抑制量生成部7、频带复用部8、噪音抑制部9、频率/时间变换部10、以及输出端子11。作为该噪音抑制装置的输入,使用如下信号,S卩,该信号是对通过麦克风(未图示)等取入的声音以及音乐等进行A/D (模拟/数字)变换之后以规定的采样频率(例如,8kHz)进行采样、并且分割为帧单位(例如,IOms)的信号。下面,根据图I说明与实施方式I有关的噪音抑制装置的动作原理。输入端子I接受如上所述的信号,并作为输入信号y (t)而输出到时间/频率变换部2。时间/频率变换部2对分割为帧单位的输入信号I (t)进行加窗处理,并对于该加窗后的信号y (n, t),使用例如256点的FFT (Fast Fourier Transform :快速傅立叶变换)将时间轴上的信号变换为频率上的信号(谱),计算出输入信号的功率谱Y (n,k)和相位谱P (n,k)。这里,n表示帧编号,k表示谱编号,t表示离散时间编号。以下,只要不需要特别地表示,就指当前帧的输入信号,在该信号表示谱的情况下省略帧编号。所得到的功率谱分别输出到声音相似度推定部3、噪音谱推定部4、频带分离部5以及噪音抑制部9。另外,所得到的相位谱输出到频率/时间变换部10。此外,作为加窗处理,例如能够使用汉宁窗、梯形窗等的公知的方案。另外,时间/频率变换部2在进行加窗处理时,根据需要还实施零填充处理。FFT是公知的方案,因此省略说明。声音相似度推定部3使用从时间/频率变换部2输入的输入信号的功率谱,计算出声音相似度评价值来作为当前帧的输入信号的形态“是否像声音”的程度,其中,所述声音相似度评价值例如是在声音的可能性高的情况下取大的值、在声音的可能性低的情况下取小的值这样的声音相似度评价值。作为声音相似度评价值的计算方法,能够分别单独或者组合使用例如通过对输入信号的功率谱进行傅立叶变换而得到的自相关系数的最大值、从功率谱的总和得到的输入信号能量、输入信号的全频带SN比(信噪比)、以及表示功率谱的变动状态的谱熵等公知的方案。在此为了简化说明,只示出单独使用了能够通过当前帧的输入信号的功率谱来计算的自相关系数的最大值的情况。自相关系数c ( T )能够如下式(I)那样求出。c ( T ) =F (I)这里,T表示延迟(延迟时间),F□表示傅立叶变换。在该傅立叶变换中,能够与在时间/频率变换部2中所使用的FFT相同地使用例如256点的FFT。上式(I)的自相关系数的计算方法是公知的方案,因此省略说明。声音相似度推定部3接下来通过将所得到的自相关系数c ( T )除以c (0)而在(Tl的范围内进行标准化,例如在存在声音的基频的可能性高的16〈 T <120的范围内搜寻自相关系数的最大值,并将所得到的最大值作为声音相似度评价值VAD而输出到噪音谱推定部4。噪音谱推定部4使用输入信号的功率谱Y (k)和声音相似度评价值VAD来推定包含在输入信号中的平均的噪音谱。具体地说,噪音谱推定部4参照作为声音相似度推定部3的输出的声音相似度评价值VAD,在当前帧的输入信号的形态为噪音的可能性高的情况下(即,是声音的可能性低的情况下),使用当前帧的输入信号的功率谱Y (n,k),来更新噪音谱推定部4所存储的前I帧的噪音谱N (n-1,k),并将更新了的噪音谱输出到噪音抑制量生成部7。噪音谱推定部4例如按照下式(2),在声音相似度评价值VAD为规定的阈值(例如0. 2)以下的情况下,将输入信号的功率谱反映到噪音谱,从而实施噪音谱的更新。在声音相似度评价值VAD超过阈值0. 2的情况下,认为当前帧的输入信号是声音的可能性高,因此不进行噪音谱的更新,而将前I帧的噪音谱原样地用作当前帧的噪音谱。< ( 2 )其中,(Xk〈K这里,n为帧编号,k为谱编号,K为FFT点数的一半的值,N (n-1, k)为更新前的噪音谱,Y (n,k)是判断为噪音的可能性高的当前帧的噪音谱,旷(n,k)是更本文档来自技高网...
【技术保护点】
【技术特征摘要】
【国外来华专利技术】
【专利技术属性】
技术研发人员:古田训,田崎裕久,
申请(专利权)人:三菱电机株式会社,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。