提供对包含量化噪音等劣化声音的输入声音信号加工为主观上难于感觉到劣化声音的声音信号加工方法还声音信号加工装置。$由变形强度控制部计算作为输入声音信号的译码声音的听觉加权后的频谱,根据其振幅的大小和频谱的连续性计算变形强度。由信号变形部求译码声音的频谱,根据变形强度进行振幅平滑化和相位扰乱处理,返回到信号区域,作为变形译码声音。由信号评价部分析译码声音,求背景噪音相似度,并将其作为相加运算控制值。在相加运算控制值表示像背景噪音时,由加权计算部减小对译码声音的权重,增加对变形译码声音的权重,进行相加计算后作为输出声音。(*该技术在2018年保护过期,可自由使用*)
【技术实现步骤摘要】
本专利技术涉及将通过声音或音乐等的编码译码处理而发生的量化噪音或通过噪音抑制处理等各种各样的信号加工处理而产生的失真等主观上不喜欢的成分加工为主观上难于感觉到的声音信号加工方法和声音信号加工装置。
技术介绍
提高声音或音乐等的信息源编码的压缩率时,作为编码时的失真的量化噪音将逐渐地增加,或者量化噪音发生变形而在主观上不能忍耐。举例说明,在想忠实地表现PCM(pulse Code Modulation)或ADPCM(Advanced Pulse Code Modulation)那样的信号本身的声音编码方式时,量化噪音是随机状的,主观上虽然没有太注意,但是,随着压缩率提高、编码方式复杂,在量化噪音中将表现出编码方式固有的频谱特性,从而将出现主观上很大的劣化情况。特别是在背景噪音占支配地位的信号区间,由于不符合高压缩率的声音编码方式利用的声音模式,所以,将成为非常难听的声音。另外,进行频谱减法等噪音抑制处理时,噪音的推算误差在处理后的信号上将作为失真而残留下来,由于这与处理前的信号有很大的不同的特性,所以,有时将使主观评价发生很大的劣化。作为抑制上述量化噪音或失真引起的主观评价降低的先有的方法,有特开平8-130513号、特开平8-146998号、特开平7-160296号、特开平6-326670号、特开平7-248793号和S.F.Boll著raction SSP-27,No.2,pp.113-120,April 1979(以下,称为文献1)公开的方法。特开平8-130513号是以背景噪音区间的品质改善为目的的方法,判断是否仅是背景噪音的区间,对仅是背景噪音的区间进行专用的编码处理或译码处理,在进行仅是背景噪音的区间的译码时,通过控制合成滤波器的特性,得到在听觉上感到是自然的再生声音。特开平8-146998号是以抑制白噪音通过编码译码而成为影响听觉的音色为目的的方法,是对译码声音加上白噪音或预先存储的背景噪音。特开平7-160296号是以在听觉上降低量化噪音为目的的方法,根据关于译码声音或声音译码部教授的频谱参量的指数求听觉屏蔽阈值,并求反映该阈值的滤波系数,从而将该系数使用于后置滤波器。特开平6-326670号是在为了进行通信电力控制等在不包含声音的区间停止代码传送的系统中,在没有代码传送时,在译码侧就生成并输出模拟背景噪音,目的是减轻这时发生的包含在声音区间的实际的背景噪音与无声音区间的模拟背景噪音之间的不连续感,不仅将模拟背景噪音叠加到不包含声音的区间,而且也叠加到声音区间。特开平7-248793号是以在听觉上减轻通过噪音抑制处理而发生的失真声音为目的的方法,在编码侧,先判断是噪音区间还是声音区间,在噪音区间传送噪音频谱,在声音区间传送噪音抑制处理后的频谱;在译码侧,使用在噪音区间接收的噪音频谱生成并输出合成声音,对使用在噪音区间接收的噪音频谱生成的合成声音乘以叠加倍率并与使用在声音区间接收的噪音抑制处理后的频谱生成的合成声音相加后而输出。文献1的目的是在听觉上减轻通过噪音抑制处理而发生的失真声音,对噪音抑制处理后的输出声音进行在时间上前后区间和振幅频谱上的平滑化处理,进而限于对背景噪音区间进行振幅抑制处理。在上述先有的方法中,存在以下所述的问题。在特开平8-130513号中,由于是按区间判断结果来切换编码处理和译码处理的,所以,在噪音区间与声音区间的分界处将发生特性的急剧变化。特别是在频繁地发生将噪音区间误判定为声音区间时,本来比较稳定的噪音区间将不稳定地变化,甚至有时反而发生噪音区间的劣化。传送噪音区间判断结果时,必须追加用于传送的信息,进而该信息在传送路上发生错误时,将会引起不必要的劣化。另外,用于仅抑制合成滤波器的特性不能减轻声源编码时发生的量化噪音,所以,根据噪音种类不同,存在几乎不能得到改善效果的问题。在特开平8-146998号中,由于加上了预先准备的噪音,所以,将失去已编码的现在的背景噪音的特性。为了难于听到量化声音,必须加上比劣化声音的电平高的噪音,从而再生的背景噪音将增大。在特开平7-160296号中,根据频谱参量求听觉屏蔽阈值,并根据该阈值只进行频谱后置滤波,所以,在频谱比较平坦的背景噪音等部分,几乎没有屏蔽的成分,从而不能获得完全改善效果。另外,对于未屏蔽的主要成分,不能赋予大的变化,所以,对于包含在主要成分中的失真,也不能得到任何改善效果。在特开平6-326670号中,由于生成与实际的背景噪音无关的模拟背景噪音,所以,将失去实际的背景噪音的特性。在特开平7-248793号中,由于按区间判断结果切换编码处理和译码处理,所以,在噪音区间或声音区间的判断发生错误时,将引起大的劣化。在将噪音区间的一部分误判定为声音区间时,噪音区间内的音质将发生不连续的变化,从而非常难听。相反,在将声音区间误判定为噪音区间时,声音成分将混入使用平均噪音频谱的噪音区间的合成声音和使用在声音区间重叠的噪音频谱的合成声音中,从而在总体上发生音质劣化。此外,为了听不到声音区间的劣化声音,必须叠加不小的噪音。在文献1中,为了实现平滑化,存在发生半区间(约10ms~20ms)的处理延迟问题。另外,在将噪音区间内的一部分误判定为声音区间时,噪音区间内的音质将发生不连续的变化,从而非常难听。本专利技术就是为了解决上述问题而提案的,目的旨在提供区间误判断引起的劣化少、与噪音种类及频谱形状的依赖关系小、不需要大的延迟时间、可以保留实际的背景噪音特性、不会使背景噪音电平过度大、不需要追加新的传送信息、对于声源编码等引起的劣化成分也可以获得良好的抑制效果的声音信号加工方法和声音信号加工装置。专利技术的公开本专利技术的特征在于将输入声音信号加工,生成第1加工信号,分析上述输入声音信号,计算指定的评价值,根据该评价值对上述输入声音信号和上述第1加工信号进行加权计算后,作为第2加工信号,最后,将该第2加工信号作为输出信号。另外,本专利技术的特征在于上述第1加工信号生成方法通过将上述输入声音信号进行付利叶变换,计算各频率的频谱成分,对该通过付利叶变换而计算出的各频率的频谱成分进行指定的变形,将变形后的频谱成分进行付利叶逆变换后生成上述第1加工信号。另外,本专利技术的特征在于在频谱领域进行上述加权计算。另外,本专利技术的特征在于对各频率成分独立地控制上述加权计算。另外,本专利技术的特征在于在对上述各频率的频谱成分的指定的变形中包含振幅频谱成分的平滑化处理。另外,本专利技术的特征在于在对上述各频率的频谱成分的指定的变形中包含相位频谱成分的扰乱处理。另外,本专利技术的特征在于根据输入声音信号的振幅频谱成分的大小控制上述平滑化处理的平滑化强度。另外,本专利技术的特征在于根据输入声音信号的振幅频谱成分的大小控制上述扰乱处理的扰乱强度。另外,本专利技术的特征在于根据输入声音信号的频谱成分的时间方向的连续性的大小控制上述平滑化处理的平滑化强度。另外,本专利技术的特征在于根据输入声音信号的频谱成分的时间方向的连续性的大小控制上述扰乱处理的扰乱强度。另外,本专利技术的特征在于作为上述输入声音信号,使用进行了听觉加权处理的输入声音信号。另外,本专利技术的特征在于根据上述评价值的时间变动性的大小控制上述平滑化处理的平滑化强度。另外,本专利技术的特征在于根据上述评价值的时间变动性的大小控制上述扰乱处本文档来自技高网...
【技术保护点】
一种声音信号加工方法,其特征在于:将输入声音信号加工,生成第1加工信号,分析上述输入声音信号,计算指定的评价值,根据该评价值对上述输入声音信号和上述第1加工信号进行加权计算后,作为第2加工信号,最后,将该第2加工信号作为输出信号。
【技术特征摘要】
JP 1997-12-8 336803/971.一种声音信号加工方法,其特征在于将输入声音信号加工,生成第1加工信号,分析上述输入声音信号,计算指定的评价值,根据该评价值对上述输入声音信号和上述第1加工信号进行加权计算后,作为第2加工信号,最后,将该第2加工信号作为输出信号。2.按权利要求1所述的声音信号加工方法,其特征在于上述第1加工信号生成方法通过将上述输入声音信号进行付利叶变换,计算各频率的频谱成分,对该通过付利叶变换而计算出的各频率的频谱成分进行指定的变形,将变形后的频谱成分进行付利叶逆变换后生成上述第1加工信号。3.按权利要求1所述的声音信号加工方法,其特征在于在频谱区进行上述加权计算。4.按权利要求3所述的声音信号加工方法,其特征在于对各频率成分独立地控制上述加权计算。5.按权利要求2所述的声音信号加工方法,其特征在于在对上述各频率的频谱成分的指定的变形中,包含振幅频谱成分的平滑化处理。6.按权利要求2所述的声音信号加工方法,其特征在于在对上述各频率的频谱成分的指定的变形中,包含相位频谱成分的扰乱处理。7.按权利要求5所述的声音信号加工方法,其特征在于根据输入声音信号的振幅频谱成分的大小控制上述平滑化处理的平滑化强度。8.按权利要求6所述的声音信号加工方法,其特征在于根据输入声音信号的振幅频谱成分的大小控制上述扰乱处理的扰乱强度。9.按权利要求5所述的声音信号加工方法,其特征在于根据输入声音信号的频谱成分的时间方向的连续性的大小控制上述平滑化处理的平滑化强度。10.按按权利要求6所述的声音信号加工方法,其特征在于根据输入声音信号的频谱成分的时间方向的连续性的大小控制上述扰乱处理的扰乱强度。11.按权利要求10所述的声音信号加工方法,其特征在于作为上述输入声音信号,使用听觉加权处理后的输入声音信号。12.按权利要求5所述的声音信号加工方法,其特征在于根据上述评价值的时间变动性的大小控制上述平滑化处理的平滑化强度...
【专利技术属性】
技术研发人员:田崎裕久,
申请(专利权)人:三菱电机株式会社,
类型:发明
国别省市:JP[日本]
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。