语音信号处理方法及装置制造方法及图纸

技术编号:9619095 阅读:134 留言:0更新日期:2014-01-30 07:11
本发明专利技术公开了一种语音信号处理方法及装置,其中,该方法包括:获取语音信号帧的能量分布特性;根据该能量分布特性判断该语音信号帧是否为噪声帧。通过本发明专利技术,解决了相关技术中对变化较快的非平稳噪声的判别效果较差的问题,提高了对语音信号中噪声帧的判断准确性。

Speech signal processing method and apparatus

The invention discloses a device and a method for processing of speech signal, wherein, the method comprises: acquiring energy distribution characteristics of speech signal frame; according to the energy distribution characteristics of the judgment of the speech signal frame is a noise frame. The invention solves the problem that the discrimination effect of the non-stationary noise is faster in the relevant technology, and the judgment accuracy of the noise frame in the speech signal is improved.

【技术实现步骤摘要】
语音信号处理方法及装置
本专利技术涉及通信领域,具体而言,涉及一种语音信号处理方法及装置。
技术介绍
目前在生活中,人们对移动终端的语音通话功能及通话质量的要求越来越高,然而现实生活中的通话过程往往会受到背景噪声的干扰,尤其是一些公共场合如车站、广场、街道等。这些非平稳的强噪声对通话质量和语音清晰度有很大的影响,而传统的语音增强算法通常只针对平稳的或者变化很慢的噪声具有较好的效果,但是对变化较快的非平稳噪声的抑制效果很不理想,而且还会在抑制噪声的同时损失语音的清晰度。为了加强对背景噪声的跟踪和估计,相关技术中存在如下几种方法:第一种,Donoho提出了典型阈值法,Donoho通过分析高斯白噪声在小波域的特征,根据经验和统计特性在小波域人为的设定一个阈值来区分噪声和实际信号。但是实际中噪声和语音并没有一个明显的阈值界限。第二种,基于语音活动检测的方法,研究人员发现一段语音的最开始阶段是完全由背景噪声组成的,可以用这一段信号作为噪声的估计样本,并且通过语音活动检测,提取出语音间隔处的信号进行噪声样本更新。但是这同样是一种粗略的提取,只能跟踪变化缓慢的噪声信号。这些方法都会造成语音帧和噪声帧的误判,从而产生一定的语音失真。此外,为了提高带噪语音的清晰度,现有的技术如下:第一种,基于清浊音判定的语音增强算法,在去噪前首先进行清浊音判定,清音集中了大部分语音的高频信号,是影响语音清晰度的主要成分,所以设置一个较低的阈值,对浊音设置一个稍大的阈值去除大部分噪声成分。但是在背景噪声较大的时候,清音往往被噪声淹没。第二种,基于人耳掩蔽效应的去噪算法,通过计算估计掩蔽模型的阈值,对语音进行阈值去噪。但是在计算掩蔽阈值时就存在偏差,并且计算量会增加很多,增加了手机的运算负担。这些算法虽然都起到了一定的效果,但是都很难针对每一帧语音内的噪声进行精确处理。针对相关技术中对变化较快的非平稳噪声的判别效果较差的问题,目前尚未提出有效的解决方案。
技术实现思路
针对相关技术中对变化较快的非平稳噪声的判别效果较差的问题,目前尚未提出有效的解决方案,本专利技术提供了一种语音信号处理方法及装置,以至少解决上述问题。根据本专利技术的一个方面,提供了一种语音信号处理方法,包括:获取语音信号帧的能量分布特性;根据所述能量分布特性判断所述语音信号帧是否为噪声帧。优选地,根据所述能量分布特性判断所述语音信号帧是否为噪声帧包括:判断所述语音信号帧的能量分布是否集中;在判断结果为否的情况下,确定所述语音信号帧为噪声帧。优选地,判断所述语音信号帧的能量分布是否集中包括:计算所述语音信号帧的频域语音峰的个数;在所述个数大于第一预定阈值的情况下,确定所述语音信号帧的能量分布不集中。优选地,判断所述语音信号帧的能量分布是否集中包括:计算所述语音信号帧的VPER ;在所述VPER小于第二预定阈值的情况下,确定所述语音信号帧的能量分布不集中; V/V,其中本文档来自技高网
...
语音信号处理方法及装置

【技术保护点】
一种语音信号处理方法,其特征在于,包括:获取语音信号帧的能量分布特性;根据所述能量分布特性判断所述语音信号帧是否为噪声帧。

【技术特征摘要】
1.一种语音信号处理方法,其特征在于,包括: 获取语音信号帧的能量分布特性; 根据所述能量分布特性判断所述语音信号帧是否为噪声帧。2.根据权利要求1所述的方法,其特征在于,根据所述能量分布特性判断所述语音信号中贞是否为噪声帧包括: 判断所述语音信号帧的能量分布是否集中; 在判断结果为否的情况下,确定所述语音信号帧为噪声帧。3.根据权利要求2所述的方法,其特征在于,判断所述语音信号帧的能量分布是否集中包括: 计算所述语音信号帧的频域语音峰的个数; 在所述个数大于第一预定阈值的情况下,确定所述语音信号帧的能量分布不集中。4.根据权利要求2或3所述的方法,其特征在于,判断所述语音信号帧的能量分布是否集中包括: 计算所述语音信号帧的语音峰能量比VPER ; 在所述VPER小于第二预定阈值的情况下,确定所述语音信号帧的能量分布不集中;其 SPF中,mR = ,SPEl为第一语音峰能量,spE2为第二语音峰能量。5.根据权利要求4所述的方法,其特征在于,所述语音峰能量通过以下公式计算:S叹=,其中ENGi为第i子带能量,a和b分别为所述语音峰所占频带两端的子带。 i=a6.根据权利要求1至5中任一项所述的方法,其特征在于,在根据所述能量分布特性判断所述语音信号帧是否为噪声帧之后,还包括: 根据所述语音信号帧的子带能量获取所述语音信号帧的子带信噪比; 根据所述子带信噪比对所述语音信号帧进行自动增益。7.根据权利要求6所述的方法,其特征在于,根据所述子带信噪比对所述语音信号帧进行自动增益包括: 调整所述语音信号帧的自动增益系数随着所述子带信噪比的减小而减小,以及随着所述子带信噪比的增大而增大。8.根据权利要求7所述的方法,其特征在于,调整所述语音信号帧的自动增益系数随着所述子带信噪比的减小而减小,以及随着所述子带信噪比的增大而增大包括: RcUio = Omxe且 ? ,,.Raiio (jctn1--S.中, Ration] ,、1, Gain为信号幅度增益;Ratio为信号增益相关系数;ES (m, i)为第m帧信号第i个子带的能量;SNRs(i,j)为第i帧第j个子带的子带信噪比。9.一种语音信号处理装置,其特征在于,包括: 第一获取模块,用于获取语音信号帧的能量分布特性; 判断模块,用于根据所述能量分布特性判断...

【专利技术属性】
技术研发人员:王进军孙焘刘冬梅薛涛王霞姚远
申请(专利权)人:中兴通讯股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1