本发明专利技术提出了一种语音降噪方法,该方法包括以下步骤:a,通过端点检测将语音帧区分为静音帧和语音帧;b,对于静音帧,计算当前帧的功率谱值作为噪声功率谱估计值,对于语音帧,计算平均噪声功率谱作为噪声功率谱估计值;c,将语音帧的功率谱减去噪声功率谱估计值,得到降噪后的语音功率谱;d,根据降噪后的语音功率谱得出降噪后的语音帧。本发明专利技术通过端点检测技术减小了噪声功率谱估计值的误差,基本消除了音乐噪声,从而提高了语音降噪质量和主观听觉的效果。
【技术实现步骤摘要】
本专利技术涉及语音通话领域,尤其涉及。
技术介绍
在语音业务中最常见的问题是在通话中有噪声,目前处理噪声最常用的技术是谱 减法。它利用语音信号的短时平稳特性,从带噪语音的短时谱值中减去噪声的短时谱估计 值,从而得到较纯净语音的频谱,达到语音降噪的目的。谱减法包括幅度谱减法和功率谱减 法:幅度谱减法就是在频域中从带噪语音的幅度谱上减去噪声的幅度谱作为语音信号的幅 度谱;功率谱减法则是从带噪语音的功率谱中减去噪声的功率谱,得到纯净语音的功率谱, 通过开方运算得到幅度谱。由于人耳对语音频谱分量的相位感知并不敏感,因此该些算法 都是在幅度上进行的修正,相位部分则保持不变,在处理完噪声后,仍然使用带噪语音的相 位来恢复降噪后的语音。在噪声谱的估计方面,一般是使用语音未产生之前的噪声谱作为 整个语音降噪区间的噪声谱估计值。 上述谱减法通过从带噪语音的短时谱中减去噪声的短时谱估计值来达到语音降 噪的目的,算法简单且容易实现。由于是把语音未产生之前的噪声谱作为整个语音降噪区 间的噪声谱估计值,使得噪声谱的估计值误差较大,因此在减去噪声谱后,还会有些较大功 率谱分量的剩余部分,在频谱上呈现出随机出现的尖峰,在听觉上形成残留噪声。该种噪声 具有一定的节奏性起伏感,被称之为"音乐噪声",是各峽的多种随机频率点上出现的声调 的组合结果。听者常常能发现处理后的语音中的"音乐噪声",它比原始语音中的噪声更为 清晰,也更易令人反感。
技术实现思路
为了解决目前采用谱减法处理噪声后出现音乐噪声的问题,专利技术提出了一种基于 谱减法改进的语音降噪方法。该方法包括W下步骤: a,通过端点检测将语音峽区分为静音峽和语音峽; b,对于静音峽,计算当前峽的功率谱值作为噪声功率谱估计值,对于语音峽,计算 平均噪声功率谱作为噪声功率谱估计值; C,将语音峽的功率谱减去噪声功率谱估计值,得到降噪后的语音功率谱;d,根据降噪后的语音功率谱得出降噪后的语音峽。 优选的,步骤a具体为:计算每一语音峽的能量,如果大于或等于口限值,则为语 音峽,如果小于口限值,则为静音峽。进一步的,将前30峽语音峽的平均噪声能量作为所述 口限值。 优选的,步骤b中将前30峽语音峽的平均噪声能量作为所述平均噪声功率谱。 优选的,步骤b中所述噪声谱估计值还进行平滑处理。 优选的,步骤d利用降噪前语音峽的相位谱,根据降噪后的语音功率谱计算出降 噪后的语音谱,进而得到降噪后的语音峽。 本专利技术通过端点检测技术减小了噪声功率谱估计值的误差,基本消除了音乐噪 声,从而提高了语音降噪质量和主观听觉的效果。【附图说明】 为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现 有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发 明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可W根 据该些附图获得其他的附图。 图1是本专利技术实施例的端点检测流程示意图。【具体实施方式】 为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例 中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是 本专利技术一部分实施例,而不是全部的实施例;需要说明的是,在不冲突的情况下,本申请中 的实施例及实施例中的特征可W相互组合。基于本专利技术中的实施例,本领域普通技术人员 在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。 在降噪方法中噪声谱的估计至关重要,如果噪声估计偏差较大的话,将毫无疑问 的影响语音降噪质量。本实施例是在端点检测的基础上进行噪声估计的,端点检测是指从 一段包含语音的信号中确定出语音的起始点和终点,从而从连续记录的带噪语音信号中分 离出我们真正感兴趣的语音信号。本实施例通过端点检测把要降噪的语音峽区分为静音峽 和语音峽。在静音峽,当前的谱值就是噪声谱,在语音峽,使用平均噪声功率谱作为噪声功 率谱估计值。该样就比传统的在整个降噪区间使用平均噪声功率谱作为噪声功率谱的估计 值误差小很多。 本实施例的端点检测方法是将语音信号的短时能量与口限值比较,如果超过口限 值则表示当前为有语音的语音段,否则就表示当前为无音的静音段。整个端点检测流程如 图1所示:首先设置一个经验值为口限值,本实施例是将前30峽语音峽的平均噪声能量 (EMN)作为口限值。然后依次计算每一峽的能量;【主权项】1. ,其特征在于,所述方法包括以下步骤: a,通过端点检测将语音帧区分为静音帧和语音帧; b,对于静音帧,计算当前帧的功率谱值作为噪声功率谱估计值,对于语音帧,计算平均 噪声功率谱作为噪声功率谱估计值; c,将语音帧的功率谱减去噪声功率谱估计值,得到降噪后的语音功率谱; 山根据降噪后的语音功率谱得出降噪后的语音帧。2. 根据权利要求1所述的方法,其特征在于,步骤a具体为:计算每一语音帧的能量, 如果大于或等于门限值,则为语音帧,如果小于门限值,则为静音帧。3. 根据权利要求2所述的方法,其特征在于,将前30帧语音帧的平均噪声能量作为所 述门限值。4. 根据权利要求1所述的方法,其特征在于步骤b,将前30帧语音帧的平均噪声能量 作为所述平均噪声功率谱。5. 根据权利要求1或4所述的方法,其特征在于步骤b,所述噪声谱估计值还进行平滑 处理。6. 根据权利要求1所述的方法,其特征在于步骤d,利用降噪前语音帧的相位谱,根据 降噪后的语音功率谱计算出降噪后的语音谱,进而得到降噪后的语音帧。【专利摘要】本专利技术提出了,该方法包括以下步骤:a,通过端点检测将语音帧区分为静音帧和语音帧;b,对于静音帧,计算当前帧的功率谱值作为噪声功率谱估计值,对于语音帧,计算平均噪声功率谱作为噪声功率谱估计值;c,将语音帧的功率谱减去噪声功率谱估计值,得到降噪后的语音功率谱;d,根据降噪后的语音功率谱得出降噪后的语音帧。本专利技术通过端点检测技术减小了噪声功率谱估计值的误差,基本消除了音乐噪声,从而提高了语音降噪质量和主观听觉的效果。【IPC分类】G10L21-0216【公开号】CN104867497【申请号】CN201410076957【专利技术人】陈子华, 徐正春 【申请人】北京信威通信技术股份有限公司, 北京信友达视讯技术有限公司【公开日】2015年8月26日【申请日】2014年2月26日本文档来自技高网...
【技术保护点】
一种语音降噪方法,其特征在于,所述方法包括以下步骤:a,通过端点检测将语音帧区分为静音帧和语音帧;b,对于静音帧,计算当前帧的功率谱值作为噪声功率谱估计值,对于语音帧,计算平均噪声功率谱作为噪声功率谱估计值;c,将语音帧的功率谱减去噪声功率谱估计值,得到降噪后的语音功率谱;d,根据降噪后的语音功率谱得出降噪后的语音帧。
【技术特征摘要】
【专利技术属性】
技术研发人员:陈子华,徐正春,
申请(专利权)人:北京信威通信技术股份有限公司,北京信友达视讯技术有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。