本发明专利技术实施例公开了一种语音增强处理方法和装置,其中语音增强处理方法包括:第一VQE模块测量接收到的语音信号的至少一个语音质量参数;第一VQE模块利用至少一个语音质量参数检测语音质量问题;如果检测到语音质量问题,第一VQE模块通知第二VQE模块改变其VQE操作模式。
【技术实现步骤摘要】
本专利技术涉及数字信号处理
,尤其是一种语音增强处理方法和装置。
技术介绍
在数字通信领域,语音、图像、音频、视频的传输有着非常广泛的应用需求,如手机通话、音视频会议、广播电视、多媒体娱乐等。语音被数字化处理,通过语音通信网络从一个终端传递到另一个终端,这里的终端可以是手机、数字电话终端或其他任何类型的语音终端,数字电话终端例如VOIP电话或ISDN电话、计算机、电缆通信电话。语音质量增强(VQE,Voice Quality Enhancement)功能被广泛地应用到语音通信网络中的不同地方,用于解决网络中的语音问题,如声学回声(acoustic echo)、线回声(line echo)、环境噪声、电平等问题。常见的 VQE 功能(VQE functionality)包括回声消除(EC, Echo Cancellation,Echo Canceller)、噪声消除(NR, Noise Reduction)(也可以叫做噪声抑制(NoiseCancellation, Noise Canceller))、自动电平控制(ALC, Automatic Level Control)、自动听力增强(ALE, Automatic Listener Enhancement)等。语音通信网络由多个终端及互相连接的网络节点构成,其中每个终端和每个网络节点都可能使用VQE模块(模块上可能具有一个或多个VQE功能)。多个网络节点和终端上的VQE模块可以提供相同或者不同的VQE功能,如果在通信链路上的VQE模块的功能没有进行很好的调度和协调,则会损伤所传输的语音质量。例如,两个回声消除前后串联(intandem),带回声的语音信号经过第一个EC的处理后传递给第二个EC模块,此时第二个EC将不能正确观察到回声的特性,因此无法充分训练其内部的自适应滤波器以及控制其内部的非线性处理(NLP,Non-linear Processing)模块,可能造成语音的误损伤。再例如,两个噪声消除(NR,Noise Reduction)前后串联,带噪声的语音信号先经第一个NR处理,然后第二个NR处理,此时可能产生过度抑制,从而导致信号中的语音部分受损。
技术实现思路
本专利技术实施例的目的在于提供一种语音增强处理方法和装置,提高语音质量。根据本专利技术的一实施例,一种语音增强处理方法,包括第一 VQE模块测量接收到的语音信号的至少一个语音质量参数;第一 VQE模块利用至少一个语音质量参数检测语音质量问题;如果检测到语音质量问题,第一 VQE模块通知第二 VQE模块改变其VQE操作模式。根据本专利技术的另一实施例,一种语音增强处理装置,包括测量模块,用于测量接收到的语音信号的至少一个语音质量参数;检测模块,用于利用至少一个语音质量参数检测语音质量问题;通知模块,如果检测到语音质量问题,则通知另一 VQE模块改变其VQE操作模式。 本专利技术实施例,网络中的每个VQE模块能和其他VQE模块进行动态协商,能有效地解决或改善网络中语音质量问题,提升整网的语音质量。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图I为本专利技术实施例所涉及的网络环境示意图;图2为本专利技术提供的语音增强处理方法一个实施例的流程示意图;图3为本专利技术提供的语音增强处理方法另一个实施例的流程示意图;图4为本专利技术提供的语音增强处理方法另一个实施例的流程示意图;图5为本专利技术提供的语音增强处理方法另一个实施例的流程示意图;图6为本专利技术提供的语音增强处理方法另一个实施例的流程示意图;图7为本专利技术提供的语音增强处理方法另一个实施例的流程示意图;图8为本专利技术提供的语音增强处理方法另一个实施例的流程示意图;图9为本专利技术提供的语音增强处理方法另一个实施例的流程示意图;图10为本专利技术提供的语音增强处理方法另一个实施例的流程示意图;图11为本专利技术提供的语音增强处理方法另一个实施例的流程示意图;图12为本专利技术提供的语音增强处理方法另一个实施例的流程示意图;图13为本专利技术提供的语音增强处理方法另一个实施例的流程示意图;图14为本专利技术提供的信号处理装置一个实施例的结构示意图;图15为本专利技术提供的信号处理装置另一个实施例的结构示意图;。具体实施例方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。国际电信联盟(ITU-T)的一个标准G. 799. 2,定义了一种动态协商机制,通过交换语音通信网络中VQE模块的所处位置信息来协商各VQE功能的开关。G. 799. 2提供了各种VQE功能的最优位置,并且推荐不在最优位置的VQE功能进行关闭。例如,对于EC,最优位置为终端,如手机,对于不在终端的EC,推荐关闭。G. 799. 2通过这种协商方式,在网络中只留下最优位置的VQE功能,而关闭其他位置的VQE功能,虽然可以避免VQE模块前后串联带来的可能的质量下降问题,但是它也完全排除了在非最优位置的VQE功能对语音质量的改善,使得整体语音质量无法得到优化。例如,语音通信网路里的一个EC不能去除所有残留回声,在它之后串连的另一个EC虽然有能力去除这些残留回声,但是因为它不在最优位置上而被关闭,从而无法继续优化整体的语音质量。参考图1,本专利技术实施例的一个应用环境框架图,语音通信网络中包括多个终端(如终端A、终端D)和多个网络节点(如网络节点B、网络节点C),任意终端或网络节点均可以叫做网元。每个终端和网络节点(例如,基站、网关等)分别包括VQE模块,如VQE A、VQE B、VQE C和VQE D。语音通话可以从终端A发起,传递到终端D,也可以反方向发起和传递,这里以A到D方向进行以下叙述。每个VQE模块可能是一个VQE功能,也可能是多个VQE功能的组合。每个网元上的每个VQE功能测量语音信号,然后根据这些测量的语音质量参数来处理语音以提升语音质量。语音质量参数可以是语音电平、语音频谱、噪声电平、噪声频谱、信噪比(SNR)、残留回声或者其他任何可以从语音信号里提取出来的参数。例如,EC通过测量残留回声来调整训练它的自适应滤波器,也可以通过测量语音行为(Voice Activity)来决定NLP的动作,以更好地去除回声;NR可以通过测量带噪语音的频谱,以更好地去除噪声;ALC可以通过测量语音电平以将其调整到一个预定电平上。这些测量提供了语音信号的相关信息,图I中的A、B、C、D每个点上都可以进行这些测量。例如,终端A上的VQE A,基于终端A得到的语音信号测量,可以处理网络语音问题(如回声、噪声等),网络节点B上也有VQE B,可以基于节点B得到的语音信号测量,处理该节点的网络语音问题。然而,两个VQE模块的操作不仅取决于各自的测量,还取决于各自的设计特性。例如,终端A上的VQE A里有EC,其设计特性是只能处理本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种语音增强处理方法,其特征在于,包括 第一 VQE模块测量接收到的语音信号的至少一个语音质量参数; 第一 VQE模块利用至少一个语音质量参数检测语音质量问题; 如果检测到语音质量问题,第一 VQE模块通知第二 VQE模块改变其VQE操作模式。2.根据权利要求I所述的方法,其特征在于,还包括 如果检测到语音质量问题,第一 VQE模块改变其VQE操作模式。3.根据权利要求I所述的方法,其特征在于,第一VQE模块通知第二 VQE模块改变其VQE操作模式包括 第一 VQE模块向第二 VQE模块发送语音质量问题报告,所述第二 VQE模块根据语音质量问题报告改变VQE操作模式。4.根据权利要求I所述的方法,其特征在于,第一VQE模块通知第二 VQE模块改变其VQE操作模式包括 向第二 VQE模块发送VQE操作模式改变请求,该VQE操作模式改变请求包含改变的操作模式。5.根据权利要求3或4所述的方法,其特征在于,还包括 根据第二 VQE模块对语音质量问题的解决结果改变第一 VQE模块的VQE操作模式。6.根据权利要求5所述的方法,其特征在于,还包括 如果第一 VQE模块的VQE操作模式改变后未能解决该语音质量问题,则通知第二 VQE模块关闭部分或全部VQE操作模式。7.根据权利要求6所述的方法,其特征在于,还包括 如果第一 VQE模块未能解决语音质量问题,则撤销第二 VQE模块的操...
【专利技术属性】
技术研发人员:艾雅·苏谟特,刘长娥,
申请(专利权)人:华为技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。