本发明专利技术公开了用于增强编码音频信号的方法和设备,所述编码音频信号包括代表音频信号参数的指数,所述音频信号参数至少包括代表音频信号的第一特性的第一参数。从与第一参数对应的指数确定当前第一参数值。调整当前第一参数值,以便获得增强的第一特性,从而得到增强的第一参数值。从进一步与第二参数对应的所述指数确定当前第二参数值。从使指数值与第一参数值相关和使指数值与第二参数值相关的表确定新的指数值,从而与新的指数值对应的新的第一参数值和与新的指数值对应的新的第二参数值实质上与增强的第一参数值和当前第二参数值匹配。
【技术实现步骤摘要】
本专利技术涉及话音增强,尤其涉及用于增强编码音频信号的方法和设备。
技术介绍
目前,一般利用话音处理DSP(数字信号处理)算法所形成的改善话音质量来区分网络提供商。到分组网或者到具有扩展汇接自由操作(TFOtandem free operation)或代码转换器自由操作(TrFOtranscoder free operation)的网络的传送会减小这种利用传统话音处理算法来区分网络的能力。因此,通常负责维护其客户的语音质量的运营商同样还要求为编码语音执行话音处理算法。TFO是配置在GSM(全球移动通信系统)和GSM演化的3G(第三代)网络中的话音标准。它旨在避免移动-移动呼叫配置中的传统双语音编码/译码技术。汇接配置的主要不便之处在于双代码转换所带来的语音质量降质。根据ETSI收听试验,当语音编译码器低速操作时,这种降质通常更明显。此外,较高的背景噪声级别会加大这种降质。当始发端和终接端连接使用相同的语音编译码器时,可以将从始发端MS(移动台)接收到的语音帧透明地传送到终接端MS,而无需启动始发端和终接端网络中的代码转换功能。汇接自由操作(TFO)的主要优点在于语音质量的改善,因为它避免了网络中的双代码转换,还可能节省了载送与16kbit/s或8kbit/s的子多路复用方案兼容的压缩语音的PLMN(公共陆地移动网)间的传输链路(包括分组交换传输),还可能节省了网络设备中的处理功率(因为代码转换器单元中的代码转换被旁路),以及可能缩短了端到端传输延迟。在TFO呼叫配置中,代码转换器装置物理上处在信号通路中,但代码转换功能被旁路。代码转换装置可以执行控制和协议变换功能。另一方面,在代码转换器自由操作(TrFO)中,物理上没有代码转换器装置,因此不启动控制或者变换或与其有关的其他功能。语音电平是影响语音的可感质量的重要因素。通常在网络端采用一些自动电平控制算法,这些算法通过提高微弱语音的电平和稍微降低一点很大声话音的电平将语音电平调整到某一所期望的目标电平。在未来的语音以编码格式从发送装置到接收装置进行端到端传播的分组网中,这些方法就不能这样使用。目前,编码语音在网络中被译码,并且使用传统语音增强方法用线性PCM抽样来执行语音增强。此后,语音再一次被编码并传送到接收方。然而,例如,对AMR语音编译码器来说,在这些较低模式中电平控制更为困难,这是因为固定码簿增益(fixed codebook gain)不再被标量量化,而是与自适应码簿增益(adaptive codebookgain)一起被矢量量化。
技术实现思路
本专利技术的目的在于,提供一种用于增强编码音频信号的方法和设备,利用这种方法和设备可以克服上述问题并可以改善编码音频信号的增强。根据本专利技术的第一方面,通过一种用于增强编码音频信号的设备和方法来达到这一目的,所述编码音频信号包括代表音频信号参数的指数,所述音频信号参数至少包括代表音频信号的第一特性的第一参数和第二参数,包括从与第一参数对应的指数确定当前第一参数值;调整当前第一参数值,以便获得增强的第一特性,从而得到增强的第一参数值;从进一步与第二参数对应的所述指数确定当前第二参数值;和从使指数值与第一参数值相关和使指数值与第二参数值相关的表确定新的指数值,从而与新的指数值对应的新的第一参数值和与新的指数值对应的新的第二参数值实质上与增强的第一参数值和当前第二参数值匹配。根据本专利技术的第二方面,通过一种用于增强编码音频信号的设备和方法来达到这一目的,所述编码音频信号包括代表音频信号参数的指数,所述音频信号参数至少包括代表音频信号的第一特性的第一参数和背景噪声参数,包括从与至少第一参数对应的指数确定当前第一参数值;调整当前第一参数值,以便获得增强的第一特性,从而得到增强的第一参数值;从使指数值与至少第一参数值相关的表确定新的指数值,从而与新的指数值对应的新的第一参数值实质上与增强的第一参数值匹配;检测当前背景噪声参数指数值;和确定与增强的第一特性对应的新的背景噪声参数指数值。根据本专利技术的第三方面,通过一种用于增强编码音频信号的设备和方法来达到这一目的,所述编码音频信号包括代表音频信号参数的指数,包括检测音频信号的特性;检测当前背景噪声参数指数值;和确定与所检测的音频信号的特性对应的新的背景噪声参数指数值。本专利技术还可以体现为计算机程序产品,该产品包括当产品在计算机上运行时用于实现步骤的部分。根据本专利技术的一种实施方式,通过处理AMR(自适应多速率)语音编译码器的编码语音和/或噪声参数来增强编码域中的含有语音和/或噪声的编码音频信号。结果,如TFO、TrFO以及未来分组网中那样,即使不将语音变换成线性PCM抽样,也能在网络中实现自适应电平控制、回声控制和噪声抑制。具体地说,根据本专利技术的一种实施方式,描述了一种用于控制所有AMR编译码器模式12.2kbit/s、10.2kbit/s、7.95kbit/s、7.40kbit/s、6.70kbit/s、5.90kbit/s、5.15kbit/s和4.75kbit/s的AMR编码语音的电平。在模式12.2kbit/s和7.95kbit/s中,通过改变编码语音参数之一(即固定码簿增益因子的量化指数)来调整编码语音的电平。在其余模式中,固定码簿增益与自适应码簿增益被联合矢量量化,因此,调整编码语音的电平要求既改变固定码簿增益因子又改变自适应码簿增益(联合指数(joint index))。根据本专利技术,找出一个新的增益指数,以便使所期望的增益与所实现的有效增益之间的误差最小。所提出的电平控制不会带来可听人为噪声。因此,根据本专利技术,在较低的AMR比特率(不仅仅是12.2kbit/s和7.95kbit/s)也能进行电平控制。可以通过考虑所需的对应电平控制来改善AMR模式12.2kbit/s中的电平控制,以得到舒适的噪声电平。附图说明图1示出了AMR中语音合成的简化模型。图2利用嘈杂儿童语音抽样说明了对增益处理算法进行DTX操作的结果。图3示出了说明自适应码簿对阶跃函数的响应的图解。图4示出了在模式12.2kbit/s和7.95kbit/s中的固定码簿增益因子的非线性32级量化表。图5示出了说明图4的量化表中的相邻量化电平之间的差的图解。图6示出了在模式10.2、7.4和6.7kbit/s中的自适应码簿增益和固定码簿增益的矢量量化表。图7示出了在模式5.90和5.15bit/s中的自适应码簿增益和固定码簿增益因子的矢量量化表。图8示出了说明当固定码簿增益因子变化了1个量化步长时固定码簿增益的变化的图解。图9和10示出了说明固定码簿增益因子的再量化电平的图解。图11利用男性语音抽样说明了项 和 的值。图12利用儿童语音抽样说明了项 和 的值。图13示出了说明一种根据本专利技术用于增强编码音频信号的方法的流程图。图14示出了说明一种根据本专利技术用于增强编码音频信号的设备的示意框图。图15示出了说明固定增益的用法的框图。图16示出了说明本专利技术在一种媒体网关中的高级实现方式的图解。具体实施例方式下面,将结合含有语音和/或噪声的AMR编码音频信号来描述本专利技术的一种实施方式。然而,本专利技术并不局限于AMR编码,而可以适用于使用与音频信号参数对应的指数的任何音频信号编码技术。例如,这些音频信号参数可以本文档来自技高网...
【技术保护点】
一种用于增强编码音频信号的方法,所述编码音频信号包括代表音频信号参数的指数,所述音频信号参数至少包括代表音频信号的第一特性的第一参数和第二参数,该方法包括下列步骤:从与第一参数对应的指数确定当前第一参数值;调整当前第一参数值 ,以便获得增强的第一特性,从而得到增强的第一参数值;从进一步与第二参数对应的所述指数确定当前第二参数值;和从使指数值与第一参数值相关和使指数值与第二参数值相关的表确定新的指数值,从而与新的指数值对应的新的第一参数值和与新的指 数值对应的新的第二参数值基本上与增强的第一参数值和当前第二参数值匹配。
【技术特征摘要】
...
【专利技术属性】
技术研发人员:帕维瓦尔夫,安迪祖帕桑宁,
申请(专利权)人:诺基亚公司,
类型:发明
国别省市:FI[芬兰]
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。