包括幅度包络的参数音频编码制造技术

技术编号:3045092 阅读:232 留言:0更新日期:2012-04-11 18:40
一种音频编码器,包括正弦类型编码器以及幅度调制编码器,它们二者都接收音频输入信号。所述幅度调制编码器产生一组正弦分量,每一个正弦分量已分配与时变幅度包络有关的单独参数。所述正弦类型编码器可以是传统的恒定幅度类型编码器并产生一组恒定正弦分量。基于使用预定的编码效率标准(如感知相关的标准)的最优化,所述音频编码器判定要把来自两个编码器的哪些分量包含于输出比特流中。在一优选的实施例中,仅仅使用来自两个编码器之一的分量。优选地,对每个音频信号段重复最优化过程,且优选地,用于每段的标志包含于该比特流中,用以表明幅度包络参数是否存在于该段中。本发明专利技术另外涉及一种音频编码器、编码和解码方法以及包含编码器和解码器的编码信号和设备。根据本发明专利技术的音频编码对瞬态声回波效应提供高声音质量,同时由于在仅仅证明比特率是有效的情况下才包含幅度包络,所以所述音频编码在比特率上也是高效的。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及高质量低比特率音频信号编码领域。本专利技术尤其涉及基于参数编码且用于有效编码以及瞬态声的情况下的高声音质量的音频编码。更具体地,本专利技术涉及基于幅度调制的和恒定幅度正弦曲线的组合编码。
技术介绍
音频编码中的典型问题是前回音失真,即错误发生在开始(onset)之前。与存在掩码(marsker)时的情形相比较,这些错误非常不易被人类的听觉系统掩蔽。因此,量化错误发生在瞬态前很可能引起明显的听觉失真。因此,对于合适地编码瞬态声,必须特别关注。可以测量预掩蔽,通常其持续仅仅大约20ms,而滞后掩蔽可以持续长于100ms。另外,应注意的是该掩蔽现象基于临界频带发生,即它们基于宽带无法被精确地处理。许多音频编码技术,如正弦编码器,用10-20ms的驻波分量为音频信号建模。然后,需要许多分量为短的持续时间瞬态建模。在参数音频建模及编码内,幅度调制的正弦模型是捕捉瞬态声的特征(例如在″钟乐器(Glockenspiel)″和″响板(Castanets)″摘录中遇到的特征)所关注的。例如,在音频建模的情景下为此目的减幅正弦波已受到一些关注。在音频编码中使用幅度调制的现有技术解决方案的例子是B.Edler,H.Purnhagen和C.Ferekidis的″Analysis/Synthesis Audio Codecfor Very Low Bit Rates″(100th Conv.Audio Eng.Soc.preprint4179,1996)以及Schuijers,Oomen,den Brinker和Gerrits的″Advances in parametric coding for high-quality audion″(Proc.1st IEEE Benelux Workshop on Model Based Processing and Codingof Audio(MPCA-2002))。然而,这些在其瞬态的定义、检测及编码中都是单波带的,意思是包络对所有分量来说都是相同的。不过,在″Analysis/Synthesis Audio Codec for Very Low Bit Rates″中,对于每个分量都要判定是否要应用一个被估计的包络。所提到的现有技术的例子都存在着如下缺点幅度调制信号的窗口长度或估计可以由强驻波低频分量占主导,而较弱的瞬态出现在高频处,因此引起听觉假象。另一缺点是因存在高频瞬态的原因而要挑选短的窗口长度,因此导致频率分辨率很差,以致于降低驻波低频信号部分的听觉质量。
技术实现思路
可以看到本专利技术的目的是提供一种幅度调制正弦音频编码器,它在速率失真方面是高效的,意思是,在给定比特率的情况下,与传统的正弦编码器相比较,它实现了更低的失真,而且它在复杂性方面也是高效的,且同时它能够处理瞬态声音而没有严重的听觉假象。根据本专利技术的第一方面,该目的通过提供一种适于对音频信号编码的音频编码器来实现,该音频编码器包括-正弦类型编码器,适于产生第一编码信号部分,该部分包括第一多个正弦分量,以及-幅度调制编码器,适于产生第二编码信号部分,该部分包括第二多个正弦分量,所述第二多个正弦分量被单独分配有与时变幅度包络有关的至少一个参数,其中该音频编码器包括适于相对于预定的编码效率标准评价第一与第二编码信号部分并响应其而产生编码的输出信号的装置。根据本专利技术的第一方面的编码器还对瞬态音频信号提供高编码效率。原因是幅度调制编码器适于向每个单独的正弦分量分配幅度包络参数,优选地每个单独的正弦分量还在一个段内。因此,所述音频编码器能够精确地表示瞬态音频信号,原因在于它可以使一些正弦分量随时间相当大地变化,而其它的正弦分量可以是恒定的或者差不多是恒定的。据此,瞬态信号可以以一种方式来代表,使得可以避免或者至少相当大地减少明显的听觉前回音效应。这是优于现有技术编码器的一个优点。根据本专利技术的第一方面的编码器也是高效的,原因在于音频输入信号的编码效率是相对于正弦类型编码器和幅度调制编码器而评价的,优选地,正弦类型编码器是传统的恒定幅度类型编码器。因此,在就一些预定的编码效率标准已评价是高效的时候,仅仅使用代表与每个正弦分量的时变幅度包络有关的参数的额外比特率。优选地,效率标准包括感知相关的失真测量。在优选的实施例中,所述效率标准包括总体比特率与感知失真测量的组合。使用感知失真测量,所感知的声音质量可以在判定幅度调制参数是否应被包含于编码的输出信号中予以考虑。在一个优选的实施例中,所述音频编码器适于选择第一与第二编码信号部分中之一以便包含于编码的输出信号中。优选地,基于编码效率评价,判定音频信号应由正弦类型编码器还是由幅度调制编码器编码。这样的判定可以包括在目标比特率的约束的情况下对两种编码器比较失真测量的任务,然后选择提供最低失真的一个。代替直接使用失真测量,代价函数可以被定义且选择具有代价最低的备选方案。所述代价函数可以包含比特率与感知失真的组合。可选地,所述音频编码器可以考虑来自正弦编码器和幅度调制编码器的正弦分量的混合。这可以导致一个更高效率的编码表示。然而,该任务更复杂。优选地,所述编码器适于评价第一与第二编码信号部分的编码效率并响应其为音频信号的每一段产生编码的输出信号。对于快速变化的信号,诸如瞬态,逐段处理音频输入信号是重要的,原因在于单个瞬态通常会发生在仅仅一个或两个段中,因此相对于编码效率而言仅仅在有必要的地方(即发现就预定的编码效率标准而言是高效的段中)使用幅度调制编码器是很重要的。否则,就把比特率浪费在了不必要的段的包络参数数据上。优选地,所述幅度调制编码器适于产生与时变幅度包络的突变(attack)有关的时变幅度包络参数。所述突变参数可以包括幅度包络的陡度的数学描述。另外,它可以包括开始或突变时间。优选地,所述音频编码器适于为每个音频信号段产生一个标志用以表明时变幅度信号是否包含于编码的输出信号中并且进入到其输出比特流中。据此就向解码设备通知是准备好了接收包络参数数据还是没有准备好。尤其对于所述音频编码器适于产生具有恒定正弦分量与包含幅度包络信息的正弦分量的混合的编码的输出信号的实施例,可以优选的是,所述音频编码器适于为每个正弦分量都产生一个标志用于表明它是否具有幅度包络信息并且进入到其输出比特流中。根据第二方面,本专利技术提供一种适于对编码的音频信号进行解码的音频解码器,该音频解码器包括-适于接收包含一组正弦分量的编码的音频信号的装置,该正弦分量被单独分配具有与时变幅度包络有关的至少一个参数,以及-信号产生装置,适于响应其产生音频信号。优选地,所述解码器适于在其输入比特流中接收一个表明每个段它是否包含幅度包络数据的标志。在第三方面,本专利技术提供一种编码音频信号的方法,该方法包括如下步骤-产生第一编码信号部分,该部分包括第一组正弦分量,-产生第二编码信号部分,该部分包括第二组正弦分量,所述第二组正弦分量被单独分配具有与时变幅度包络有关的至少一个参数,-相对于预定的编码效率标准评价第一与第二编码信号部分,以及-基于对第一与第二编码信号部分的评价的编码效率的结果,产生包含第一与第二编码信号部分的编码音频信号。在第四方面,本专利技术提供一种对编码音频信号解码的方法,该方法包括如下步骤-接收一组正弦分量,本文档来自技高网
...

【技术保护点】
一种音频编码器,适于编码音频信号(IN),该音频编码器包括:-正弦类型编码器(CA),适于产生第一编码信号部分,该部分包括第一多个正弦分量,以及-幅度调制编码器(AM),适于产生第二编码信号部分,该部分包括第二多个正弦分量, 所述第二多个正弦分量被单独分配有与时变幅度包络有关的至少一个参数,其中该音频编码器包括适于相对于预定的编码效率标准评价第一与第二编码信号部分并响应其而产生编码的输出信号(OUT)的装置。

【技术特征摘要】
【国外来华专利技术】EP 2004-11-1 04105428.91.一种音频编码器,适于编码音频信号(IN),该音频编码器包括-正弦类型编码器(CA),适于产生第一编码信号部分,该部分包括第一多个正弦分量,以及-幅度调制编码器(AM),适于产生第二编码信号部分,该部分包括第二多个正弦分量,所述第二多个正弦分量被单独分配有与时变幅度包络有关的至少一个参数,其中该音频编码器包括适于相对于预定的编码效率标准评价第一与第二编码信号部分并响应其而产生编码的输出信号(OUT)的装置。2.根据权利要求1所述的音频编码器,适于选择第一与第二编码信号部分之一以便包含于所述编码的输出信号(OUT)中。3.根据权利要求1所述的音频编码器,适于评价第一与第二编码信号部分的编码效率,并响应其为音频信号(IN)的每一段产生编码的输出信号。4.根据权利要求1所述的音频编码器,其中幅度调制编码器(AM)适于产生与时变幅度包络的突变有关的时变幅度包络参数。5.根据权利要求1所述的音频编码器,其中所述预定的编码效率标准包含总体比特率与感知失真测量的组合。6.根据权利要求1所述的音频编码器,适于在所述编码输出信号(OUT)中为每段音频信号(IN)产生一个标志,用以表明时变幅度信息是否包含于所述编码输出信号(OUT)中。7.根据权利要求1所述的音频编码器,适于在所述编码输出信号(OUT)中为每段以及为所述编码输出信号(OUT)的每个单独的正弦分量产生一个标志,用以表明时变幅度信息是否被包括。8.根据权利要求1所述的音频编...

【专利技术属性】
技术研发人员:MG克里斯坦森SLJDE范德帕尔
申请(专利权)人:皇家飞利浦电子股份有限公司
类型:发明
国别省市:NL[荷兰]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利