音频解码器装置及音频编码器装置制造方法及图纸

技术编号:31080490 阅读:26 留言:0更新日期:2021-12-01 11:54
对比特流进行解码的音频解码器装置包括:预测性解码器,用于从比特流产生解码的音频帧,其中预测性解码器包括从比特流产生音频帧的音频参数的参数解码器、以及通过合成音频帧的音频参数而产生音频帧的合成滤波器装置;存储器装置,包括存储音频帧的存储器状态的一个或多个存储器,存储器状态被合成滤波器装置用来合成音频参数;以及存储器状态再取样装置,用于通过针对存储器再取样合成用于先前解码的音频帧的音频参数的先前存储器状态,为存储器确定用来合成用于解码的音频帧的音频参数的存储器状态,解码的音频帧具有取样率,先前解码的音频帧具有与解码的音频帧的取样率不同的先前取样率,并将用于存储器的存储器状态存储于各个存储器中。存储于各个存储器中。存储于各个存储器中。

【技术实现步骤摘要】
音频解码器装置及音频编码器装置
[0001]本申请是申请人为弗劳恩霍夫应用研究促进协会、申请日为“2015年8月14日”、申请号为“201580044544.0”、专利技术名称为“音频解码器装置及音频编码器装置”的分案申请。


[0002]本专利技术涉及语音及音频编码,尤其涉及用于处理音频信号(对于其,输入和输出取样率从先前帧变化至当前帧)的音频编码装置以及音频解码装置。本专利技术还涉及操作此类装置的方法以及执行此方法的计算机程序。

技术介绍

[0003]语音及音频编码能够得到具有多节奏(multi

cadence)的输入及输出的好处,并且得到能够立即地且无缝地将一个取样率切换至另一取样率。传统的语音及音频编码器对于确定的输出比特率使用单取样率并且在不彻底重设系统时无法对其进行改变。这随后在通信中以及在解码信号中造成不连续。
[0004]另一方面,通过选择通常取决于源和信道条件的多个优化参数,适应性取样率以及比特率允许较高质量。随后,重要的是当改变输入/输出信号的取样率时实现无缝过渡。
[0005]此外,重要的是对于此过渡限制复杂度增加。现代语音及音频编解码器,如将至的跨LTE网络的3GPP EVS,将需要能够开发此功能。
[0006]高效的语音及音频编码器需要能够从时域至另一者改变其取样率以更好地适合于源与信道条件。取样率的改变对于连续线性滤波器尤其是个问题,其仅可以在它们的过去状态显示与当前时间区间相同的取样率用以滤波时应用。
[0007]更特别地,预测性编码随着时间和帧在编码器及解码器处维持不同的存储器状态。在码激励线性预测(CELP,code

excited linear prediction)中,这些存储器通常是线性预测编码(LPC)合成滤波器存储器、去加重滤波器存储器以及适应性码本。直接的方案是当取样率改变发生时重设全部存储器。这在解码信号中造成非常恼人的不连续。恢复可能是非常久且非常明显的。
[0008]图1示出根据现有技术的第一音频解码器装置。使用此音频解码器装置,当来源于非预测性编码方案时,无缝地切换至预测性编码是可能的。此可以通过对用于维持预测性编码器所需的滤波器状态的非预测性编码器的解码输出的反向滤波来进行。例如,在AMR

WB+及USAC中进行,用于从基于变换的编码器、TCX切换至语音编码器、ACELP。然而,在此两种编码器中,取样率是相同的。反向滤波可直接用在TCX的解码的音频信号上。此外,在USAC及AMR

WB+中的TCX传送并利用也被反向滤波所需的LPC系数。LPC解码的系数在反向滤波计算中被简单地再使用。值得注意的是,如果使用相同的滤波器和相同的取样率在两个预测性编码器之间切换,则不需要反向滤波。
[0009]图2示出根据现有技术的第二音频解码器装置。在两个编码器具有不同取样率的情况下,或在相同的预测性编码器中但使用不同取样率切换的情况下,如图1所示的先前音频帧的反向滤波不再足够。直接的方案是将过去解码的输出再取样为新的取样率并且然后
通过反向滤波计算存储器状态。如果一些滤波器系数是取样率依赖的,如针对LPC合成滤波器的情况,则需要进行再取样的过去信号的额外分析。为了以新的取样率fs_2得到LPC系数,重新计算自相关函数且对再取样的过去解码的样本使用列文逊

杜宾算法(Levinson

Durbin algorithm)。此方案是计算苛刻的并且难以在实际实施中使用。

技术实现思路

[0010]待解决的问题在于提供用于在音频处理装置处切换取样率的改进概念。
[0011]在第一方面中,通过用于对比特流进行解码的音频解码器装置解决问题,其中音频解码器装置包括:
[0012]预测性解码器,用于从比特流产生解码的音频帧,其中预测性解码器包括用于从比特流产生用于解码的音频帧的一个或多个音频参数的参数解码器,并且其中预测性解码器包括用于通过合成用于解码的音频帧的一个或多个音频参数而产生解码的音频帧的合成滤波器装置;
[0013]存储器装置,包括一个或多个存储器,其中每个存储器用于存储用于解码的音频帧的存储器状态,其中一个或多个存储器的用于解码的音频帧的存储器状态被合成滤波器装置用来合成用于解码的音频帧的一个或多个音频参数;以及
[0014]存储器状态再取样装置,用于通过针对所述存储器中的一个或多个再取样用来合成用于先前解码的音频帧的一个或多个音频参数的先前存储器状态,为所述存储器中的一个或多个确定用来合成用于解码的音频帧的一个或多个音频参数的存储器状态,解码的音频帧具有取样率,先前解码的音频帧具有不同于解码的音频帧的取样率的先前取样率;并用于将用于所述存储器中的一个或多个的用来合成用于解码的音频帧的一个或多个音频参数的存储器状态存储于各个存储器中。
[0015]术语“解码的音频帧”指当前正在处理的音频帧,而术语“先前解码的音频帧”指在当前正在处理的音频帧之前被处理的音频帧。
[0016]本专利技术允许预测性编码方案切换其内部取样率(intern sampling rate),而无需再取样整个缓冲区,用以重新计算其滤波器的状态。通过直接仅对必要的存储器状态再取样,可维持低复杂度,而无缝过渡仍是可能的。
[0017]根据本专利技术的优选的实施例,一个或多个存储器包括用于存储适应性码本存储器状态的适应性码本存储器,该适应性码本存储器状态用来确定用于解码的音频帧的一个或多个激发参数;其中,存储器状态再取样装置用于通过再取样用来确定用于先前解码的音频帧的一个或多个激发参数的先前适应性码本状态,确定用来确定用于解码的音频帧的一个或多个激发参数的适应性码本状态,以及存储器状态再取样装置用于将用来确定用于解码的音频帧的一个或多个激发参数的适应性码本状态存储于适应性码本存储器中。
[0018]例如,适应性码本存储器状态用于CELP装置中。
[0019]为了能够再取样存储器,在不同取样率下的存储器大小必须关于其覆盖的时间持续而相同。换言之,如果滤波器在取样率fs_2下具有M阶,在先前取样率fs_1下更新的存储器应覆盖至少M*(fs_1)/(fs_2)个样本。
[0020]由于在适应性码本的情况下存储器通常与取样率成比例,不论取样率如何其都覆盖解码的残余信号的大约最后20ms,无需进行额外的存储器管理。
[0021]根据本专利技术的优选的实施例,一个或多个存储器包括用于存储合成滤波器存储器状态的合成滤波器存储器,合成滤波器存储器状态用来确定用于解码的音频帧的一个或多个合成滤波器参数;其中,存储器状态再取样装置用于通过再取样用来确定用于先前解码的音频帧的一个或多个合成滤波器参数的先前合成存储器状态,确定用来确定用于解码的音频帧的一个或多个合成滤波器参数的合成存储器状态,以及存储器状态再取样装置用于将用来确定用于解码的音频帧的一个或多个合成滤波器参数的合成存储器状态存储于合成滤波器存储器中。
...

【技术保护点】

【技术特征摘要】
1.一种用于对比特流(BS)进行解码的音频解码器装置,所述音频解码器装置(1)包括:预测性解码器(2),用于从所述比特流(BS)产生解码的音频帧(AF),其中所述预测性解码器(2)包括用于从所述比特流(BS)产生用于所述解码的音频帧(AF)的一个或多个音频参数(AP)的参数解码器(3),以及其中所述预测性解码器(2)包括用于通过合成用于所述解码的音频帧(AF)的一个或多个音频参数(AP)而产生所述解码的音频帧(AF)的合成滤波器装置(4);存储器装置(5),包括一个或多个存储器(6;6a,6b,6c),其中存储器(6;6a,6b,6c)中的每个用于存储用于所述解码的音频帧(AF)的存储器状态(MS;AMS,SMS,DMS),其中所述一个或多个存储器(6;6a,6b,6c)的用于所述解码的音频帧(AF)的存储器状态(MS;AMS,SMS,DMS)被所述合成滤波器装置(4)用来合成用于所述解码的音频帧(AF)的一个或多个音频参数(AP);以及存储器状态再取样装置(10),用于通过针对所述存储器(6;6a,6b,6c)中的一个或多个再取样用来合成用于先前解码的音频帧(PAF)的一个或多个音频参数的先前存储器状态(PMS;PAMS,PSMS,PDMS),为所述存储器(6;6a,6b,6c)中的一个或多个确定用来合成用于所述解码的音频帧(AF)的一个或多个音频参数(AP)的存储器状态(MS;AMS,SMS,DMS),所述解码的音频帧(AF)具有取样率(SR),所述先前解码的音频帧(PAF)具有与所述解码的音频帧(AF)的取样率(SR)不同的先前取样率(PSR);并用于将用于所述存储器(6;6a,6b,6c)中的一个或多个的用来合成用于所述解码的音频帧(AF)的一个或多个音频参数(AP)的存储器状态(MS;AMS,SMS,DMS)存储于各个存储器(6;6a,6b,6c)中。2.根据权利要求1所述的音频解码器装置,其中所述一个或多个存储器(6;6a,6b,6c)包括用于存储用来确定用于所述解码的音频帧(AF)的一个或多个激发参数(EP)的适应性码本存储器状态(AMS)的适应性码本存储器(6a);其中,所述存储器状态再取样装置(10)用于通过再取样用来确定用于所述先前解码的音频帧(PAF)的一个或多个激发参数的先前适应性码本存储器状态(PAMS),确定用来确定用于所述解码的音频帧(AF)的一个或多个激发参数(EP)的所述适应性码本存储器状态(AMS),并用于将用来确定用于所述解码的音频帧(AF)的一个或多个激发参数(EP)的所述适应性码本存储器状态(AMS)存储于所述适应性码本存储器(6a)中。3.根据权利要求1所述的音频解码器装置,其中所述一个或多个存储器(6;6a,6b,6c)包括用于存储用来确定用于所述解码的音频帧(AF)的一个或多个合成滤波器参数(SP)的合成滤波器存储器状态(SMS)的合成滤波器存储器(6b);其中,所述存储器状态再取样装置(1)用于通过再取样用来确定用于所述先前解码的音频帧(PAF)的一个或多个合成滤波器参数的先前合成存储器状态(PSMS),确定用来确定用于所述解码的音频帧(AF)的一个或多个合成滤波器参数(SP)的所述合成滤波器存储器状态(SMS),并用于将用来确定用于所述解码的音频帧(AF)的一个或多个合成滤波器参数(SP)的所述合成存储器状态(SMS)存储于所述合成滤波器存储器(6b)中。4.根据权利要求3所述的音频解码器装置,其中所述存储器再取样装置(10)以此方式配置:相同的合成滤波器参数(SP)被用于所述解码的音频帧(AF)的多个子帧。5.根据权利要求3所述的音频解码器装置,其中所述存储器再取样装置(10)以此方式配置:通过将用于所述先前解码的音频帧(PAF)的先前合成滤波器存储器状态(PSMS)变换
至功率谱以及通过再取样所述功率谱,进行所述先前合成滤波器存储器状态(PSMS)的再取样。6.根据权利要求1所述的音频解码器装置,其中所述一个或多个存储器(6;6a,6b,6c)包括用于存储用来确定用于所述解码的音频帧(AF)的一个或多个去加重参数(DP)的去加重存储器状态(DMS)的去加重存储器(6c);其中,所述存储器状态再取样装置(10)用于通过再取样用来确定用于所述先前解码的音频帧(PAF)的一个或多个去加重参数的先前去加重存储器状态(PDMS),确定用来确定用于所述解码的音频帧(AF)的一个或多个去加重参数(DP)的所述去加重存储器状态(DMS),并用于将用来确定用于所述解码的音频帧(AF)的一个或多个去加重参数(DP)的所述去加重存储器状态(DMS)存储于所述去加重存储器(6c)中。7.根据权利要求1所述的音频解码器装置,其中所述一个或多个存储器(6;6a,6b,6c)以此方式配置:用于所述解码的音频帧(AF)的所存储的样本的数量与所述解码的音频帧(AF)的取样率(SR)成比例。8.根据权利要求1所述的音频解码器装置,其中所述存储器状态再取样装置(10)以此方式配置:通过线性内插进行再取样。9.根据权利要求1所述的音频解码器装置,其中所述存储器状态再取样装置(10)用于从所述存储器装置(5)检索用于所述存储器(6;6a,6b,6c)中的一个或多个的先前存储器状态(PMS;PAMS,PSMS,PDMS)。10.根据权利要求1所述的音频解码器装置,其中所述音频解码器装置(1)包括反向滤波装置(17),所述反向滤波装置(17)用于在所述先前取样率(PSR)下的先前解码的音频帧(PAF)的反向滤波,以确定所述存储器(6;6a,6b,6c)中的一个或多个的先前存储器状态(PMS;PAMS,PSMS,PDMS);其中所述存储器状态再取样装置用于从所述反向滤波装置检索用于所述存储器中的一个或多个的先前存储器状态。11.根据权利要求1所述的音频解码器装置,其中所述存储器状态再取样装置用于从另一音频处理装置(26)检索用于所述存储器(6;6a,6b,6c)中的一个或多个的先前存储器状态(PMS;PAMS,PSMS,PDMS)。12.一种用于操作用于对比特流(BS)进行解码的音频解码器装置(1)的方法,所述方法包括步骤:使用预测性解码器(2)从所述比特流(BS)产生解码的音频帧(AF),其中所述预测性解码器(2)包括参数解码器(3),所述参数解码器(3)用于从所述比特流(BS)产生用于所述解码的音频帧(AF)的一个或多个音频参数(AP),以及其中所述预测性解码器(2)包括合成滤波器装置(4),所述合成滤波器装置(4)用于通过合成用于所述解码的音频帧(AF)的一个或多个音频参数(AP)而产生所述解码的音频帧(AF);提供包括一个或多个存储器(6;6a,6b,6c)的存储器装置(5),其中存储器(6;6a,6b,6c)中的每个用于存储用于所述解码的音频帧(AF)的存储器状态(MS;AMS,SMS,DMS),其中所述一个或多个存储器(6;6a,6b,6c)的用于所述解码的音频帧(AF)的存储器状态(MS;AMS,SMS,DMS)被所述合成滤波器装置(4)用来合成用于所述解码的音频帧(AF)的一个或多个音频参数(AP);通过针对所述存储器(6;6a,6b,6c)中的一个或多个再取样用来合成用于先前解码的
音频帧(PAF)的一个或多个音频参数的先前存储器状态(PMS;PAMS,PSMS,PDMS),为所述存储器(6;6a,6b,6c)中的一个或多个确定用来合成用于所述解码的音频帧(AF)的一个或多个音频参数(AP)的存储器状态(MS;AMS,SMS,DMS),所述解码的音频帧(AF)具有取样率(SR),所述先前解码的音频帧(PAF)具有与所述解码的音频帧(AF)的取样率(SR)不同的先前取样率(PSR);以及将用于所述存储器(6;6a,6b,6c)中的一个或多个的用来合成用于所述解码的音频帧(AF)的一个或多个音频参数(AP)的存储器状态(MS;AMS,SMS,DMS)存储于各个存储器中。13.一种计算机程序,当在处理器上运行时,用于执行根据前述权利要求所述的方法。14.一种用于对成帧的音频信号(FAS)进行编码的音频编码器装置,所述音频编码器装置(27)包括:预测性编码器(28),用于从所述成帧的音频信号(FAS)产生编码的音频帧(EAF),其中所述预测...

【专利技术属性】
技术研发人员:斯蒂芬
申请(专利权)人:弗劳恩霍夫应用研究促进协会
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1