If the synthetic window used to reduce the audio decoding is the following sample version of the reference synthesis window involved in the non reduced audio decoding process, the reduced version of the audio decoding process can be more effectively maintained with / or improved compatibility, in which the downsampled version is sampled according to the downsampling factor. The segmented interpolation of frame length 1/4 is used, and the down sampling factor represents the deviation of the sampling rate and the original sampling rate of the down sampling.
【技术实现步骤摘要】
【国外来华专利技术】缩减解码
本申请涉及缩减(downscaled)解码构思。
技术介绍
MPEG-4增强型低延迟AAC(AAC-ELD)通常以高达48kHz的采样率操作,导致15ms的算法延迟。对于某些应用,例如音频的唇音同步(lip-sync)传输,期望更低的延迟。AAC-ELD已经通过以更高的采样率(例如,96kHz)操作来提供这样的选择,从而提供具有更低延迟(例如,7.5毫秒)的操作模式。但是,这种操作模式由于采样率高而带来不必要的高复杂度。该问题的解决方案是应用滤波器组的缩减版本,并且从而以较低的采样率(例如,48kHz,而不是96kHz)来渲染音频信号。缩减操作已经是AAC-ELD的一部分,因为它是从作为AAC-ELD基础的MPEG-4AAC-LD编解码器继承而来的。但是,仍然存在的问题是如何找到特定滤波器组的缩减版本。也就是说,唯一的不确定因素是在支持对AAC-ELD解码器的缩减操作模式的清楚的一致性测试的同时推导窗系数的方式。在下文中,描述AAC-(E)LD编解码器的缩减操作模式的原理。在ISO/IEC14496-3:2009的第4.6.17.2.7节“对采用较低采样率的系统的适配”中描述了针对AAC-LD的缩减操作模式或AAC-LD,描述如下:“在某些应用中,可能有必要将低延迟解码器集成到以较低采样率(例如16kHz)运行但比特流有效载荷的标称采样率要高得多(例如48kHz,对应于算法编解码器延迟约20毫秒)的音频系统中。在这种情况下,有利的是直接以目标采样率解码低延迟编解码器的输出,而不是在解码之后使用附加采样率转换操作。这可以通过将帧尺寸和采样率两者适当 ...
【技术保护点】
一种音频解码器(10),被配置为以第一采样率从数据流(24)解码音频信号(22),所述音频信号(22)是以第二采样率变换编码到所述数据流中的,所述第一采样率是所述第二采样率的1/F,所述音频解码器(10)包括:接收器(12),被配置为接收所述音频信号的每帧的N个频谱系数(28),其中帧的长度为N;抓取器(14),被配置为针对每个帧从所述N个频谱系数(28)中抓取长度为N/F的低频分量;频谱‑时间调制器(16),被配置为针对每个帧(36),使所述低频分量经过逆变换以获得长度为(E+2)·N/F的时间部分,其中所述逆变换具有在时间上在相应帧以及E+1个先前帧上延伸的长度为(E+2)·N/F的调制函数;加窗器(18),被配置为针对每个帧(36)使用长度为(E+2)·N/F的合成窗口为所述时间部分加窗,所述合成窗口包括在其前端的长度为1/4·N/F的零部分,并且在所述合成窗口的一时间间隔内具有峰值,所述时间间隔在所述零部分之后并且具有长度7/4·N/F,使得所述加窗器获得长度为(E+2)·N/F的经加窗的时间部分;以及时域混叠消除器(20),被配置为使所述帧的经加窗的时间部分经过重叠相加处理, ...
【技术特征摘要】
【国外来华专利技术】2015.06.16 EP 15172282.4;2015.10.12 EP 15189398.91.一种音频解码器(10),被配置为以第一采样率从数据流(24)解码音频信号(22),所述音频信号(22)是以第二采样率变换编码到所述数据流中的,所述第一采样率是所述第二采样率的1/F,所述音频解码器(10)包括:接收器(12),被配置为接收所述音频信号的每帧的N个频谱系数(28),其中帧的长度为N;抓取器(14),被配置为针对每个帧从所述N个频谱系数(28)中抓取长度为N/F的低频分量;频谱-时间调制器(16),被配置为针对每个帧(36),使所述低频分量经过逆变换以获得长度为(E+2)·N/F的时间部分,其中所述逆变换具有在时间上在相应帧以及E+1个先前帧上延伸的长度为(E+2)·N/F的调制函数;加窗器(18),被配置为针对每个帧(36)使用长度为(E+2)·N/F的合成窗口为所述时间部分加窗,所述合成窗口包括在其前端的长度为1/4·N/F的零部分,并且在所述合成窗口的一时间间隔内具有峰值,所述时间间隔在所述零部分之后并且具有长度7/4·N/F,使得所述加窗器获得长度为(E+2)·N/F的经加窗的时间部分;以及时域混叠消除器(20),被配置为使所述帧的经加窗的时间部分经过重叠相加处理,使得当前帧的经加窗的时间部分的长度为(E+1)/(E+2)的尾端分量与前一帧的经加窗的时间部分的长度为(E+1)/(E+2)的前端重叠,其中所述逆变换是逆MDCT或逆MDST,以及其中所述合成窗口是对长度为(E+2)·N的参考合成窗口按照因子F进行下采样且按照长度为1/4·N的分段进行分段内插获得的下采样版本。2.根据权利要求1所述的音频解码器(10),其中,所述合成窗口是长度为1/4·N/F的样条函数的级联。3.根据权利要求1或2所述的音频解码器(10),其中,所述合成窗口是长度为1/4·N/F的三次样条函数的级联。4.根据前述权利要求中任一项所述的音频解码器(10),其中E=2。5.根据前述权利要求中任一项所述的音频解码器(10),其中所述逆变换是逆MDCT。6.根据前述权利要求中任一项所述的音频解码器(10),其中,所述合成窗口的大小的80%以上被包括在所述零部分之后并且具有长度7/4·N/F的所述时间间隔内。7.根据前述权利要求中任一项所述的音频解码器(10),其中,所述音频解码器(10)被配置为执行所述内插或者从存储器导出所述合成窗口。8.根据前述权利要求中任一项所述的音频解码器(10),其中,所述音频解码器(10)被配置为支持F的不同值。9.根据前述权利要求中任一项所述的音频解码器(10),其中F在1.5和10之间,且包括1.5和10。10.根据前述权利要求中任一项所述的音频解码器(10),其中,所述参考合成窗口是单峰的。11.根据前述权利要求中任一项所述的音频解码器(10),其中,所述音频解码器(10)被配置为以如下方式执行所述内插:所述合成窗口的系数中的大部分取决于所述参考合成窗口的系数中的多于两个。12.根据前述权利要求中任一项所述的音频解码器(10),其中,所述音频解码器(10)被配置为以如下方式执行所述内插:所述合成窗口的被多于来自分段边界的两个系数所分隔的每个系数取决于所述参考合成窗口的系数中的两个。13.根据前述权利要求中任一项所述的音频解码器(10),其中,所述加窗器(18)和所述时域混叠消除器进行协作,使得所述加窗器在使用所述合成窗口对所述时间部分进行加权时跳过所述零部分,并且所述时域混叠消除器(20)在重叠相加处理中不考虑经加窗的时间部分的相应非加权部分,于是仅E+1个经加窗的时间部分被求和,从而导致相应帧的相应非加权部分和E+2个经加窗的部分在相应帧的剩余部分内被求和。14.一种用于生成根据前述权利要求中任一项所述的音频解码器(10)的合成窗口的缩减版本的音频解码器,其中E=2,使得所述合成窗口函数包括长度为2·N/F的与内核相关的一半,该与内核相关的一半之前是长度为2·N/F的另一半,并且其中所述频谱-时间调制器(16)、所述加窗器(18)和所述时域混叠消除器(20)被实现为在提升实现中进行协作,根据所述提升实现:所述频谱-时间调制器(16)将针对每个帧(36)使低频分量经过逆变换限制在与相应帧和一个先前帧一致的变换内核,从而获得时间部分xk,n,其中n=0...2M-1,且M=N/F是采样索引,k是帧索引,其中所述逆变换具有时间上在相应帧以及E+1个先前帧上延伸的长度为(E+2)·N/F的调制函数;所述加窗器(18)针对每个帧(36)根据zk,n=ωn·xk,n,n=0,...,...
【专利技术属性】
技术研发人员:马库斯·施内尔,曼弗雷德·卢茨基,埃伦尼·福托普楼,康斯坦丁·施密特,康拉德·本多夫,阿德里安·托马舍克,托比亚斯·艾伯特,蒂蒙·塞德尔,
申请(专利权)人:弗劳恩霍夫应用研究促进协会,
类型:发明
国别省市:德国,DE
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。