在编码器中,用于产生前向混叠消除(FAC)参数的方法,所述FAC参数用于消除由在具有重叠窗口的使用第一编码模式的第一变换编码帧和具有非重叠窗口的使用第二编码模式的第二帧之间的转换对在所述第一变换编码帧中的编码音频信号造成的时域混叠,包括:计算表示编码前的第一帧的音频信号和第一变换编码帧的编码音频信号的合成之间的差的FAC目标;以及加权所述FAC目标以产生所述FAC参数。在解码器中,加权的前向混叠消除(FAC)参数被接收并逆加权,以产生FAC合成。基于所述第一帧中的编码音频信号的合成,使用所述FAC合成从所述音频信号合成中消除所述时域混叠。
【技术实现步骤摘要】
【国外来华专利技术】
本公开涉及编码和解码音频信号领域。更具体地,本公开涉及在编码音频信号中的时域混叠消除。
技术介绍
音频编码技术发展水平为了数据简化,以一种有意义的方式,使用时频分解来表示信号。更具体地,音频编码器使用变换以执行将时域样本到频域系数的映射。用于这种时间-频率映射的离散时间变换通常基于正弦函数内核,诸如离散傅里叶变换(DFT)和离散余弦变换(DCT)。可以显示的是,这样的变换实现音频信号的能量紧致(compaction)。能量紧致意味着,在变换(或频率)域内,相比于在时域样本中,能量分布被局部化在更少的重要(significant)频域系数中。接着可以通过将自适应比特分配(adaptive bit allocation)以及适当的量化施加于频域系数,而实现编码增益。在接收端,表示量化和编码的参数(包 括频域系数)的比特用以恢复量化的频域系数(或其它量化数据,诸如增益),并且逆变换产生时域音频信号。这种编码方案通常被称为变换编码。通过定义,变换编码在输入音频信号样本的连续块(通常称为“帧”)上操作。由于量化在每个音频信号的合成块中引入某些失真,使用非重叠块可能在块边界处引入中断,其可能降低音频信号的质量。因此,在变换编码中,为了避免中断,在应用变换之前将音频信号的编码块重叠,并且在重叠片段中适当开窗以允许从样本的一个解码块平滑转换(transition)到下一个。很遗憾,使用诸如DFT(或其快速等价的快速傅里叶变换(FFT))或DCT的变换并将其应用到样本的重叠块导致所谓的“非临界(non-critical)采样”。例如,采取典型的50%重叠的情况,编码N个连续时域样本的块实际上要求对2N个连续样本进行变换,2N个连续样本包括N个来自当前块的样本和N个来自前一个块和下一个块的重叠部分的样本。因此,对于每N个时域样本的块,编码2N个频域系数。频域中的临界(critical)采样意味着N个输入时域样本仅产生N个频域系数以进行量化和编码。已经设计了专门的变换以允许使用重叠窗口并且在变换域中仍然保持临界采样。用这种专门的变换,变换输入的2N个时域样本导致变换输出的N个频域系数。为了实现这点,首先通过特殊的时间反演(time inversion)、在窗口的一端为2N个样本长加窗(windowed)信号的特定部分进行求和、以及在窗口的另一端2N个样本长加窗信号的特定部分彼此相减,将2N个时域样本的块减少为N个时域样本的块。这些特殊的时间反演、求和和减法引入所谓的“时域混叠(time-domain aliasing, TDA)”。一旦将TDA引入音频信号样本的块中,将不能仅使用该块将其移除。是作为大小为N (而不是2N)的变换的输入的这个时域混叠的信号产生N个变换的频域系数。为了恢复N个时域样本,在称为“时域混叠消除(TDAC)”的过程中,逆变换使用来自两个连续并重叠的帧或块的变换系数,以抵消TDA。被广泛使用于音频编码中的这样的应用TDAC的变换的示例是改进的离散余弦变换(MDCT)。实际上,MDCT引入TDA而没有时域中的显式(explicit)折叠。实际上,当考虑样本的单个块的直接(direct)MDCT和逆MDCT (MDCT)这二者时,会引入时域混叠。这来自于MDCT的数学构造并且为本领域普通技术人员众所周知。然而还已知的是,该隐式(implicit)时域混叠可视为等同于时域样本的第一个反向部分并且将这个反向部分加上(或减去)信号的其它部分。这称为“折叠”。当音频编码器在一个使用TDAC而另一个不使用TDAC的两种编码模式之间切换时,会产生问题。例如,假设编解码器(codec)从TDAC编码模式切换到非TDAC编码模式。使用TDAC编码模式编码的样本块的一侧(其对不使用TDAC编码的块是公用的)包含TDA,其不能用使用非TDAC编码模式编码的样本块抵消。第一种解决方案是丢弃包含不能被抵消的混叠的样本。该第一种解决方案导致传输带宽的低效使用,这是因为TDA不能被抵消的样本块被编码两次,一次是由基于TDAC的编解码器编码,第二次是由基于非TDAC的编解码器编码。第二种解决方案是使用特殊设计的窗口,当应用时间反演和求和/减法过程时, 在窗口的至少一个部分中不引入TDA。图I是在其左侧引入TDA而没有在其右侧引入TDA的2N个样本窗口的不例的不意图。图I的窗口 100对于从基于TDAC的编解码器转换到基于非TDAC的编解码器是有用的。窗口 100的前半部分被成形(shape),从而它引入TDA 110,如果前一个窗口也使用具有重叠的TDA,则TDA 110可以被消除。然而,图I中的窗口 100右侧,在3N/2位置上的折叠点之后具有零值区域120。因此当在3N/2位置上的折叠点周围执行时间反演和求和/减法(或折叠)过程时,窗口 100的这个区域120不引入任何TDA。如图I所示,窗口 100包含平坦区域130,之前为左侧锥形区域140。锥形区域140的目的是当计算变换时提供良好的光谱分辨率以及在相邻块之间的重叠和相加操作期间平滑转换。增加窗口 100的平坦区域130的持续时间会减少信息的开销。然而,由于区域120中仅传达零值样本信息,所以区域120会降低窗口 100光谱性能。因此,例如在多模动态图象专家组(Moving Pictures Expert Group, MPEG)联合语音音频编解码器(Unified Speech and Audio Codec, USAC)中,需要有用的改善的TDAC技术,以管理在使用矩形非重叠窗口的帧和使用非矩形重叠的窗口的帧之间的转换,同时确保适当的光谱分辨率、数据开销减少并且在这些不同的帧类型之间的转换的平滑。
技术实现思路
因此,需要用于支持编码模式之间的切换的混叠消除技术,其中所述技术在这些模式之间的切换点上补偿混叠效应。因此,根据第一个方面,提供了一种用于产生前向混叠消除(forward aliasingcancellation, FAC)参数的方法,所述FAC参数用于消除由在具有重叠窗口的使用第一编码模式的第一变换编码帧和具有非重叠窗口的使用第二编码模式的第二帧之间的转换对在所述第一变换编码帧中的编码音频信号造成的时域混叠,包括计算表示编码前的第一帧的音频信号和第一变换编码帧的编码音频信号的合成之间的差的FAC目标;以及加权所述FAC目标以产生所述FAC参数。根据第二个方面,提供了一种用于前向消除时域混叠的方法,所述时域混叠是由在具有重叠窗口的使用第一编码模式的第一变换编码帧和具有非重叠窗口的使用第二编码模式的第二帧之间的转换对在所述第一变换编码帧中的编码音频信号造成的时域混叠,所述方法包括接收加权的前向混叠消除(FAC)参数;逆加权所述加权的FAC参数,以产生FAC合成;以及基于所述第一帧中的编码音频信号的合成,使用所述FAC合成从所述音频信号合成中消除所述时域混叠。根据第三个方面,提供了用于产生前向混叠消除(FAC)参数的设备,用于消除由在具有重叠窗口的使用第一编码模式的第一变换编码帧和具有非重叠窗口的使用第二编码模式的第二帧之间的转换对在所述第一变换编码帧中的编码音频信号造成的时域混叠,包括FAC目标计算器,该FAC目标表示编码前的第一帧的音频信号和第一变换编本文档来自技高网...
【技术保护点】
【技术特征摘要】
【国外来华专利技术】...
【专利技术属性】
技术研发人员:B贝塞特,
申请(专利权)人:沃伊斯亚吉公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。