本文件涉及音频源编码系统。特别地,本文件涉及与滤波器组结合使用线性预测的音频源编码系统。描述了用于估计音频信号的第一子带中的第一子带信号的第一采样(615)的方法。使用分析滤波器组(612)确定音频信号的第一子带信号,分析滤波器组(612)包括分别提供音频信号的多个子带中的多个子带信号的多个分析滤波器。该方法包括:确定信号模型的模型参数(613);基于信号模型、基于模型参数(613)并且基于分析滤波器组(612),确定预测系数,该预测系数将应用于从第一子带信号推导的第一解码子带信号的先前采样(614);其中,所述先前采样(614)的时隙在第一采样(615)的时隙之前;并且通过将所述预测系数应用于所述先前采样(614)来确定第一采样(615)的估计。
【技术实现步骤摘要】
【国外来华专利技术】
本文件涉及音频源编码系统。特别地,本文件涉及与滤波器组结合使用线性预测 的音频源编码系统。
技术介绍
在用于音频信号的源编码的系统中应用两个重要的信号处理工具,即,临界采样 滤波器组和线性预测。临界采样滤波器组(例如,基于修正离散余弦变换MDCT的滤波器 组)使得能够直接访问时间-频率表示,其中可以利用感知不相干性和信号冗余性。线性 预测使得能够对音频信号,特别是语音信号进行高效的源建模。这两个工具的结合,即,在 滤波器组的子带中使用预测,主要用于高位率音频编码。对于低位率编码,在子带中进行预 测的挑战是,保持用于预测器的描述的成本(即,位率)低。另一挑战是,控制子带预测器 所获得的预测误差信号的所导致的噪声成形。 关于以位高效的方式对子带预测器的描述进行编码的挑战,可能的途径是,从音 频信号的先前解码的部分估计预测器,从而完全避免预测器描述的成本。如果可以从音频 信号的先前解码的部分确定预测器,则可以在不需要将预测器描述从编码器发送到解码器 的情况下,在编码器处以及在解码器处确定预测器。该方案被称为向后自适应预测方案。然 而,当编码的音频信号的位率降低时,向后自适应预测方案通常显著地劣化。子带预测器的 高效编码的替代的或附加的途径是,识别更自然的预测器描述,例如,利用待编码音频信号 的固有结构的描述。例如,低位率语音编码通常应用向前自适应方案,该方案基于短期预测 器(利用短期相关性)和长时预测器(利用由于语音信号的基本音高(underlying pitch) 而导致的长期相关性)的紧凑表示。 关于控制预测误差信号的噪声成形的挑战,观察到,虽然预测器的噪声成形可以 在子带内部被很好地控制,但是编码器的最终输出的音频信号通常表现出混叠伪像(除了 表现出基本上平坦的频谱噪声形状的音频信号之外)。 子带预测器的重要情况是具有重叠窗口的滤波器组中的长期预测的实现。长期预 测器通常利用周期性的和近周期性的音频信号(诸如表现出固有音高的语音信号)的冗余 性,并且可以用单个或少数预测参数描述。长期预测器可以在连续时间内通过反映音频信 号的周期性的延迟来定义。当该延迟与滤波器组窗口的长度相比大时,长期预测器可以在 离散时域中通过平移(shift)或分数延迟来实现,并且可以被转换回子带域中的因果预测 器。这样的长期预测器通常没有表现出混叠伪像,但是对于用于从时域转换到频域的附加 滤波器组操作的需要引起计算复杂度的显著提高。此外,在时域中确定延迟并且将延迟转 换到子带预测器中的方法不适用于待编码音频信号的周期堪比或小于滤波器组窗口大小 的情况。 本文件解决以上提及的子带预测的缺点。特别地,本文件描述使得可以对子带预 测器进行位率高效的描述和/或使得可以减小由子带预测器引起的混叠伪像的方法和系 统。特别地,本文件中描述的方法和系统使得能够实现低位率的使用子带预测的音频编码 器,这些音频编码器使得混叠伪像的水平降低。
技术实现思路
本文件描述改进在临界采样滤波器组的子带域中利用预测的音频源编码的质量 的方法和系统。这些方法和系统可以使用子带预测器的紧凑描述,其中,该描述是基于信号 模型的。可替代地或者附加地,这些方法和系统可以直接在子带域中使用预测器的高效实 现。可替代地或者附加地,这些方法和系统可以使用如本文件中所描述的交叉子带预测器 项来使得可以减小混叠伪像。 如本文件中所概述的,子带预测器的紧凑描述可以包括正弦曲线的频率、周期信 号的周期、刚硬弦线的振动所遇到的轻微非谐波的频谱、和/或用于多音信号的多个音高。 已经表明,对于长期预测器的情况,周期信号模型为一系列滞后参数(或延迟)提供高质量 因果预测器,该系列滞后参数包括比滤波器组的窗口大小短和/或长的值。这意味着,周期 信号模型可以用于以高效的方式实现长期子带预测器。提供从基于正弦模型的预测到任意 延迟的逼近的无缝转变。子带域中的预测器的直接实现使得能够明确地访问所生成的量化 失真的感知特性。此外,子带域中的预测器的实现使得能够访问诸如预测增益的数值属性 和预测器对参数的依赖性。例如,基于信号模型的分析可以揭示,预测增益只有在所考虑的 子带的子集中是显著的,并且作为被选择用于传输的参数的函数的、预测器系数的变化对 于参数格式的设计以及高效的编码算法可以是有帮助的。而且,与依赖于在时域和子带域 两者中操作的算法的使用的预测器实现相比,计算复杂度可以显著地降低。特别地,本文件 中所描述的方法和系统可以用于在子带域中直接实现子带预测,而不需要在时域中确定和 应用预测器(例如,长期延迟)。 与带内预测器(其仅依赖于带内预测)相比,子带预测器中的交叉子带项的使用 使得能够显著地改进频域噪声整形特性。通过这样做,可以减小混叠伪像,从而使得能够将 子带预测用于相对低位率的音频编码系统。 根据一方面,描述了一种用于估计音频信号的第一子带的第一采样的方法。音频 信号的第一子带可能已经使用分析滤波器组确定,所述分析滤波器组包括从音频信号分别 提供多个子带中的多个子带信号的多个分析滤波器。时域音频信号可以被提交给分析滤波 器组,从而得到多个子带中的多个子带信号。所述多个子带中的每个通常覆盖音频信号的 不同频率范围,从而提供对于音频信号的不同频率分量的访问。所述多个子带可以具有相 等的或均匀的子带间隔。第一子带对应于分析滤波器组所提供的多个子带之一。 分析滤波器组可以具有各种特性。包括多个合成滤波器的合成滤波器组可以具有 类似的或相同的特性。对于分析滤波器组和分析滤波器描述的特性也可适用于合成滤波 器组和合成滤波器的特性。通常,分析滤波器组和合成滤波器组的结合使得可以完美地重 构音频信号。分析滤波器组的分析滤波器可以相对于彼此是平移不变(shift invariant) 的。可替代地或者附加地,分析滤波器组的分析滤波器可以包括共用窗口函数。特别地,分 析滤波器组的分析滤波器可以包括共用窗口函数的不同调制版本。在实施例中,使用余弦 函数对共用窗口函数进行调制,从而得到余弦调制的分析滤波器组。特别地,分析滤波器组 可以包括(或者可以对应于)以下中的一个或多个:MDCT、QMF和/或ELT变换。共用窗口 函数可以具有有限的持续时间K。共用窗口函数的持续时间可以为使得子带信号的随后的 采样使用时域音频信号的重叠分段而被确定。就这点而论,分析滤波器组可以包括重叠变 换。分析滤波器组的分析滤波器可以形成正交和/或标准正交基础。作为进一步的特性, 分析滤波器组可以对应于临界采样滤波器组。特别地,所述多个子带信号的采样的数量可 以对应于时域音频信号的采样的数量。 所述方法可以包括确定信号模型的模型参数。应指出,可以使用多个模型参数来 描述信号模型。就这点而论,所述方法可以包括确定信号模型的所述多个模型参数。可以 从所接收的包括或者指示模型参数和预测误差信号的位流提取模型参数。可替代地,可以 通过例如使用均方差方法(例如,逐帧地)使信号模型拟合音频信号来确定模型参数。 信号模型可以包括一个或多个正弦模型分量。在这样的情况下,模型参数可以指 示所述一个或多个正弦模型分量的一个或多个频率。举例来说,模型参数可以指示多正弦 信号模型的基本频率Ω,其中,多正弦信号包括与基本频率Ω的倍数q本文档来自技高网...
【技术保护点】
一种用于估计音频信号的第一子带中的第一子带信号的第一采样(615)的方法;其中,使用分析滤波器组(612)确定所述音频信号的第一子带信号,所述分析滤波器组(612)包括分别从所述音频信号提供多个子带中的多个子带信号的多个分析滤波器,所述方法包括:‑确定信号模型的模型参数(613);‑基于所述信号模型,基于所述模型参数(613)并且基于所述分析滤波器组(612),确定将应用于从所述第一子带信号推导的第一解码子带信号的先前采样(614)的预测系数;其中,所述先前采样(614)的时隙在所述第一采样(615)的时隙之前;和‑通过将所述预测系数应用于所述先前采样(614)来确定所述第一采样(615)的估计。
【技术特征摘要】
【国外来华专利技术】...
【专利技术属性】
技术研发人员:L·维尔莫斯,
申请(专利权)人:杜比国际公司,
类型:发明
国别省市:荷兰;NL
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。