用于通过使用频谱模式有效合成正弦曲线和扫描的设备及方法技术

技术编号:12028989 阅读:151 留言:0更新日期:2015-09-10 14:39
提供了一种基于编码音频信号频谱生成音频输出信号的设备。该设备包括处理单元(115),其用于对编码音频信号频谱进行处理,以获得包括多个频谱系数的解码音频信号频谱,其中,每个频谱系数具有频谱值和在编码音频信号频谱内的频谱位置,其中,频谱系数根据其在编码音频信号频谱内的频谱位置被依次排序,使得频谱系数形成频谱系数序列。此外,该设备包括伪系数确定器(125),其用于确定解码音频信号频谱的一个或更多个伪系数,每个伪系数具有频谱值。此外,该设备包括替换单元(135),其用于用确定的频谱模式替换至少一个或更多个伪系数,以获得修改的音频信号频谱,其中,确定的频谱模式包括至少两个模式系数,其中,该至少两个模式系数中的每一个具有频谱值。此外,该设备包括频谱时间转换单元(145),其用于将修改的音频信号频谱转换至时域,以获得音频输出信号。

【技术实现步骤摘要】
【国外来华专利技术】【专利说明】用于通过使用频谱模式有效合成正弦曲线和扫描的设备及 方法 本专利技术涉及音频信号编码、解码和处理,并且具体地涉及通过使用频谱模式有效 合成正弦曲线和扫描。 音频信号处理变得越来越重要。由于现代感知音频编解码器被要求以越来越低的 比特率来传送满意的音频质量,所以出现了挑战。另外,例如对于双向通信应用或分布式游 戏等而言,可允许的延迟通常也很低。 现代波形保留变换音频编码器通常伴随着参数化编码增强如噪声替换或带宽扩 展。除了这些熟知的参数化工具以外,可能还期望在这样的解码器中根据参数化边信息来 合成正弦音调。计算复杂度始终是编解码器发展中的重要标准,原因在于:对于编解码器的 广泛接受和部署而言,低复杂度是必要的。因此,需要的是生成这些音调的有效方式。 例如,虽然MPEG-D USAC(MPEG-D =运动图像专家组-D ;USAC =统一语音和音频编 码)音频编解码器通常在时域预测编码和变换域编码之间进行切换,然而音乐内容仍然主 要在变换域中进行编码。在低比特率如<14kbit/s时,音乐项目中的音调成分在通过变换 编码器进行编码时通常不好听,这使得以足够的质量对音频进行编码的任务甚至更具有挑 战性。 另外,低延迟约束一般引起变换编码器的滤波器组的次优频率响应(原因是低延 迟优化窗口形状和/或变换长度),并且因此进一步损害这样的编解码器的感知质量。 根据传统心理声学模型,对关于量化噪声的透明度的先决条件进行了定义。在高 比特率的情况下,这与遵守人类听觉掩蔽等级的量化噪声的感知适配最佳时间/频率分布 有关。然而,在低比特率的情况下,无法实现透明度。因此,在低比特率的情况下,可以使用 掩蔽等级要求降低策略。 已经针对音乐内容提供了一流的编解码器,具体地为基于改进的离散余弦变换 (MDCT)的变换编码器,其在频域中量化并传输频谱系数。然而,在数据速率非常低的情况 下,每个时间帧中的仅很少的频谱线可以通过该帧的可用的比特进行编码。因此,时间调制 伪声和所谓的颤音伪声不可避免地被引入编码信号中。 最显著地,在拟稳态音调成分中可以感知到这些类型的伪声。如果由于延迟约束 而必须选择由于公知的泄露效应会在相邻频谱系数(频谱展宽)之间引入显著串扰的变换 窗口形状,则尤其出现该情形。然而,尽管如此,通常这些相邻频谱系数中的仅一个或几个 在由低比特率编码器进行粗量化之后,仍然保持为非零。 如上所述,根据现有技术中的一种方法,使用变换编码器。非常适合于对音乐内容 进行编码的现代高压缩率音频编解码器全部依靠于变换编码。最突出的示例是MPEG2/4高 级音频编码(AAC)和MPEG-D统一语音和音频编码(USAC)。USAC具有切换式核心,该切换 式核心与主要意图用于语音编码的代数码激发线性预测(ACELP)模块加上变换编码激励 (TCX)模块(参见) -致,并且替代地,与主要意图用于对音乐进行编码的AAC-致。如 同AAC -样,TCX也是基于变换的编码方法。在低比特率设置的情况下,这些编码方案容易 展现出颤音伪声,尤其在基本编码方案基于改进的离散余弦变换(MDCT)(参见)的情况 下。 对于音乐再现而言,变换编码器是用于音频数据压缩的优选技术。然而,在低比特 率的情况下,传统变换编码器展现出强颤音和粗糙伪声。大多数伪声来源于过度稀疏编码 的音调频谱成分。在通过次优的频谱变换功能(泄露效应)对这些频谱成分进行频谱涂抹 的情况下,此情形尤其发生,该次优的频谱变换功能主要被设计成满足严格的延迟约束。 根据现有技术中的另一种方法,对于瞬变、正弦曲线和噪声而言,编码方案是完全 参数化的。具体地,对于中比特率和低比特率,完全参数化音频编解码器已经被标准化,其 中最突出的是:MPEG-4第三部分,第七子部分,谐波和特征线加噪声(HILN)(参见)以 及MPEG-4第三部分,第八子部分,正弦编码(SSC)(参见)。然而,参数化编码器遭受令 人不舒服的伪声,并且随着比特速率增加,参数化编码器不会很好地调整以接近感知透明 度。 另一种方法提供混合波形和参数化编码。在中,提出了基于变换的波形编码 和MPEG 4-SSC(仅正弦部分)的混合。在迭代的过程中,提取正弦曲线且从信号中减去正弦 曲线来形成残差信号,进而要通过变换编码技术进行编码。所提取的正弦曲线通过参数集 进行编码且与残差一起进行传输。在中,提供了一种分别对正弦曲线和残差进行编码 的混合编码方法。在中,在所谓的受限能量交叠变换(CELT)编解码器/重影网页处, 描绘了利用振荡器组进行混合编码的思想。然而,通过与解码器并行运行并且其输出在时 域中与解码器的合成滤波器组的输出进行混合的振荡器组来生成伪音调意味着巨大的计 算负担,因为很多振荡器必须以高采样率并行地进行计算。计算复杂度始终是编解码器发 展和部署中的重要标准,因此需要的是生成这些音调的更有效的方式。 在中比特率或较高比特率的情况下,变换编码器由于其自然的声音而非常适用于 对音乐进行编码。其中,基础心理声学模型的透明度要求得以完全满足或几乎完全满足。然 而,在低比特率的情况下,编码器不得不严重违反心理声学模型的要求,并且在这样的情形 下,变换编码器易于发生颤音伪声、粗糙伪声和音乐噪声伪声。 尽管完全参数化音频编解码器最适合于较低的比特率,但是,已知的是这些音频 编解码器发出令人不舒服的伪声。此外,这些编解码器并不无缝地调整至感知透明度,因为 相当粗糙的参数化模型的逐步细化并不可行。 混合波形和参数化编码可以潜在地克服个别方法的限制,并且可以潜在地受益于 两种技术的相互正交的特性。然而,在当前的先进技术下,混合波形和参数化编码由于混合 编解码器的变换编码部分与参数化部分之间缺乏相互作用而受到阻碍。问题涉及:参数化 部分与变换编解码器部分之间的信号分割、变换部分与参数化部分之间的比特预算操控、 用信号发出参数的技术以及参数化输出与变换编解码器输出的无缝合并。 本领域中另外的先前出版物涉及直接在时域中合成正弦音调,或在DFT频域中合 成逐段恒定的音调,并且涉及在DFT域中对截断模式的SNR最优化。已经描述了 在感知编解码器环境中基于MDCT频谱嵌入逐段恒定频率音调或带宽拓展情形。 然而,似乎既没有解决在MDCT域中对扫描及其与无缝轨迹的链接的有效生成,也没有解决 在参数空间中对可用自由度的合理限制的定义。本专利技术的目的是提供用于混合音频解码的改进概念。本专利技术的目的由以下项来实 现:根据权利要求1所述的设备、根据权利要求14所述的设备、根据权利要求20所述的方 法、根据权利要求21所述的方法以及根据权利要22所述的计算机程序。 提供了一种基于编码音频信号频谱生成音频输出信号的设备。 该设备包括处理单元,其用于对编码音频信号频谱进行处理,以获得包括多个频 谱系数的解码音频信号频谱,其中,每个频谱系数具有频谱值和在编码音频信号频谱内的 频谱位置,其中,频谱系数根据其在编码音频信号频谱内的频谱位置依次被排序,使得频谱 系数形成频谱系数序列。 此外,该设备包括伪系数确定器,其用于确定解码音频信号频谱的一个或更多个 伪系数,每个伪系数具有频谱位置和频谱值。 此外,该设备包括替换单元,其通过确定的频谱模式来替换至少一个或更多个伪本文档来自技高网...

【技术保护点】
一种基于编码音频信号频谱生成音频输出信号的设备,其中,所述设备包括:处理单元(115),用于对所述编码音频信号频谱进行处理以获得包括多个频谱系数的解码音频信号频谱,其中,每个所述频谱系数具有频谱值和在所述编码音频信号频谱内的频谱位置,其中,所述频谱系数根据所述频谱系数在所述编码音频信号频谱内的频谱位置被依次排序,使得所述频谱系数形成频谱系数序列,伪系数确定器(125),用于确定所述解码音频信号频谱的一个或更多个伪系数,其中,每个所述伪系数是所述频谱系数中的一个,替换单元(135),用于用确定的频谱模式替换至少一个或更多个伪系数以获得修改的音频信号频谱,其中,所述确定的频谱模式包括至少两个模式系数,其中,所述至少两个模式系数中的每一个具有频谱值,以及频谱时间转换单元(145),用于将所述修改的音频信号频谱转换至时域以获得所述音频输出信号。

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:萨沙·迪施本亚明·舒伯特拉尔夫·热日尔贝恩德·埃德勒马丁·迪策尔
申请(专利权)人:弗兰霍菲尔运输应用研究公司
类型:发明
国别省市:德国;DE

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1