用于改善对多声道音频信号的呈现的方法和设备技术

技术编号:11191119 阅读:128 留言:0更新日期:2015-03-25 19:46
传统的音频压缩技术执行标准化的信号变换,与内容的类型无关。多声道信号被分解为它们的信号分量,随后进行量化和编码。由于缺少对场景构成的特性的了解,所述方法是不利的,尤其对于例如多声道音频或高阶立体声(HOA)内容。一种用于对预处理处理的音频数据进行编码的改善方法包括:对预处理的音频数据进行编码;以及对辅助数据进行编码,所述辅助数据表示特定的音频预处理。一种用于对编码的音频数据进行解码的改善方法包括:确定在编码之前是否已经对音频数据进行预处理;对音频数据进行解码;从接收到的数据提取与预处理有关的信息;以及根据所提取的预处理的信息,对解码的音频数据进行后处理。

【技术实现步骤摘要】
【国外来华专利技术】用于改善对多声道音频信号的呈现的方法和设备
[0001 ] 本专利技术的领域为音频压缩,具体地多声道音频信号和以声场为导向的音频场景的 压缩,例如高阶立体声(HOA)。
技术介绍
目前,多声道音频信号的压缩方案不能明确地考虑输入的音频材料是如何制作或 混合的。因此,已知的音频压缩技术无法获知他们将进行压缩的内容的原始/混合类型。在 已知方法中,执行盲信号变换,通过所述变换将多声道信号分解为随后进行量化和编码 的信号分量。这种方法的缺点在于对上述信号分解的计算是要求计算能力的,针对给定片 段的音频场景,寻找最适合的和最有效的信号分解是困难的并且易于出错。
技术实现思路
本专利技术涉及一种用于改善多声道音频呈现的方法和设备。 发现至少一部分上述缺点是由于缺少关于场景组成的特性的先验知识而导致的。 尤其对于空间音频内容(例如,多声道音频或高阶立体声(HOA)内容),这种现有信息有助 于采用压缩方案。例如,压缩算法中的通用预处理步骤是音频场景分析,目的是从原始内容 或原始内容混合中提取定向的音频源或音频对象。可以与残余空间音频分量分离地对这种 定向的音频源或音频对象进行编码。 在一个实施例中,用于对预处理的音频数据进行编码的方法包括以下步骤:对预 处理的音频数据进行编码;以及对辅助数据进行编码,所述辅助数据表示对音频数据的特 定音频进行预处理。 在一个实施例中,本专利技术涉及一种用于对编码的音频数据进行解码的方法,包括 以下步骤:确定在编码之前是否已经对音频数据进行预处理;对音频数据进行解码;从接 收到的数据提取与预处理有关的信息;以及根据所提取的预处理信息,对解码的音频数据 进行后处理。可以通过分析音频数据或通过分析伴随的元数据,来实现所述确定在编码之 前是否已经对音频数据进行预处理的步骤。 在本专利技术的一个实施例中,用于对预处理的音频数据进行编码的编码器包括:第 一编码器,用于对预处理的音频数据进行编码;以及第二编码器,用于对辅助数据进行编 码,所述辅助数据表示对音频数据的特定音频进行预处理。 在本专利技术的一个实施例中,用于对编码的音频数据进行解码的解码器包括:分析 器,用于确定在编码之前是否已经对音频数据进行预处理;第一解码器,用于对所述音频数 据进行解码;数据流解析单元或数据流提取单元,用于从接收到的数据提取与预处理有关 的信息;以及处理单元,用于根据所提取的预处理信息对解码的音频数据进行后处理。 在本专利技术的一个实施例中,计算机可读介质将可执行指令存储在其上,以便引起 计算机执行根据上述方法中的至少一个的方法。 本专利技术的总体构思是基于对多声道音频压缩系统的以下扩展中的至少一个的: 根据一个实施例,多声道音频压缩和/或呈现系统具有接口,所述接口包括多声 道音频信号流(例如,PCM流)、声道或相应扬声器的相关空间位置以及表示向多声道音频 信号流施加的混合的类型的元数据。混合类型表示例如(在先)使用或配置和/或HOA或 VBAP平移的任何详情、特定记录技术或等同信息。所述接口可以是信号传输链的输入接口。 在HOA内容的情况下,扬声器的空间位置可以是虚拟扬声器的位置。 根据一个实施例,多声道压缩编解码器的比特流包括信令信息和后续的呈现算 法,所述信令信息向解码器传输与虚拟或实际扬声器位置和原始混合信息有关的上述元数 据。从而,可以调整任何施加在解码侧上的任何呈现技术,以便适应所述具体传输内容的编 码侧上的特定混合特性。 在一个实施例中,元数据的使用是可选的并且是可以接通或关断的。即,可以按 照不使用元数据的简单模式来解码和呈现音频内容,但是在所述简单模式下,所述解码和/ 或呈现不是优化的。在增强模式下,可以通过使用元数据实现优化的解码和/或呈现。在 该示例中,解码器/呈现器可以在两个模式之间切换。 【附图说明】 参考附图描述了本专利技术的有利示例实施例,附图中: 图1是已知多声道传输系统的结构; 图2是根据本专利技术的一个实施例的多声道传输系统的结构; 图3是根据本专利技术的一个实施例的智能解码器; 图4是针对HOA信号的多声道传输系统的结构; 图5是DSHT的空间采样点; 图6是针对在编码器和解码器结构框中使用的码本的球面采样位置的示例;以及 图7是特别改善的多声道音频编码器的示例实施例。 【具体实施方式】 图1示出了多声道音频编码的已知方法。在多声道音频编码器20中对来自音频 制作阶段10的音频数据进行编码,并在多声道音频解码器30中对其进行传输和解码。可 以明确地传输元数据(或可以隐含地包括它们的信息),所述元数据与空间音频成份相关。 这种传统元数据局限于与扬声器的空间位置有关的信息,例如特定格式的形式(例如,立 体声或ITU-R BS. 775-1,也称作5. 1环绕声)或具有扬声器位置的表格。不向多声道音 频编码器20传送与如何产生特定空间音频混合/记录有关的信息,因此当在多声道音频编 码器20内压缩信号时无法采用或利用这种信息。 然而,可以认识到,如果多声道空间音频编码器处理源自高阶立体声(HOA)格式 的内容、用任意固定麦克风设备进行的记录以及用任意特定平移算法进行的多声道混合中 的至少一个,则由于在这些情况下压缩方案可以采用特定的混合特性,对内容的原始类型 和混合类型中的至少一个的了解是十分重要的。此外,附加混合信息指示可能对原始多声 道音频内容有帮助。有利的是指示例如所用平移方法(例如,基于矢量的幅度平移(VBAP)) 或其任何细节,以便改善编码效率。有利地,可以根据所述信息来调整音频场景分析的信 号模型以及后续的编码步骤。这样导致在速率失真性能和计算工作量方面更高效的压缩系 统。 在HOA内容的具体情况下,存在以下问题:存在多种不同惯例,例如,复数值的vs 实数值的球面谐波、多个/不同规范化方案等。为了避免不同产生的HOA内容之间的不兼 容,有用的是定义通用格式。通过使用例如离散球面谐波变换(DSHT)的变换来将HOA时域 系数变换为等同的空间表示(多声道表示),来实现该目的。根据空间采样位置的规则球 面分布来创建DSHT,其中可以认为所述空间采样位置与虚拟扬声器位置等同。下文给出了 与DSHT有关的更多定义和详情。使用HOA的另一定义的任何系统能够从这种在空间域内 定义的通用格式,导出它自己的HOA系数表示。如下文所详述,关于虚拟扬声器信号表现原 始HOA信号的先验知识对于压缩所述通用格式的信号是相当有益的。 此外,这种混合信息等对于解码器和呈现器同样是有用的。在一个实施例中,将所 述混合信息等包括在比特流中。可以调整所用的呈现算法以便适应原始混合(例如,HOA或 VBAP),从而允许向灵活的扬声器位置更好地进行混缩或呈现。 图2根据本专利技术的一个实施例的示出了多声道音频传输系统的扩展。通过添加对 在音频内容的制作阶段10所施加的混合类型、记录类型、编辑类型、合成类型等中的至少 一个进行描述的元数据,来实现所述扩展。解码器输出携带这种信息,并可以在多声道压缩 编解码器40、50中使用所述信息,以便改善效率。向多声道音频编码器40传达与如何产 生特定的空间音频混合/记录有关的本文档来自技高网...
用于改善对多声道音频信号的呈现的方法和设备

【技术保护点】
一种用于对预处理的音频数据进行编码的方法,包括以下步骤:‑对音频数据进行编码;以及‑对辅助数据进行编码,所述辅助数据表示对音频数据的特定音频预处理。

【技术特征摘要】
【国外来华专利技术】2012.07.19 EP 12290239.81. 一种用于对预处理的音频数据进行编码的方法,包括w下步骤: -对音频数据进行编码;W及 -对辅助数据进行编码,所述辅助数据表示对音频数据的特定音频预处理。2. 根据权利要求1所述的方法,其中所述音频数据是HOA格式。3. 根据权利要求1或2所述的方法,其中所述编码包括使用自适应逆DSHT (423)。4. 根据权利要求1-3之一所述的方法,其中所述辅助数据表示根据HOA内容得到所述 音频内容加上W下内容中的至少一个;HOA内容表示的阶次,2D、3D或半球面表示W及空间 采样点的位置。5. 根据权利要求1-4之一所述的方法,其中所述辅助数据表示使用VBAP合成地混合音 频内容,加上对VBAP成对扬声器或=个一组扬声器的分配。6. 根据权利要求1-5之一所述的方法,其中所述辅助数据表示用固定分散的麦克风记 录所述音频内容加上W下内容中的至少一个:一个或更多个麦克风在记录设备上的一个或 更多个位置和方向;W及一个或更多个类型的麦克风。7. -种用于对编码的音频数据进行解码的方法,包括W下步骤: -确定在编码之前是否已经对音频数据进行预处理; -对音频数据进行解码; -从接收到的数据提取与预处理有关的信息;W及 -根据所提取的预处理信息,对解码的音频数据进行后处理。8. 根据权利要求7所述的方法,其中所述与预处理有关的信息表示根据HOA内容得到 音频内容加上W下内容中的至少一个;HOA内容表示的阶次,2D、3D或半球面表示W及空间 采样点的位置。9. 根据权利要求1...

【专利技术属性】
技术研发人员:奥利弗·威伯特约翰内斯·伯姆彼得·杰克斯
申请(专利权)人:汤姆逊许可公司
类型:发明
国别省市:法国;FR

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1