用于改善对多声道音频信号的呈现的方法和设备技术

技术编号：11191119 阅读：137 留言：0更新日期：2015-03-25 19:46

传统的音频压缩技术执行标准化的信号变换，与内容的类型无关。多声道信号被分解为它们的信号分量，随后进行量化和编码。由于缺少对场景构成的特性的了解，所述方法是不利的，尤其对于例如多声道音频或高阶立体声(HOA)内容。一种用于对预处理处理的音频数据进行编码的改善方法包括：对预处理的音频数据进行编码；以及对辅助数据进行编码，所述辅助数据表示特定的音频预处理。一种用于对编码的音频数据进行解码的改善方法包括：确定在编码之前是否已经对音频数据进行预处理；对音频数据进行解码；从接收到的数据提取与预处理有关的信息；以及根据所提取的预处理的信息，对解码的音频数据进行后处理。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】用于改善对多声道音频信号的呈现的方法和设备
[0001 ] 本专利技术的领域为音频压缩，具体地多声道音频信号和以声场为导向的音频场景的压缩，例如高阶立体声（HOA)。
技术介绍
目前，多声道音频信号的压缩方案不能明确地考虑输入的音频材料是如何制作或混合的。因此，已知的音频压缩技术无法获知他们将进行压缩的内容的原始/混合类型。在已知方法中，执行盲信号变换，通过所述变换将多声道信号分解为随后进行量化和编码的信号分量。这种方法的缺点在于对上述信号分解的计算是要求计算能力的，针对给定片段的音频场景，寻找最适合的和最有效的信号分解是困难的并且易于出错。
技术实现思路
本专利技术涉及一种用于改善多声道音频呈现的方法和设备。发现至少一部分上述缺点是由于缺少关于场景组成的特性的先验知识而导致的。尤其对于空间音频内容（例如，多声道音频或高阶立体声（HOA)内容），这种现有信息有助于采用压缩方案。例如，压缩算法中的通用预处理步骤是音频场景分析，目的是从原始内容或原始内容混合中提取定向的音频源或音频对象。可以与残余空间音频分量分离地对这种定向的音频源或音频对象进行编码。在一个实施例中，用于对预处理的音频数据进行编码的方法包括以下步骤：对预处理的音频数据进行编码；以及对辅助数据进行编码，所述辅助数据表示对音频数据的特定音频进行预处理。在一个实施例中，本专利技术涉及一种用于对编码的音频数据进行解码的方法，包括以下步骤：确定在编码之前是否已经对音频数据进行预处理；对音频数据进行解码；从接收到的数据提取与预...
用于改善对多声道音频信号的呈现的方法和设备

【技术保护点】
一种用于对预处理的音频数据进行编码的方法，包括以下步骤：‑对音频数据进行编码；以及‑对辅助数据进行编码，所述辅助数据表示对音频数据的特定音频预处理。

【技术特征摘要】
【国外来华专利技术】2012.07.19 EP 12290239.81. 一种用于对预处理的音频数据进行编码的方法，包括w下步骤： -对音频数据进行编码；W及 -对辅助数据进行编码，所述辅助数据表示对音频数据的特定音频预处理。2. 根据权利要求1所述的方法，其中所述音频数据是HOA格式。3. 根据权利要求1或2所述的方法，其中所述编码包括使用自适应逆DSHT (423)。4. 根据权利要求1-3之一所述的方法，其中所述辅助数据表示根据HOA内容得到所述音频内容加上W下内容中的至少一个；HOA内容表示的阶次，2D、3D或半球面表示W及空间采样点的位置。5. 根据权利要求1-4之一所述的方法，其中所述辅助数据表示使用VBAP合成地混合音频内容，加上对VBAP成对扬声器或=个一组扬声器的分配。6. 根据权利要求1-5之一所述的方法，其中所述辅助数据表示用固定分散的麦克风记录所述音频内容加上W下内容中的至少一个：一个或更多个麦克风在记录设备上的一个或更多个位置和方向；W及一个或更多个类型的麦克风。7. -种用于对编码的音频数据进行解码的方法，包括W下步骤： -确定在编码之前是否已经对音频数据进行预处理； -对音频数据进行解码； -从接收到的数据提取与预处理有关的信息；W及 -根据所提取的预处理信息，对解码的音频数据进行后处理。8. 根据权利要求7所述的方法，其中所述与预处理有关的信息表示根据HOA内容得到音频内容加上W下内容中的至少一个；HOA内容表示的阶次，2D、3D或半球面表示W及空间采样点的位置。9. 根据权利要求1...

【专利技术属性】
技术研发人员：奥利弗·威伯特，约翰内斯·伯姆，彼得·杰克斯，
申请(专利权)人：汤姆逊许可公司，
类型：发明
国别省市：法国;FR

全部详细技术资料下载我是这个专利的主人