用于编码和解码基于对象的音频信号的方法和装置制造方法及图纸

技术编号:3048374 阅读:145 留言:0更新日期:2012-04-11 18:40
提供了用于编码和解码基于对象的音频信号的方法和装置。解码基于对象的音频信号的方法包括从输入信号中提取缩混信号和基于对象的参数信息,使用所述缩混信号和所述基于对象的参数信息产生对象音频信号,并通过将3D信息应用到所述对象音频信号来产生具有三维(3D)效果的对象音频信号。因此,能够为每个对象音频信号定位声像,并因此在重现对象音频信号的过程中提供生动的真实感。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及用于编码和解码音频信号的方法和装置,更具体地, 涉及可以为每个对象音频信号在需要的空间位置定位声像(sound image)的编码和解码音频信号的方法和装置。
技术介绍
通常,在典型的基于对象的音频编码方法中,对象编码器通过縮 混(down-mix)多个的对象音频信号产生縮混信号,并产生包括从对 象音频信号中提取出的多个信息的参数信息。在典型的基于对象的音 频解码方法中,对象解码器通过使用基于对象的参数信息解码接收到 的縮混信号来恢复多个的对象音频信号,且表现器使用控制数据将对 象音频信号合成为2通道信号或多通道信号,这是指定所恢复对象音 频信号的位置所必需的。但是,控制数据只是互电平(inter-level)信息,而在通过仅仅使 用电平(level)信息进行声像定位来产生3D效果时具有明显的局限性。
技术实现思路
技术问题本专利技术提供用于编码和解码音频信号的方法和装置,可以为每个 对象音频信号在需要的空间位置定位声像。技术方案根据本专利技术的一个方面,提供了一种解码音频信号的方法。该方 法包括从输入音频信号中提取縮混信号和基于对象的参数信息,使用 縮混信号和基于对象的参数信息产生对象音频信号,和通过将3D信息应用到对象音频信号而产生具有三维(3D)效果的对象音频信号。根据本专利技术的另一方面,提供了一种用于解码音频信号的装置。 该装置包括从输入音频信号中提取縮混信号和基于对象的参数信息的 分用器,使用缩混信号和基于对象的参数信息产生对象音频信号的对 象解码器,和通过将3D信息应用到对象音频信号而产生具有3D效果的三维对象音频信号的表现器。根据本专利技术的另一方面,提供了一种解码音频信号的方法。该方 法包括从输入音频信号中提取缩混信号和基于对象的参数信息,通过 转换基于对象的参数信息产生基于通道的参数信息,使用縮混信号和基于通道的参数信息产生音频信号,和通过将3D信息应用到音频信号 而产生具有3D效果的音频信号。根据本专利技术的另一方面,提供了一种用于解码音频信号的装置。 该装置包括从输入音频信号中提取縮混信号和基于对象的参数信息的 分用器,使用索引数据取回3D信息并输出该3D信息的表现器,使用 基于对象的参数信息和3D信息产生基于通道的参数信息的代码转换 器,和使用縮混信号和基于通道的参数信息产生音频信号并通过将3D 信息应用到音频信号而产生具有3D效果的音频信号的多通道解码器。根据本专利技术的另一方面,提供了一种用于解码音频信号的装置。 该装置包括从输入音频信号中提取縮混信号和基于对象的参数信息的 分用器,使用索引数据提取3D信息并输出该3D信息的表现器,将基 于对象的参数信息转换为基于通道的参数信息,将3D信息转换为基于 通道的3D信息并输出该基于通道的参数信息和基于通道的3D信息的 代码转换器,和使用縮混信号和基于通道的参数信息产生音频信号并 通过将3D信息应用到音频信号而产生具有3D效果的音频信号的多通 道解码器。根据本专利技术的另一方面,提供了一种用于编码音频信号的方法。 该方法包括通过縮混对象音频信号产生縮混信号,提取关于对象音频 信号的信息并基于所提取信息产生基于对象的参数信息,和将索引数 据插入到基于对象的参数信息中,该索引数据是寻找用于为对象音频信号建立3D效果的3D信息所必需的。根据本专利技术的另一方面,提供了一种具有在其上记录用于执行上 述方法中的一种的程序的计算机可读记录介质。有益效果如上所述,根据本专利技术,在重现对象音频信号的过程中,通过为 每个对象音频信号定位声像,在最大限度使用典型的基于对象的音频 编码和解码方法的同时,提供比典型的基于对象的音频编码和解码方法更加生动的真实感。另外,可以通过将本专利技术应用到其中游戏玩家 频繁地经由网络改变操纵的游戏人物的位置信息的互动游戏中以建立 高保真的虚拟现实。详细附图说明图1是示出典型的基于对象的音频编码装置的框图2是根据本专利技术的实施例的解码音频信号的装置的框图3是示出在图2中示出的装置的操作的流程图4是示出根据本专利技术的另一实施例的解码音频信号的装置的框图5是示出在图4中示出的装置的操作的流程图6是示出根据本专利技术的另一实施例的解码音频信号的装置的框图7是示出通过图6中示出的装置的三维(3D)信息到帧的应用; 图8是示出根据本专利技术的另一实施例的解码音频信号的装置的框 图;以及图9是示出根据本专利技术的另一实施例的解码音频信号的装置的框图。具体实施例方式下文将结合附图更充分地说明本专利技术,在附图中给出了本专利技术的 示例性实施例。根据本专利技术的用于编码和解码音频信号的方法和装置可应用于, 但不限于基于对象的音频编码和解码操作。换句话说,根据本专利技术, 根据本专利技术的用于编码和解码音频信号的方法和装置也可应用于除在 此所提到的信号处理操作之外的各种信号处理操作,只要所述信号处 理操作满足少许条件。根据本专利技术,根据本专利技术的用于编码和解码音 频信号的方法和装置可以通过将诸如应用头部关联传输功能(HRTF) 的三维(3D)信息应用到对象音频信号来在需要的空间位置定位对象 音频信号的声像。图1是示出典型的基于对象的音频编码装置。参照图1,基于对象 的音频编码装置包括对象编码器110和比特流发生器120。对象编码器110接收N个对象音频信号,并产生基于对象的縮混 信号和包括从N个对象音频信号中提取出的多个信息的基于对象的参 数信息。该多个信息可以是能量差和相关值。比特流发生器120通过结合由对象编码器110产生的基于对象的 縮混信号和基于对象的参数信息来产生比特流。由比特流发生器120 产生的比特流可包括解码装置默认设置所必需的默认混合参数。该默 认混合参数可包括寻找用于产生3D效果的诸如HRTF的3D信息所必 需的索引数据。图2示出根据本专利技术的实施例的用于解码音频信号的装置。可以 通过将基于HRTF的3D双耳定位的概念结合到典型的基于对象的编码方法中来设计图2中所示的装置。HRTF是描述在任意位置的声源和耳膜之间的声波的传输的传输函数,并返回根据声源的方向和高度而变化的值。如果使用HRTF过滤无方向的信号,该信号可以听起来就像 从某一方向重现一样。参照图2,该装置包括分用器130、对象解码器140、表现器150 和3D信息数据库160。分用器130从输入比特流中提取縮混信号和基于对象的参数信息。 对象解码器140基于縮混信号和基于对象的参数信息产生对象音频信 号。3D信息数据库160是储存3D信息诸如HRTF的数据库,并寻找 和输出对应于输入索引数据的3D信息。表现器150使用由对象解码器 140产生的对象音频信号和由3D信息数据库160输出的3D信息产生 3D信号。图3示出在图2中示出的装置的操作。参照图2和图3,当接收到 通过用于编码音频信号的装置传输的比特流时(S170),分用器130 从该比特流中提取縮混信号和基于对象的参数信息(S172)。对象解 码器140使用縮混信号和基于对象的参数信息产生对象音频信号 (S174)。表现器150使用包括在控制数据中的索引数据从3D信息数据库 160中取回3D信息,这对于指定对象音频信号的位置是必需的(S176)。 表现器150通过使用由对象解码器IIO提供的对象音频信号和由3D数 据库160提供的3D信息进行3D表现操作而产本文档来自技高网...

【技术保护点】
一种解码音频信号的方法,包括: 从输入的音频信号中提取缩混信号和基于对象的参数信息; 使用所述缩混信号和所述基于对象的参数信息产生对象音频信号;以及 通过把3D信息应用到所述对象音频信号产生具有三维(3D)效果的对象音频信号。

【技术特征摘要】
【国外来华专利技术】US 2006-2-9 60/771,471;US 2006-2-15 60/773,337;US 1. 一种解码音频信号的方法,包括从输入的音频信号中提取缩混信号和基于对象的参数信息;使用所述缩混信号和所述基于对象的参数信息产生对象音频信号;以及通过把3D信息应用到所述对象音频信号产生具有三维(3D)效果的对象音频信号。2. 根据权利要求1所述的方法,其中所述3D信息是头部关联传 输功能(HRTF)信息。3. 根据权利要求l所述的方法,进一步包括在数据库中储存所述 3D信息。4. 根据权利要求1所述的方法,其中所述3D信息对应于包含在 用于表现所述对象音频信号的控制数据中的索引数据。5. 根据权利要求4所述的方法,其中所述控制数据包括以下信息 中的至少一种通道间电平信息、通道间时间信息、位置信息以及所述通道间电平信息和所述时间信息的组合。6. 根据权利要求4所述的方法,进一步包括使用所述控制数据来 表现所述对象音频信号。7. 根据权利要求l所述的方法,其中所述索引数据包含在默认混 合参数信息中,而所述默认混合参数信息包含在所述基于对象的参数 信息中。8. —种解码音频信号的装置,包括 分用器,用于从输入的音频信号中提取縮混信号和基于对象的参 数信息;对象解码器,用于使用所述縮混信号和所述基于对象的参数信息 产生对象音频信号;以及表现器,用于通过将3D信息应用到所述对象音频信号而产生具有 3D效果的三维对象音频信号。9. 根据权利要求8所述的装置,进一步包括用于储存所述3D信 息的3D信息数据库。10. 根据权利要求8所述的装置,其中所述3D信息是头部关联传 输功能(HRTF)信息。11. 根据权利要求8所述的装置,其中所述3D信息对应于包含在 用于表现所述对象音频信号的控制数据中的索引数据。12. 根据权利要求ll所述的装置,其中所述控制数据包括以下信 息中的至少一种通道间电平信息、通道间时间信息、位置信息以及所述通道间电平信息和所述时间信息的组合。13. —种解码音频信号的方法,包括从输入的音频信号中提取缩混信号和基于对象的参数信息; 通过转换所述基于对象的参数信息产生基于通道的参数信息;以及使用所述縮混信号和所述基于通道的参数信息产生音频信号,并 通过将3D信息应用到所述音频信号而产生具有3D效果的音频信号。14. 根据权利要求13所述的方法,进一步包括在数据库中储存所 述3D信息。15. 根据权利要求13所述的方法,其中所述3D信息是HRTF信息。16. 根据权利要求13所述的方法,其中所述3D信息对应于包含 在用于表现所述对象音频信号的控制数据中的索引数据。17. 根据权利要求16所述的方法,其中所述控制数据包括以下信 息中的至少一种通道间电平信息、通道间时间信息、位置信息以及 所述通道间电平信息和所述时间信息的组合。18. 根据权利要求16所述的方法,进一步包括使用所述控制数据 表现所述对象音频信号。19. 根据权利要求1...

【专利技术属性】
技术研发人员:尹圣龙房熙锡李显国金东秀林宰显
申请(专利权)人:LG电子株式会社
类型:发明
国别省市:KR[韩国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1