用于向后兼容音频译码的系统、方法、设备和计算机可读媒体技术方案

技术编号:11228989 阅读:83 留言:0更新日期:2015-03-28 12:27
本发明专利技术呈现用于描述声场的基函数系数集合的向后兼容译码的系统、方法和设备。

【技术实现步骤摘要】
【国外来华专利技术】用于向后兼容音频译码的系统、方法、设备和计算机可读媒体依据35U.S.C.§119的优先权主张本专利申请案主张2012年7月15日申请且转让给本受让人的标题为“在使用球谐系数用于空间音频表示时提供向后兼容性(PROVIDINGBACKWARDCOMPATIBILITYWHENUSINGSPHERICALHARMONICSCOEFFICIENTSFORSPATIALAUDIOREPRESENTATION)”的第61/671,789号临时申请案的优先权。
本专利技术涉及空间音频译码。
技术介绍
环绕声的演进现今已使得许多用于娱乐的输出格式可用。市场上的环绕声格式的范围包含流行的5.1家庭影院系统格式,其在应用于起居室方面已最成功地超越了立体声。此格式包含以下六个通道:前左(L)、前右(R)、中心或前中心(C)、后左或环绕左(Ls)、后右或环绕右(Rs),以及低频效果(LFE)。环绕声格式的其它实例包含增长的7.1格式和由NHK(日本放送协会(NipponHosoKyokai)或日本广播公司)开发的未来的22.2格式,例如用于与超高清晰度电视标准一起使用。可需要一种环绕声格式以在两个维度中和/或在三个维度中对音频进行编码。
技术实现思路
描述根据一般配置的处理多个基函数系数的方法。所述多个基函数系数描述在时间间隔期间的声场。此方法包含对所述多个基函数系数的第一群组执行可逆变换以产生多个通道信号,其中所述多个通道信号中的每一者与对应不同空间区相关联。此方法还包含基于所述多个通道信号产生数据结构,所述数据结构包含(A)所述多个基函数系数的第二群组的表示,其中所述第二群组不同于所述第一群组,以及(B)与所述第二群组的所述表示分开的所述多个通道信号的表示。还揭示具有有形特征的计算机可读存储媒体(例如,非暂时性媒体),所述有形特征致使读取所述特征的机器执行此方法。描述根据一般配置的用于处理多个基函数系数的设备。所述多个基函数系数描述在时间间隔期间的声场。此设备包含用于对所述多个基函数系数的第一群组执行可逆变换以产生多个通道信号的装置,其中所述多个通道信号中的每一者与对应不同空间区相关联。此设备还包含用于基于所述多个通道信号产生数据结构的装置,所述数据结构包含(A)所述多个基函数系数的第二群组的表示,其中所述第二群组不同于所述第一群组,以及(B)与所述第二群组的所述表示分开的所述多个通道信号的表示。描述根据另一一般配置的用于处理多个基函数系数的设备。所述多个基函数系数描述在时间间隔期间的声场。此设备包含计算器,其经配置以对所述多个基函数系数的第一群组执行可逆变换以产生多个通道信号,其中所述多个通道信号中的每一者与对应不同空间区相关联。此设备还包含数据格式化器,其经配置以基于所述多个通道信号产生数据结构,所述数据结构包含(A)所述多个基函数系数的第二群组的表示,其中所述第二群组不同于所述第一群组,以及(B)与所述第二群组的所述表示分开的所述多个通道信号的表示。附图说明图1A展示不具有向后兼容性考虑的基于场景的译码的实例。图1B说明用于使用MPEG编解码器的标准化的一般结构。图1C展示用于单声道/立体声的向后兼容实例。图2A展示具有向后兼容设计的编码过程的实例。图2B展示无法对基于场景的数据进行解码的常规解码器上的解码过程的实例。图3A展示可处置基于场景的数据的新装置的解码过程的实例。图3B展示根据一般配置的音频信号处理方法M100的流程图。图3C展示根据一般配置的用于音频信号处理的设备MF100的框图。图3D展示根据另一一般配置的用于音频信号处理的设备A100的框图。图4展示阶数0和1的球谐基函数的量值的表面网格绘图的实例。图5展示阶数2的球谐基函数的量值的表面网格绘图的实例。图6展示5.1系统的扬声器角度的标准顺应性实例。图7展示用于5.1目标系统的扬声器角度的均匀间隔布置的实例。图8展示7.1系统的扬声器角度的标准顺应性实例。图9展示用于7.1目标系统的扬声器角度的均匀间隔布置的实例。图10A展示根据一般配置的音频信号处理方法M200的流程图。图10B展示方法M200的实施方案M210的流程图。图11A展示根据一般配置的用于音频信号处理的设备MF200的框图。图11B展示设备MF100的实施方案MF210的框图。图11C展示根据另一一般配置的用于音频信号处理的设备A200的框图。图11D展示设备A100的实施方案A210的框图。图11E展示根据另一一般配置的用于音频信号处理的设备P100的框图。具体实施方式除非由其上下文明确限制,否则术语“信号”在此用以指示其普通意义中的任一者,包含如在电线、总线或其它传输媒体上表示的存储器位置(或存储器位置集合)的状态。除非由其上下文明确限制,否则术语“产生”在此用以指示其普通意义中的任一者,例如计算或以其它方式产生。除非由其上下文明确限制,否则术语“计算”在此用以指示其普通意义中的任一者,例如计算、评估、估计和/或从多个值中选择。除非由其上下文明确限制,否则术语“获得”用以指示其普通意义中的任一者,例如计算、推导、接收(例如,从外部装置)和/或检索(例如,从存储元件阵列)。除非由其上下文明确限制,否则术语“选择”用以指示其普通意义中的任一者,例如识别、指示、应用和/或使用两者或两者以上的集合中的至少一者且少于全部。在本专利技术描述和权利要求书中使用术语“包括”的情况下,其并不排除其它元件或操作。术语“基于”(如“A基于B”中)用以指示其普通意义中的任一者,包含如下情况:(i)“推导自”(例如,“B是A的前体”),(ii)“至少基于”(例如,“A至少基于B”),以及在特定上下文中适当的情况下,(iii)“等于”(例如,“A等于B”)。类似地,术语“响应于”用以指示其普通意义中的任一者,包含“至少响应于”。对多麦克风音频感测装置的麦克风的“位置”的参考指示所述麦克风的声学敏感面的中心的位置,除非上下文另外指示。根据特定上下文,术语“通道”有时候用以指示信号路径且在其它时候用以指示由此路径载运的信号。除非另外指示,否则术语“系列”用以指示两个或两个以上项目的序列。术语“对数”用以指示基于十的对数,但此运算向其它基数的扩展在本专利技术的范围内。术语“频率分量”用以指示信号的一组频率或频带当中的一者,例如所述信号的频域表示的样本(例如,由快速傅立叶变换产生)或所述信号的子带(例如,巴克(Bark)尺度或梅尔(mel)尺度子带)。除非另外指示,否则对具有特定特征的设备的操作的任何揭示也明确预期揭示具有类似特征的方法(且反之亦然),且对根据特定配置的设备的操作的任何揭示也明确预期揭示根据类似配置的方法(且反之亦然)。术语“配置”可参考由其特定上下文指示的方法、设备和/或系统来使用。术语“方法”、“过程”、“程序”和“技术”一般地且可互换地使用,除非特定上下文另外指示。术语“设备”和“装置”也一般地且可互换地使用,除非特定上下文另外指示。术语“元件”和“模块”通常用以指示较大配置的一部分。除非由其上下文明确限制,否则术语“系统”在此用以指示其普通意义中的任一者,包含“相互作用以用于共同目的的元件群组”。通过引用文档的一部分的任何并入也应当理解为并入了在所述部分内参考的术语或变量的定义,此些定义在文本文档来自技高网...
用于向后兼容音频译码的系统、方法、设备和计算机可读媒体

【技术保护点】
一种处理描述在时间间隔期间的声场的多个基函数系数的方法,所述方法包括:对所述多个基函数系数的第一群组执行可逆变换以产生多个通道信号,其中所述多个通道信号中的每一者与对应不同空间区相关联;以及基于所述多个通道信号产生数据结构,所述数据结构包含(A)所述多个基函数系数的第二群组的表示,其中所述第二群组不同于所述第一群组,以及(B)与所述第二群组的所述表示分开的所述多个通道信号的表示。

【技术特征摘要】
【国外来华专利技术】2012.07.15 US 61/671,789;2013.03.15 US 13/844,4471.一种处理描述在时间间隔期间的声场的多个基函数系数的方法(M100),所述方法包括:对所述多个基函数系数的第一群组执行可逆变换以产生多个通道信号(T100),其中所述多个通道信号中的每一者与对应不同空间区相关联;以及基于所述多个通道信号产生数据结构(T200),所述数据结构包含:A.所述多个基函数系数的第二群组的表示,其中所述第二群组不同于所述第一群组,以及B.与所述第二群组的所述表示分开的所述多个通道信号的表示。2.根据权利要求1所述的方法,其中所述多个基函数系数为球谐基函数的多个系数。3.根据权利要求1所述的方法,其中所述数据结构包括包含所述第二群组的所述表示的第一流和包含所述多个通道信号的所述表示的第二流。4.一种获得描述在时间间隔期间的声场的多个基函数系数的方法(M200),所述方法包括:从数据结构获得(T300):A.所述多个基函数系数的第二群组的表示,以及B.与所述第二群组的所述表示分开的多个通道信号的表示,其中所述多个通道信号的子集中的每一者与对应不同空间区相关联;以及对所述多个通道信号的所述子集执行变换以产生所述多个基函数系数的第一群组(T400),其中所述第一群组不同于所述第二群组。5.根据权利要求4所述的方法,其中所述多个基函数系数中的每一者对应于球谐基函数集合的唯一一者。6.根据权利要求4所述的方法,其中所述方法包括基于所述多个基函数系数产生第二多个通道信号,其中所述多个通道信号的所述子集中的每一信号与共面方向集合中的对应不同一者相关联,且其中所述第二多个通道信号中的每一者与跨越三维空间的方向集合中的对应不同一者相关联。7.一种用于处理描述在时间间隔期间的声场的多个基函数系数的设备(MF100),所述设备包括:用于对所述多个基函数系数的第一群组执行可逆变换以产生多个通道信号的装置(F100),其中所述多个通道信号中的每一者与对应不同空间区相关联;以及用于基于所述多个通道信号产生数据结构的装置(F200),所述数据结构包含:A.所述多个基函数系数的第二群组的表示,其中所述第二群组不同于所述第一群组,以及B.与所述第二群组的所述表示分开的所述多个通道信号的表示。8.根据权利要求7所述的设备,其进一步包含转码器,所述转码器经配置以从所述多个通道信号产生后向兼容位流。9.根据权利要求8所述的设备,其中所述后向兼容位流是ATSCA/52、杜比数字、杜比TrueHD、DTS-HD大师音频、或高效高级音频译码。10.根据权利要求7所述的设备,其中所述多个基函数的所述第二群组是可从信号导出的球谐系数,该信号是由麦克风阵列捕获的物理上获取的音频信号。11.根据权利要求7所述的设备,其进一步包括编码器(SE20),所述编码器用于编码球谐系数的所述第二群组以产生所述多个基函数的所述第二群组的所述表示。12.一种用于获取描述在时间间隔期间的声场的多个基函数系数的的设备,所述设备包括:用于从数据结构获取下述内容的装置:A.所述多个基函数系数的第二群组的表示,及B.与所述第二群组的所述表示分开的多个通道信号的表示,其中所述多个通道信号的子集...

【专利技术属性】
技术研发人员:D·森向佩
申请(专利权)人:高通股份有限公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1