将音频信道插入到声场的描述中制造技术

技术编号:13975989 阅读:90 留言:0更新日期:2016-11-11 11:45
本发明专利技术通常描述用于将音频信道插入到声场的描述中的技术。包括处理器的装置可经配置以执行所述技术。所述处理器可经配置以获得不同于声场的高阶立体混响表示的音频信道。所述处理器可进一步经配置以将所述音频信道插入所述声场内的空间位置处,使得所述音频信道能够从所述声场中提取。

【技术实现步骤摘要】
【国外来华专利技术】本申请案要求2014年3月21日申请的标题为“将音频信道插入到声场的描述中(INSERTING AUDIO CHANNELS INTO DESCRIPTIONS OF SOUNDFIELDS)”的第61/969,011号美国临时申请案及2014年3月24日申请的标题为“将音频信道插入到声场的描述中(INSERTING AUDIO CHANNELS INTO DESCRIPTIONS OF SOUNDFIELDS)”的第61/969,586号美国临时申请案的权益,所述申请案中的每一者通过引用以其全文并入本文中。
本专利技术涉及音频数据,且更确切地说,涉及高阶立体混响音频数据的译码。
技术介绍
高阶立体混响(HOA)信号(常由多个球谐系数(SHC)或其它阶层元素表示)是声场的三维表示。HOA或SHC表示可以独立于用于播放从SHC信号呈现的多信道音频信号的局部扬声器几何布置的方式来表示声场。SHC信号还可促进向后兼容性,因为可将SHC信号呈现为众所周知的且被广泛采用的多信道格式(例如,举例来说,5.1音频信道格式或7.1音频信道格式)。SHC表示因此可实现对声场的更好表示,其也适应向后兼容性。
技术实现思路
一般来说,本专利技术描述用于对高阶立体混响音频数据进行译码的技术。高阶立体混响音频数据可包括与具有大于一的阶数的球谐基底函数对应的至少一个高阶立体混响(HOA)系数。在一个方面中,装置包括一或多个处理器,其经配置以获得包含不同于声场的音频信道的声场的经扩增高阶立体混响表示,并且从声场的经扩增高阶立体混响表示内的空间位置提取音频信道。在另一方面中,方法包括获得包含不同于声场的音频信道的声场的经扩增高阶立体混响表示;及从声场的经扩增高阶立体混响表示内的空间位置提取音频信道。在另一方面中,装置包括一或多个处理器,其经配置以获得不同于声场的高阶立体混响表示的音频信道;及将音频信道插入声场内的空间位置处,使得音频信道能够从声场提取。在另一方面中,方法包括获得不同于声场的高阶立体混响表示的音频信道;及将音频信道插入声场内的空间位置处,使得音频信道能够从声场提取。在附图及以下描述中阐述所述技术的一或多个方面的细节。所述技术的其它特征、目标及优点将从所述描述及图式以及权利要求书中显而易见。附图说明图1是说明具有各种阶数及子阶数的球谐基底函数的图。图2是说明可执行本专利技术中所描述的技术的各种方面的系统的图。图3A-3C是说明可各自执行本专利技术中所描述的技术的各种方面的图2中展示的音频编码装置的各种实例的框图。图4A-4C是说明可执行本专利技术中所描述的技术的各种方面的图2中展示的音频解码装置的各种实例的框图。图5A-5C是说明在执行本专利技术中所描述的插入技术的各种方面时音频编码装置的插入单元的示范性操作的图。图6是说明在执行本专利技术中所描述的区域形成及插入技术的各种方面时音频编码装置的插入单元的示范性操作的流程图。图7是说明在执行本专利技术中所描述的音频信道提取技术的各种方面时音频解码装置的音频信道提取单元的示范性操作的流程图。图8A-8C是说明根据本专利技术中所描述的技术的音频对象可插入的声场的图。具体实施方式环绕声的演进已使得许多输出格式可用于娱乐。此类消费型环绕声格式的实例大部分为“声道”式的,这是因为其以某些几何坐标隐含地指定到扩音器的馈入。消费型环绕声格式包含普遍的5.1格式(其包含以下六个声道:左前(FL)、右前(FR)、中心或前中心、左后或左环绕、右后或右环绕,及低频效应(LFE))、发展中的7.1格式、包含高度扬声器的各种格式,例如7.1.4格式及22.2格式(例如,用于供超高清晰电视标准使用)。非消费型格式可跨越任何数目的扬声器(呈对称及非对称几何形状),其常常称为“环绕阵列”。此种阵列的一个实例包含定位在截角二十面体的拐角上的坐标处的32个扩音器。到未来MPEG编码器的输入任选地为三个可能格式中的一者:(i)传统的基于信道的音频(如上文所论述),其意图通过处于预先指定的位置处的扩音器播放;(ii)基于对象的音频,其涉及用于单个音频对象的具有含有其位置坐标(以及其它信息)的相关联元数据的离散脉码调制(PCM)数据;及(iii)基于场景的音频,其涉及使用球谐基底函数的系数(也称为“球谐系数”或SHC、“高阶立体混响”或HOA及“HOA系数”)来表示声场。未来MPEG编码器的额外细节可发现于国际标准化组织/国际电工委员会(ISO)/(IEC)JTC1/SC29/WG11/N13411的标题为“要求对于3D音频的提议(Call for Proposals for 3D Audio)”的文献中,该文献于2013年1月在瑞士日内瓦发布,且可在http://mpeg.chiariglione.org/sites/default/files/files/standards/parts/docs/w13411.zip获得。不同基于“环绕声”信道的格式是可用的。所述格式的范围(例如)是从5.1家庭影院系统(其在使起居室享有立体声方面已获得最大成功)到NHK(日本广播协会或日本广播公司)所开发的22.2系统。内容创建者(例如,好莱坞工作室)将希望产生电影的声迹一次,而不花费精力来针对每一扬声器配置对其进行重混。近来,标准开发组织(standards developing organizations)一直在考虑如下方式:将编码及后续解码(适合于且不知晓播放位置(涉及呈现器)处的扬声器几何形状(及数目)和声学条件)提供于标准化位流中。为向内容创建者提供此种灵活性,可使用分层要素集合来表示声场。所述分层要素集合可指其中要素经排序以使得较低阶元素的基础集合提供模型化声场的完整表示的一组元素。在所述集合扩展以包含高阶元素时,所述表示变得更详细,从而增加分辨率。分层要素集合的一个实例为一组球谐系数(SHC)。以下表达式展示使用SHC对声场的描述或表示:表达式展示在时间t处在声场的任何点处的压力pi可独特地由SHC,来表示。此处,c是音速(~343m/s),是参考点(或观测点),jn(·)是阶n的球贝塞尔函数,且是阶n及子阶m的球谐基底函数。方括号中的术语为信号(即)的频域表示,其可由各种时频变换近似表示,例如离散傅里叶变换(DFT)、离散余弦变换(DCT)或小波变换。分层集合的其它实例包含小波变换系数的集合及多分辨率基底函数的系数的其它集合。图1是说明从零阶(n=0)到四阶(n=4)的球谐基底函数的图。如可看出,对于每一阶,存在子阶m的扩展,出于易于说明的目的,在图1的实例中展示所述子阶但未明确注释。可通过各种麦克风阵列配置物理地获取(例如,记录)或替代地,其可从声场的基于信道或基于对象的描述导出。SHC表示基于场景的音频,其中SHC可输入到音频编码器以获得经编码SHC,所述经编码SHC可促成更有效的发射或存储。举例来说,可使用涉及(1+4)2个(25,且因此为四阶)系数的四阶表示。如上文所指出,可使用麦克风阵列从麦克风记录导出SHC。可如何从麦克风阵列导出SHC的各种实例描述于Poletti,M的“基于球面谐波的三维环绕声系统(Three-Dimensional Surround Sound Systems Bas本文档来自技高网...

【技术保护点】
一种装置,其包括:一或多个处理器,其经配置以获得声场的经扩增高阶立体混响表示,所述经扩增高阶立体混响表示包含与所述声场分开的音频信道,并且从所述声场的所述经扩增高阶立体混响表示内的空间位置提取音频信道;及存储器,其经配置以存储所述音频信道。

【技术特征摘要】
【国外来华专利技术】2014.03.21 US 61/969,011;2014.03.24 US 61/969,586;1.一种装置,其包括:一或多个处理器,其经配置以获得声场的经扩增高阶立体混响表示,所述经扩增高阶立体混响表示包含与所述声场分开的音频信道,并且从所述声场的所述经扩增高阶立体混响表示内的空间位置提取音频信道;及存储器,其经配置以存储所述音频信道。2.根据权利要求1所述的装置,其中所述空间位置位于所述声场的底部或所述声场的顶部中的一者处。3.根据权利要求1所述的装置,其中所述一或多个处理器进一步经配置以基于所述声场的基于向量的分析而识别所述声场内的所述空间位置。4.根据权利要求1所述的装置,其中所述声场的所述经扩增高阶立体混响表示包括描述所述声场的多个高阶立体混响系数,及其中所述一或多个处理器经配置以将所述多个高阶立体混响系数从球谐域变换到空间域,以便获得所述声场的经扩增空间域表示并且从所述声场的所述经扩增空间域表示内的所述空间位置提取所述音频信道。5.根据权利要求1所述的装置,其中所述一或多个处理器进一步经配置以从包含所述声场的所述经扩增高阶立体混响表示的位流中获得插入所述音频信道的所述空间位置。6.根据权利要求1所述的装置,其中所述一或多个处理器进一步经配置以从包含所述声场的所述经扩增高阶立体混响表示的位流中获得描述所述音频信道的信息。7.根据权利要求6所述的装置,其中描述所述音频信道的所述信息包括识别广播员的信息、识别说出存在于所述音频信道中的解说所用的语言的信息或识别存在于所述音频信道中的内容的类型的信息中的一者。8.根据权利要求1所述的装置,其中所述单独音频信道包括来自广播员的音频信道、通过非广播员获得的音频信道、以非英语语言提供解说的非英语音频信道及以英语语言提供解说的英语音频信道中的一者。9.根据权利要求1所述的装置,其中所述声场的所述高阶立体混响表示包括描述所述声场的环境分量的多个高阶立体混响系数。10.一种方法,其包括:获得声场的经扩增高阶立体混响表示,所述经扩增高阶立体混响表示包含与所述声场分开的音频信道;及从所述声场的所述经扩增高阶立体混响表示内的空间位置提取音频信道。11.根据权利要求10所述的方法,其中所述空间位置位于所述声场的底部或所述声场的顶部中的一者处。12.根据权利要求10所述的方法,其进一步包括基于所述声场的所述经扩增高阶立体混响表示的基于向量的分析而识别所述声场内的所述空间位置。13.根据权利要求10所述的方法,其中所述声场的所述经扩增高阶立体混响表示包括描述所述声场的多个高阶立体混响系数,及其中提取所述音频信道包括:将所述多个高阶立体混响系数从球谐域变换到空间域,以便获得所述声场的经扩增空间域表示;及从所述声场的所述经扩增空间域表示内的所述空间位置提取所述音频信道。14.根据权利要求10所述的方法,其进一步包括从包含所述声场的所述经扩增高阶立体混响表示的位流中获得指示插入所述音频信道的所述空间位置的插入信息,其中所述插入信息包括识别插入所述音频信道的所述空间位置的V-向量。15.根据权利要求10所述的方法,其进一步包括从包含所述声场的所述经扩增高阶立体混响表示的位流中获得描述所述音频信道的信息。16.根据权利要求15所述的方法,其中描述所述音频信道的所述信息包括识别现场广播员的信息、识别说出存在于所述音频信道中的解说所用的语言的信息或识别存在于所述音频信道中的内容的类型的信息中...

【专利技术属性】
技术研发人员:D·森N·G·彼得斯
申请(专利权)人:高通股份有限公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1