一股来说,本发明专利技术描述用于将音频对象分组成群集的技术。在一些实例中,一种用于音频信号处理的装置包含群集分析模块,所述群集分析模块经配置以基于N个音频对象中的每一者的空间信息将包含所述N个音频对象的多个音频对象分组成L个群集,其中L小于N,其中所述群集分析模块经配置以接收来自传输信道、解码器及显现器中的至少一者的信息,且其中L的最大值是基于所述所接收信息。所述装置还包括:降混模块,其经配置以将所述多个音频对象混合成L个音频流;及元数据降混模块,其经配置以基于所述空间信息及所述分组产生指示所述L个音频流中的每一者的空间信息的元数据。
【技术实现步骤摘要】
【国外来华专利技术】【专利摘要】一股来说,本专利技术描述用于将音频对象分组成群集的技术。在一些实例中,一种用于音频信号处理的装置包含群集分析模块,所述群集分析模块经配置以基于N个音频对象中的每一者的空间信息将包含所述N个音频对象的多个音频对象分组成L个群集,其中L小于N,其中所述群集分析模块经配置以接收来自传输信道、解码器及显现器中的至少一者的信息,且其中L的最大值是基于所述所接收信息。所述装置还包括:降混模块,其经配置以将所述多个音频对象混合成L个音频流;及元数据降混模块,其经配置以基于所述空间信息及所述分组产生指示所述L个音频流中的每一者的空间信息的元数据。【专利说明】基于对象的环绕声编码解码器的具有反馈的可缩放降混设 计 本申请案主张以下各临时申请案的优先权:2012年7月20日申请的第 61/673, 869号美国临时申请案;2012年12月21日申请的第61/745, 505号美国临时申请 案;及2012年12月21日申请的第61/745, 129号美国临时申请案。
本专利技术涉及音频译码且,更具体来说,涉及空间音频译码。
技术介绍
环绕声的演进现今已使得许多输出格式可用于娱乐。市场上的环绕声格式的范 围包含风行的5. 1家庭影院系统格式,所述格式就侵入起居室来说已为超过立体声最为成 功的。此格式包含以下六个通道:左前(L)、右前(R)、中心或前方中心(C)、左后或左环绕 (Ls)、右后或右环绕(Rs)及低频效果(LFE)。环绕声格式的其它实例包含由日本放送协会 或日本广播协会(NHK,Nippon Hoso Kyokai 或 Japan Broadcasting Corporation)开发以 供(例如)超高清晰度电视标准使用的正发展的7. 1格式及未来的22. 2格式。可能需要 环绕声格式按二维(2D)及/或按三维(3D)编码音频。然而,这些2D及/或3D环绕声格 式需要高位速率以适当地按2D及/或3D编码音频。
技术实现思路
一般来说,描述用于在按2D及/或3D编码音频时将音频对象分组成群集以可能 地减少位速率要求的技术。 作为一个实例,一种音频信号处理方法包含基于N个音频对象中的每一者的空间 信息,将包含所述N个音频对象的多个音频对象分组成L个群集,其中L小于N。所述方法 还包含将所述多个音频对象混合成L个音频流。所述方法还包含基于所述空间信息及所述 分组,产生指示所述L个音频流中的每一者的空间信息的元数据,其中L的最大值是基于从 传输信道、解码器及显现器中的至少一者接收的信息。 作为另一实例,一种用于音频信号处理的设备包括用于从传输信道、解码器及显 现器中的至少一者接收信息的装置。所述设备还包括用于基于N个音频对象中的每一者的 空间信息将包含所述N个音频对象的多个音频对象分组成L个群集的装置,其中L小于N 且其中L的最大值是基于所述所接收信息。所述设备还包括用于将所述多个音频对象混合 成L个音频流的装置,及用于基于所述空间信息及所述分组产生指示所述L个音频流中的 每一者的空间信息的元数据的装置。 作为另一实例,一种用于音频信号处理的装置包括群集分析模块,所述群集分析 模块经配置以基于N个音频对象中的每一者的空间信息将包含所述N个音频对象的多个音 频对象分组成L个群集,其中L小于N,其中所述群集分析模块经配置以从传输信道、解码器 及显现器中的至少一者接收信息,且其中L的最大值是基于所述所接收信息。所述装置还 包括:降混模块,其经配置以将所述多个音频对象混合成L个音频流;及元数据降混模块, 其经配置以基于所述空间信息及所述分组,产生指示所述L个音频流中的每一者的空间信 息的元数据。 作为另一实例,一种非暂时性计算机可读存储媒体具有存储于其上的指令,所述 指令在被执行时致使一或多个处理器基于N个音频对象中的每一者的空间信息将包含所 述N个音频对象的多个音频对象分组成L个群集,其中L小于N。所述指令还致使所述处理 器将所述多个音频对象混合成L个音频流且,基于所述空间信息及所述分组,产生指示所 述L个音频流中的每一者的空间信息的元数据,其中L的最大值是基于从传输信道、解码器 及显现器中的至少一者接收的信息。 作为另一实例,一种音频信号处理方法包含基于多个音频对象产生将所述多个音 频对象分组成L个群集的第一分组,其中所述第一分组是基于来自所述多个音频对象当中 的至少N个音频对象的空间信息且L小于N。所述方法还包含计算相对于所述多个音频对 象的所述第一分组的误差。所述方法进一步包含基于所述所计算的误差,根据将所述多个 音频对象分组成L个群集的第二分组产生多个L个音频流,所述第二分组不同于所述第一 分组。 作为另一实例,一种用于音频信号处理的设备包含用于基于多个音频对象产生将 所述多个音频对象分组成L个群集的第一分组的装置,其中所述第一分组是基于来自所述 多个音频对象当中的至少N个音频对象的空间信息且L小于N。所述设备还包含用于计算 相对于所述多个音频对象的所述第一分组的误差的装置,及用于基于所述所计算的误差, 根据将所述多个音频对象分组成L个群集的第二分组产生多个L个音频流的装置,所述第 二分组不同于所述第一分组。 作为另一实例,一种用于音频信号处理的装置包含群集分析模块,所述群集分析 模块经配置以基于多个音频对象产生将所述多个音频对象分组成L个群集的第一分组,其 中所述第一分组是基于来自所述多个音频对象当中的至少N个音频对象的空间信息且L小 于N。所述装置还包含误差计算器,所述误差计算器经配置以计算相对于所述多个音频对象 的所述第一分组的误差,其中所述误差计算器经进一步配置以基于所述所计算的误差,根 据将所述多个音频对象分组成L个群集的第二分组产生多个L个音频流,所述第二分组不 同于所述第一分组。 作为另一实例,一种非暂时性计算机可读存储媒体具有存储于其上的指令,所述 指令在被执行时致使一或多个处理器基于多个音频对象产生将所述多个音频对象分组成 L个群集的第一分组,其中所述第一分组是基于来自所述多个音频对象当中的至少N个音 频对象的空间信息且L小于N。所述指令进一步致使所述处理器计算相对于所述多个音频 对象的所述第一分组的误差,及基于所述所计算的误差,根据将所述多个音频对象分组成L 个群集的第二分组产生多个L个音频流,所述第二分组不同于所述第一分组。 一种根据一般配置的音频信号处理方法包含基于N个音频对象中的每一者的空 间信息,将包含所述N个音频对象的多个音频对象分组成L个群集,其中L小于N。此方法 还包含将所述多个音频对象混合成L个音频流,及基于所述空间信息及所述分组产生指示 所述L个音频流中的每一者的空间信息的元数据。还揭示具有有形特征的计算机可读存储 媒体(例如,非暂时性媒体),所述有形特征致使读取所述特征的机器执行此类方法。 -种根据一般配置的用于音频信号处理的设备包含用于基于N个音频对象中的 每一者的空间信息,将包含所述N个音频对象的多个音频对象分组成L个群集的装置,其中 L小于N。此设备还包含用于将所述多个音频对象混合成L个音频流的装置;及用于基于所 述空间信息及所述分组产生指示所述L个音频流中的每一者的空间信息的元数本文档来自技高网...
【技术保护点】
一种音频信号处理方法,所述方法包括:基于N个音频对象中的每一者的空间信息,将包含所述N个音频对象的多个音频对象分组成L个群集,其中L小于N;将所述多个音频对象混合成L个音频流,以及基于所述空间信息及所述分组,产生指示所述L个音频流中的每一者的空间信息的元数据。
【技术特征摘要】
【国外来华专利技术】...
【专利技术属性】
技术研发人员:向佩,D·森,K·T·哈特曼,
申请(专利权)人:高通股份有限公司,
类型:发明
国别省市:美国;US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。