提供一种用于生成一个或多个音频声道的装置(100)。该装置包括:根据控制信号(b)从一个或多个经处理的元数据信号(z1,…,zN)生成一个或多个重建的元数据信号(x1’,…,xN’)的元数据解码器(110),其中一个或多个重建的元数据信号(χ1′,...,χN′)中的每个指示与一个或多个音频对象信号中的音频对象信号相关联的信息,其中元数据解码器(110)用于通过确定用于一个或多个重建的元数据信号(x1’xN’)中的每个的多个重建的元数据样本(x1’(n),…,xN’(n)),生成一个或多个重建的元数据信号(X1’,…,XN’)。此外该装置包括用于根据一个或多个音频对象信号以及根据一个或多个重建的元数据信号(X1′,...,χN′)生成一个或多个音频声道的音频声道生成器(120)。元数据解码器(110)用于接收一个或多个经处理的元数据信号(z1,…,zN)中的每个的多个经处理的元数据样本(z1(n),…,zN(n))。此外,元数据解码器(110)用于接收控制信号(b)。此外,元数据解码器(110)用于确定一个或多个重建的元数据信号(x1’,…,xN’)中的每个重建的元数据信号(χi′)的多个重建的元数据样本(Xi′(1),...Xi′(n-1),Xi′(n))中的每个重建的元数据样本(χi,′(n)),以使得当控制信号(b)指示第一状态(b(n)=0)时,所述重建的元数据样本(Xi’(n))为一个或多个经处理的元数据信号(zi)中的一个的经处理的元数据样本(z,(n))中的一个与所述重建的元数据信号(Xi’)的另一个已生成的重建的元数据样本(Xi’(n-1))的和,并使得当控制信号指示不同于第一状态的第二状态(b(n)=1)时,所述重建的元数据样本(Xi’(n))为一个或多个经处理的元数据信号(z1,…,zN)中的所述一个(Zi)的经处理的元数据样本(zi,(1),…,zi(n))中的所述一个(zi,(n))。此外,提供用于生成编码的音频信息的装置(250)。
【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及音频编码/解码,特别涉及空间音频编码和空间音频对象编码,更特别 涉及用于有效的对象元数据编码的装置和方法。
技术介绍
在本
中,空间音频编码工具是众所周知的并且,例如,在环绕MPEG标准中 已被标准化。空间音频编码从诸如在再现装备(setup)中通过其布置而识别的五个或七个 声道(即左声道、中间声道、右声道、左环绕声道、右环绕声道以及低频增强声道)的原始输 入声道开始。空间音频编码器通常从原始声道得到一个或多个降混合声道,以及此外,得到 关于空间线索(cues)的参数化数据,例如在声道相干数值中的声道间水平差异、声道间相 位差异、声道间时间差异等等。一个或多个降混合声道与指示空间线索的参数化边信息一 起被传输至空间音频解码器,该空间音频解码器对降混合声道和相关联的参数化数据进行 解码以最终获得输出声道,该输出声道为原始输入声道的近似版本。声道在输出装备中的 布置通常为固定的且为,例如5.1声道格式或7.1声道格式等。 此种基于声道的音频格式被广泛用于储存或传输多声道音频内容,其中每个声道 涉及在给定位置处的特定扬声器。这些种类的格式的忠实再现需要扬声器装备,其中扬声 器放置在与音频信号产生期间所使用的扬声器相同的位置。而增加扬声器数量可改进真正 拟真的三维音频场景的再现,但是达到此要求变得越来越困难,尤其是在诸如客厅的家庭 环境中。 通过基于对象的方法可以克服对特定扬声器装备的需求,在基于对象的方法中特 别针对播放装备渲染扬声器信号。 例如,空间音频对象编码工具在此
中是众所周知的且在MPEG SA0C(SA0C =空间音频对象编码)标准中被标准化。相比于空间音频编码从原始声道开始,空间音频对 象编码从非自动专用于特定渲染再现装备的音频对象开始。另外,音频对象在再现场景中 的布置是灵活的,且可由用户通过将特定渲染信息输入至空间音频对象编码解码器来确 定。可选地或此外地,渲染信息,即在再现装备中特定音频对象通常随时间待被放置的位置 处的信息,可被传输作为附加的边信息或元数据。为了获得特定的数据压缩,通过SA0C编码 器对多个音频对象进行编码,SA0C编码器通过根据特定的降混合信息对对象进行降混合以 从输入对象计算一个或多个传输声道。此外,SA0C编码器计算表示对象间线索的参数化边 信息,例如对象水平差异(0LD)、对象相干数值等等。当在空间音频编码(SAC)中,针对个别 的时间/频率平铺(time/frequency tiles)(即,针对包括例如1024或2048个样本的音频信 号的特定帧,24、32或64等)计算对象间参数化数据,考虑频带以使得最后对于每个帧和每 个频带都存在参数化数据。作为示例,当音频片具有20个帧且每个帧被细分成32个频带时, 时间/频率平铺的数量为640。 在基于对象的方法中,通过离散音频对象描述声场。此需要对象元数据,其描述每 个声源在3D空间中的时变位置。 现有技术中的第一元数据编码概念为空间声音描述交换格式(SpatDIF),尚在发 展中的音频场景描述格式。音频场景描述格式被设计为用于基于对象的声音场景的交 换格式,且其并没有提供任何用于对象轨迹的压缩方法。SpatDIF使用基于文本的开放式声 音控制(0SC)格式以构造对象元数据。然而,简单的基于文本的表示并不是用于对象轨 迹的经压缩的传输的选项。 现有技术中的另一个元数据概念为音频场景描述格式(ASDF),其和基于文本 的解决方案具有相同的缺点。由同步多媒体集成语言(SMIL)的扩展构造数据,该同步多媒 体集成语言(SMIL)为可扩展标记语言(XML) 的子集。 现有技术中的另一个元数据概念为用于场景的音频二进制格式(AudioBIFS),二 进制格式是MPEG-4规范的一部分。它与基于乂1^的虚拟现实建模语言(¥1?^)密切相 关,基于XML的虚拟现实建模语言被开发用于音频虚拟3D场景的描述和交互式虚拟现实应 用。复杂的AudioBIFS规范使用场景图以指定对象移动的路径。AudioBIFS的主要缺点在 于,它并非被设计用于要求有限的系统延迟和随机访问数据流的实时操作。此外,对象位置 的编码没有运用听者的有限定位能力。对于音频虚拟场景中的固定的听者位置,可以利用 较低数目的比特来量化对象数据。因此,应用于AudioBIFS的对象元数据的编码对于数 据压缩是无效的。 因此,如果能提供改进的有效的对象元数据编码概念,将会获得高度的赞赏。
技术实现思路
本专利技术的目的在于提供用于对象元数据编码的改进技术。通过根据权利要求1的 装置、根据权利要求6的装置、根据权利要求12的系统、根据权利要求13的方法、根据权利要 求14的方法以及根据权利要求15的计算机程序达成本专利技术的目的。 提供一种用于生成一个或多个音频声道的装置,该装置包括:元数据解码器,用于 根据控制信号(b)从一个或多个经处理的元数据信号( Z1,…,ZN)生成一个或多个重建的元 数据信号(11',一,別'),其中一个或多个重建的元数据信号(^',一,別')中的每个指示与 一个或多个音频对象信号的音频对象信号相关联的信息,其中元数据解码器用于通过确定 用于一个或多个重建的元数据信号(^',一,別')中的每个的多个重建的元数据样本(^' (11),一,別'(11))以生成一个或多个重建的元数据信号(1 1',一,幼')。此外,该装置包括:音 频声道生成器,用于根据一个或多个音频对象信号以及根据一个或多个重建的元数据信号 ( Χ1',···,ΧΝ')生成一个或多个音频声道。元数据解码器用于接收一个或多个经处理的元数 据信号( Z1,…,ΖΝ)中的每个的多个经处理的元数据样本(Ζ1(η),…,ΖΝ(η))。此外,元数据解 码器用于接收控制信号(b)。此外,元数据解码器用于确定一个或多个重建的元数据信号 ( X1',…,XN')中的每个重建的元数据信号(Xl')的多个重建的元数据样本(1 1'(1),-^1'(11-1),^'(11))中的每个重建的元数据样本(11'(11)),以使得当控制信号(13)指示第一状态卬 (η) =0)时,所述重建的元数据样本(Xl'(η))为一个或多个经处理的元数据信号中的一个 (Zl)的经处理的元数据样本中的一个( Zl(n))与所述重建的元数据信号(Xl')的另一个已生 成的重建的元数据样本(Xl'(n-1))的和,并使得当控制信号指示不同于第一状态的第二状 态(b(n) = l)时,所述重建的元数据样本(Xl'(η))为一个或多个经处理的元数据信号 (Ζ1,…,ΖΝ)中的所述一个(Zi)的经处理的元数据样本(Zi(l)),···,Zi(n))中的所述一个(Zi (n))〇 此外,提供一种用于生成包括一个或多个编码的音频信号和一个或多个经处理的 元数据信号的编码的音频信息的装置。此装置包括:元数据编码器,用于接收一个或多个原 始元数据信号,以及用于确定一个或多个经处理的元数据信号,其中一个或多个原始元数 据信号中的每个包括多个原始元数据样本,其中一个或多个原始元数据信号中的每个的原 始元数据样本指示与一个或多个音频对象信号中的音频对象信号相关联的信息。 此外,该装置包括:音频编码器,用于对本文档来自技高网...
【技术保护点】
一种用于生成一个或多个音频声道的装置(100),其中所述装置包括:元数据解码器(110;901),用于根据控制信号(b)从一个或多个经处理的元数据信号(z1,…,zN)生成一个或多个重建的元数据信号(x1’,…,xN’),其中所述一个或多个重建的元数据信号(x1’,…,xN’)中的每个指示与一个或多个音频对象信号中的音频对象信号相关联的信息,其中所述元数据解码器(110;901)用于通过确定用于所述一个或多个重建的元数据信号(x1’,…,xN’)中的每个的多个重建的元数据样本(x1’(n),…,xN’(n))以生成所述一个或多个重建的元数据信号(x1’,…,xN’),以及音频声道生成器(120),用于根据所述一个或多个音频对象信号以及根据所述一个或多个重建的元数据信号(x1’,…,xN’)生成所述一个或多个音频声道,其中所述元数据解码器(110;901)用于接收所述一个或多个经处理的元数据信号(z1,…,zN)中的每个的多个经处理的元数据样本(z1(n),…,zN(n)),其中所述元数据解码器(110;901)用于接收所述控制信号(b),其中所述元数据解码器(110;901)用于确定所述一个或多个重建的元数据信号(x1’,…,xN’)中的每个重建的元数据信号(xi’)的所述多个重建的元数据样本(xi’(1),…xi’(n‑1),xi’(n))中的每个重建的元数据样本(xi’(n)),以使得当所述控制信号(b)指示第一状态(b(n)=0)时,所述重建的元数据样本(xi’(n))为所述一个或多个经处理的元数据信号中的一个(zi)的经处理的元数据样本中的一个(zi(n))与所述重建的元数据信号(xi’)的另一个已生成的重建的元数据样本(xi’(n‑1))的和,并使得当所述控制信号指示不同于所述第一状态的第二状态(b(n)=1)时,所述重建的元数据样本(xi’(n))为所述一个或多个经处理的元数据信号(z1,…,zN)中的所述一个(zi)的经处理的元数据样本(zi(1)),…,zi(n))中的所述一个(zi(n))。...
【技术特征摘要】
【国外来华专利技术】...
【专利技术属性】
技术研发人员:克里斯蒂安·鲍斯,克里斯蒂安·埃特尔,约翰内斯·希勒佩特,
申请(专利权)人:弗朗霍夫应用科学研究促进协会,
类型:发明
国别省市:德国;DE
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。