一种用于合成双声道音频信号的方法,该方法包括:输入参数化编码的音频信号,其包括多个音频信道的至少一个组合信号以及描述多信道声音图像的边信息的一个或多个对应集合;以及将头部相关传输函数滤波器的预定集合应用于通过边信息的所述对应集合按比例确定的至少一个组合信号,以便合成双声道音频信号。
【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及空间音频编码,并且更具体地涉及对双声道音频信 号的解码。
技术介绍
在空间音频编码中,对双信道/多信道音频信号进行处理,以使 得在互不相同的不同音频信道上重现音频信号,从而为收听者提供 围绕音频源的空间效果的印象。该空间效果可以通过将音频直接记 录成用于多信道或者双声道重现的适当格式来生成,或者可以以任 意双信道/多信道音频信号来模拟产生,其称为空间化。通常已知的是,对于头戴受话器,重现模拟空间化可以通过 HRTF (头部相关传输函数)滤波来执行,该HRTF滤波产生用于收 听者左耳和右耳的双声道信号。利用根据对应于声源信号的来源方 向的HRTF导出的滤波器对这些声源信号进行滤波。HRTF是从自由 场中的声源至人耳或者模拟头部测量的传输函数除以从声源至放置 在头中部用于代替头部的麦克风的传输函数。可以将模拟的房间效 果(例如早期反射和/或晚期混响)添加到空间化的信号中,以改善 声源的形象化和自然性。随着音频收听和交互设备多样性的增加,兼容性变得更加重要。 在空间音频格式中,通过上升混合和下降混合技术来力求兼容性。通常已知的是,存在将多信道音频信号转换成立体声格式(例如,杜比数码Dolby Dighta^和杜比环绕Dolby Surround )以及进一步将 立体声格式转换成双声道信号的算法。然而,在这种处理中,不能完全重现原始多信道音频信号的空间图像。对于头戴收听而言用于 转换多信道音频信号的更好的方式是通过利用HRTF滤波使用虚拟 扬声器来替换原始扬声器以及通过那些虚拟扬声器(例如,杜比头 戴受话器Dolby headphone )来播放该扬声器信道信号。然而,该处 理的缺点在于,为了产生双声道信号,首先总是需要多信道混合。 即,首先对多信道(例如5+1个信道)信号进行解码以及合成,然 后将HRTF应用于每个信号,用来形成双声道信号。与直接从压缩 的多信道格式解码成双声道格式相比,这是一种计算繁重的方法。双耳线索编码(BCC)是高度发展的参数化空间音频编码方法。 BCC将空间多信道信号表示为单个(或若干)下降混合的音频信道 以及根据频率和时间由原信号估计的 一 组感性相关信道间差值。该 方法允许将针对任意扬声器布局混合的空间音频信号转换为用于任 意其他扬声器布局,包括相同或者不同数量的扬声器。因此,BCC是针对多信道扬声器系统而设计的。然而,由BCC 处理的单声道信号及其边信息生成双声道信号要求首先基于单声道 信号及其边信息对多信道表示进行合成,且仅在那时才有可能由多 信道表示生成用于空间头戴受话器播放的双声道信号。很明显,该 方法在生成双声道信号方面也未优化。
技术实现思路
现在,此处专利技术了一种改进的方法以及实现该方法的技术设备, 其支持直接从参数化编码的音频信号生成双声道信号。本专利技术的各 个方面包括解码方法、解码器、装置以及计算机程序,它们的特征 在于下面详细地一般性公开的内容。也公开了本专利技术的各种实施方式。根据本专利技术的第 一 方面,根据本专利技术的方法基于这样的想法,即合成双声道音频信号,以使得首先输入参数化编码的音频信号, 该音频信号包括多个音频信道的至少一个组合信号以及描述多信道 声音图像的边信息的 一个或多个对应集合。将该至少 一个组合信号 划分到多个子带,根据边信息的所述集合来确定子带的参数值。然 后,以所述参数值确定的比例,将头部相关传输函数滤波器的预定 集合应用于至少一个组合信号,以便合成双声道音频信号。根据实施方式,所述参数值通过根据由所述边信息的集合所提 供的下一个和前一个参数值对与特定子带对应的参数值进行插值来 确定。根据实施方式,可以根据头部相关传输函数滤波器的预定集合, 选择将要应用的与原多信道扬声器布局的每个扬声器方向相对应的一对左右头部相关传输函数滤波器。根据实施方式,边信息的所述集合包括用于描述原声音图像的 多信道音频的信道信号的增益估计的集合。根据实施方式,原多信道音频的增益估计根据时间和频率来确定;以及对每个扬声器信道的增益进行调整以使得每个增益值平方 之和等于1。根据实施方式,至少一个组合信号被划分到下列子带类型之一 多个QMF子带;多个等效矩形带宽(ERB)子带;或者多个心理声 学激发的频带。根据实施方式,所述参数值是至少一个子带的增益值。根据实施方式,确定子带的增益值的步骤进一步包括确定描 述原声音图像的多信道音频的每个信道信号的增益值;以及根据每 个信道信号的所述增益值对子带的单个增益值进行插值。根据实施方式,通过将所述至少一个组合信号与至少一个增益 值和预定头部相关传输函数滤波器相乘来确定子带的双声道信号的 频域表示。根据本专利技术的装置提供了显著的优势。主要优势是解码过程的 简单化和低计算复杂度。从解码器完全基于由编码器给定的空间和编码参数来执行双声道合成的意义上讲,该解码器也是灵活的。另外,在转换中,维持了与原信号的相等空间性。对于边信息,原混 合的增益估计的集合就足以了。最重要的是,本专利技术支持对参数化 音频编码中提供的压缩中间状态的增强利用,从而提高了传输以及 存储音频时的效率。如果根据边信息来确定用于子带的增益值,则 双声道输出信号的质量可以通过引入更加平滑的频带间增益值变化 而得以改进。滤波也可以得到显著简化。本专利技术的其他方面包括各种装置,其布置用于实现上述方法的 本专利技术步骤。附图说明在下文中,将参考附图对本专利技术的各种实施方式进行更加详细 的描述。图1示出了根据现有技术的一般双耳线索编码(BCC)方案; 图2示出了根据现有技术的BCC合成方案的一般结构; 图3示出了根据本专利技术的实施方式的双声道解码器的方框图; 图4以简化图示出了根据本专利技术的实施方式的电子设备。具体实施例方式在下文中,将通过参考双耳线索编码(BCC )作为用于实现根据 实施方式的解码方法的示例性平台来说明本专利技术。然而,应当注意 的是,本专利技术并非仅局限于BCC型空间音频编码方法,而是还可以 利用提供由一个或多个音频信道的原集合组合的至少一个音频信号 以及适当空间边信息的任意音频编码方案来实现。双耳线索编码(BCC)是空间音频的参数化表示的一般原理,用 于根据单个音频信道加上一些边信息来递送具有任意数量信道的多信道输出。图1示出了该原理。通过下降混合过程将若干(M)输 入音频信道组合成单个输出(S:"求和")信号。并行地,从输入 信道提取描述该多信道声音图像的最突出的信道间线索,并将其密实地编码为B C C边信息。然后将求和信号和边信息都传送到接收方, 可以使用适当的低比特率音频编码方案来编码该求和信号。最后, BCC解码器通过重新合成携带了相关信道间线索(诸如信道间时间 差ICTD,信道间声级差ICLD,以及信道间相干性ICC)的信道输 出信号,根据传送的求和信号和空间线索信息生成用于扬声器的多 信道(N)输出信号。因此依据对于特别用于扬声器播放的多信道音 频信号的重建的优化来选择BCC边信息,即信道间线索。有两种BCC方案,即用于灵活呈现的BCC (类型IBCC)以及 用于自然呈现的BCC (类型IIBCC),灵活呈现的BCC意在为了在 接收方一侧呈现而进行的大量独立的源信号的传送,自然呈现的 BCC意在立体声或者环绕信号的大量音频信道的传输。灵活呈现的 BCC采本文档来自技高网...
【技术保护点】
一种用于合成双声道音频信号的方法,所述方法包括: 输入参数化编码音频信号,该音频信号包括多个音频信道的至少一个组合信号以及描述多信道声音图像的边信息的一个或多个对应集合; 将该至少一个组合信号划分到多个子带中; 根据所述边信息的集合确定用于子带的参数值; 按照由所述参数值确定的比例,将头部相关传输函数滤波器的预定集合应用于该至少一个组合信号,以合成双声道音频信号。
【技术特征摘要】
【国外来华专利技术】...
【专利技术属性】
技术研发人员:P奥雅拉,J蒂尔屈,M瓦阿纳南,M塔米,
申请(专利权)人:诺基亚公司,
类型:发明
国别省市:FI[芬兰]
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。