基于复指数调制的滤波器组的高级处理和自适应时间信号传送方法技术

技术编号:3405662 阅读:183 留言:0更新日期:2012-04-11 18:40
用于利用输入信号生成去相关信号的合成器可在多个子带信号上进行操作,其中一个子带信号包括至少两个子带采样的序列,该子带采样的序列代表子带信号的带宽,该带宽小于输入信号的带宽。合成器包括第一级(201),用于利用混响滤波器对每个子带信号滤波以获得多个混响后的子带信号,其中多个混响后的子带信号一起表示去相关信号。此去相关信号被用于基于参数编码后的立体声信号重建信号,该立体声信号由单声道信号和相干测量结果组成。(*该技术在2024年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利技术涉及音频源编码系统,但是同样的方法也可应用于许多其他
中。介绍了可用于利用立体声属性的参数表示的音频编码系统的不同技术。
技术介绍
本专利技术涉及音频信号的立体声声像的参数编码。用于描述立体声声像属性的典型参数是声道间强度差异(IID)、声道间时间差异(ITD)和声道间相干(IC)。为了基于这些参数重建立体声声像,要求一种能够根据IC参数重建两个声道间的正确相关级别的方法。这是通过去相关方法来实现的。有几种创建去相关后的信号的方法可用。理想情况下,要求具有全通频率响应的线性时不变(LTI)函数。用于实现这一点的一种明显方法是通过使用恒定延迟。但是,使用延迟或任何其他LTI全通函数,将会导致加上未经处理的信号后的非全通响应。在延迟的情况下,结果将会是典型梳状滤波器。梳状滤波器通常给出不合需要的“金属”声音,即使立体声加宽效果有效,该声音也会大大降低原始声音的自然度。现有技术还已知通过沿频率轴向IID值添加随机序列来生成去相关后的信号的频域方法,其中不同序列用于不同音频声道。通过随机序列修改进行的频域去相关的一个问题是引入了前回声。主观测试表明对于非静止信号,前回声比起后回声来恼人得多,已确立的心理声学原理也支持这一点。此问题可通过就瞬态内容而言针对信号特性而动态自适应变换尺寸来减小。但是,切换变换尺寸始终是硬(即二元)判决,它影响整个信号带宽并且难以用鲁棒的方式来实现。美国专利申请公布US2003/0219130A1公开了基于相干的音频编码和合成。具体而言,通过为每个临界频带修改听觉情景参数,从单声道(mono)音频信号合成听觉情景,所述参数例如是临界频带内的每个子频带的耳间级别差异(ILD)和/或耳间时间差异(ITD),其中修改是基于临界频带的平均估计相干的。基于相干的修改产生了具有对象宽度的听觉情景,这精确地匹配了原始输入听觉情景中的对象的宽度。立体声参数是公知的BCC参数,其中BCC代表技术心理声学编码(binaural cue coding)。当生成两个不同的去相关后的输出声道时,由离散付立叶变换所获得的频率系数被一起聚集在单个临界频带中。基于声道间相干测量,加权因子被乘以伪随机序列,该序列优选地被选择为使得对于所有临界频带方差大致恒定,并且在每个临界频带内平均值为0。相同的序列适用于每个不同帧的频谱系数。
技术实现思路
本专利技术的目的是提供一种用于参数性编码的多声道信号的解码概念或用于生成这种信号的编码概念,这种信号产生良好的音频质量和良好的编码效率。此目的是通过用于根据权利要求1的用于生成去相关信号的装置、根据权利要求13的多声道解码器、根据权利要求20的生成去相关信号的方法、根据权利要求21的多声道解码方法、根据权利要求22的对立体声信号编码的装置或根据权利要求26的对立体声信号编码的方法或者根据权利要求27的计算机程序来实现的。本专利技术基于在使用混响滤波器(reverberation filter)时在解码侧发现获得一个用于基于输入单声道信号生成多声道信号的第一和第二声道的良好的去相关信号,该混响滤波器向输入信号引入了整数延迟或者优选地引入了分数延迟。重要的是,此混响滤波器不被应用到整个输入信号。相反,几个混响滤波器被应用到原始输入信号即单声道信号的几个子带,以便当应用付立叶变换时,利用混响滤波器进行的混响滤波不被应用于时域或频域中,即所到达的域中。专利技术性地,利用混响滤波器为子带进行的混响滤波是在子带域中单独执行的。子带信号包括至少两个子带采样的序列,子带采样的序列代表子带信号的带宽,该带宽小于输入信号的带宽。显然,子带信号的频率带宽高于归因于由付立叶变换获得的频率系数的频率带宽。子带信号优选地由滤波器组生成,该滤波器组例如具有32或64个滤波器组信道,而对于同一示例,FFT将会具有1.024或2.048个频率系数,即频率信道。子带信号可以是通过对一批输入信号采样进行滤波而获得的子带信号。或者,子带滤波器组也可被连续应用,而没有按批进行的处理。但是对于本专利技术按批进行的处理是优选的。由于混响滤波不被应用到整个信号,而是按照子带应用的,所以避免了由梳状滤波导致的“金属”声。当子带的两个连续子带采样之间的采样周期对于解码器端的良好声音印象来说太大时,在混响滤波器中最好使用分数延迟,例如子带信号的采样周期的0.1至0.9之间的延迟,并且最好是子带信号的采样周期的0.2至0.8之间的延迟。注意,在临界采样情况下,当利用具有64个滤波器组信道的滤波器组生成64个子带信号时,子带信号中的采样周期比原始输入信号的采样周期大64倍。这里要注意延迟是混响设备中使用的滤波过程的不可缺少的部分。输出信号由输入信号的多个延迟后的版本构成。最好将信号延迟子带采样周期的若干分之几,以便在子带域中实现良好的混响设备。在本专利技术的优选实施例中,由每个子带中的每个混响滤波器引入的延迟以及优选地分数延迟对于所有子带是相等的。然而,对于每个子带,滤波器系数是不同的。优选使用IIR滤波器。根据实际情形,可利用收听测试来经验地确定不同滤波器的分数延迟和滤波器系数。由混响滤波器组进行滤波的子带构成去相关信号,该去相关信号将被与原始输入信号即单声道信号相混合,以获得解码后的左声道和解码后的右声道。去相关信号与原始信号的这一混合是基于与参数性编码的信号一起传输的声道间相干参数来执行的。为了获得不同的左声道和右声道,即不同的第一和第二声道,将去相关信号与单声道信号混合以获得第一输出声道与将去相关信号与单声道信号混合以获得第二输出声道是不同的。为了在编码侧获得高效效率,利用立体声参数集合的自适应式确定,而执行多声道编码。为此,编码器除了包括用于计算单声道信号的装置以及用于生成立体声参数集合的装置外,还包括用于确定左声道和右声道的后续部分的立体声参数集合的有效性的装置。优选地,该用于确定的装置可操作以在确定立体声参数集合不再有效时激活所述用于生成的装置,以便为开始于第二时间边界处的左声道和右声道的部分计算第二立体声参数集合。此第二时间边界也是通过所述确定有效性的装置来确定的。于是编码后的输出信号包括单声道信号,第一立体声参数集合和与第一参数集合相关联的第一时间边界以及第二立体声参数集合和与第二立体声参数集合相关联的第二时间边界。在解码侧,解码器将会使用有效立体声参数集合,直到达到新的时间边界。当达到此新的时间边界时,利用新的立体声参数集合执行解码操作。与现有技术方法(即执行按批进行的处理,因而执行立体声参数集合的按批确定)相比,所专利技术的自适应地确定编码侧所确定的不同时间边界的立体声参数集合的方式一方面提供了高编码效率,另一方面提供了高编码质量。这是因为对于相对静止的信号,相同的立体声参数集合可用于许多批的单声道信号采样,而不会引入可听误差。另一方面,当考虑非静止信号时,所专利技术的自适应立体声参数确定提供了增大的时间分辨率,以便每个信号部分具有其最优立体声参数集合。本专利技术通过用混响单元作为去相关器,其用滤波器组中的分数延迟线实现,并且利用去相关后的混响信号的自适应级别调整,从而提供了对现有技术问题的解决方案。以下将概述本专利技术的几个方面。本专利技术的一个方面是用于通过以下步骤延迟信号的方法通过复数滤波器组的一解析部分对实数值时域信号进行本文档来自技高网
...

【技术保护点】
用于对立体声信号编码以获得单声道输出信号和立体声参数集合的装置,包括:用于通过组合所述立体声信号的左声道和右声道来计算所述单声道信号的装置;用于利用所述左声道的一部分和所述右声道的一部分来生成第一立体声参数集合的装置(403),所述部分开始于第一时间边界处;用于确定第一立体声参数集合对所述左声道和所述右声道的后续部分的有效性的装置(401、402),其中所述用于确定的装置可操作以便:生成第二时间边界,并且在确定所述第一立体声参数集合不再有效时激活所述用于生成的装置,以便生成开始于所述第二时间边界处的、用于左信号和右信号的部分的第二立体声参数集合;以及用于输出所述单声道信号、所述第一立体声参数集合和与所述第一参数集合相关联的所述第一时间边界、以及所述第二立体声参数集合和与所述第二立体声参数集合相关联的所述第二时间边界的装置。

【技术特征摘要】
...

【专利技术属性】
技术研发人员:约纳斯恩德加德拉斯维尔莫斯
申请(专利权)人:杜比国际公司
类型:发明
国别省市:NL[荷兰]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利