使用边增益和残差增益对多声道信号进行编码或解码的装置和方法制造方法及图纸

技术编号：40606683 阅读：19 留言：0更新日期：2024-03-12 22:13

公开了一种用于对包括至少两个声道101、102在内的多声道信号100进行编码的装置，该装置包括：下混合器120，用于根据多声道信号100计算下混合信号122；参数计算器140，用于根据至少两个声道中的第一声道101和至少两个声道中的第二声道102计算边增益141，并且用于根据第一声道101和第二声道102计算残差增益142；以及输出接口160，用于产生输出信号，该输出信号包括与下混合信号122、边增益141和残差增益142有关的信息。还公开了一种用于对经编码的多声道信号进行解码的装置、以及对应的编码方法和解码方法、计算机可读介质。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及音频编码的领域，并且具体地涉及立体声或多声道编码/解码的领域。

技术介绍

1、用于在低比特率下对立体声信号进行有损参数化编码的现有技术方法基于如mpeg-4第3部分中标准化的参数化立体声。总的构思是在提取作为边信息而被发送给解码器的立体声参数之后，通过计算来自两个输入声道的下混合信号来减少声道的数量。这些立体声参数通常是声道间电平差(inter-channel-level-difference)ild、声道间相位差(inter-channel-phase-difference)ipd和声道间相干性(inter-channel-coherence)icc，这些参数在子带中计算并且在一定程度上捕获空间图像。

2、解码器执行单声道输入的上混合，从而产生满足ild、ipd和icc关系的两个声道。这是通过将输入信号与在解码器处产生的该信号的去相关的版本一起矩阵化来完成的。

3、已经发现，例如这些参数的使用使得计算和处理这些参数显著复杂。特别地，ild参数是有问题的，因为它可以具有非常小或非常大的值，并且这种几乎不受限制的值范围引起关于有效计算、量化等的问题。

技术实现思路

1、本专利技术的目的是提供一种用于处理多声道数据的改进的构思。

2、该目的通过根据本申请实施例所述的用于对多声道信号进行编码的装置、根据本申请实施例所述的用于对经编码的多声道信号进行解码的装置、根据本申请实施例所述的对多声道信号进行编码的方法、根据本申请实施例所述的对经编码

3、本专利技术的第一方面基于以下发现：与现有技术相比，采用不同的参数化编码过程，其依赖于两个增益参数，即，边增益(side gain)参数和残差增益(residual gain)参数。根据多声道信号的至少两个声道中的第一声道和多声道信号的至少两个声道中的第二声道来计算这两个增益参数。这两个增益参数(即，边增益和残差增益)都被发送或存储、或者通常与下混合信号一起输出，其中下混合信号是由下混合器根据多声道信号而计算的。

4、本专利技术的第一方面的实施例基于新的中间/边方法，从而产生新的参数集合：在编码器处，中间/边变换被应用于输入声道，其中输入声道一起捕获两个输入声道的完整信息。中间信号是左右声道的经加权的均值，其中权重是复数并且被选择用于补偿相位差。因此，边信号是输入声道的对应的经加权后的差。仅中间信号是波形编码的，而边信号是参数化建模的。编码器在子带中操作，在其中它提取ipd和两个增益参数作为立体声参数。第一增益(称为边增益)通过由中间信号预测边信号而获得，第二增益(称为残差增益)捕获相对于中间信号的能量的其余项的能量。然后，中间信号用作下混合信号，其与立体声参数一起被发送给解码器。

5、解码器通过基于边增益和残差增益估计丢失的边声道并使用其余项的替代项来合成两个声道。

6、本专利技术的第一方面的优点在于，一方面，边增益是限于某一小范围的数的增益，并且另一方面，残差增益是限于某一小范围的数的增益。具体地，在优选实施例中，边增益限于-1到+1的范围内，并且残差增益甚至限于0与1的范围内。并且，在优选实施例中，甚至更有用的是残差增益取决于边增益，使得随着边增益变得越大，残差增益可以具有的值的范围变得越小。

7、具体地，边增益被计算为边预测增益，其可应用于第一声道和第二声道的中间信号，以便预测第一声道和第二声道的边信号。并且，参数计算器还被配置为将残差增益计算为残差预测增益，其中残差预测增益指示通过中间信号和边增益对边信号进行这种预测的残差信号的能量或幅度。

8、然而，重要的是，不必在编码器侧实际执行预测或在编码器侧实际对边信号进行编码。相反，可以通过仅使用幅度相关测量(例如，能量、功率或与左右声道的幅度相关的其它特性)来计算边增益和残差增益。附加地，边增益和残差增益的计算仅与两个声道之间的内积相关，即，在实施例中，不必计算除了左声道和右声道之外的任何其它声道(例如，下混合声道本身或边声道本身)。然而，在其它实施例中，可以计算边信号，可以计算用于预测的不同试验，并且可以根据残差信号计算增益参数(例如，边增益和残差增益)，其中残差信号与在不同的试验中产生预定义准则(例如，残差或其余信号的最小能量)的某个边增益预测相关联。因此，存在高灵活性，并且尽管如此，在一方面存在用于计算边增益的低复杂度，并且在另一方面存在用于计算残差增益的低复杂度。

9、与ild和icc相比，存在增益参数的两个示例性优点。首先，它们自然位于有限区间(边增益在[-1，1]中，并且残差增益在[0，1]中)，这与ild参数相反，其中ild参数可以取任意大或小的值。其次，计算不那么复杂，因为它仅涉及单个特殊的函数评估，而ild和icc的计算涉及两个。

10、第一方面的优选实施例依赖于参数在频谱域中的计算，即，针对不同频率段(frequency bin)计算参数，或者更优选地，针对不同子带计算参数，其中每个子带包括某一数量的频率段。在优选实施例中，子带内包括的频率段的数量从较低子带到较高子带增加，以便模仿人类收听感知的特性，即较高频带覆盖较高频率范围或带宽，而较低频带覆盖较低频率范围或带宽。

11、在优选实施例中，下混合器计算经绝对相位补偿的下混合信号，其中，基于ipd参数，相位旋转被应用于左声道和右声道，但是以使得具有更多能量的声道比具有更少能量的声道更少地旋转的方式来执行相位补偿。为了控制相位补偿，可以优选地使用边增益，然而，在其它实施例中，可以使用任何其它下混合，并且这也是本专利技术的特定优点，即，边信号的参数化表示(即，一方面的边信号和另一方面的残差信号)仅基于原始的第一声道和第二声道计算，而不需要关于所发送的下混合的任何信息。因此，任何下混合可以与由边增益和残差增益组成的新参数化表示一起使用，但是本专利技术对于与基于边增益的绝对相位补偿一起应用也是特别有用的。

12、在绝对相位补偿的另一实施例中，相位补偿参数具体地基于特定的预定数来计算，使得在计算相位补偿参数时出现的反正切函数(atan或tan-1)的奇点从中心移动到某一边位置。奇点的这种移位确保了对于+/-180°的相移和接近0的增益参数(即，具有非常相似的能量的左右声道)，不会发生由于奇点引起的任何问题。已经发现这种信号经常发生，但是在自然情况下不会出现彼此异相但是具有例如在3db与12db之间或者大约6db的差值的信号。因此，尽管奇点仅被移位，但是已经发现这种移位仍然改进了下混合器的整体性能，因为相比于直接反正切函数的奇点的情况，这种移位确保了奇点更少地出现在信号星座图(signal constellation)情况下(这在正常情况下出现)。

13、另外的实施例利用边增益和残差增益的依赖性来实现有效的量化过程。为此，优选地执行联合量化，在第一实施例中，执行联合量化以便首先量化边增益，然后使用基于边本文档来自技高网...

【技术保护点】

1.一种用于对包括至少两个声道(101、102)在内的多声道信号(100)进行编码的装置，包括：

2.根据权利要求1所述的装置，

3.根据权利要求1所述的装置，

4.根据权利要求1所述的装置，

5.根据权利要求1所述的装置，

6.根据权利要求1所述的装置，

7.根据权利要求6所述的装置，

8.根据权利要求7所述的装置，

9.根据权利要求7所述的装置，

10.根据权利要求7所述的装置，

11.根据权利要求6所述的装置，

12.根据权利要求1所述的装置，

13.根据权利要求1所述的装置，

14.根据权利要求1所述的装置，

15.根据权利要求14所述的装置，其中，所述参数计算器(140)被配置为计算所述边增益(141)，使得所述边增益(141)具有在-1与+1之间的值范围，并且

16.根据权利要求14所述的装置，

17.根据权利要求14所述的装置，

18.根据权利要求14所述的装置，</p>

19.根据权利要求1所述的装置，

20.根据权利要求19所述的装置，

21.一种用于对经编码的多声道信号(200)进行解码的装置，包括：

22.根据权利要求21所述的装置，

23.根据权利要求21所述的装置，

24.根据权利要求21所述的装置，

25.根据权利要求21所述的装置，

26.根据权利要求21所述的装置，

27.根据权利要求26所述的装置，

28.根据权利要求27所述的装置，

29.根据权利要求21所述的装置，

30.根据权利要求27所述的装置，

31.根据权利要求21所述的装置，

32.根据权利要求31所述的装置，

33.根据权利要求21所述的装置，其中所述边增益(206)表示边预测增益，所述边预测增益应用于第一声道和第二声道的中间信号以预测所述第一声道和所述第二声道的边信号，以及其中，所述残差增益(205)表示残差预测增益，所述残差预测增益指示使用所述边增益(206)通过所述中间信号预测所述边信号的残差信号的幅度相关特性。

34.一种对包括至少两个声道(101、102)在内的多声道信号(100)进行编码的方法，包括：

35.一种对经编码的多声道信号(200)进行解码的方法，包括：

36.一种计算机可读介质，存储有计算机程序，所述计算机程序用于当在计算机或处理器上运行时执行根据权利要求34所述的方法或权利要求35所述的方法。

...

【技术特征摘要】