用于生成输出降混表示的装置、方法或计算机程序制造方法及图纸

技术编号：31611165 阅读：15 留言：0更新日期：2021-12-29 18:40

一种用于从输入降混表示生成输出降混表示的装置，其中，输入降混表示的至少一部分根据第一降混方案，所述装置包括：升混器(200)，用于使用与第一降混方案相对应的升混方案对输入降混表示的至少所述一部分进行升混，以获得至少一个升混部分；以及降混器(300)，用于根据不同于第一降混方案的第二降混方案对至少一个升混部分进行降混。一个升混部分进行降混。一个升混部分进行降混。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】用于生成输出降混表示的装置、方法或计算机程序

[0001]本专利技术涉及多声道处理，并且具体地，涉及提供单声道输出的可能性的多声道处理。

技术介绍

[0002]尽管通常将立体声编码的比特流解码以在立体声系统上回放，但是并非所有能够接收立体声比特流的设备将始终能够输出立体声信号。一种可能的场景会是在仅具有单声道扬声器的移动电话上回放立体声信号。随着新兴的3GPP IVAS标准支持的多声道移动通信场景的到来，因此需要立体声到单声道降混，该降混避免了附加延迟，并且在复杂度方面尽可能地有效，同时还提供最佳可能的感知质量，其超出了使用简单的被动降混所能达到的效果。
[0003]有多种将立体声信号转换为单声道信号的方式。最直接的方式是在时域中通过被动降混[1]，通过将左声道与右声道相加并缩放结果来生成中间信号：
[0004][0005]其他更复杂的(即主动的)基于时域的降混方法包括：致力于保持信号的整体能量的能量缩放[2]、[3]、避免相消效果的相位对齐[4]以及通过相干抑制防止梳状滤波器效果[5]。
[0006]另一种方法是通过计算多个频谱带的各自的加权因子，以频率相关的方式进行能量校正。例如，这是作为MPEG
‑
H格式转换器的一部分完成的，其中降混在信号的混合QMF子频带表示上执行，该信号具有声道的附加先前相位对齐。在[7]中，类似的按照频带的降混(包括相位与时间对齐二者)已经用于参数化的低比特率模式DFT立体声，其中在DFT域中应用加权和混合。
[0007]在对立体声信号进...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种用于从输入降混表示生成输出降混表示的装置，其中，所述输入降混表示的至少一部分根据第一降混方案，所述装置包括：升混器(200)，用于使用与所述第一降混方案相对应的升混方案对所述输入降混表示的至少所述一部分进行升混，以获得至少一个升混部分；以及降混器(300)，用于根据不同于所述第一降混方案的第二降混方案对所述至少一个升混部分进行降混，以获得第一降混部分，所述第一降混部分表示针对所述输入降混表示的至少所述一部分的输出降混表示。2.根据权利要求1所述的装置，其中，所述输入降混表示的仅所述一部分根据所述第一降混方案，并且所述输入降混表示的第二部分根据所述第二降混方案，其中，所述降混器(300)被配置用于根据所述第二降混方案对所述至少一个升混部分进行降混，以获得所述第一降混部分；以及所述装置还包括组合器(400)，用于组合所述第一降混部分和所述输入降混表示的第二部分，或者组合所述第一降混部分和从所述输入降混表示的第二部分中导出的降混部分，以获得所述输出降混表示，所述输出降混表示包括针对所述输入降混表示的仅所述一部分的第一输出表示和针对所述输入降混表示的第二部分的第二输出表示，其中，针对所述输入降混表示的仅所述一部分的第一输出表示和针对所述输入降混表示的第二部分的第二输出表示基于相同的降混方案。3.根据权利要求1或2所述的装置，其中，所述输入降混表示的至少所述一部分或者所述输入降混表示的仅所述一部分是第一频段，其中，所述第一降混方案是依赖于残差信号的降混方案，以及其中，所述升混器(200)被配置为使用所述残差信号来执行升混。4.根据权利要求1、2或3所述的装置，其中，所述第二降混方案是全参数化方案，并且其中，所述降混器(300)被配置为应用所述第二降混方案。5.根据权利要求2、3或4所述的装置，其中，所述输入降混表示的第二部分是第二频段，并且其中，所述组合器(400)被配置为组合所述第一降混部分和所述输入降混表示的第二部分，以获得所述输出降混表示。6.根据前述权利要求中任一项所述的装置，还包括音频解码器(10)，用于生成针对所述输入降混表示的至少所述一部分或者所述输入降混表示的仅所述一部分的解码核心信号，并且生成针对所述输入降混表示的至少所述一部分或者所述输入降混表示的仅所述一部分的解码残差信号，其中，所述升混器(200)被配置为在所述升混方案中使用针对所述所述输入降混表示的至少所述一部分或者所述输入降混表示的仅所述一部分的解码核心信号和针对所述输入降混表示的至少所述一部分或者所述输入降混表示的仅所述一部分的解码残差信号，其中，所述降混器(300)被配置用于接收所述至少一个升混部分，所述至少一个升混部分包括比所述输入降混表示更多的声道。7.根据权利要求6所述的装置，其中，所述输入降混表示的第二部分根据所述第二降混方案，其中，所述音频解码器(10)被配置用于生成针对所述输入降混表示的第二部分的解码核心信号，并且生成针对所述输入降混表示的至少所述一部分或者所述输入降混表示的仅所述一部分的解码残差信号，并且其中，所述组合器(400)被配置为组合所述第一降混部
分和针对所述输入降混表示的第二部分的解码核心信号。8.根据前述权利要求中的一项所述的装置，还包括：时间到频谱转换器(100)，用于将所述输入降混表示的至少所述一部分或者所述输入降混表示的仅所述一部分的时域输入降混表示转换到频谱域；以及频谱到时间转换器(400)，用于将输出信号转换到时域，以获得所述输出降混表示，其中，所述时间到频谱转换器(100)或者所述频谱到时间转换器(400)被配置为执行重叠和相加处理或者从较早时间块到稍后时间块执行交叉处理，或者还包括输出接口(500)，用于向渲染设备输出所述输出降混表示，或者还包括渲染设备，用于将所述输出降混表示渲染为单声道重播信号，或者其中，所述降混器(300)被配置为将以下降混方案应用为所述第二降混方案：主动降混方案、节能降混方案或其中降混信号的目标能量与从第一声道和第二声道中导出的中间声道的能量的比例在预定比例中的降混方案，其中，所述第一声道和所述第二声道中的至少一个在相加到一起以形成所述输入降混表示之前被相位旋转。9.根据权利要求8所述的装置，其中，所述输入降混表示的第二部分根据第二降混，其中，所述时间到频谱转换器(100)被配置用于将所述输入降混表示的第二部分的时域输入降混表示转换到频谱域，或者其中，所述预定比例指示相对于第一原始声道和第二原始声道的能量中较高的能量相等或具有3dB的偏差范围。10.根据前述权利要求中的一项所述的装置，其中，所述输入降混表示的至少所述一部分根据所述第一降混方案，所述第一降混方案依赖于残差信号或者依赖于残差信号和参数化信息，其中，所述升混器(200)被配置用于分别使用与所述第一降混方案相对应的升混方案并且使用所述残差信号或所述残差信号和所述参数化信息，来对所述输入降混表示的至少所述一部分的输入降混表示进行升混，以获得所述至少一个升混部分；以及其中，所述降混器(300)被配置用于根据不同于所述第一降混方案的所述第二降混方案，对所述至少一个升混部分进行降混，以获得包括至少一个降混部分的输出降混表示，其中，所述第二降混方案是主动降混方案或全参数化降混方案。11.根据权利要求10所述的装置，还包括输出接口(500)，用于向渲染设备输出所述输出降混表示，或者还包括渲染设备，用于将所述输出降混表示渲染为单声道重播信号。12.根据权利要求10或11所述的装置，其中，所述降混器(300)被配置为将以下降混方案应用为主动降混方案：节能降混方案或其中降混信号的目标能量相对于从第一声道和第二声道中导出的中间声道的能量的比例在预定比例中的降混方案，其中，所述第一声道和所述第二声道中的至少一个在相加到一起之前被相位旋转。13.根据权利要求10、11或12所述的装置，其中，所述输入降混表示的至少所述一部分包括所述输入降混表示的全部带宽。14.根据前述权利要求中的一项所述的装置，其中，所述降混器(300)被配置为执行所述第二降混方案，所述第二降混方案包括：针对所述至少一个升混部分的频谱带，计算(800)第一声道的第一权重和第二声道的第二权重，所述频谱带包括多条频谱线；以及
将所述第一权重应用于(820)所述第一声道的频谱带的频谱线，并且将所述第二权重应用于所述第二声道的频谱带的频谱线，并且将第一经加权线和第二经加权线相加，以获得频谱带中的降混频谱线，并且其中，所述装置被配置为将所述降混频谱线转换(840)到时域，以获得所述输出降混表示的时域样本。15.根据权利要求14所述的装置，其中，使用所述第一声道和所述第二声道的能量以及目标能量，按照频带来执行所述第一权重和所述第二权重的计算。16.根据权利要求15所述的装置，其中，所述目标能量等于经相位旋转的中间声道的能量，或者是从所述第一声道、所述第二声道的能量并且从所述第一声道与所述第二声道之间的相关值中导出的。17.根据权利要求14至16中的一项所述的装置，其中，针对频谱带计算所述第一权重和所述第二权重包括：计算(802)所述频谱带中的第一声道的幅度相关度量；计算(804)所述频谱带中的第二声道的幅度相关度量；计算(806)所述频谱带中的第一声道与第二声道的线性组合的幅度相关度量；计算(808)所述频谱带中的所述第一声道与所述第二声道之间的互相关度量；以及使用所述第一声道的幅度相关度量、所述第二声道的幅度相关度量、所述线性组合的幅度相关度量以及所述互相关度量来计算(810)所述第一权重和所述第二权重。18.根据前述权利要求中的一项所述的装置，其中，所述升混器(200)被配置为执行升混方案，所述升混方案包括：使用频谱带的预测参数和所述频谱带的残差信号线以及第一计算规则，根据所述输入降混表示的至少所述一部分或者所述输入降混表示的仅所述一部分的频谱带的频谱线，来针对所述输入降混表示的至少所述一部分或者所述输入降混表示的仅所述一部分的频谱带，计算第一声道频谱线，以及使用频谱带的预测参...

【专利技术属性】
技术研发人员：弗伦茨，
申请(专利权)人：弗劳恩霍夫应用研究促进协会，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人