解码系统和解码方法技术方案

技术编号：11914488 阅读：120 留言：0更新日期：2015-08-20 17:50

本发明专利技术提供了一种解码系统和解码方法。在一个实施例中，解码方法用于从输入立体声信号获得输出立体声信号，该输入立体声信号通过复数预测编码进行编码并且包括两个输入通道的第一频域表示，该解码方法包括以下的上混步骤：(i)计算第一输入通道的第二频域表示；以及(ii)根据第一输入通道的第一频域表示和第二频域表示、第二输入通道的第一频域表示和复数预测系数来计算输出通道。可响应于控制数据将上混挂起。

全部详细技术资料下载

【技术实现步骤摘要】
解码系统和解码方法本申请是申请日为2011年4月6日、申请号为“201180023421.0”、专利技术名称为“基于MDCT的复数预测立体声编码”的专利技术专利申请的分案申请。
本文中公开的专利技术总体上涉及立体声音频编码，更准确地涉及用于在频域中使用复数预测的立体声编码的技术。
技术介绍
与立体声信号的左(L)通道和右(R)通道的独立编码相比，立体声信号的左(L)通道和右(R)通道的联合编码使得能够进行更有效的编码。用于联合立体声编码的常用方法是中间/侧(M/S)编码。这里，中间(M)信号是通过将L信号和R信号相加而形成的，例如，M信号可具有M＝(L+M)/2的形式。另外，侧(S)信号是通过将两个通道L和R相减而形成的，例如，S信号可具有S＝(L-R)/2的形式。在M/S编码的情况下，对M和S信号而不是L和R信号进行编码。在MPEG(运动图像专家组)AAC(高级音频编码)标准(参见标准文档ISO/IEC13818-7)中，可以以时变方式或频变方式选择L/R立体声编码和M/S立体声编码。因此，立体声编码器可将L/R编码应用于立体声信号的一些频段，而将M/S编码用于对立体声信号的其它频段进行编码(频变)。另外，编码器可随着时间在L/R编码与M/S编码之间进行切换(时变)。在MPEGAAC中，在频域中、尤其是在MDCT(改进离散余弦变换)中实现立体声编码。这允许以频率可变方式和时间可变方式自适应地选择L/R编码或M/S编码。参数立体声编码是用于将立体声音频信号有效地编码为单耳信号加立体声参数的少量侧信息的技术。它是MPEG-4音频标准(参见标准文档ISO/IE...

【技术保护点】
一种解码器系统，用于通过复数预测立体声编码提供立体声信号，所述解码器系统包括：上混级，被适配为根据下混信号(M)和残余信号(D)的第一频域表示生成所述立体声信号，所述第一频域表示中的每个包括第一频谱分量，所述第一频谱分量表示在多维空间的第一子空间中表示的对应信号的频谱内容，所述上混级包括：用于根据所述下混信号的所述第一频域表示计算所述下混信号的第二频域表示的模块，所述第二频域表示包括第二频谱分量，所述第二频谱分量表示在所述多维空间的第二子空间中表示的信号的频谱内容，所述第二子空间包括所述多维空间的未包括在所述第一子空间中的部分；加权求和器，用于根据所述下混信号的所述第一频域表示和所述第二频域表示、所述残余信号的所述第一频域表示和编码在比特流信号中的复数预测系数(α)来计算侧信号(S)；以及和与差级，用于根据所述侧信号和所述下混信号的所述第一频域表示计算所述立体声信号，其中，用于计算所述下混信号的第二频域表示的模块被适配为：从所述第一频谱分量中的至少一些导出一个或更多个第一中间分量；根据一个或更多个脉冲响应中的至少一部分形成所述一个或更多个第一频谱分量的组合，以获得一个或更多个第二中间分...

【技术特征摘要】
2010.04.09 US 61/322,4581.一种解码器系统，用于通过复数预测立体声编码提供立体声信号，所述解码器系统包括：上混级(206,207,210,211；306,307,308,309,312；406,407,408,409；1410；1421；1433)，被适配为根据下混信号(M)和残余信号(D)的第一频域表示生成所述立体声信号，所述第一频域表示中的每个包括第一频谱分量，所述第一频谱分量表示在多维空间的第一子空间中表示的对应信号的频谱内容，所述上混级包括：用于根据所述下混信号的所述第一频域表示计算所述下混信号的第二频域表示的模块(206；306,307；408)，所述第二频域表示包括第二频谱分量，所述第二频谱分量表示在所述多维空间的第二子空间中表示的信号的频谱内容，所述第二子空间包括所述多维空间的未包括在所述第一子空间中的部分，其中，所述模块被适配为通过对所述下混信号的所述第一频谱分量应用有限脉冲响应滤波器来确定所述下混信号的所述第二频谱分量；加权求和器(210,211；308,309；406,407)，用于根据所述下混信号的所述第一频域表示和所述第二频域表示、所述残余信号的所述第一频域表示和编码在比特流信号中的复数预测系数(α)来计算侧信号(S)；以及和与差级(207；312；409)，用于根据所述侧信号和所述下混信号的所述第一频域表示计算所述立体声信号，其中，所述上混级还能够在直通模式下操作，在所述直通模式下将所述下混信号和残余信号直接供应到所述和与差级。2.如权利要求1所述的解码器系统，其中，所述有限脉冲响应滤波器的脉冲响应是根据被应用以确定所述下混信号的所述第一频域表示的窗口函数来确定的。3.如权利要求1所述的解码器系统，其中，所述下混信号和残余信号被分割为时间帧，所述上混级还被适配为：针对每个时间帧，接收与该帧相关联的两比特数据字段，并且响应于所述数据字段的值，在所述上混级的活动模式或所述上混级的直通模式下操作。4.如权利要求1所述的解码器系统，其中，所述下混信号和残余信号被分割为时间帧，所述上混级还被适配为：针对每个时间帧，在MPEG比特流中接收与该帧相关联的ms_mask_present字段，并且响应于所述ms_mask_present字段的值，在所述上混级的活动模式或所述上混级的直通模式下操作。5.如权利要求1-4中任一项所述的解码器系统，还包括：布置在所述上混级的上游的去量化级(202；301；401)，用于根据比特流信号提供所述下混信号(M)和残余信号(D)的所述第一频域表示。6.如权利要求1-4中任一项所述的解码器系统，其中：所述第一频谱分量具有在所述第一子空间中表示的实数值；以及所述第二频谱分量具有在所述第二子空间中表示的虚数值。7.如权利要求6所述的解码器系统，其中，所述第一频谱分量能够通过以下各项之一获得：离散余弦变换DCT，或改进离散余弦变换MDCT，以及，所述第二频谱分量能够通过以下各项之一获得：离散正弦变换DST，或改进离散正弦变换MDST。8.根据权利要求1-4中任一项所述的解码器系统，还包括布置在所述上混级的上游的至少一个时域噪声整形TNS模块(204；303；403)；布置在所述上混级的下游的至少一个其它TNS模块(410)；以及第一选择器布置(404,411)，用于选择性地激活：(a)在所述上混级的上游的所述TNS模块；(b)在所述上混级的下游的所述其它TNS模块。9.如权利要求6所述的解码器系统，其中：所述下混信号被划分为连续的时间帧，每个时间帧与所述复数预测系数的值相关联；以及用于计算所述下混信号的第二频域表示的模块被适配为：响应于所述复数预测系数的虚部的绝对值小于时间帧的预定公差，将其本身去激活，使得其针对该时间帧不产生任何输出。10.如权利要求9所述的解码器系统，其中...

【专利技术属性】
技术研发人员：蓬图斯·卡尔森，海科·普尔哈根，拉尔斯·维尔默斯，
申请(专利权)人：杜比国际公司，
类型：发明
国别省市：荷兰;NL

全部详细技术资料下载我是这个专利的主人