解码系统和解码方法技术方案

技术编号:11914488 阅读:112 留言:0更新日期:2015-08-20 17:50
本发明专利技术提供了一种解码系统和解码方法。在一个实施例中,解码方法用于从输入立体声信号获得输出立体声信号,该输入立体声信号通过复数预测编码进行编码并且包括两个输入通道的第一频域表示,该解码方法包括以下的上混步骤:(i)计算第一输入通道的第二频域表示;以及(ii)根据第一输入通道的第一频域表示和第二频域表示、第二输入通道的第一频域表示和复数预测系数来计算输出通道。可响应于控制数据将上混挂起。

【技术实现步骤摘要】
解码系统和解码方法本申请是申请日为2011年4月6日、申请号为“201180023421.0”、专利技术名称为“基于MDCT的复数预测立体声编码”的专利技术专利申请的分案申请。
本文中公开的专利技术总体上涉及立体声音频编码,更准确地涉及用于在频域中使用复数预测的立体声编码的技术。
技术介绍
与立体声信号的左(L)通道和右(R)通道的独立编码相比,立体声信号的左(L)通道和右(R)通道的联合编码使得能够进行更有效的编码。用于联合立体声编码的常用方法是中间/侧(M/S)编码。这里,中间(M)信号是通过将L信号和R信号相加而形成的,例如,M信号可具有M=(L+M)/2的形式。另外,侧(S)信号是通过将两个通道L和R相减而形成的,例如,S信号可具有S=(L-R)/2的形式。在M/S编码的情况下,对M和S信号而不是L和R信号进行编码。在MPEG(运动图像专家组)AAC(高级音频编码)标准(参见标准文档ISO/IEC13818-7)中,可以以时变方式或频变方式选择L/R立体声编码和M/S立体声编码。因此,立体声编码器可将L/R编码应用于立体声信号的一些频段,而将M/S编码用于对立体声信号的其它频段进行编码(频变)。另外,编码器可随着时间在L/R编码与M/S编码之间进行切换(时变)。在MPEGAAC中,在频域中、尤其是在MDCT(改进离散余弦变换)中实现立体声编码。这允许以频率可变方式和时间可变方式自适应地选择L/R编码或M/S编码。参数立体声编码是用于将立体声音频信号有效地编码为单耳信号加立体声参数的少量侧信息的技术。它是MPEG-4音频标准(参见标准文档ISO/IEC14496-3)的一部分。可使用任何音频编码器对单耳信号进行编码。可将立体声参数嵌入在单声道比特流的辅助部分中,因此实现完全的前向和后向兼容性。在解码器中,首先对单耳信号进行解码,其后借助于立体声参数重建立体声信号。通过去相关器,例如可包括一个或更多个延迟线的适当的全通滤波器,来生成解码后的单声道信号的去相关版本,去相关版本与单声道信号具有零交叉相关性。实质上,去相关的信号与单声道信号具有相同的频谱和时间能量分布。将单耳信号和去相关的信号一起输入到上混处理,该上混处理通过立体声参数来控制并且重建立体声信号。有关更多信息,参见论文“LowComplexityParametricStereoCodinginMPEG-4”,H.Purnhagen,第七届有关数字音频效果的国际会议的论文集(DAFx’04),意大利,那不勒斯,2004年10月5-8日,第163-168页。MPEG环绕(MPS;参见ISO/IEC23003-1和论文“MPEGSurround-TheISO/MPEGStandardforEfficientandCompatibleMulti-ChannelAudioCoding”,J.Herre等,音频工程会议论文7084,第122次会议,2007年5月5-8日)允许将参数立体声编码的原理与残余编码的原理进行组合,用所发送的残余来替代去相关的信号,从而提高感知质量。残余编码可通过对多通道信号进行下混并且可选地通过提取空间线索(spatialcues)来实现。在下混处理期间,表示误差信号的残余信号被计算,然后被编码并且被发送。它们可在解码器中代替去相关的信号。在混合方法中,它们可在某些频带中,尤其是在相对低的带中代替去相关的信号。根据当前的MPEG统一语音和音频编码(USAC)系统(图1中示出其两个示例),解码器包括位于核心解码器下游的复数值的正交镜像滤波器(QMF)组。作为滤波器组的输出获得的QMF表示是复数的—因此通过因子2进行过采样—并且可被布置为下混信号(或者等同地,中间信号)M和残余信号D,其中,对下混信号M和残余信号D应用具有复数条目的上混矩阵。L和R信号(在QMF域中)被获得为:其中,g是实数增益因子,而α是复数预测系数。优选地,α被选择为使得残余信号D的能量最小化。增益因子可通过规一化来确定,即确保和信号的能量等于左信号和右信号的能量之和。L信号和R信号中的每个的实部和虚部相互冗余—基本上,L信号和R信号中的每个可以根据另一个来计算—但是有益于使得随后能够应用频带复制(SBR)解码器而不会产生音频失真伪像。出于类似的原因,也可以以防止与其它时间或频率自适应信号处理(未示出)(例如单声道至立体声上混)有关的伪像为目的,来选择过采样信号表示的使用。逆QMF滤波是解码器中的最后处理步骤。注意,信号的带限QMF表示允许可集成到这种类型的解码器中的带限残余技术和“残余填充”技术。关于计算复杂度,以上编码结构非常适合于低比特率,通常为80kb/s以下,但是对于更高比特率来说不是最优的。更准确地,在更高的比特率,通常不采用SBR工具(由于其不会提高编码效率)。于是,在没有SBR级的解码器中,只有复数值的上混矩阵对QMF滤波器组的存在进行激励,这需要大量计算并且引入延迟(在1024个样本的帧长度,QMF分析/合成滤波器组引入961个样本的延迟)。这清楚地指示需要更有效的编码结构。
技术实现思路
本专利技术的目的是提供在高比特率范围内计算效率也高的用于立体声编码的方法和设备。本专利技术通过分别提供编码器和解码器、编码方法和解码方法以及用于编码和解码的计算机程序产品来实现该目的。在第一方面,本专利技术提供了一种用于提供通过复数预测立体声编码的立体声信号的解码器系统,该解码器系统包括:上混,被适配为根据下混信号(M)和残余信号(D)的第一频域表示生成立体声信号,第一频域表示中的每个包括第一频谱分量,第一频谱分量表示在多维空间的第一子空间中表示的对应信号的频谱内容,该上混级包括:用于根据下混信号的第一频域表示来计算下混信号的第二频域表示的模块,第二频域表示包括第二频谱分量,第二频谱分量表示在多维空间的第二子空间中表示的信号的频谱内容,该第二子空间包括多维空间的未包括在第一子空间中的部分;加权求和器,用于根据下混信号的第一频域表示和第二频域表示、残余信号的第一频域表示和编码在比特流信号中的复数预测系数(α)来计算侧信号(S);以及和与差级,用于根据侧信号和下混信号的第一频域表示计算立体声信号,其中,上混级还能够在直通模式下操作,在直通模式下,将所述下混信号和残余信号直接供应到和与差。在第二方面,本专利技术提供了一种用于通过复数预测立体声编码利用比特流信号对立体声信号进行编码的编码器系统,包括:估计器,用于估计复数预测系数;编码级,能够操作用于:(a)以由复数预测系数的值确定的关系,将立体声信号变换为下混信号和残余信号的频域表示,以及多路复用器,用于从编码级和估计器接收输出,并且用所述比特流信号对该输出进行编码。在本专利技术的第三方面和第四方面,提供了用于将立体声信号编码为比特流的方法和用于将比特流解码为至少一个立体声信号的方法。每个方法的技术特征分别类似于编码器系统和解码器系统的技术特征。在第五方面和第六方面,本专利技术还提供了包含用于在计算机上执行方法中的每个的指令的计算机程序产品。本专利技术得益于MPEGUSAC系统中的统一立体声编码的优点。这些优点在更高比特率时也被保持,而没有会伴随基于QMF的方法的计算复杂度的显著增加,其中,在更高比特率时通常不采用SBR。至少在下混通道和残本文档来自技高网
...

【技术保护点】
一种解码器系统,用于通过复数预测立体声编码提供立体声信号,所述解码器系统包括:上混级,被适配为根据下混信号(M)和残余信号(D)的第一频域表示生成所述立体声信号,所述第一频域表示中的每个包括第一频谱分量,所述第一频谱分量表示在多维空间的第一子空间中表示的对应信号的频谱内容,所述上混级包括:用于根据所述下混信号的所述第一频域表示计算所述下混信号的第二频域表示的模块,所述第二频域表示包括第二频谱分量,所述第二频谱分量表示在所述多维空间的第二子空间中表示的信号的频谱内容,所述第二子空间包括所述多维空间的未包括在所述第一子空间中的部分;加权求和器,用于根据所述下混信号的所述第一频域表示和所述第二频域表示、所述残余信号的所述第一频域表示和编码在比特流信号中的复数预测系数(α)来计算侧信号(S);以及和与差级,用于根据所述侧信号和所述下混信号的所述第一频域表示计算所述立体声信号,其中,用于计算所述下混信号的第二频域表示的模块被适配为:从所述第一频谱分量中的至少一些导出一个或更多个第一中间分量;根据一个或更多个脉冲响应中的至少一部分形成所述一个或更多个第一频谱分量的组合,以获得一个或更多个第二中间分量;以及从所述一个或更多个第二中间分量导出所述一个或更多个第二频谱分量。...

【技术特征摘要】
2010.04.09 US 61/322,4581.一种解码器系统,用于通过复数预测立体声编码提供立体声信号,所述解码器系统包括:上混级(206,207,210,211;306,307,308,309,312;406,407,408,409;1410;1421;1433),被适配为根据下混信号(M)和残余信号(D)的第一频域表示生成所述立体声信号,所述第一频域表示中的每个包括第一频谱分量,所述第一频谱分量表示在多维空间的第一子空间中表示的对应信号的频谱内容,所述上混级包括:用于根据所述下混信号的所述第一频域表示计算所述下混信号的第二频域表示的模块(206;306,307;408),所述第二频域表示包括第二频谱分量,所述第二频谱分量表示在所述多维空间的第二子空间中表示的信号的频谱内容,所述第二子空间包括所述多维空间的未包括在所述第一子空间中的部分,其中,所述模块被适配为通过对所述下混信号的所述第一频谱分量应用有限脉冲响应滤波器来确定所述下混信号的所述第二频谱分量;加权求和器(210,211;308,309;406,407),用于根据所述下混信号的所述第一频域表示和所述第二频域表示、所述残余信号的所述第一频域表示和编码在比特流信号中的复数预测系数(α)来计算侧信号(S);以及和与差级(207;312;409),用于根据所述侧信号和所述下混信号的所述第一频域表示计算所述立体声信号,其中,所述上混级还能够在直通模式下操作,在所述直通模式下将所述下混信号和残余信号直接供应到所述和与差级。2.如权利要求1所述的解码器系统,其中,所述有限脉冲响应滤波器的脉冲响应是根据被应用以确定所述下混信号的所述第一频域表示的窗口函数来确定的。3.如权利要求1所述的解码器系统,其中,所述下混信号和残余信号被分割为时间帧,所述上混级还被适配为:针对每个时间帧,接收与该帧相关联的两比特数据字段,并且响应于所述数据字段的值,在所述上混级的活动模式或所述上混级的直通模式下操作。4.如权利要求1所述的解码器系统,其中,所述下混信号和残余信号被分割为时间帧,所述上混级还被适配为:针对每个时间帧,在MPEG比特流中接收与该帧相关联的ms_mask_present字段,并且响应于所述ms_mask_present字段的值,在所述上混级的活动模式或所述上混级的直通模式下操作。5.如权利要求1-4中任一项所述的解码器系统,还包括:布置在所述上混级的上游的去量化级(202;301;401),用于根据比特流信号提供所述下混信号(M)和残余信号(D)的所述第一频域表示。6.如权利要求1-4中任一项所述的解码器系统,其中:所述第一频谱分量具有在所述第一子空间中表示的实数值;以及所述第二频谱分量具有在所述第二子空间中表示的虚数值。7.如权利要求6所述的解码器系统,其中,所述第一频谱分量能够通过以下各项之一获得:离散余弦变换DCT,或改进离散余弦变换MDCT,以及,所述第二频谱分量能够通过以下各项之一获得:离散正弦变换DST,或改进离散正弦变换MDST。8.根据权利要求1-4中任一项所述的解码器系统,还包括布置在所述上混级的上游的至少一个时域噪声整形TNS模块(204;303;403);布置在所述上混级的下游的至少一个其它TNS模块(410);以及第一选择器布置(404,411),用于选择性地激活:(a)在所述上混级的上游的所述TNS模块;(b)在所述上混级的下游的所述其它TNS模块。9.如权利要求6所述的解码器系统,其中:所述下混信号被划分为连续的时间帧,每个时间帧与所述复数预测系数的值相关联;以及用于计算所述下混信号的第二频域表示的模块被适配为:响应于所述复数预测系数的虚部的绝对值小于时间帧的预定公差,将其本身去激活,使得其针对该时间帧不产生任何输出。10.如权利要求9所述的解码器系统,其中...

【专利技术属性】
技术研发人员:蓬图斯·卡尔森海科·普尔哈根拉尔斯·维尔默斯
申请(专利权)人:杜比国际公司
类型:发明
国别省市:荷兰;NL

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1