一种声音解码装置及其方法制造方法及图纸

技术编号:10487497 阅读:110 留言:0更新日期:2014-10-03 16:21
本发明专利技术涉及一种声音解码方法,包括:解复用声音编码码流以获取低频波形编码数据和高频参数编码数据;对低频波形编码数据解码得到MDCT域上的低频谱数据;将MDCT域上的低频谱数据转换到MDFT域;从MDFT域上的低频谱数据中映射部分谱数据到高频部分;根据高频参数编码数据对映射的高频谱数据进行参数解码;将MDCT域上的低频谱数据和参数解码的MDFT域上的高频谱数据组合成MDFT域上的全频谱数据,最后通过IMDFT得到时域上的声音解码数据。本发明专利技术直接用MDCT低频谱计算MDFT低频谱,避免了进行IMDCT和MDFT转换,通过将低频MDCT谱与高频MDFT谱拼接成全频带MDFT谱,避免了在MDFT频时变换时引入低频MDFT估算带来的误差,在保持编码质量的前提下,降低了解码器的计算复杂度和计算误差。

【技术实现步骤摘要】
一种声音解码装置及其方法
本专利技术涉及音频解码,尤其涉及一种声音解码装置及其方法。
技术介绍
一种现有技术的声音解码装置和方法,包括:比特流解复用模块,用于对接收的声音编码码流进行解复用,得到相应数据帧的编码数据和边信息,向低频波形解码模块输出相应的编码数据和边信息,向高频参数解码模块和频时映射模块输出相应的边信息;低频波形解码模块用于对该帧低频波形编码数据解码,并根据冗余处理边信息对解码数据进行冗余逆处理,获取低频谱解码数据;低频谱至高频谱映射模块用于从该帧解码后的低频谱中映射部分谱数据到高频部分,得到低频谱至高频谱映射后的高频谱;高频参数解码模块用于从低频谱至高频谱映射模块中接收低频谱至高频谱映射后的高频谱,按照比特流解复用模块输出的高频参数编码数据(包括增益调整和音调性调整边信息)调整其增益和音调性得到高频谱解码数据;频时映射模块用于将低频谱和高频谱组合在一起进行频时映射。频时映射根据信号类型边信息采用不同阶数的变换或子带滤波,获取该帧的时域信号。频时映射的方法是编码端时频映射模块中时频映射的逆过程。包括逆离散傅立叶变换(IDFT)、逆离散余弦变换(IDCT)、逆修正离散余弦变换(IMDCT)、逆修正离散傅立叶变换(IMDFT)、逆余弦调制滤波器组、逆小波变换等。重采样模块用于将频时映射模块输出的该帧时域信号的采样频率变换到适合声音回放的采样频率。该声音编解码装置和方法引入了新的编解码框架,以充分结合声音波形编码和参数编码的特点,在较低的码率和计算复杂度约束下,对语音和音乐均能高质量编码。根据上述现有技术的方法,当所述低频波形解码是在MDCT变换域、所述频时映射为IMDFT变换时,解码器需要进行IMDCT频时变换以得到低频时域建信号;在进行高频参数解码之前,需要对低频解码得到的低频时域重建信号进行MDFT时频变换以得到用于高频参数解码的修正离散傅立叶变换(MDFT)域低频谱数据;最后需要进行全频带的IMDFT频时变化以得到重建信号。整个解码器需要进行三次时频/频时变换,这无疑增加了解码器的计算复杂度。如何能在保持对音乐信号的编码质量的前提下,进一步降低计算复杂度,是这个技术方向面临的课题。
技术实现思路
本专利技术的目的是提供一种能够克服上述缺陷的声音解码装置及其方法。在第一方面,本专利技术提供了一种声音解码方法,包括:对声音编码码流进行解复用,以获取低频波形编码数据和高频参数编码数据;对所述低频波形编码数据进行解码,得到修正离散余弦变换MDCT域上的低频谱数据;将所述MDCT域上的低频谱数据从MDCT域转换到修正离散傅里叶变换MDFT域,得到MDFT域上的低频谱数据;从所述MDFT域上的低频谱数据中映射部分低频谱数据到高频部分,得到频谱映射后的高频谱数据;根据所述高频参数编码数据对所述频谱映射后的高频谱数据进行参数解码,得到MDFT域上的高频谱数据;将所述MDCT域上的低频谱数据和所述MDFT域上的高频谱数据进行组合,得到MDFT域上的全频谱数据;以及对所述MDFT域上的全频谱数据进行逆修正离散傅里叶变换IMDFT,得到时域上的声音解码数据。在第二方面,本专利技术提供了一种声音解码装置,包括:比特流解复用模块,用于对声音编码码流进行解复用,以获取低频波形编码数据和高频参数编码数据;低频波形解码模块,用于对所述低频波形编码数据进行解码,得到修正离散余弦变换MDCT域上的低频谱数据;低频MDFT转换模块,用于将所述MDCT域上的低频谱数据从MDCT域转换到修正离散傅里叶变换MDFT域,得到MDFT域上的低频谱数据;低频谱至高频谱映射模块,用于从所述MDFT域上的低频谱数据中映射部分低频谱数据到高频部分,得到频谱映射后的高频谱数据;高频参数解码模块,用于根据所述高频参数编码数据对所述频谱映射后的高频谱数据进行参数解码,得到MDFT域上的高频谱数据;高频谱与低频谱组合模块,用于将所述MDCT域上的低频谱数据和所述MDFT域上的高频谱数据进行组合,得到MDFT域上的全频谱数据;以及频时映射模块,用于对所述MDFT域上的全频谱数据进行逆修正离散傅里叶变换IMDFT,得到时域上的声音解码数据。本专利技术通过由MDCT低频谱直接得到MDFT低频谱数据,避免了进行IMDCT频时变换和MDFT时频变换,并且通过将低频MDCT谱与高频MDFT谱拼接得到全频带MDFT谱,避免了在MDFT频时变换时引入因低频MDFT估算所带来的误差,从而在保持对音乐信号的编码质量的前提下,有效降低了解码器的计算复杂度并降低了计算误差。附图说明图1是根据本专利技术实施例的声音解码装置的结构框图。图2是图1所示的低频波形解码模块的结构框图。图3是图1所示的高频参数解码模块的结构框图。图4是图1所示的低频MDFT转换模块的结构框图。图5是图1所示的高频谱与低频谱组合模块的结构框图。具体实施方式下面通过附图和实施例,对本专利技术的技术方案做进一步的详细描述。为了更好地理解本专利技术的原理,需要对修正离散傅立叶变换(MDFT)、修正离散余弦变换(MDCT)、修正离散正弦变换(MDST)及其逆变换以及它们之间的关系进行介绍。首先,介绍MDFT变换的情况。选取前一帧M个样本和当前帧M个样本的时域信号,再对这两帧共2M个样本的时域信号进行加窗操作,然后对经过加窗后的信号进行MDFT变换,从而获得M个频谱系数。MDFT变换的计算公式为:k=0,1,…,2M-1,其中,w(n)为窗函数;s(n)为MDFT变换的输入时域信号,X(k)为MDFT变换输出的频域信号。为满足信号完全重构的条件,MDFT变换的窗函数w(n)必须满足以下两个条件:w(2M-1-n)=w(n)且w2(n)+w2(n+M)=1。在实际中,可选用Sine窗作为窗函数。当然,也可以通过使用双正交变换,用特定的分析滤波器和综合滤波器来修改对窗函数的限制。IMDFT变换的表达式为:其中,n表示样本序号,2M为帧长,M表示时域样本数,k表示谱序号。其次,介绍MDCT变换、MDST变换。对于时域信号s(n),其MDCT域系数X(k)的计算公式为:其中,2M为帧长。逆修正离散余弦变换(IMDCT)的公式如下:其中,xe(n)为IMDCT变换的输出时域信号,hk(n)为MDCT合成滤波器的脉冲响应,w(n)为窗函数,X(k)为MDCT域系数。类似的,定义MDST域系数Y(k)的计算公式为最后,介绍MDCT、MDST与MDFT变换的关系。以MDCT域系数X(k)为实部,MDST域系数Y(k)为虚部,构造MDFT域系数Z(k)为:Z(k)=X(k)+jY(k),k=0,1,…,2M-1,j为虚数符号。Z(k)=X(k)+jY(k)此MDFT变换是复数变换,带有相位信息,且满足能量守恒,变换域与时域信号的能量保持一致。可见MDFT域系数的实部就是等价于MDCT域系数。对于MDCT、MDST和MDFT变换,通过逆变换及时域混叠取消,都可以实现对源信号的完全重构。本专利技术后续部分关于MDCT系数与MDFT系数之间的转换关系的推导过程中将用到这一性质。图1是根据本专利技术实施例的声音解码装置的结构框图。如图1所示,根据本专利技术实施例的声音解码装置包括:比特流解复用模块101、低频波形解码模块102、低频MDFT转换模块103、低频谱至高频谱本文档来自技高网
...
一种声音解码装置及其方法

【技术保护点】
一种声音解码方法,包括:对声音编码码流进行解复用,以获取低频波形编码数据和高频参数编码数据;对所述低频波形编码数据进行解码,得到修正离散余弦变换MDCT域上的低频谱数据;将所述MDCT域上的低频谱数据从MDCT域转换到修正离散傅里叶变换MDFT域,得到MDFT域上的低频谱数据;从所述MDFT域上的低频谱数据中映射部分低频谱数据到高频部分,得到频谱映射后的高频谱数据;根据所述高频参数编码数据对所述频谱映射后的高频谱数据进行参数解码,得到MDFT域上的高频谱数据;将所述MDCT域上的低频谱数据和所述MDFT域上的高频谱数据进行组合,得到MDFT域上的全频谱数据;以及对所述MDFT域上的全频谱数据进行逆修正离散傅里叶变换IMDFT,得到时域上的声音解码数据。

【技术特征摘要】
1.一种声音解码方法,包括:对声音编码码流进行解复用,以获取低频波形编码数据和高频参数编码数据;对所述低频波形编码数据进行解码,得到修正离散余弦变换MDCT域上的低频谱数据;将所述MDCT域上的低频谱数据从MDCT域转换到修正离散傅里叶变换MDFT域,得到MDFT域上的低频谱数据;从所述MDFT域上的低频谱数据中映射部分低频谱数据到高频部分,得到频谱映射后的高频谱数据;根据所述高频参数编码数据对所述频谱映射后的高频谱数据进行参数解码,得到MDFT域上的高频谱数据;将所述MDCT域上的低频谱数据和所述MDFT域上的高频谱数据进行组合,得到MDFT域上的全频谱数据;以及对所述MDFT域上的全频谱数据进行逆修正离散傅里叶变换IMDFT,得到时域上的声音解码数据。2.根据权利要求1所述的方法,其中,所述将所述低频谱数据从MDCT域转换到修正离散傅里叶变换MDFT域,得到MDFT域上的低频谱数据的步骤包括:根据当前帧及其前后帧的MDCT域上的低频谱数据和三个转换矩阵,计算出所述MDFT域上的低频谱数据,其中,所述三个转换矩阵是通过建立所述低频谱数据的当前帧及其前后帧的MDCT域系数与当前帧的MDFT域系数之间的关系,然后根据所述关系预先确定的。3.根据权利要求1所述的方法,其中,所述将所述MDCT域上的低频谱数据和所述MDFT域上的高频谱数据进行组合,得到MDFT域上的全频谱数据的步骤包括:根据所述MDCT域上的低频谱数据的频带边界构造出所述MDCT域上的低频谱数据在MDFT域上的变体表达谱数据,其中,所述变体表达谱数据不是MDFT谱数据并且用于通过其IMDFT变换重构时域数据,所述频带边界是根据所述声音编码码流的当前帧的块类型以及在编码端确定的高低频分割频率预先确定的;对所述变体表达谱数据和所述MDFT域上的高频谱数据进行频段拼接,得到MDFT域上的全频谱数据。4.根据权利要求3所述的方法,其中,所述构造出所述MDCT域上的低频谱数据在MDFT域上的变体表达谱数据的步骤包括:根据所述频带边界对所述MDCT域上的低频谱数据进行分类;根据分类后的低频谱数据构造出所述MDFT域上的变体表达谱数据。5.根据权利要求4所述的方法,其中:所述MDCT域上的低频谱数据被分为不超过所述频带边界的第一类数据和超过所述频带边界的第二类数据;所述MDFT域上的变体表达谱数据是通过将所述第一类数据乘以2,将所述第二类数据置0而得到的。6.根据权利要求3所述的方法,其中,所述构造出所述MDCT域上的低频谱数据在MDFT域上的变体表达谱数据的步骤包括:根据第一频带边界范围将所述MDCT域上的低频谱数据转换到MDFT域,得到第一频带边界范围内MDFT域上的低频谱数据,其中,所述第一频带边界范围由所述频带边界和预定的第一边界处理宽度决定;根据第二频带边界范围对所述MDCT域上的低频谱数据进行分类,其中,所述第二频带边界范围由所述频带边界和预定的第二边界处理宽度决定;根据分类后的低频谱数据和所述第一频带边界范围内的MDFT域的低频谱数据,构造出所述MDFT域上的变体表达谱数据。7.根据权利要求6所述的方法,其中:所述MDCT域上的低频谱数据被分为不超过所述第二频带边界范围最小值的第一类数据和超过所述第二频带边界范围最大值的第二类数据;所述MDFT域上的变体表达谱数据是通过将所述第一类数据乘以2,将第二类数据置0,并且将当前帧及其前后帧的所述第一频带边界范围内的MDFT域上的低频谱数据分别与预先得到的三个转换矩阵相乘再将三个乘积相加而得到的。8.根据权利要求3所述的方法,其中,所对所述变体表达谱数据和所述MDFT域上的高频谱数据进行频段拼接,得到MDFT域上的全频谱数据的步骤包括:在第三频带边界范围内对所述变体表达谱数据和所述MDFT域上的高频谱数据进行频段拼接...

【专利技术属性】
技术研发人员:吴超刚潘兴德
申请(专利权)人:北京天籁传音数字技术有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1