使用改进的概率分布估计的基于线性预测的音频编码制造技术

技术编号:11379663 阅读:138 留言:0更新日期:2015-05-01 00:08
通过使用概率分布估计对由多个频谱分量构成的频谱进行编码来改进基于线性预测的音频编码,该概率分布估计是针对该多个频谱分量中的每个频谱分量根据线性预测系数信息来确定。具体地,总能获得该线性预测系数信息。因此,该信息可用于在编码侧和解码侧确定概率分布估计。该概率分布估计的确定可通过使用例如在该多个频谱分量处对概率分布估计的适当参数化以计算上简单的方式来实施。总之,由熵编码提供的编码效率与使用环境选择达到的概率分布估计兼容,但概率分布估计的求导较不复杂。例如,该求导可单纯地以分析方式进行和/或不需要关于邻近频谱线的属性的任何信息,诸如在空间环境选择的情况下的邻近频谱线的先前被编码/解码的频谱值。

【技术实现步骤摘要】
【国外来华专利技术】使用改进的概率分布估计的基于线性预测的音频编码
本专利技术涉及基于线性预测的音频编码,并且具体地,涉及使用频谱编码的基于线性预测的音频编码。
技术介绍
用于在频域中进行量化和编码的经典方法为获取信号的(重迭)窗,执行时间频率变换,应用感知模型(perceptualmodel),以及通过熵编码器(诸如算术编码器)来量化各个频率[1]。感知模型基本上为加权函数,将其与频谱线相乘,使得每一加权频谱线中的误差具有相等的感知影响。因此能够以相同准确度量化所有的加权线,并且总体准确度确定感知质量与位消耗之间的折衷。在USAC的AAC及频域模式(非TCX)中,逐频带地界定感知模型,使得一组频谱线(谱带)将具有相同权重。这些权重称作比例因子,这是因为这些权重界定了频带通过什么因子进行按比例调整(scale)。此外,对这些比例因子进行差分编码。在TCX域中,这些权重并未使用比例因子来编码,而是通过界定频谱包络的LPC(线性预测系数,linearpredictioncoefficient)模型[2]来进行编码,频谱包络为频谱的总体形状。使用LPC是因为其允许在TCX与ACELP之间平滑切换。然而,LPC并不能很好地对应于感知模型(LPC应更加平滑),从而将称作加权的处理应用于LPC,使得被加权的LPC近似地对应于所期望的感知模型。在USAC的TCX域中,频谱线由算术编码器来编码。算术编码器是基于将概率分配给信号的所有可能组配,使得高概率值可用数目较少的位进行编码,使得位消耗最小化。为了估计频谱线的概率分布,编码解码器(codec)使用概率模型,该概率模型在时间频率空间中基于先前已编码的线来预测信号分布。先前的线被称为待编码的当前线的环境(context)[3]。最近,NTT建议一种用于改进算术编码器的环境的方法(比较[4])。该方法是基于使用LTP来确定谐波线的近似位置(梳形滤波器(comb-filter))并且重新布置这些频谱线,使得根据环境的量值(magnitude)预测更有效率。通常而言,概率分布估计越好,则通过熵编码实现的压缩就越有效率。有利的是即将获得能够实现质量与使用上文概述的技术中的任一种可获得的质量类似、但复杂性降低的概率分布估计的原理。
技术实现思路
因此,本专利技术的目标是提供具有改进的特性的基于线性预测的音频编码方案。该目标由独立权利要求的主题来实现。本专利技术的一个基本发现为:可通过使用针对该多个频谱分量中的每个频谱分量根据线性预测系数信息确定的概率分布估计对包括多个频谱分量的频谱进行编码来改进基于线性预测的音频编码。具体地,总能获得该线性预测系数信息。因此,该信息可用于在编码侧和解码侧确定概率分布估计。该概率分布估计的确定可通过使用例如在该多个频谱分量处对该概率分布估计的适当参数化以计算上简单的方式来实施。总之,由熵编码提供的编码效率与使用环境选择达到的概率分布估计兼容,但概率分布估计的求导较不复杂。例如,该求导可单纯地以分析方式进行和/或不需要关于邻近频谱线的属性的任何信息,诸如在空间环境选择的情况下的邻近频谱线的先前被编码/解码的频谱值。例如,此继而使计算处理的并行化更为容易。此外,可需要更少的内存要求和更少的内存访问。根据本申请的一个实施例,频谱(其频谱值通过使用如刚刚概述地确定的概率估计进行熵编码)可以是使用线性预测系数信息获得的变换编码激励。根据本申请的一个实施例,例如,频谱却是在感知加权域中界定的变换编码激励。即,使用所确定概率分布估计来熵编码的频谱对应于使用变换函数来预滤波的音频信号频谱,该变换函数对应于由线性预测系数信息界定的感知加权的线性预测合成滤波器,并且针对多个频谱分量中的每个频谱分量,确定多个分布参数,使得概率分布参数在频谱上遵循函数(例如,为该函数的按比例调整版本),该函数取决于该线性预测合成滤波器的传递函数(transferfunction)与该线性预测合成滤波器的感知加权修改的传递函数的倒数(inverse)的乘积。对于多个频谱分量中的每个频谱分量,多个分布估计则为通过相应频谱分量的概率分布参数来参数化的可参数化函数。而且,总能获得线性预测系数信息,并且概率分布参数的求导可实施为单纯的分析处理和/或不需要在该频谱的不同频谱分量处的频谱值之间的任何互依性的处理。根据又一个实施例,替代地或额外地确定概率分布参数,使得概率分布参数在频谱上遵循一个函数,该函数以乘法方式(multiplicatively)取决于频谱精细结构,该频谱精细结构又是使用长期预测(LTP,longtermprediction)来确定。而且,在一些基于线性预测的编码解码器中,总能获得LTP信息,并且除此之外,概率分布参数的确定单纯地以分析方式执行和/或不需要频谱的不同频谱分量的频谱值的编码之间的互依性仍是可行的。当LTP使用与感知变换编码激励编码组合时,适度增加复杂性,则编码效率得进一步改进。附图说明有利的实现方式和实施例为从属权利要求的主题。下文关于附图进一步描述本申请的优选实施例,其中,图1示出了根据实施例的基于线性预测的音频编码器的框图;图2示出了根据实施例的图1的频谱确定器的框图;图3a示出了当使用感知编码来实施图1和图2中所示元件的操作模式时在对该操作模式的描述中出现的不同传递函数;图3b示出了图3a的函数,然而该函数使用感知模型的倒数来加权;图4示出了例示根据使用感知编码的实施例的图1的概率分布估计器14的内部操作的框图;图5a示出了例示在预加强滤波(pre-emphasisfiltering)之后的原始音频信号及其估计包络的曲线图;图5b示出了根据实施例的用于更接近地估计包络的LTP函数的实例;图5c示出了例示通过将图5b的LTP函数应用于图5a的实例的包络估计结果的曲线图;图6示出了在使用感知编码和LTP处理的另一实施例中概率分布估计器14的内部操作的框图;图7示出了根据一个实施例的基于线性预测的音频解码器的框图;图8示出了根据另一实施例的基于线性预测的音频解码器的框图;图9示出了根据一个实施例的图8的滤波器的框图;图10示出了根据一个实施例的定位于量化与熵编码级和概率分布估计器14处的图1的编码器的一部分的更详细的结构的框图;以及图11示出了根据一个实施例的(例如)图7和图8的基于线性预测的音频解码器内的一部分的框图,其定位于基于线性预测的音频解码器的与在编码侧图10所位于的部分对应的部分处,即位于概率分布估计器102和熵解码与解量化级104处。具体实施方式在描述本申请的各种实施例之前,对照本申请的说明书的引言部分中所指示的背景来例示性地论述作为本申请的基础的思想。不应将由于与具体比较技术例如USAC的比较的特定特征视为对本申请及其实施例的范围的限制。在用于算术编码的USAC方法中,环境基本上预测了随后的线的量值分布。即,在编码/解码的同时在频谱维度中扫描频谱线或频谱分量,并且根据先前编码/解码的频谱值来持续地预测量值分布。然而,LPC已在无需预测的情况下明确地编码相同信息。因此,使用LPC代替环境应带来类似的结果,但计算复杂性更低或至少具有实现更低复杂性的可能性。实际上,由于在低的位速率下,频谱基本上由“1”和“0”组成,所以环境将几乎总是非常稀少并且缺乏有用信息。因此,因为用于概率本文档来自技高网
...
使用改进的概率分布估计的基于线性预测的音频编码

【技术保护点】
一种基于线性预测的音频解码器,包括:概率分布估计器(102),所述概率分布估计器被配置成针对多个频谱分量中的每个频谱分量根据数据流(22)中所包含的线性预测系数信息来确定概率分布估计(28),其中,音频信号被编码进所述数据流中;以及熵解码与解量化级(104),所述熵解码与解量化级被配置成使用针对所述多个频谱分量中的每个频谱分量确定的概率分布估计对来自所述数据流(22)的所述多个频谱分量所构成的频谱(26)进行熵解码与解量化。

【技术特征摘要】
【国外来华专利技术】2012.06.28 US 61/665,4851.一种基于线性预测的音频解码器,包括:概率分布估计器(102),所述概率分布估计器被配置成针对多个频谱分量中的每个频谱分量根据数据流(22)中所包含的线性预测系数信息来确定概率分布估计(28),其中,音频信号被编码进所述数据流中;熵解码与解量化级(104),所述熵解码与解量化级被配置成使用针对所述多个频谱分量中的每个频谱分量确定的概率分布估计对来自所述数据流(22)的所述多个频谱分量所构成的频谱(26)进行熵解码与解量化;以及滤波器,所述滤波器被配置成根据传递函数来对所述频谱(26)塑形,所述传递函数取决于由所述线性预测系数信息界定的线性预测合成滤波器,其中,所述概率分布估计器被配置成根据所述数据流中所包含的长期预测参数来确定频谱精细结构,并且针对所述多个频谱分量中的每个频谱分量来确定概率分布参数,使得所述概率分布参数在频谱上遵循一个函数,所述函数以乘法方式取决于所述频谱精细结构,其中,对于所述多个频谱分量中的每个频谱分量,所述概率分布估计是通过相应频谱分量的概率分布参数来参数化的可参数化函数。2.根据权利要求1所述的基于线性预测的音频解码器,还包括:比例因子确定器(110),所述比例因子确定器被配置成基于所述线性预测系数信息来确定比例因子;以及频谱塑形器(112),所述频谱塑形器被配置成通过使用所述比例因子按比例调整所述频谱来对所述频谱进行频谱塑形,其中,所述比例因子确定器被配置成确定所述比例因子,使得所述比例因子表示取决于由所述线性预测系数信息界定的线性预测合成滤波器的传递函数。3.根据权利要求1或2所述的基于线性预测的音频解码器,其中,所述传递函数对由所述线性预测系数信息界定的所述线性预测合成滤波器的相依性使得所述传递函数被感知加权。4.根据权利要求1或2所述的基于线性预测的音频解码器,其中,所述传递函数对由所述线性预测界定的所述线性预测合成滤波器1/A(z)的相依性使得所述传递函数为传递函数1/A(k·z),其中,k为常数。5.根据权利要求1或2所述的基于线性预测的音频解码器,其中,所述概率分布估计器被配置成使得所述频谱精细结构是通过所述长期预测参数界定的梳状结构。6.根据权利要求1或2所述的基于线性预测的音频解码器,其中,所述长期预测参数包括长期预测增益和长期预测间距。7.根据权利要求1或2所述的基于线性预测的音频解码器,其中,对于所述多个频谱分量中的每个频谱分量,界定所述可参数化函数,使得所述概率分布参数是对所述概率分布估计的频散的量度。8.根据权利要求1或2所述的基于线性预测的音频解码器,其中,对于所述多个频谱分量中的每个频谱分量,所述可参数化函数为拉普拉斯分布,并且相应频谱分量的概率分布参数形成相应拉普拉斯分布的比例参数。9.根据权利要求1或2所述的基于线性预测的音频解码器,还包括去加强滤波器。10.根据权利要求1或2所述的基于线性预测的音频解码器,其中,所述熵解码与解量化级(104)被配置成在对所述多个频谱分量的频谱进行解量化与熵解码时,通过使用针对所述多个频谱分量中的每个频谱分量确定的用于量值的概率分布估计来分别地处理所述多个频谱分量的符号和量值。11.根据权利要求1或2所述的基于线性预测的音频解码器,其中,所述熵解码与解量化级(104)被配置成在针对每个频谱分量熵解码频谱的量值水平时使用所述概率分布估计,并且针对所有频谱分量同等地解量化所述量值水平以便获得所述频谱。12.根据权利要求11所述的基于线性预测的音频解码器,其中,所述熵解码与量化级(104)被配置成使用恒定量化步长来解量化所述量值水平。13.根据权利要求1或2所述的基于线性预测的音频解码器,还包括:逆变换器,所述逆变换器被配置成使所述频谱经历实数值临界采样逆变换以便获得遭受混叠的时域信号部分;及重迭加法器,所述重迭加法器被配置成使所述遭受混叠的时域信号部分与在前和/或在后的时域部分经历重迭和相加处理,以便重构所述音频信号。14.一种基于线性预测的音频编码器,包括:线性预测分析器(12),所述线性预测分析器被配置成确定线性预测系数信息;概率分布估计器(14),所述概率分布估计器被配置成针对多个频谱分量中的每个频谱分量根据所述线性预测系数信息来确定概率分布估计;以及频谱确定器(16),所述频谱确定器被配置成根据音频信号确定由所述多个频谱分量构成的频谱;量化与熵编码级(18),所述量化与熵编码级被配置成使用针对所述多个频谱分量中的每个频谱分量确定的所述概率分布估计来对所述频谱进行量化与熵编码,其中,所述频谱确定器(16)被配置成根据传递函数对所述音频信号的原始频谱进行塑形,所述传递函数取决于由所述线性预测系数信息界定的线性预测合成滤波器的反向滤波器,以及其中,所述基于线性预测的音频编码器还包括长期预测器,所述长期预测器被配置成确定长期预测参数,并且所述概率分布估计器被配置成根据所述长期预测参数来确定频谱精细结构并且针对所述多个频谱分量中的每个频谱分量来确定概率分布参数,使得所述概率分布参数在频谱上遵循一个函数,所述函数取决于所述线性预测合成滤波器的传递函数、所述线性预测合成滤波器的感知加权修改的传递函数的倒数与所述频谱精细结构的乘积,其中,对于所述多个频...

【专利技术属性】
技术研发人员:汤姆·贝克斯特伦克里斯蒂安·黑尔姆里希纪尧姆·富克斯马库斯·穆尔特鲁斯马丁·迪策尔
申请(专利权)人:弗兰霍菲尔运输应用研究公司
类型:发明
国别省市:德国;DE

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1