使用改进的概率分布估计的基于线性预测的音频编码制造技术

技术编号：11379663 阅读：143 留言：0更新日期：2015-05-01 00:08

通过使用概率分布估计对由多个频谱分量构成的频谱进行编码来改进基于线性预测的音频编码，该概率分布估计是针对该多个频谱分量中的每个频谱分量根据线性预测系数信息来确定。具体地，总能获得该线性预测系数信息。因此，该信息可用于在编码侧和解码侧确定概率分布估计。该概率分布估计的确定可通过使用例如在该多个频谱分量处对概率分布估计的适当参数化以计算上简单的方式来实施。总之，由熵编码提供的编码效率与使用环境选择达到的概率分布估计兼容，但概率分布估计的求导较不复杂。例如，该求导可单纯地以分析方式进行和/或不需要关于邻近频谱线的属性的任何信息，诸如在空间环境选择的情况下的邻近频谱线的先前被编码/解码的频谱值。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】使用改进的概率分布估计的基于线性预测的音频编码
本专利技术涉及基于线性预测的音频编码，并且具体地，涉及使用频谱编码的基于线性预测的音频编码。
技术介绍
用于在频域中进行量化和编码的经典方法为获取信号的(重迭)窗，执行时间频率变换，应用感知模型(perceptualmodel)，以及通过熵编码器(诸如算术编码器)来量化各个频率[1]。感知模型基本上为加权函数，将其与频谱线相乘，使得每一加权频谱线中的误差具有相等的感知影响。因此能够以相同准确度量化所有的加权线，并且总体准确度确定感知质量与位消耗之间的折衷。在USAC的AAC及频域模式(非TCX)中，逐频带地界定感知模型，使得一组频谱线(谱带)将具有相同权重。这些权重称作比例因子，这是因为这些权重界定了频带通过什么因子进行按比例调整(scale)。此外，对这些比例因子进行差分编码。在TCX域中，这些权重并未使用比例因子来编码，而是通过界定频谱包络的LPC(线性预测系数，linearpredictioncoefficient)模型[2]来进行编码，频谱包络为频谱的总体形状。使用LPC是因为其允许在TCX与ACELP之间平滑切换。然而，LPC并不能很好地对应于感知模型(LPC应更加平滑)，从而将称作加权的处理应用于LPC，使得被加权的LPC近似地对应于所期望的感知模型。在USAC的TCX域中，频谱线由算术编码器来编码。算术编码器是基于将概率分配给信号的所有可能组配，使得高概率值可用数目较少的位进行编码，使得位消耗最小化。为了估计频谱线的概率分布，编码解码器(codec)使用概率模型，该概率模型在时间频率空间中基于先...
使用改进的概率分布估计的基于线性预测的音频编码

【技术保护点】
一种基于线性预测的音频解码器，包括：概率分布估计器(102)，所述概率分布估计器被配置成针对多个频谱分量中的每个频谱分量根据数据流(22)中所包含的线性预测系数信息来确定概率分布估计(28)，其中，音频信号被编码进所述数据流中；以及熵解码与解量化级(104)，所述熵解码与解量化级被配置成使用针对所述多个频谱分量中的每个频谱分量确定的概率分布估计对来自所述数据流(22)的所述多个频谱分量所构成的频谱(26)进行熵解码与解量化。

【技术特征摘要】
【国外来华专利技术】2012.06.28 US 61/665,4851.一种基于线性预测的音频解码器，包括：概率分布估计器(102)，所述概率分布估计器被配置成针对多个频谱分量中的每个频谱分量根据数据流(22)中所包含的线性预测系数信息来确定概率分布估计(28)，其中，音频信号被编码进所述数据流中；熵解码与解量化级(104)，所述熵解码与解量化级被配置成使用针对所述多个频谱分量中的每个频谱分量确定的概率分布估计对来自所述数据流(22)的所述多个频谱分量所构成的频谱(26)进行熵解码与解量化；以及滤波器，所述滤波器被配置成根据传递函数来对所述频谱(26)塑形，所述传递函数取决于由所述线性预测系数信息界定的线性预测合成滤波器，其中，所述概率分布估计器被配置成根据所述数据流中所包含的长期预测参数来确定频谱精细结构，并且针对所述多个频谱分量中的每个频谱分量来确定概率分布参数，使得所述概率分布参数在频谱上遵循一个函数，所述函数以乘法方式取决于所述频谱精细结构，其中，对于所述多个频谱分量中的每个频谱分量，所述概率分布估计是通过相应频谱分量的概率分布参数来参数化的可参数化函数。2.根据权利要求1所述的基于线性预测的音频解码器，还包括：比例因子确定器(110)，所述比例因子确定器被配置成基于所述线性预测系数信息来确定比例因子；以及频谱塑形器(112)，所述频谱塑形器被配置成通过使用所述比例因子按比例调整所述频谱来对所述频谱进行频谱塑形，其中，所述比例因子确定器被配置成确定所述比例因子，使得所述比例因子表示取决于由所述线性预测系数信息界定的线性预测合成滤波器的传递函数。3.根据权利要求1或2所述的基于线性预测的音频解码器，其中，所述传递函数对由所述线性预测系数信息界定的所述线性预测合成滤波器的相依性使得所述传递函数被感知加权。4.根据权利要求1或2所述的基于线性预测的音频解码器，其中，所述传递函数对由所述线性预测界定的所述线性预测合成滤波器1/A(z)的相依性使得所述传递函数为传递函数1/A(k·z)，其中，k为常数。5.根据权利要求1或2所述的基于线性预测的音频解码器，其中，所述概率分布估计器被配置成使得所述频谱精细结构是通过所述长期预测参数界定的梳状结构。6.根据权利要求1或2所述的基于线性预测的音频解码器，其中，所述长期预测参数包括长期预测增益和长期预测间距。7.根据权利要求1或2所述的基于线性预测的音频解码器，其中，对于所述多个频谱分量中的每个频谱分量，界定所述可参数化函数，使得所述概率分布参数是对所述概率分布估计的频散的量度。8.根据权利要求1或2所述的基于线性预测的音频解码器，其中，对于所述多个频谱分量中的每个频谱分量，所述可参数化函数为拉普拉斯分布，并且相应频谱分量的概率分布参数形成相应拉普拉斯分布的比例参数。9.根据权利要求1或2所述的基于线性预测的音频解码器，还包括去加强滤波器。10.根据权利要求1或2所述的基于线性预测的音频解码器，其中，所述熵解码与解量化级(104)被配置成在对所述多个频谱分量的频谱进行解量化与熵解码时，通过使用针对所述多个频谱分量中的每个频谱分量确定的用于量值的概率分布估计来分别地处理所述多个频谱分量的符号和量值。11.根据权利要求1或2所述的基于线性预测的音频解码器，其中，所述熵解码与解量化级(104)被配置成在针对每个频谱分量熵解码频谱的量值水平时使用所述概率分布估计，并且针对所有频谱分量同等地解量化所述量值水平以便获得所述频谱。12.根据权利要求11所述的基于线性预测的音频解码器，其中，所述熵解码与量化级(104)被配置成使用恒定量化步长来解量化所述量值水平。13.根据权利要求1或2所述的基于线性预测的音频解码器，还包括：逆变换器，所述逆变换器被配置成使所述频谱经历实数值临界采样逆变换以便获得遭受混叠的时域信号部分；及重迭加法器，所述重迭加法器被配置成使所述遭受混叠的时域信号部分与在前和/或在后的时域部分经历重迭和相加处理，以便重构所述音频信号。14.一种基于线性预测的音频编码器，包括：线性预测分析器(12)，所述线性预测分析器被配置成确定线性预测系数信息；概率分布估计器(14)，所述概率分布估计器被配置成针对多个频谱分量中的每个频谱分量根据所述线性预测系数信息来确定概率分布估计；以及频谱确定器(16)，所述频谱确定器被配置成根据音频信号确定由所述多个频谱分量构成的频谱；量化与熵编码级(18)，所述量化与熵编码级被配置成使用针对所述多个频谱分量中的每个频谱分量确定的所述概率分布估计来对所述频谱进行量化与熵编码，其中，所述频谱确定器(16)被配置成根据传递函数对所述音频信号的原始频谱进行塑形，所述传递函数取决于由所述线性预测系数信息界定的线性预测合成滤波器的反向滤波器，以及其中，所述基于线性预测的音频编码器还包括长期预测器，所述长期预测器被配置成确定长期预测参数，并且所述概率分布估计器被配置成根据所述长期预测参数来确定频谱精细结构并且针对所述多个频谱分量中的每个频谱分量来确定概率分布参数，使得所述概率分布参数在频谱上遵循一个函数，所述函数取决于所述线性预测合成滤波器的传递函数、所述线性预测合成滤波器的感知加权修改的传递函数的倒数与所述频谱精细结构的乘积，其中，对于所述多个频...

【专利技术属性】
技术研发人员：汤姆·贝克斯特伦，克里斯蒂安·黑尔姆里希，纪尧姆·富克斯，马库斯·穆尔特鲁斯，马丁·迪策尔，
申请(专利权)人：弗兰霍菲尔运输应用研究公司，
类型：发明
国别省市：德国;DE

全部详细技术资料下载我是这个专利的主人