本发明专利技术公开了一种对音频信号进行编码的方法,主要是滤波参数矢量量化和结合量化模型预测的音频信号编码方法。它用来解决音频信号编码中预回声问题,同时又能做到有效的降低码率和控制噪声的目的。在本发明专利技术中,音频信号经滤波器后得到滤波参数,对滤波参数进行预测分析,求出预测模型的参数,对它们用矢量量化方法进行参数化处理,这相当于在传统的感知编码器滤波器模块和量化模块之间增加了一个新的模块。(*该技术在2023年保护过期,可自由使用*)
【技术实现步骤摘要】
本专利技术涉及一种对音频信号进行编码的方法,具体地说是指。主要是滤波参数矢量量化和结合量化模型预测的音频信号编码方法,它用来解决音频信号编码中预回声问题,同时又能有效的降低码率和控制噪声。在编解码音频信号中,为解决预回声现象,当前已有的一些技术大致包括以下几种预回声控制与比位池技术对滤波器组覆盖快变段窗内的谱系数,增加编码精度。这会极大的增加快变帧编码所需要的比特数,这种方法不能用于固定码率编码器。在MPEG-1标准中,采用比特池方法,在比特需要峰值时使用前面的帧留下的比特,从而维持平均的恒定码率。然而实际上,如果遇到变化非常快的信号,编码时所需的比特池的大小会大的不合理。自适应窗切换技术许多感知编码器中使用的是自适应窗切换技术。这种方法能根据输入信号的特性,自适应的调整滤波器组窗的大小;稳态部分或缓变部分采用长时窗,快变信号部分采用短时窗进行编码。这样可以极大的降低峰值比特需求,因为需要高编码精度的信号部分在时间上得到了限制。这种方法的主要缺点是它增加了编码器计算量,并且使得编码器结构复杂化。由于不同的窗长需要心理声学模型不同的解释和归一化,以及不同的频带及无噪编码结构,窗切换显著的增加了编码器结构的复杂度。此外,在采用交叠相加结构滤波器组时,窗切换判断需要编码器额外的缓冲和延迟,会导致更大的端对端的延迟。最后,虽然长窗和短窗具有较好的时频局部特性,但是开始窗和结束窗却会引入较大的低效编码。增益修正技术第三种抑制量化噪声扩散的技术,是在计算信号的谱分解前,对信号应用动态增益修正方法进行增益控制。输入信号的动态范围通过一个乘积性预处理器得到降低,然后进入编码器,这样,信号的“峰值”在编码前得到了消弱。增益修正参数也编码到比特流中,在解码端,用此信息进行一个相反的过程。对信号谱分解前作动态乘积修正,等价于动态修正滤波器组的分析窗,依赖于增益修正函数的形状不同,分析滤波器的频率响应根据合成窗函数而变化。为了能对大多数信号都能有效处理,非常重要的是要让增益修正过程能独立的应用于音频信号谱的不同部分,这是因为,快变信号时间一般只在部分谱上占主导,而且,通常并不希望扩宽滤波器组的低通滤波通道的频率响应,因为这样会增大临界带宽的不匹配。在MPEG音频编码技术中,MPEG-1和MPEG-2所定义的编码器系列,层1和层2使用低频率分辨率的滤波器组,没有进行谱度量来处理预回声现象。层3运用了高的频率分辨率滤波器组,结合预回声控制、比特池和自适应窗切换技术来进行预回声处理。在MPEG-4的编码工具中,增加了一种“时域噪声成形”技术,在基于感知音频编码器的结构中,信号经过滤波器组变换成频域系数后,根据对信号类型的判断,如果是快变类信号,不直接对频域系数进行量化,而是在通过增加一个TNS滤波器,再转换到时域中,在时域中进行量化和编码。这种技术的优点是利用了快变信号在频域的特点,能够通过预测的方法对变换系数进行编码,使得量化噪声在时域的形状和原始信号包络类似,有效的控制了量化噪声的扩散问题,不足之处增加的边带信息较多,影响了整体编码效率。本专利技术的,对音频信号编码的方法包括以下步骤(1)输入音频信号用分析滤波器分析、转换到频域的系数;(2)对频域系数进行线性预测分析;(3)对预测系数进行矢量量化;(4)谱系数进行预测滤波得到残差系数序列;(5)谱系数残差和预测系数矢量量化结果一同量化;(6)量化结果和边带信息进行编码,得到输出比特流。所述的对音频信号编码的方法中对频域系数的量化由以下步骤组成(1)对分析滤波器的输出,确定预测的频率范围以及窗的大小;(2)对选定的系数执行线性预测分析过程;(3)根据预测增益确定是否使用预测参数矢量量化和谱系数滤波;(4)对谱系数用量化重构的滤波器系数做误差滤波;(5)残差序列用传统的量化和编码方法处理。所述的对音频信号编码的方法中对预测器参数矢量量化由以下步骤组成(1)用线性预测分析模型对谱系数进行预测;(2)预测分析器的参数由预测器系数组成,用LSF参数的形式表示;(3)LSF参数采用矢量量化方法发送;(4)矢量量化器的结构采用分级形式,最少两级,第一级量化LSF系数,第二级量化第一级的误差矢量,以此类推;(5)矢量量化LSF参数的失真度量采用最佳的失真度量准则确定;(6)矢量量化的结果得到的是码本中码字的序号,作为量化的参数发送到解码端。本专利技术的,对音频信号解码的方法包括以下步骤(1)从比特流中解码出标记信息,得到相应的预测器参数编码和量化的谱数据;(2)预测器参数的反量化过程,得到预测器系数;(3)对预测谱系数进行逆滤波过程;(4)用合成滤波器得到重构的音频信号。所述的对音频信号解码的方法中对预测参数的反量化由以下步骤组成(1)从比特流中得到矢量量化的码字序号;(2)根据码字序号,分级重构、插值,求出量化重构后的LSF参数;(3)转换LSF参数到预测器参数形式;(4)用重构的预测器参数,对谱预测残差进行逆滤波处理。本专利技术的滤波参数矢量量化和结合量化模型预测的音频编码方法,解决音频信号编码中预回声问题,同时有效的降低码率和控制噪声。图2是本专利技术音频编码方法解码器端的结构框图。图3是本专利技术编码器实施例中的一个算法流程框图。对快变类信号,其最优的编码方法可以从以下的事实得到假设有实信号x(t),它的平方Hilbert包络可以表示为其频谱的自相关函数的逆Fourier变换;同时我们知道,信号的功率谱密度函数可以表示为其时域波形的自相关函数的Fourier变换。因此,可以说信号在时域的平方Hilbert包络与信号在频域的功率谱密度函数是互为对偶关系的。从上面的对偶关系可以得到,每个一定频率范围内的部分带通信号,如果它的Hilbert包络保持恒定的话,那么相邻谱值的自相关也将保持恒定。这就意味着谱系数序列相对于频率而言是稳态序列,从而可以用预测编码技术来对谱值进行处理,用公用的一组预测系数来有效的表示信号。对于快变信号如响板信号,这种谱系数的可预测编码性质还可以更直观的来理解。对一个纯粹的正弦信号,其时域包络是平坦的,对应的频域表示是一个极度不平坦的单脉冲形状的谱。显然,对它的最优编码方式,如果在频域,就是对谱直接编码的变换编码技术,如果在时域,则是用预测编码如LPC线性预测技术;假设时域的输入信号是一个脉冲信号,那么它在频域的就具有一个平坦的功率谱,这个信号对传统的音频编码技术而言,不论是用变换编码处理频域系数,还是用预测技术处理时域波形,都是最坏的一种情况。然而,此时如果采用相反的技术,即时域波形用变换编码技术或频域系数用预测方法,则可以更有效的对信号编码。建立了时域和频域的对偶关系后,对频域滤波系数应用预测编码的方法,那么所有关于时域的预测性质现在对频域而言也是成立的。由于功率谱密度与平方Hilbert包络之间互为对偶,谱系数预测的增益即编码的残差能量依赖于平方包络的平坦度度量,因此对具有快变特性的信号,其平方包络不平坦度决定了具有较高的编码增益的性质。对快变信号段,预测策略可以选择开环预测和闭环预测两种方案,都可以获得编码增益,但在系统的整体性能上,二者各具有不同的优点。闭环预测的误差能量在解码信号中随着预测增益增加而减小,因为谱系数数据中引入的误差具有平坦的功率密度谱,在解本文档来自技高网...
【技术保护点】
一种滤波参数矢量量化和结合量化模型预测的音频编码方法,其特征在于对音频信号编码的方法包括以下步骤:(1)输入音频信号用分析滤波器(101)分析、转换到频域的系数;(2)对频域系数进行线性预测分析(304);(3)对预测系数进行矢量量化(307);(4)谱系数进行预测滤波得到残差系数序列;(5)谱系数残差和预测系数矢量量化结果一同量化;(6)量化结果和边带信息进行编码,得到输出比特流。
【技术特征摘要】
1.一种滤波参数矢量量化和结合量化模型预测的音频编码方法,其特征在于对音频信号编码的方法包括以下步骤(1)输入音频信号用分析滤波器(101)分析、转换到频域的系数;(2)对频域系数进行线性预测分析(304);(3)对预测系数进行矢量量化(307);(4)谱系数进行预测滤波得到残差系数序列;(5)谱系数残差和预测系数矢量量化结果一同量化;(6)量化结果和边带信息进行编码,得到输出比特流。2.根据权利要求1所述的对音频信号编码的方法,其特征在于所述的频域系数的量化由以下步骤组成(1)对分析滤波器(101)的输出,确定预测的频率范围(302)以及窗的大小;(2)对选定的系数执行线性预测分析(304)过程;(3)根据预测增益(305)确定是否使用预测参数矢量量化和谱系数滤波;(4)对谱系数用量化重构的滤波器系数做误差滤波;(5)残差序列用传统的量化和编码方法处理。3.根据权利要求1所述的对音频信号编码的方法,其特征在于所述的预测器参数矢量量化由以下步骤组成(1)用线性预测分析(304)模型对谱系数进行预测;(2)预测分析器的参...
【专利技术属性】
技术研发人员:潘兴德,
申请(专利权)人:北京阜国数字技术有限公司,
类型:发明
国别省市:11[]
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。