使用网格降低MPEG-2高级音频编码的比例因子传输成本制造技术

技术编号:3046031 阅读:211 留言:0更新日期:2012-04-11 18:40
一种降低采用自适应比特分配的感觉音频编码器的总比特成本的方法,其中音频信号的时域表达被分割为连续的时间块,每个时间块被分割为频带,为每一个所述频带分配比例因子,其中表示每个块所需的比特数随着所述比例因子值的增加而增加,并随着频带到频带的比例因子值的变化的增加而增加,所述方法包括    确定每一个所述频带的初始比例因子,以及    优化每一个所述频带的所述比例因子,所述优化包括对于一个或多个所述频带将所述比例因子的值增加到大于所述初始比例因子值的值,使得所述增加导致的比特成本的增加等于或小于因为一个或多个所述频带的比例因子的增加所导致的频带到频带的比例因子值的变化的减少而导致的比特成本的降低。(*该技术在2023年保护过期,可自由使用*)

【技术实现步骤摘要】
【国外来华专利技术】
技术介绍
典型的变换和滤波器组音频编码技术,诸如MPEG-1的1到3层,Dolby AC3(也称为Dolby Digital)(Dolby、Dolby Digital和Dolby AC-3是Dolby实验室许可公司的商标)和MPEG-2高级音频编码(AAC)通过在时域和频域动态地分配比特以消除音频信号中听不见的冗余来降低传输数据速率。该比特的动态分配典型地基于与信号相关的心理声学原理。Dolby AC3的进一步细节可以在1994年11月10日批准的数字音频压缩(AC-3)标准、(Rev 1)1995年4月12日增加的附件A、(Rev 2)1995年5月24日增加的13个勘误以及(Rev 3)1995年12月20日增加的附件B和C中找到。AAC的更进一步细节可以在“ISO/IEC MPEG-2 Audio Coding by Bosi et al,presented at the 101st Convention 1996 November 8-11,Los Angeles,Audio Engineering Society Preprint 4382)找到。在AAC中,使用比特流所包含的全局增益参数和比例因子来实现比特分配。使用众所周知的修改的离散余弦变换(MDCT)即通常所知的时域混叠消除(TDAC)(参见Princen et al,“Analysis/synthesisfilter bank design based on time domain aliasing cancellation”,IEEETrans. Acoust.,Speech,Signal Processing,Vol. ASSP-34,pp.1153-1161,October 1986)转换的音频频谱,被划分为大约一半临界带宽的频带,并且相乘地应用比例因子。比例因子和全局增益联合表示1.5dB步长或大约四分之一比特增量的比特分配(根据音频信号的随机特征获得准确的比特分配,并进一步被结合在AAC的非线性量化器复杂化)。增加频带中的比例因子,通过分配更多的比特到频带,有效地降低该频带中的量化噪声。相反地,减少比例因子,通过减少分配到特定频带的比特,增加了该特定频带的量化噪声。因为AAC是前向自适应音频编码系统,所以比例因子被传递到解码器。这通过对比例因子差分编码然后对该差进行霍夫曼编码来实现的。AAC标准中定义的霍夫曼码,频带到频带的比例因子参数的很大的变化,导致边信息形式的可用比特的过份消耗,这使比例因子推导变得复杂,如下节所述。比例因子计算由于改变比例因子实现的噪声分配的不确定性和使用非线性量化器台阶,计算AAC编码器中的比例因子是非常困难的问题。在AAC中通常使用两种技术以计算比例因子,即分析综合法和直接从掩蔽模型(masking model)估计法,这在以下将介绍。虽然比例因子的选择可以是任意的,但是在由标准提出的一些限制中这两种技术是最公知的。使用分析综合法计算比例因子使用分析综合法的比例因子计算是通过两种嵌套循环实现的,负责量化和比特计算的内循环和分析内循环的结果并相应地改变比例因子的外循环。内循环改变AAC比特流包含的全局增益参数以确保用来编码音频频谱的比特数不超过可用比特的数。全局增益被设置为初始值,频谱被量化。然后计算使用的比特数。如果使用的比特数大于可用比特数,那么全局增益被增加,频谱被再一次量化,并且使用的比特数被重新计算。重复该过程直到使用的比特数小于可用比特数。因为内循环控制编码比特速率,所以内循环通常被称为“速率循环”。外循环分析由内循环得到的结果并改变比例因子,使得在每个频带的量化噪声尽可能地满足心理声学需求。外循环开始于所有比例因子被设置为零,内循环被调用来量化该频谱。然后计算每个频带的失真(量化噪声),并将其与由心理声学模型计算的每个频带的噪声要求相比较。如果在任何频带的失真大于心理声学模型计算的允许的失真,那么那个频带的比例因子被增加。使用调整的比例因子再一次调用内循环,重复该过程直到(1)所有频带的失真小于心理声学模型计算的掩蔽级别或者(2)所有的比例因子已经被增加。分析综合技术遭遇几个问题;首先该技术非常复杂,因而不适合复杂度受限的应用。此外,上述的双循环处理不能保证收敛于最佳解决方案;然而,在较高的数据速率,它已经显示了产生极好的结果。从掩蔽级别估计比例因子通过假设在频带中将比例因子增加一个单元导致在该频带中量化失真减少1.5dB(信噪比的增加)(全局增益和比例因子都以1.5dB的步长量化),比例因子可以直接从“Increased efficiency MPEG-2AAC Encoding”,by Smithers et al,Audio Engineering SocietyConvention Paper,Presented at the 111thConvention,2001September 21-24,New York描述的掩蔽模型中推导。对于该技术,比例因子首先直接从掩蔽模型计算,例如,通过使用下面等式1的表达式,其中si是第i个频带的比例因子,mi是心理声学模型计算的第i个频带的掩蔽级别。si=-2log10(2)·log10(mi)]]>(等式1)然后该频谱被前一部分描述的内循环(或速率循环)量化,从而消除对高复杂性外循环的需求。虽然该技术比前面描述的分析综合技术简单的多,从而适合复杂度受限的系统,但是从掩蔽模型计算比例因子产生的比例因子,其比2循环分析综合技术产生的比例因子示出了较高的频带到频带的变化。因为该比例因子被差分编码,然后被霍夫曼编码(较大的差意味着较长的霍夫曼码字),比例因子的高变化意味着传输比例因子的比特成本非常高,这降低了掩蔽级别技术的比例因子估计的性能。
技术实现思路
本专利技术提供了一种方法,用来降低采用自适应比特分配的感觉音频编码器的总比特成本,其中音频信号的时域表达被分为连续的时间块,每个时间块被分割为频带,为每一个频带分配一个比例因子,其中表示每个块所需的比特数随着比例因子值的增加而增加,并随着频带到频带的比例因子值的变化的增加而增加。确定每一个频带的初始比例因子,并优化每一个频带的比例因子,该优化包括对于一个或多个频带,将比例因子的值增加到大于的初始比例因子值的值,使得所述增加导致的比特成本的增加等于或小于因为一个或多个频带的比例因子的增加所导致的频带到频带的比例因子值的变化的减少而导致的比特成本的减少。上述计算AAC中比例因子的技术中没有一个明确地考虑到传输比例因子到解码器的成本。特别地,较简单的直接推导技术能使得比例因子传输成本超过整个可用于音频传输的数据速率的10%(在立体声素材的128kbps),因此降低了解码性能。为了解决该问题,本专利技术采用动态编程优化技术,包括,例如,格子和维特比搜索算法,以减少在AAC(MPEG-2/4高级音频编码)传输比例因子信息的比特成本。本专利技术最小化了成本函数,在传输比例因子的成本和从初始比例因子计算技术得到的初始值改变该比例因子的成本之间折衷。具体地,为了减小从一个比例因子频带到下一个的比例因子值的变化的范围,具有比其他比例因子更低的值的比例因子可以被改变到更高值。虽然本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种降低采用自适应比特分配的感觉音频编码器的总比特成本的方法,其中音频信号的时域表达被分割为连续的时间块,每个时间块被分割为频带,为每一个所述频带分配比例因子,其中表示每个块所需的比特数随着所述比例因子值的增加而增加,并随着频带到频带的比例因子值的变化的增加而增加,所述方法包括确定每一个所述频带的初始比例因子,以及优化每一个所述频带的所述比例因子,所述优化包括对于一个或多个所述频带将所述比例因子的值增加到大于所述初始比例因子值的值,使得所述增加导致的比特成本的增加等于或小于因为一个或多个所述频带的比例因子的增加所导致的频带到频带的比例因子值的变化的减少而导致的比特成本的降低。2.如权利要求1所述的方法,其中所述优化步骤包括最小...

【专利技术属性】
技术研发人员:马克·S·温登
申请(专利权)人:杜比实验室特许公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1