对源音频信号进行编码的方法和相应的编码设备、解码方法和设备、信号、计算机程序产品技术

技术编号:3048252 阅读:203 留言:0更新日期:2012-04-11 18:40
本发明专利技术涉及对源音频信号进行编码的方法。按照本发明专利技术,这种方法包括下列步骤:按照至少两种不同的编码技术对表示源音频信号的至少一个变换的系数的量化分布进行编码,给出至少两个表示一个量化分布的数据组;根据预定选择准则选择表示量化分布的所述数据组中的一个数据组;以及发送和/或存储表示所选择的量化分布的数据组和表示相应编码技术的指示符。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及对诸如音乐之类的音频数字信号或数字化语音信号 进行编码和解码的纟支术领域。具体地说,本专利技术涉及在实现感知编码(perceptual encoding ) 中量化音频信号的谱系数的技术。本专利技术特别(但不只是)可应用于在MPEG音频标准(ISO/1EC 14496-3 )的环境内所提出的使用可扩缩数据编码/解码型系统对音频 数字数据进行分级编码(hierarchical encoding )的系统。一般地说,本专利技术可以应用于对声音和音乐进行高效量化以便存 储、压缩和通过传输信道(例如,无线或有线信道)传输声音和音乐 的

技术介绍
1传输掩蔽曲线的感知编码 1.1音频压缩和量化音频压缩往往基于人耳的一定听觉能力。对音频信号的编码和量 化往往要考虑这个特性。在这种情况下所用的术语是感知编码,或 者遵从人耳心理听觉模型的编码。人耳不能区分一个信号在邻近频率和在有限时隙内发送的两个 分量。这个性质称为听觉掩蔽(auditory masking)。此外,耳朵具有 听觉门限(hearing threshold),在安静的环境内,将感觉不到所发 送的低于听觉门限的声音。这个门限的值随声波频率改变。在压缩和/或传输音频数字信号中,可以想到的是,确定量化比 特数,以量化形成信号的频镨分量,不会引入过多的量化噪声而损害到编码后信号的质量。目标通常是减少量化比特数量以得到对信号的 高效压缩。因此,必须做的是找到声音质量与信号压缩程度之间的折 衷。所以,在经典的现有技术中,量化原理使用了人耳引起的掩蔽门 限和掩蔽性质,以确定注入音频信号而在信号再现时耳朵感觉不到(即 不会引入任何过分失真)的可接受的最大量化噪声量。1.2感知音频变换编码音频变换编码的详细说明可参见Jayant、 Johnson和Safranek 的基于人类感知的方法的信号压缩(Signal Compression Based on Method of Human Perception, Proc.OfIEEE, Vol.81, No. 10, pp. 1385-1422, October 1993 )。这种技术使用了图1所例示的人耳频率掩蔽模型,图中示出了音 频信号频率与人耳掩蔽门限之间的关系的例子。X轴10表示频率f (Hz) , Y轴ll表示声强I (dB)。人耳将信号x(t)的频谱在频域内按Bark刻度分解成一些关键频带(critical band) 120、 121、 122、 123。信号i(f)的关键频带n 120具有能量En,在频带n内和在邻近的关键频带122和123处产生掩蔽13。所关联的掩蔽门限13与掩蔽 分量120的能量En成正比,而随关键频带低于和高于关键频带n递 减。分量122和123在图l这个例子中受到掩蔽。此外,分量121由 于低于绝对听觉门限14也受到掩蔽。于是,通过将绝对听觉门限14 和与音频信号;r(f)的以关键频带分析的各个分量关联的掩蔽门限組合在一起,就可以得到总的掩蔽曲线。这个掩蔽曲线表示可以在信号编 码时叠加到信号上而人耳感觉不到的最大量化噪声的谱密度。于是, 在量化从源音频信号频率变换得到的i瞽系数期间,就可形成量化间隔 分布(quantization interval profile ),不很严格地也可称为注入噪声 分布。图2为例示经典的感知编码器的原理的流程图。时间源音频信号x(t)由时间-频率变换单元20变换到频域。于是,得到由镨系数J^形成的信号的频语。该频镨由心理听觉模型21分析,该模型根据绝对听 觉门限和信号的每个频语分量的掩蔽门限确定信号的总掩蔽曲线C。 所得到的掩蔽曲线可用来得出可以注入的量化噪声量,从而确定用来 量化镨系数或样本的比特数。确定比特数这个步骤由给出每个镨系数 X,i的量化间隔分布A^的二进制分配单元22执行。二进制分配单元通过用掩蔽曲线C所给出的成形限制修改量化间隔设法达到目标比特 率。量化间隔 由二进制分配单元22以比例因子F的形式编码,再在比特流T内作为辅助信息发送。量化单元23接收到镨系数X^和所确定的量化间隔^后给出经量化的系数1 。最后,编码和比特流形成单元24将经量化的谱系数1 和比例因子F集中在一起进行编码,形成含有经编码的源音频信号的有效负栽 数据和表示比例因子的数据的比特流。 2掩蔽曲线的分级构建下面说明在音频数字数据分级编码环境内现有技术的缺点。然 而,本专利技术可以应用于根据人耳心理听觉模型实现量化的各种音频数 字信号编码器。这些编码器不一定是分级的。分级编码需要将一些编码级级联起来。第一级产生比特率最低的 编码版本,而随后的这些级提供逐级增大比特率的相继改善。在音频 信号编码的特定情况下,这些改善级传统上基于如在以上这节中所说 明的感知变换编码。然而,这种分级感知变换编码的一个缺点是必须从最前面的一级 或者说初级就发送所得到的比例因子。这些比例因子与有效负载数据 相比占用了分配给低比特率级的一大部分比特率。为了克服这个缺点以节约对注入量化噪声分布(即比例因子)的 传输,J. Li在采用隐含听觉掩蔽的嵌入式音频编码(EAC) (Embedded Audio Coding ( EAC )With Implicit AuditoryMasking, ACM Multimedia 2002 )中业已提出 一种称为隐含,,技术 的掩蔽技术。这种技术有赖于分级结构的编码/解码系统,在每个改善 级用掩蔽曲线的近似值对掩蔽曲线进行递推估计,使掩蔽曲线逐级细 化。因此,在分级编码的每个级利用在前一级所量化的变换系数重复 更新掩蔽曲线。由于对掩蔽曲线的估计基于时间-频率变换的系数的量化值,因 此能在编码器和解码器处同样执行,这具有避免向解码器传输量化间 隔分布或量化噪声的优点。3现有技术的缺点即使基于分级编码的隐含掩蔽技术避免了传输掩蔽曲线因此与 经典的需发送量化间隔分布的感知编码相比在比特率上有所得益,但 本专利技术的专利技术者注意到它还具有一些缺点。确实,在编码器和解码器内同时实现的掩蔽模型一定是闭环的 (closed-ended),因此可以不用精确地适合信号的特性。例如,无论 需编码的频语分量有没有音调特性都使用单个掩蔽因子。此外,掩蔽曲线是在信号是标准(standing)信号的假设下计算 的,不能适当地应用于瞬变部分和声沖击。此外,由于掩蔽曲线是在每一级从前一级所量化的系数或系数残 差得出,因此第一级的掩蔽曲线由于某些部分的频镨还没有编码所以 是不完全的。这个不完全的曲线不一定表示所考虑的这个分级编码级 的量化间隔分布的最佳形状。
技术实现思路
本专利技术提出了一种对源音频信号进行编码的方法,这种方法包括 下列步骤按照至少两个不同的编码技术对表示源音频信号的至少一 个变换的系数的量化分布进行编码,给出表示量化分布的至少两 个数据组;按照基于分别从所述数据组重建的信号的失真的度量和基 于对所述数据组进行编码所需的比特率的选择准则,选择表示量化分布的所述数据组中的一个数据组;以及发送和/或存储表示所选择的量化分布的所述数据组和表示 相应的编码技术的指示符。因此,本专利技术所依赖的是一种新颖的、创造性的对源音频信号的 系数进行编码的途径,这种途径可以降低分配给传输量本文档来自技高网
...

【技术保护点】
一种对源音频信号进行编码的方法,其特征在于包括下列步骤: 按照至少两个不同的编码技术对表示所述源音频信号的至少一个变换的系数的量化分布进行编码,给出表示量化分布的至少两个数据组; 按照基于分别从所述数据组重建的信号的失真的度量和 基于对所述数据组进行编码所需的比特率的选择准则,选择表示量化分布的所述数据组中的一个数据组;以及 发送和/或存储表示所选择的量化分布的所述数据组和表示相应的编码技术的指示符。

【技术特征摘要】
【国外来华专利技术】FR 2006-3-13 06021791. 一种对源音频信号进行编码的方法,其特征在于包括下列步骤按照至少两个不同的编码技术对表示所述源音频信号的至少一个变换的系数的量化分布进行编码,给出表示量化分布的至少两个数据组;按照基于分别从所述数据组重建的信号的失真的度量和基于对所述数据组进行编码所需的比特率的选择准则,选择表示量化分布的所述数据组中的一个数据组;以及发送和/或存储表示所选择的量化分布的所述数据组和表示相应的编码技术的指示符。2. 按照权利要求1所述的编码方法,其特征在于对于至少所 述编码技术中的第 一编码技术,所述数据组与所述量化分布的参数表 示相应。3. 按照权利要求2所述的编码方法,其特征在于所述参数表 示由至少一段由斜率和原点值表征的直线形成。4. 按照权利要求1至3中任一项所述的编码方法,其特征在于 所述编码技术中的第二编码技术给出恒定的量化分布。5. 按照权利要求1至4中任一项所述的编码方法,其特征在于 按照第三编码技术,所述量化分布与绝对听觉门限相应。6. 按照权利要求1至5中任一项所述的编码方法,其特征在于 按照第四编码技术,所述表示量化分布的数据组包括所有所实施的量 化间隔。7. 按照权利要求1至6中任一项所述的编码方法,其特征在于 所述编码实现分级处理,给出包括一个初级和至少一个细化级的至少 两个分级编码级,所述细化级包括对所述初级或前一细化级的细化信 命8. 按照权利要求7所述的编码方法,其特征在于按照第五编码技术,表示量化分布的所述数据组在给定细化级通过考虑前一分级 编码级所构建的数据得出。9. 按照权利要求7和8中任一项所述的编码方法,其特征在于 所述选择步骤在每个分级编码级执行。10. 按照权利要求1至9中任一项所述的编码方法,其特征在于 所述方法给出一些系数帧,为每个帧执行所述选择步骤。11. 一种对源音频信号进行编码的设备,其特征在于包括 按照至少两个不同的编码技术对表示所述源音频信号的至少一个变换的系数的量化分布进行编码、给出表示量化分布的至少两个数 据组的装置;按照基于分别从所述数据组重建的信号的失真的度量和基于对 所述数据组进行编码所需的比特率的选择准则选择表示量化分布的所 述数据组中的一个数据组的装置;以及发送和/或存储表示所选择的量化分布的所述数据组和表示相应 的编码技术的指示符的装置。12. —种可从通信网络下载和/或存储在计...

【专利技术属性】
技术研发人员:P菲利普C沃P科郎
申请(专利权)人:法国电信公司
类型:发明
国别省市:FR[法国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1