当前位置: 首页 > 专利查询>诺基亚公司专利>正文

音频压缩制造技术

技术编号:3044354 阅读:197 留言:0更新日期:2012-04-11 18:40
本申请涉及音频编码和解码技术。为了增强已编码的音频信号,提供了将音频信号至少划分为低频带和高频带,将高频带至少划分为两个高频子频带信号,并产生至少涉及与高频子频带信号最匹配的低频带信号部分的参数。

【技术实现步骤摘要】
【国外来华专利技术】
本申请总体上涉及音频压缩
技术介绍
音频压缩通常在用于存储或传输数字音频信号的现代消费者设 备中使用。消费者设备可以是电信设备、视频设备、音频播放器、 无线电设备和其它消费型设备。较高的压缩比能够支持更好的存储 能力,或者经由通信信道的更高效传输,其中通信信道即无线通信 信道或者有线通信信道。但是同时,对应于压缩比,还应当将压缩 信号的质量保持在较高的水平。音频编码的目标通常在于,将涉及 给定压缩比即比特率的音频质量最大化。在过去几十年中,已经研发出了众多音频编码技术。高级音频 编码系统有效地利用了人耳的性质。主要思想在于,可以将编码噪 声置于对感官质量影响最小的信号区域中,使得可以在未引入听觉 失真的前提下减小数据速率。因此,心理声学理论是现代音频编码 的重要部分。在公知的音频编码器中,输入信号被分为有限数量的子频带。每个子频带信号都可以量化。根据心理声学理论,公知的是频谱 中的最高频率在感知上没有低频重要。通过将与低频子频带相比而 言较少的比特分配给高频子频带的量化,这可以在某种程度上在编 码器中加以考虑。更复杂的音频编码利用了这样的事实,即,在大部分情况下, 音频信号的低频区域和高频区域之间存在很大的相关性,即频谱较 高的那半部分通常与其较低的那半部分相当类似。低频区域可以被 认为是声谱的低半部分,而高频可以被认为是声谱的高半部分。应当理解,低频和高频的边界并不固定,而是可以在2kHz到15kHz 之间,甚至可以超越这些边界。频带复制编码(SBR )是当前公知的对高频区域进行编码的方法。 此技术在以下文章中进行了描述2002年5月在德国慕尼黑举行的 第112届AES大会上M.Dietz, L丄iljeryd、 K. Kj6rling和O.Kunz的 Spectral Band Replication, a novel approach in audio coding, 以及 2002年11月在比利时鲁汶举行的第一届IEEE Benelux Workshop on Model Based Processing and Coding of Audio 上 P.Ekstrand 的 Bandwidth extension of audio signals by spectral band replication。 所 描述的方法可以应用到普通音频编码器中,诸如,例如AAC或 MPEG-l层III (MP3)编码器,以及其它多种代表本领域技术发展 水平的编码器。根据现有技术的方法的缺点在于仅仅将低频带调换到高频带 可能导致原始高频带与利用被调换的低频对其的重建之间不相似。 另 一 缺点在于,需要使用公知方法将噪声和正弦波添加到频谱中。因此,本申请的目标在于提供一种改进的音频编码技术。本申 请的进一步目的在于提供一种编码技术,其更正确地表示输入信号, 同时具有合理低的比特速率。
技术实现思路
为了克服上述缺点,根据一个方面,本申请提供了一种用于编 码音频信号的方法,包括接收输入音频信号,将该音频信号至少 划分为低频带和高频带,将该高频带至少划分为两个高频子频带信 号,在该低频带信号部分内确定哪个与高频子频带信号最匹配,以 及产生至少涉及与高频带子频带信号最匹配的低频带信号部分的参 数。本申请提供了 一种对输入信号的高频区域进行编码的新方法。 输入信号可以被划分为时间上连续的帧。每个帧都表示输入信号的 时间实例。在每个帧中,输入信号都可以由其频谱成分来表示。频谱成分或者采样表示输入信号内的频率。本申请不是盲目地将低频区域调换到高频,而是将原始高频频谱成分与编码后的高频频镨成分之间的相似性最大化。根据本申请, 高频区域是使用信号已经编码过的低频区域来形成的。通过比较低频信号采样与所接收信号的高频子频带,可以在低 频中找到与实际高频子频带最匹配的信号部分。本申请提供了在整 个低频频谱中一个采样接着一个采样地搜索与高频子频带最相似的 信号部分。换言之,由于信号部分与采样序列对应,所以本申请提 供了找到与高频子频带最匹配的采样序列。此采样序列可以在低频 带中的任何位置开始,除了低频带中最后被考虑的起点应该是低频 带中的最后采样减去将被匹配的高频子频带的长度。与实际高频子频带最匹配的低频信号部分的索引或者链接可以 用来对高频子频带进行建模。仅需要对索引或者链接进行编码并且 存储或者传输,以便允许在接收端还原对相应高频子频带的表示。根据实施方式,在低频带中搜索最相似的匹配,即与高频子频 带最相似的信号部分频谱形状。在编码器中创建至少涉及所找至Q的 与高频子频带最相似的信号部分的参数。参数可以包括用于将所找 到部分缩放成高频带的缩放因子。在解码器侧,这些参数用来将相 应的低频信号部分调换到高频区域,以便重建高频子频带。缩放可以使用缩放因子应用到复制的低频信号部分。根据实施 方式,只有缩放因子和到低频信号部分的链接需要编码。当使用最匹配的低频信号部分来重现高频子频带时,与公知方 法相比,高频区域的形状能更紧密地遵循原始高频频谱。由于振幅、 形状和频率位置都与原始信号更相似,所以可以更准确地建才莫感知 上重要的频谱峰值。由于所建模的高频子频带可以与原始高频子频 带相比较,所以可以轻易地发现遗失的频谱成分,即正弦波或噪声, 然后将它们添加上。为了得到包络形状,实施方式通过使用参数将低频信号采样调 换到高频子频带信号而提供了对低频信号部分的利用,其中参数包括缩放因子,使得所调换的低频信号部分的包络遵循所接收信号的 高频子频带信号的包络。缩放因子使得能够调节复制的低频信号部 分的能量和形状,以便更好地与实际高频子频带相匹配。参数可以包括到低频信号部分的链接,以便根据实施方式表示 相应的高频子频带信号。链接可以是到低频信号部分的指针或者索 引。通过此信息,在构建高频子频带时,可以参考低频信号部分。为了减小量化比特的数量,可以将高频子频带信号的包络标准 化。标准化使得低频带和高频带都在标准化的振幅范围内。这样减 小了需要用来将缩放因子量化的比特数量。用来标准化的信息必须 由编码器提供,以便在解码器中构建高频子频带的表示。实施方式 利用线性预测编码提供了包络标准化。可以利用倒谱建模来标准化 包络。倒谱建模使用信号功率频谱对数的逆傅立叶变换。产生缩放因子可以包括,在线性域中产生缩放因子以便在频谙 中至少匹配振幅峰值。产生缩放因子还可以包括,根据实施方式, 至少在对数域中匹配频谱能量和/或形状。实施方式提供了使用改进离散余弦变换(MDCT )在低频带中和 /或高频带中产生信号采样。MDCT变换提供了优选为实数的频谱系 数。根据实施方式的MDCT变换可以与任何适合的帧大小一起〗吏用, 尤其可以与用于普通帧的2048个采样以及用于瞬态帧的256采样的 帧大小,以及其间任意其它数值的帧大'J、 一起使用。为了获得与相应高频子频带信号最匹配的低频信号部分,实施 方式提供了使用标准化的相关性或者Euclidian距离来计算相似性度 量。为了编码输入信号,实施方式提供了对低频信号采样进行量化 以及至少对缩放因子进行量化。到低频信号部分的链接可以是整数。还可以增加附加的正弦波,以便改进高频信号的质量。为了遵 从这样的正弦波,实施方式提供了将本文档来自技高网
...

【技术保护点】
一种用于编码音频信号的方法,包括:    -接收输入音频信号,    -将该音频信号至少划分为低频带和高频带,    -将该高频带至少划分为两个高频子频带信号,    -在低频带信号部分内确定哪个部分与高频子频带信号最匹配,以及    -产生至少涉及与高频带子频带信号最匹配的低频带信号部分的参数。

【技术特征摘要】
【国外来华专利技术】1.一种用于编码音频信号的方法,包括-接收输入音频信号,-将该音频信号至少划分为低频带和高频带,-将该高频带至少划分为两个高频子频带信号,-在低频带信号部分内确定哪个部分与高频子频带信号最匹配,以及-产生至少涉及与高频带子频带信号最匹配的低频带信号部分的参数。2. 根据权利要求1的方法,其中产生参数进一步包括产生用于缩 放该低频带信号部分的至少一个缩放因子。3. 根据权利要求2的方法,其中该缩放因子是这样产生的使 用该参数调换到该高频子频带信号的该低频信号部分的包络遵循所 接收信号的高频子频带信号的包络。4. 根据权利要求2的方法,其中产生缩放因子包括在线性域中 产生缩放因子以便至少与该频谱的振幅峰值匹配。5. 根据权利要求2的方法,其中产生缩放因子包括在对数域中 产生缩放因子以便至少与该频谱的能量和/或形状匹配。6. 根据权利要求1的方法,其中产生参数包括产生到代表该相 应高频子频带信号的低频信号部分的链接。7. 根据权利要求1的方法,其中在该低频带信号部分中确定哪 个与高频子频带信号最匹配包括至少使用以下各项之一A)标准化的相关性, B ) Euclidian距离。8. 根据权利要求1的方法,其中至少该低频信号部分的采样是 使用改进离散余弦变换产生的。9. 根据权利要求1的方法,进一步包括标准化该高频子频带信号的包络。10. 根据权利要求2的方法,进一步包括将对低频信号的采样进 行量化,并至少对该缩放因子进行量化。11. 根据权利要求1的方法,其中该输入信号被划分为时间连续 帧,并进一步包括在该输入信号中两个连续帧内检测有音调部分。12. 根据权利要求U的方法,其中检测有音调部分包括使用移 位离散傅立叶变换。13. 根据权利要求11的方法,进一步包括向有音调部分添加正 弦波。14. 根据权利要求11的方法,进一步包括增大用于有音调部分 的高频子频带数量。15. —种用于解码音频信号的方法,具有 -接收经编码的比特 流,-从该比特流中解码出至少低频信号和至少涉及低频信号部分 的参数,-利用该低频信号的采样以及涉及该低频信号部分的参数来重 建至少两个高频子频带信号,以及-输出包括至少该低频信号和至少两个高频子频带信号的输出 信号。16. —种用于编码音频信号的编码器,包括 -接收装置,其被布置以接收输入音频信号,-滤波装置,其被布置以将该音频信号至少划分为低频带和高频 带,并进一步被布置以将该高频带分为至少两个高频子频带信号, 以及-...

【专利技术属性】
技术研发人员:M塔米
申请(专利权)人:诺基亚公司
类型:发明
国别省市:FI[芬兰]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1