一种在解码由音频编码系统编码的音频信号时转换比特率的方法,所述解码包括依靠比特率的后处理步骤。根据本发明专利技术,在从初始比特率向最终比特率转换时,所述方法包括从初始比特率的信号向最终比特率的信号连续改变的转换步骤,所述信号之一或两者被后处理。应用于数据分组网络的VoIP语音和/或音频信号的传送。
【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及一种在解码由多速率音频编码系统编码的音频信号的时候转 换比特率的方法,更具体地涉及一种比特率分级和,适合的话,带宽分级的 音频编码系统。它也涉及用于比特率分级和带宽分级的音频解码系统的所述 方法的应用,以及比特率分级和带宽分级的音频解码器。
技术介绍
本专利技术在IP类承载语音的分组网络上传送语音和/或音频信号的领域有 着特别有利的应用,以便提供基于该传送信道的容量能够被修改的质量。本专利技术的方法实现在比特率分级和带宽分级的音频编码器/解码器(编解 码器)的各种比特率之间无人为干扰的转换,更具体地用于在具有比特率独 立的后处理的电话频带宽核心和一个或多个宽带增强层的比特率分级和带宽 分级的音频编码的环境中介于电话频带宽和宽带之间的转换。在一般方式中,术语电话频带宽和窄带指示频带由300赫兹(I-Iz) 到3400 Hz而术语宽带预定为从50 Hz到7000 Hz的频带。如今有#种用于将音频(语音和/或音频)信号转换成数字信号的技术以 及以此方式处理数字化的信号。最广泛使用的技术是诸如PCM或ADPCM编码一样的波形编码方 法,诸如CELP(码本激励线性预测)编码一样的通过分析与合成的参数编 码,以及在子带或通过变换的感知编码方法。窄带CELP编码一般采用 后处理来增强质量。该后处理典型地包括自适应后滤波和高通滤波。在例如 Speech Coding and Synthesis,编者W,B. Kleijn和K.K. Paliwal, Elsevier, 1995中描述用于编码音频信号的标准技术。仅用于音频信号的双向传送的技 术与此相关。在传统的语音编码中,编码器产生固定比特率的比特流。该固定的比特 率约束了该编码器和解码器的简化实现和使用。如此系统的例子有64千比特 每秒(kbps )的G.711编码和8 kbps的G.729编码。在一些应用中,诸如移动电话、IP承载的话音、或ad/70C网络承载的通 信,优选地产生不同比特率的比特流,该比特率值从预定义组中选取。存在各种多速率编码技术* 由源和/或信道控制的多模编码,如在AMR-NB 、 AMR-WB 、 SMV、 或VMR-WB系统中4吏用的。 等级编码,也称为分级',编码,其产生被称为分等级的比特流, 因为它包括核心比特率和一个或多个增强层。48kbps、 56kbps、和64 kbps 的G.722系统是比特率分级编码的简单例子。MPEG-4CELP编解码器是比特 率分级和带宽分级的(见T. Numura et al., A bitrate and bandwidth scalable CELP coder, ICASSP 1998 )。 多描述编码(见A. Gersho, J.D. Gibson, V. Cupe腿n, H. Dong, A multiple description speech coder based on AMR-WB for mobile ad hoc networks, ICASSP 2004)。在多速率编码中,由必要确保从一种编码比特率到另 一种的转换不产生 误差或人为干扰。如果在所有比特率处的编码是基于通过在相同带宽中的语音信号的相同 编码模型的表示则比特率切换很简单。例如,在AMR-NB系统中,除了由与 ACELP模型兼容的LPC (线性预测编码)类模型处理的舒适噪音(comfort noise )的产生,在电话频带(300 Hz-3400 Hz )中定义信号并且编码依靠ACELP (代数码本激励线性预测)模型。注意AMR-NB编码使用传统方式的以自适 应后滤波和高通滤波形式的后处理,该自适应后滤波系数取决于该解码比特 率。然而,没有采用预防措施来管理与根据比特率改变的后处理参数的使用 关联的任何问题。相反,AMR-WB类型的宽带CELP编码没使用后处理,主 要是复杂之故。比特率转换在比特率分级和带宽分级的音频编码中甚至更成问题。编码于是基于根据比特率而不同的模型和带宽。例如在Y. Hiwasaki, T. Mori, H. Ohmuro, J. Ikedo, D. Tokumoto禾口 A. Kataoka, Scalable Speech Coding Technology for High-Quality Ubiqutous Communications, NTT Technical Review, March 2004的文章中说明了等级音 频编码的基本概念。在此类编码中,比特流包括基本层和一个或多个增强层。 基本层通过叫做核心编解码器的固定低比特率编解码器产生,保证最小编码质量。该层必须被解码器接收以维持可接受的质量级别。该增强层用来 增强质量。虽然它们全部由编码器送出,但是它们可能并不全被解码器接收。 等级编码的主要好处是其允许仅仅通过截取比特流的比特率的调节。层的数 目,即,比特流可能截取的数目,定义编码的颗粒度。如果该比特流包括数 层,达到两到四层,则编码被称为具有强颗粒度,精细颗粒度编码允许达lkbps的增量。在此对等级编码技术有极大兴趣的是具有电话频带CELP类型核心编码 器和一个或多个宽带增强层的比特率分级和带宽分级。在H.Tadd6ietal.,A Scalable Three Bitrate (8, 14.2 and 24 kbps) Audio Coder; 107lh Convention AES, 1999中给出具有强颗粒度8、 14.2和24kbps,和在B. Kovesi, D. Massaloux, A. Sollaud, A scalable speech and audio coding scheme with continuous bitrate flexibility, ICASSP 2004中给出具有在32 kbps处精细颗粒度6.4,或MPEG-4 CELP编码的此种系统的例子。在国际申请WO 01/48931和WO 02/060075涉及与在比特率分级和带宽 分级音频编码的环境中的比特率切换的问题关联。然而,在以上两个文件中描述的技术仅应对在使用电话频带宽和宽带编 码的通信网络之间互通的问题。特别是,国际申请WO 02/060075描述一种用于从宽带到电话频带转换的 优化的抽选系统。在国际申请WO 01/48931中提出的方法是从电话频带信号中产生伪随机 宽带信号,尤其通过提取频语包络的频带扩展技术。现有技术中的公知 类似技术主要解决与宽带向电话频带转换关联的问题,其中通过使用不传送 用于从接收的电话频带信号中产生宽带信号的信息的频带扩展技术寻求避免 频带减少。注意到这些方法并不真地寻求控制在各带宽之间的传送,且它们 也具有依赖质量高度改变的频带扩展技术的缺点,以及它们因此无法确保稳 定的输出质量。
技术实现思路
因此,本专利技术的主题要解决的技术问题是要提出一种在解码由多速率音 频编码系统编码的音频信号时的切换比特率的方法,所述解码包括至少一个 依靠比特率的后处理步骤,该方法允许将在不同比特率之间被处理的转换,对于该比特率,使用的后处理依靠该解码的比特率,从而如果当解码时发生 比特率的快速改变时消除特别敏感的人为干扰。后处理对信号引入相移并且 本文档来自技高网...
【技术保护点】
一种在解码由多速率音频编码系统编码的音频信号时的比特率切换方法,所述解码包括依靠所述比特率的至少一个后处理步骤,其特征在于,当从初始比特率向最终比特率切换时,所述方法包括从处于初始比特率的信号向处于最终比特率的信号连续改变的转换步骤,所述信号之一或两者被后处理。
【技术特征摘要】
【国外来华专利技术】FR 2005-7-22 05522861.一种在解码由多速率音频编码系统编码的音频信号时的比特率切换方法,所述解码包括依靠所述比特率的至少一个后处理步骤,其特征在于,当从初始比特率向最终比特率切换时,所述方法包括从处于初始比特率的信号向处于最终比特率的信号连续改变的转换步骤,所述信号之一或两者被后处理。2. 如权利要求l所述的方法,其特征在于所述后处理是高通滤波。3. 如权利要求l所述的方法,其特征在于所述后处理是自适应后滤波。4. 如权利要求l所述的方法,其特征在于所述后处理是高通滤波和自适 应后滤波的组合。5. 如权利要求1到4中的任何一项所述的方法,其特征在于通过降低处 于初始比特率的信号的权重和增加处于最终比特率的信号的权重的加权来实 现所述连续转变。6. 如权利要求1到5中的任何一项所述的方法,其特征在于处于初始比 特率的信号和处于最终比特率的信号被后处理。7. —种计算机程序,包括用于当由计算机执行所述程序时执行根据权利 要求1到6中的任何一项的方法的代码指令。8. —种对于比特率分级音频解码系统的根据权利要求1到6中的任何一 项的方法的应用。9. 一种对于比特率分级和带宽分级音频解码系统的根据权利要求1到6 中的任何一项的方法的应用,其中由在第 一频带中的第 一解码层获得初始...
【专利技术属性】
技术研发人员:斯蒂法尼拉戈特,戴维维雷特,贝拉茨科维塞,
申请(专利权)人:法国电信公司,
类型:发明
国别省市:FR[法国]
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。