可扩展编码装置及可扩展编码方法制造方法及图纸

技术编号:3044728 阅读:119 留言:0更新日期:2012-04-11 18:40
公开了可扩展编码装置,能够在防止解码信号的音质恶化的同时削减编码速率,并削减电路规模。在该装置中,扩展层被大致分为对第一声道进行处理的系统和对第二声道进行处理的系统。对第一声道进行处理的音源预测单元(112)基于单声道信号的驱动音源信号预测第一声道的驱动音源信号,并将预测出的驱动音源信号通过乘法器(113)输出到CELP编码单元(114)。对第二声道进行处理的音源预测单元(115)基于单声道信号的驱动音源信号和来自CELP编码单元(114)的输出,预测第二声道的驱动音源信号,并将预测出的驱动音源信号通过乘法器(116)输出到CELP编码单元(117)。CELP编码单元(114和117)使用各个预测驱动音源信号,对各个声道进行CELP编码。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及对立体声信号进行编码的。
技术介绍
像通过移动电话的通话那样,在移动通信系统的语音通信中,目前通过 单声道方式的通信(单声道通信)为主流。但是,今后如果像第四代移动通信系 统那样,推进传输速率的更高比特速率化,则能够确保用于传输多个声道的 频带,因此在语音通信中也可以期待通过立体声方式的通信(立体声通信)的普及。例如,考虑在装备了 HDD(硬盘)的便携式音响播放器中记录音乐,并对 该播放器安装立体声用的耳机和头戴耳机等而欣赏立体声音乐的用户日益增 加的现状,可预测到将来移动电话和音频播放器会结合,从而利用立体声用 的耳机和头戴耳机等的设备并进行通过立体声方式的语音通信的生活方式普 及起来。而且,可以预测到在最近在逐渐普及的电视会议等的环境中,为了 实现具有现场感的会话,同样进行立体声通信。另一方面,在移动通信系统和有线方式的通信系统等中,为了减轻系统 的负荷, 一般通过对所传输的语音信号预先进行编码而谋求传输信息的低比 特速率化。由此,对立体声语音信号进行编码的技术最近备受瞩目。例如, 有 一种通过使用声道间预测(cross-channel prediction)来提高预测残差信号的 编码效率的编码技术,所述预测残差信号是进行了立体声语音信号的CELP 编码的加权的预测残差信号(参照非专利文献1)。另外,也可以预测到即使普及了立体声通信,仍然进行单声道通信。这 是因为,由于单声道通信的比特速率低而可以期待降低通信成本,而且仅支 持单声道通信的移动电话的电路规模'J 、而价格较低,因此不希望高质量的语 音通信的用户趋于购买仅支持单声道通信的移动电话。所以,在一个通信系 统中会同时存在支持立体声通信的移动电话和支持单声道通信的移动电话,从而通信系统需要支持这些立体声通信和单声道通信的双方。进而,由于在 移动通信系统中通过无线信号交换通信数据,所以根据传输路径环境,有时 会丢失通信数据的一部分。于是,如果移动电话具有即使丟失了通信数据的 一部分也能够基于剩余的接收数据恢复原来的通信数据的功能,就非常有用。 作为能够支持立体声通信和单声道通信的双方,而且即使丢失了通信数 据的 一部分也能够基于剩余的数据恢复原来的通信数据的功能,有由立体声 信号和单声道信号构成的可扩展编码。作为具有该功能的可扩展编码装置的例子,例如有非专利文献2所公开的装置。非专利文献1: Ramprashad S. A. 、 Stereophonic CELP coding using cross channel prediction、 Proc. IEEE Workshop on Speech Coding、 Pages:136 — 138、 (17-20 Sept. 2000)非专利文献2: ISO/正C 14496-3:1999 (B.14 Scalable AAC with core coder)
技术实现思路
专利技术要解决的问题然而,非专利文献1所公开的技术,对两个声道的语音信号分别具有独 立的自适应码本和固定码本等,对每个声道产生各自的驱动音源信号而生成 合成信号。也就是说,对每个声道进行语音信号的CELP编码,并将得到的 各个声道的编码信息输出到解码端。因此,存在如下问题与声道数目相应 数目的编码参数被生成而提高编码速率,同时编码装置的电路规模也变大。 假如使自适应码本和固定码本等的个数减少,虽然编码速率降低而且可削减 电路规模,但反而导致解码信号的极大的音质劣化。这是在非专利文献2所 公开的可扩展编码装置中也同样会发生的问题。因此,本专利技术的目的在于提供可扩展编码装置和可扩展编码方法,能够 在防止解码信号的音质恶化的同时削减编码速率,并削减电路规模。解决问题的方案本专利技术的可扩展编码装置采用的结构包括单声道编码单元,对单声道 信号进行编码;第一预测单元,基于在所述单声道编码单元的编码中得到的 驱动音源,预测在立体声信号中所包含的第一声道的驱动音源;第一声道编 码单元,使用所述第一预测单元所预测的驱动音源,对第一声道进行编码; 第二预测单元,基于在所述单声道编码单元和所述第一声道编码单元的各个编码中得到的驱动音源,预测在所述立体声信号中所包含的第二声道的驱动音源;以及第二声道编码单元,使用所述第二预测单元所预测的驱动音源, 对第二声道进行编码。专利技术效果根据本专利技术,对立体声语音信号,能够在防止解码信号的音质恶化的同 时削减编码速率,并削减电路规模。附图说明图1是表示实施方式1的可扩展编码装置的主要结构的方框图; 图2是表示实施方式1的立体声编码单元内部的主要结构的方框图; 图3是用于说明在实施方式1的音源预测单元中进行的预测处理的步骤 的流程图4是用于说明在实施方式1的音源预测单元中进行的预测处理的步骤 的流程图5是更详细地说明实施方式1的立体声编码单元内部的结构的方框图; 图6是表示实施方式2的可扩展编码装置的扩张层的主要结构的方框图; 图7是表示实施方式3的立体声编码单元内部的主要结构的方框图; 图8是更详细地说明实施方式3的立体声编码单元内部的结构的方框图; 图9是表示在实施方式3的码本选择单元中的比特分配处理的步骤的流 程图;以及骤的流程图。具体实施例方式以下,参照附图详细说明本专利技术的实施方式。 (实施方式1 )图1是表示本专利技术的实施方式1的可扩展编码装置100的主要结构的方 框图。另外,这里以对由两个声道构成的立体声语音信号进行编码的情况为 例进行说明,而且以下所示的第 一声道和第二声道分别表示L声道和R声道, 或者其相反的声道。可扩展编码装置100包括加法器101、乘法器102、单声道编码单元103以及立体声编码单元104,而且加法器101、乘法器102和单声道编码单 元103构成基本层,立体声编码单元104构成扩展层。 可扩展编码装置100的各个部分进行以下动作。加法器ioi将输入到可扩展编码装置ioo的第一声道信号cm和第二声道信号CH2相加,生成和信号。乘法器102将该和信号乘以1/2而将标量(scale) 减半,生成单声道信号M。也就是说,加法器101和乘法器102对第一声道 信号CH1和第二声道信号CH2求平均,并将其作为单声道信号M。单声道 编码单元103对该单声道信号M进行编码,并将得到的编码参数输出。这里, 例如在CELP编码时,编码参数为LPC(LSP)参数、自适应码本索引、自适应 音源增益、固定码本索引以及固定音源增益。另外,单声道编码单元103将 在编码时得到的驱动音源信号输出到立体声编码单元104。立体声编码单元104对输入到可扩展编码装置100的第一声道信号CH1 和第二声道信号CH2,使用从单声道编码单元103输出的驱动音源信号进行 后述的编码,并将得到的立体声信号的编码参数输出。该可扩展编码装置IOO的特征之一是,从基本层输出单声道信号的编码 参数,而从扩展层输出立体声信号的编码参数。该立体声信号的编码参数为 在解码装置中通过与基本层(单声道信号)的编码参数一起进行解码而能够得 到立体声信号的参数。也就是说,本实施方式的可扩展编码装置实现由单声 道信号和立体声信号构成的可扩展编码。例如,得到基本层和扩展层的编码 参数的解码装置,即使因传输路径环境的恶化而未能得到扩展层的本文档来自技高网
...

【技术保护点】
一种可扩展编码装置,包括:    单声道编码单元,对单声道信号进行编码;    第一预测单元,基于在所述单声道编码单元的编码中得到的驱动音源,预测在立体声信号中所包含的第一声道的驱动音源;    第一声道编码单元,使用所述第一预测单元所预测的驱动音源,对第一声道进行编码;    第二预测单元,基于在所述单声道编码单元和所述第一声道编码单元的各个编码中得到的驱动音源,预测在所述立体声信号中所包含的第二声道的驱动音源;以及    第二声道编码单元,使用所述第二预测单元所预测的驱动音源,对第二声道进行编码。

【技术特征摘要】
【国外来华专利技术】JP 2005-5-31 159685/2005;JP 2005-11-30 346665/20051、一种可扩展编码装置,包括单声道编码单元,对单声道信号进行编码;第一预测单元,基于在所述单声道编码单元的编码中得到的驱动音源,预测在立体声信号中所包含的第一声道的驱动音源;第一声道编码单元,使用所述第一预测单元所预测的驱动音源,对第一声道进行编码;第二预测单元,基于在所述单声道编码单元和所述第一声道编码单元的各个编码中得到的驱动音源,预测在所述立体声信号中所包含的第二声道的驱动音源;以及第二声道编码单元,使用所述第二预测单元所预测的驱动音源,对第二声道进行编码。2、 如权利要求1所述的可扩展编码装置,其中,所述第二预测单元通过从两倍的在所述单声道编码单元的编码中得到的 驱动音源中减去在所述第一声道编码单元的编码中得到的驱动音源,从而预 测所述第二声道的驱动音源。3、 如权利要求1所述的可扩展编码装置,其中,所述第 一预测单元使用在单声道信号和第 一 声道信号之间的延迟时间差 和振幅比中的至少 一方进行所述预测。4、 如权利要求1所述的可扩展编码装置,其中,还包括 设定单元,在所述立体声信号中所包含的声道之中,将与所述单声道信号的驱动音源的相关较高的声道设定为所述第 一声道。5、 如权利要求1所述的可扩展编码装置,其中,还包括 比特分配单元,进行对所述第 一声道编码单元和所述第二声道编码单元分配比特的处理,以使第一声道的编码失真和第二声道的编码失真均等。6、 如权利要求1所述的可扩展编码装置,其中,还包括 比特分配单元,进行对所述第一声道编码单元和所述第二声道编码单元分配比特的处理,以使第一声道的编码失真和第二声道的编码失真之和最小。7、 如权利要求1所述的可扩展编码装置,其中,还包...

【专利技术属性】
技术研发人员:后藤道代吉田幸司
申请(专利权)人:松下电器产业株式会社
类型:发明
国别省市:JP[日本]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1