语音编码装置和语音编码方法制造方法及图纸

技术编号:3044986 阅读:136 留言:0更新日期:2012-04-11 18:40
提供一种在具有单声道/立体声可伸缩结构的语音编码中,即使在立体声信号的多个声道信号之间相关小的情况下也能够高效率地对立体声语音进行编码的语音编码装置。在该装置的核心层编码部分(110)中,单声道信号生成部分(111)由第一ch语音信号和第二ch语音信号生成单声道信号,单声道信号编码部分(112)进行对单声道信号的编码,单声道信号解码部分(113)由单声道信号的编码数据生成单声道的解码信号后输出到增强层编码部分(120)。在增强层编码部分(120)中,第一ch预测信号合成部分(122)由单声道解码信号和第一ch预测滤波器量化参数合成第一ch预测信号,第二ch预测信号合成部分(126)由单声道解码信号和第二ch预测滤波器量化参数合成第二ch预测信号。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及,特别涉及用于立体声语音的。
技术介绍
随着移动通信或IP通信中的传输频带的宽频化、服务的多样化,在语音通信中,对高质量化、高临场感化的需求提高。例如,预计今后电视电话服务中的免提(hands free)方式的通话、电视会议中的语音通信、多个通话者在多个地点同时进行会话的多地点语音通信、以及能够在保持临场感的同时传输周围的声音环境的语音通信等的需要会增加。在该情况下,期望实现比单声道信号有临场感,而且能够识别多个通话者的讲话位置的基于立体声语音的语音通信。为了实现这样的基于立体声语音的语音通信,必须将立体声语音编码。此外,在IP网络上的语音数据通信中,为了实现网络上的通信量控制和组播通信,期望具有可伸缩(scalable)的结构的语音编码。可伸缩的结构是指在接收端即使由部分的编码数据也能够进行语音数据的解码的结构。从而,期望具有在将立体声语音编码并传输的情况下也能够在接收端选择立体声信号的解码和使用了编码数据的一部分的单声道信号的解码的、单声道-立体声之间的可伸缩结构(单声道/立体声可伸缩结构)的编码。作为这样的具有单声道/立体声可伸缩结构的语音编码方法,例如有通过声道相互间的音调(pitch)预测来进行声道(以下酌情简称为“ch”)之间的信号预测(从第一ch信号预测第二ch信号或从第二ch信号预测第一ch信号),即利用两个声道之间的相关来进行编码的方法(参照非专利文献1)。非专利文献1Ramprashad,S.A.,“Stereophonic CELP coding using crosschannel prediction”,Proc.IEEE Workshop on Speech Coding,pp.136-138,Sep.2000.
技术实现思路
但是,在上述非专利文献1记载的语音编码方法中,在两个声道之间的相关小的情况下,声道之间的预测的性能(预测增益(gain))降低,编码效率恶化。本专利技术的目的在于提供一种在具有单声道/立体声可伸缩结构的语音编码中,即使在立体声信号的多个声道信号之间的相关小的情况下也能够高效率地将立体声语音编码的。本专利技术的语音编码装置,包括第一编码部件,进行使用核心层的单声道信号的编码;以及第二编码部件,进行使用增强层的立体声信号的编码,所述第一编码部件具有生成部件,用于将包含第一声道信号和第二声道信号的立体声信号作为输入信号,由所述第一声道信号以及所述第二声道信号生成单声道信号,所述第二编码部件具有合成部件,用于根据从所述单声道信号得到的信号,对所述第一声道信号或所述第二声道信号的预测信号进行合成。根据本专利技术,即使在立体声信号的多个声道信号之间的相关小的情况下也能够高效率地将立体声语音编码。附图说明图1是表示本专利技术的实施方式1的语音编码装置的结构的方框图。图2是表示本专利技术的实施方式1的第一ch、第二ch预测信号合成部分的结构的方框图。图3是表示本专利技术的实施方式1的第一ch、第二ch预测信号合成部分的结构的方框图。图4是表示本专利技术的实施方式1的语音解码装置的结构的方框图。图5是本专利技术的实施方式1的语音编码装置的动作说明图。图6是本专利技术的实施方式1的语音编码装置的动作说明图。图7是表示本专利技术的实施方式2的语音编码装置的结构的方框图。图8是表示本专利技术的实施方式2的语音解码装置的结构的方框图。图9是表示本专利技术的实施方式3的语音编码装置的结构的方框图。图10是表示本专利技术的实施方式3的第一ch、第二chCELP编码部分的结构的方框图。图11是表示本专利技术的实施方式3的语音解码装置的结构的方框图。图12是表示本专利技术的实施方式3的第一ch、第二chCELP解码部分的结构的方框图。图13是本专利技术的实施方式3的语音编码装置的动作流程图。图14是本专利技术的实施方式3的第一ch、第二chCELP编码部分的动作流程图。图15是表示本专利技术的实施方式3的语音编码装置的其它结构的方框图。图16是表示本专利技术的实施方式3的第一ch、第二chCELP编码部分的其它结构的方框图。图17是表示本专利技术的实施方式4的语音编码装置的结构的方框图。图18是表示本专利技术的实施方式4的第一ch、第二chCELP编码部分的结构的方框图。具体实施例方式以下,参照附图详细说明与具有单声道/立体声可伸缩结构的语音编码有关的本专利技术的实施方式。(实施方式1)图1表示本实施方式的语音编码装置的结构。图1所示的语音编码装置100包括用于单声道信号的核心层编码部分110和用于立体声信号的增强层编码部分120。另外,在以下的说明中,将以帧为单位动作为前提来进行说明。在核心层编码部分110中,单声道信号生成部分111按照算式(1),由输入的第一ch语音信号s_ch1(n)、第二ch语音信号s_ch2(n)(其中,n=0~NF-1;NF为帧长)生成单声道信号s_mono(n),并输出到单声道信号编码部分112。s_mono(n)=(s_ch1(n)+s_ch2(n))/2...(1)单声道信号编码部分112对单声道信号s_mono(n)进行编码,并将该单声道信号的编码数据输出到单声道信号解码部分113。此外,该单声道信号的编码数据与从增强层编码部分120输出的量化码或编码数据多路复用后,作为编码数据被传输到语音解码装置。单声道信号解码部分113由单声道信号的编码数据生成单声道的解码信号后输出到增强层编码部分120。在增强层编码部分120中,第一ch预测滤波器分析部分121由第一ch语音信号s_ch1(n)和单声道解码信号求第一ch预测滤波器参数并对其进行量化,将第一ch预测滤波器量化参数输出到第一ch预测信号合成部分122。另外,作为对第一ch预测滤波器分析部分121的输入,也可以使用单声道信号生成部分111的输出即单声道信号s_mono(n)来代替单声道解码信号。此外,第一ch预测滤波器分析部分121输出将第一ch预测滤波器量化参数编码而得的第一ch预测滤波器量化码。该第一ch预测滤波器量化码与其它的编码数据或量化码多路复用后作为编码数据被传输到语音解码装置。第一ch预测信号合成部分122由单声道解码信号和第一ch预测滤波器量化参数合成第一ch预测信号,并将该第一ch预测信号输出到减法器123。关于第一ch预测信号合成部分122的细节在后叙述。减法器123求输入信号即第一ch语音信号和第一ch预测信号的差,即第一ch预测信号相对于第一ch输入语音信号的残差分量的信号(第一ch预测残差信号),并输出到第一ch预测残差信号编码部分124。第一ch预测残差信号编码部分124将第一ch预测残差信号编码后输出第一ch预测残差编码数据。该第一ch预测残差编码数据与其它的编码数据或量化码多路复用后作为编码数据被传输到语音解码装置。另一方面,第二ch预测滤波器分析部分125由第二ch语音信号s_ch2(n)和单声道解码信号求第二ch预测滤波器参数并对其进行量化,将第二ch预测滤波器量化参数输出到第二ch预测信号合成部分126。此外,第二ch预测滤波器分析部分125输出将第二ch预测滤波器量化参数编码而得的第二ch预测滤波器量化码。该第二ch预测滤波器量化码与其它的编码数据或量化码多路复用后作为编码数据被传输到语音解码装置。第二ch预测信号本文档来自技高网
...

【技术保护点】
一种语音编码装置,包括:第一编码部件,进行使用核心层的单声道信号的编码;以及第二编码部件,进行使用增强层的立体声信号的编码,所述第一编码部件具有生成部件,用于将包含第一声道信号和第二声道信号的立体声信号作为输入信号,由所述第一声道信号以及所述第二声道信号生成单声道信号,所述第二编码部件具有合成部件,用于根据从所述单声道信号得到的信号,对所述第一声道信号或所述第二声道信号的预测信号进行合成。

【技术特征摘要】
【国外来华专利技术】JP 2004-12-27 377965/2004;JP 2005-8-18 237716/20051.一种语音编码装置,包括第一编码部件,进行使用核心层的单声道信号的编码;以及第二编码部件,进行使用增强层的立体声信号的编码,所述第一编码部件具有生成部件,用于将包含第一声道信号和第二声道信号的立体声信号作为输入信号,由所述第一声道信号以及所述第二声道信号生成单声道信号,所述第二编码部件具有合成部件,用于根据从所述单声道信号得到的信号,对所述第一声道信号或所述第二声道信号的预测信号进行合成。2.如权利要求1所述的语音编码装置,其中,所述合成部件使用所述第一声道信号或所述第二声道信号相对于所述单声道信号的延迟差和振幅比来合成所述预测信号。3.如权利要求1所述的语音编码装置,其中,所述第二编码部件对所述预测信号和所述第一声道信号或所述第二声道信号的残差信号进行编码。4.如权利要求1所述的语音编码装置,其中,所述合成部件根据将所述单声道信号进行CELP编码而得到的单声道驱动音源信号来合成所述预测信号。5.如权利要求4所述的语音编码装置,其中,所述第二编码部件还具有计算部件,用于由所述第一声道信号或所述第二声道信号计算第一声道LPC残差信号或第...

【专利技术属性】
技术研发人员:吉田幸司后藤道代
申请(专利权)人:松下电器产业株式会社
类型:发明
国别省市:JP[日本]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1