声源矢量生成装置以及声音编码装置和声音解码装置制造方法及图纸

技术编号:3047279 阅读:131 留言:0更新日期:2012-04-11 18:40
本发明专利技术揭示一种声源矢量生成装置以及声音编码装置和声音解码装置。将以往的CELP型声音编码/解码装置的噪声向量读出单元和噪声码本,分别置换为根据输入振种的值输出不同矢量系列的振荡器和存储多个振种(产生振荡器振荡的“种子”)的振种存储单元。由此,不必将固定矢量原样地存储在固定码本(ROM)中,能大幅度地减小存储器容量。(*该技术在2017年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利技术涉及能得到高品质合成声音的声源矢量生成装置以及能用低位速率对高品质的声音信号进行编码/解码的声音编码装置和声音解码装置。
技术介绍
CELP(Code Excited Linear Prediction编码激励线性预测)型的声音编码装置,是对每个以一定的时间划分声音的帧进行线性预测,用存储过去的驱动声源的自适应码本和存储多个噪声矢量的噪声码本,对每帧线性预测的预测残差(激励信号)进行编码的方式。例如在“低位速率高品质量话音”(“High Quality Speechat Low Bit Rate”M.R.Schroeder,Proc.ICASSP’85,PP937-940)中公开的CELP型声音编码装置。附图说明图1表示CELP型的声音编码装置的概略结构。CELP型的声音编码装置将声音信息分离成声源信息和声道信息并进行编码。对于声道信息,将输入声音信号10输入到滤波器系数分析单元11中并进行线性预测,在滤波器系数量化单元12对线性预测系数(LPG)进行编码。借助于对合成滤波器13提供线性预测系数,在合成滤波器13能将声道信号掺人声源信息中。对于声源信息,在每个进一步细分帧的区间(称为子帧)进行自适应码本14的检索和噪声码本15的声源检索。自适应码本14的检索和噪声码本15的声源检索,是决定使式(1)的编码失真最小的自适应码矢量的码号及其增益(音调增益)、和噪声码矢量的码号及其增益(噪声码增益)的处理。‖v·(gaHp+gcHc)‖2(1)V声音信号(矢量)H合成滤波器的脉冲响应卷积矩阵 其中,h合成滤波器的脉冲响应(矢量)L帧长p自适应码矢量c噪声码矢量ga自适应码增益(音调增益)gc噪声码增益但是,因当闭环检索使式(1)为最小的前述码时,码检索中所要的运算量变得膨大,所以在一般的CELP型声音编码装置中,首先进行自适应码本检索,规定自适应码矢量的码号,接着接受其结果,进行噪声码本检索,规定噪声码矢量的码号。这里,参照图2A~图2C对CELP型声音编码装置的噪声码本检索进行说明。图中,符号x是基于式(2)求得的噪声码本检索用的目标矢量。设自适应码本检索已经结束。x=v-gaHp (2)x噪声码本检索目标(矢量)v声音信号(矢量)H合成滤波器的脉冲响应卷积矩阵p自适应码矢量ga自适应码增益(音调增益)如图2所示,噪声码本检索是规定使计算单元16中用式(3)定义的编码失真最小的噪声码矢量c的处理。‖x-gcHc)‖2(3)x噪声码本检索目标(矢量)H合成滤波器的脉冲响应卷积矩阵 c噪声码矢量gc噪声码增益失真计算单元16对控制开关21进行控制,切换从噪声码本15读出的噪声编码矢量,直到定出噪声码矢量c为止。为了减少计算的费用,实际的CELP型声音编码装置为图2B的结构,在失真计算单元16’中进行规定使式(4)的失真估算值最大的码号的处理。(xtHc)2||Hc||2=((xtH)c)2||Hc||2=(x′tc)2||Hc||2=(x′tc)2ctHtHc----(4)]]>x噪声码本检索目标(矢量)H合成滤波器的脉冲响应卷积矩阵H’H的转置矩阵x’在H对x进行时间反转合成倒置所得矢量(x”=x’H)c噪声码矢量具体地说,将噪声码本控制开关21连接到噪声码本15的1端,从对应于该端的地址读出噪声码矢量c。由合成滤波器13,将读出的噪声码矢量c与声道信息合成,生成合成矢量Hc。接着,用对目标x进行时间反转、合成、时间反转得到的矢量x’、以合成滤波器合成噪声码矢量的所得矢量Hc和噪声码矢量c,失真计算单元16’算出式(4)的失真估算值。然后,切换噪声码本控制开关21,对噪声码本内的全部噪声矢量,算出上述失真估算值。最后,将式(4)的失真估算值为最大时连接的噪声码本控制开关21的号码,作为噪声码矢量的码号,输出到编码输出单元17中。图2C表示声音解码转置的部分结构。切换控制噪声码本控制开关21,以便读出被传送来的码号的噪声码矢量。在放大电路23和合成滤波器24中设定被传送来的噪声编码增益gc和滤波器系数后,读出噪声码矢量并复原合成声音。在前述的声音编码装置和解码装置中,存储在噪声码本15中作为声源信息的噪声码矢量的越多,越能检索接近实际声音的声源的噪声码矢量。但是,因噪声码本(ROM)的容量有限制,所以不能将对应于全部声源的无数的噪声码矢量存储在噪声码本中。因此,在谋求声音品质的改善方面有其极限。此外,提议有能大幅度地降低失真计算单元的编码失真计算,而且能减小噪声码本(ROM)的代数结构的声源(记载在“8KBIT/S ACELP CODING OFSPEECH WITH 10MS SPEECH-FRAMEA CANDIDATE FOR CCITTSTANDARDIZATION”R.Salami,C.Laflamme,J-P.Adoul,ICASSP’94,pp.II-97~II-100,1994中)。代数结构的声源预先计算合成滤波器的脉冲响应和时间反转的目标的卷积运算结果以及合成滤波器的自相关,并在存储器中展开,因而能大幅度地减少编码失真计算的费用。借助于代数生成噪声码矢量,能减小存储噪声码矢量的ROM。在噪声码本中使用前述代数结构声源的CS-ACELP和ACELP分别被ITU-T作为G.729建议和G.723.1建议提出。但是,在将前述代数结构声源包括在噪声码本中的CELP型的声音编码装置/声音解码装置中,因不断地用脉冲串矢量对噪声码本检索用目标进行编码,所以在谋求声音品质的改善方面有其极限。专利技术概述鉴于前述实际情况,本专利技术的第1个目的是提供比原样在噪声码本中存储噪声码矢量的场合能大幅度地减小存储器容量,并能谋得声音品质改善的声源矢量生成装置以及声音编码装置和声音解码装置。本专利技术的第2个目的是提供在噪声码本中包括代数结构声源,与用脉冲串矢量对噪声码本检索用目标进行编码的场合相比,能生成复杂的噪声码矢量,并能谋得声音品质改善的声源矢量生成装置以及声音编码装置和声音解码装置。本专利技术将以往的CELP型声音编码/解码装置的固定矢量读出单元和固定码本,分别置换为输出与被输入的振种值相对应的不同的矢量系列的振荡器和存储多个振种(产生振荡器)的振种存储单元中。由此,不必将固定矢量原样存储在固定码本(ROM)中,能大幅度地减小存储器的容量。本专利技术将以往的CELP型声音编码/解码装置的噪声矢量读出单元和噪声码本置换为振荡器和振种存储单元。由此,不必将噪声矢量原样存储在固定码本(ROM)中,能大幅度地减小存储器的容量。本专利技术声源矢量生成装置的结构是存储多个固定波形,根据起始端候补位置信息将各固定波形配置在各自的起始端位置上,并对这些固定波形进行加法运算,生成声源矢量。因此,能生成接近实际声音的声源矢量。本专利技术是噪声码本采用前述声源矢量生成装置而构成的CELP型声音编码/解码装置。固定波形配置单元也可以代数生成固定波形的起始端候补位置信息。本专利技术的CELP型声音编码/解码装置做成存储多个固定波形,生成与每个固定波形起始端候补位置信息相对应的脉冲,对合成滤波器的脉冲响应和各自的固定波形卷积,生成波形别脉冲响应,计算前述波形别脉冲响应的自相关和互相关,并在本文档来自技高网...

【技术保护点】
一种声源矢量生成装置,其特征在于,包括 存储多个振种的振种存储装置; 对应于振种的值输出不同的矢量系列的振荡器; 切换从所述振种存储装置供给所述振荡器的振种的切换装置。

【技术特征摘要】
JP 1996-11-7 294738/96;JP 1996-11-21 310324/96;JP 1.一种声源矢量生成装置,其特征在于,包括存储多个振种的振种存储装置;对应于振种的值输出不同的矢量系列的振荡器;切换从所述振种存储装置供给所述振荡器的振种的切换装置。2.如权利要求1所述的声源矢量生成装置,其特征在于,所述振荡器是非线性滤波器。3.如权利要求2所述的声源矢量生成装置,其特征在于,所述非线性振荡器是非线性数字滤波器。4.如权利要求3所述的声源矢量生成装置,其特征在于,所述非线性数字滤波器包含具有基于非线性加法特性的加法器、将所述加法器的输出作为状态变量依次传送的多个状态变量保持单元,以及对从所述各状态变量保持单元输出的状态变量乘以增益,并将相乘所得的值输出到所述加法器的多个乘法器,所述状态变量保持单元提供从所述振种存储装置读出的振种作为所述状态变量的初始值,所述加法器以从外部供给的矢量系列和所述乘法器输出的相乘所得值作为输入值,对于所述输入值的总和产生遵循所述非线性加法特性的加法器输出,所述乘法器对增益进行限定,使数字滤波器的极点在Z平面的单位圆外。5.如权利要求4所述的声源矢量生成装置,其特征在于,所述非线性数字滤波器具有所述状态变量保持单元用2级构成,将所述乘法器并行连接到这些状态变量保持单元的输出上的2阶全极结构,所述加法器的非线性加法特性是2的补数特性。6.一种声源矢量生成装置,其特征在于,包括存储过去的声源矢量的声源存储装置;对从所述声源矢量读出的1个或者多个过去的声源矢量,根据由外部提供的标号施加不同的加工,以生成随机的新的声源矢量的声源矢量加工装置;和切换提供给所述声源矢量加工装置的标号的切换装置。7.如权利要求6所述的声源矢量生成装置,其特征在于,所述声源矢量加工装置包括对应于所述标号判定施加到过去的声源矢量上的处理内容的判定装置;对从所述声源存储装置读出的过去的声源矢量,顺次地执行对应于已判定的处理内容的处理的多个处理单元。8.如权利要求7所述的声源矢量生成装置,其特征在于,所述多个处理单元包括进行从所述声源存储装置的不同的位置读出不同长度的要素矢量的处理的读出处理单元;进行对读出处理后的多个矢量作倒置排列变换处理的倒置处理单元;进行对倒置处理后的多个矢量分别乘以不同增益的处理的乘法运算单元;进行缩短乘法处理后的多个矢量的向量的长度的处理的间抽处理单元;进行伸长间抽处理后的多个矢量的矢量长度的处理的内插处理单元;进行对内插处理后的多个矢量进行相加的处理的加法处理单元;从形成的组中进行选择的处理单元。9.一种声音编码装置,其特征在于,包括存储多个振种的振种存储装置;对应于振种的值输出不同的矢量系列的振荡器;将从所述振荡器输出的矢量系列作为声源矢量进行LPC合成,生成合成话音的合成滤波器;切换从所述振种存储装置供给到所述振荡器的振种,另一方面对应于所述振种,估算生成的合成话音的失真,指定估算值为最大的振种号码的检索装置。10.如权利要求9所述的声音编码装置,其特征在于,所述振荡器是非线性数字滤波器。11.如权利要求10所述的声音编码装置,其特征在于,所述非线性数字滤波器包含具有基于非线性加法特性的加法器,将所述加法器的输出作为状态变量依次地传送的多个状态变量保持单元,以及对从所述各状态变量保持单元输出的状态变量乘以增益,并将相乘所得的值输出到所述加法器的多个乘法器,所述状态变量保持单元提供从所述振种存储装置读出的振种作为所述状态变量的初始值,所述加法器以从外部供给的矢量系列和所述乘法器输出的相乘所得值作为输入值,对所述输入值的总和产生遵循所述非线性加法特性的加法器输出,所述乘法器对增益进行限定,使数字滤波器的极点在Z平面的单位圆外。12.如权利要求9所述的声音编码装置,其特征在于,包括存储成为声音编码的对象的输入声音信号的缓存器;对所述缓存器内的处理帧进行线性预测分析,求得线性预测系数(LPC),将求得的线性预测系数变换成线频谱对(LSP)的LPC分析装置;除与用所述LPC分析装置生成的处理帧相关的线谱对外,增加多个线谱对的LSP增加装置;对所述LPC分析装置和所述LSP增加装置生成的全部线谱对进行量化并解码,从而对全部线谱对生成解码LSP的量化和解码装置;从所述多个解码LSP中选择异常噪声最少的解码LSP的装置;对选择的解码LSP进行编码的装置。13.如权利要求12所述的声音编码装置,其特征在于,所述LPC分析装置对所述缓存器内的首读区间进行线性预测分析,求得对所述首读区间的线性预测系数,并从求得的线性预测系数生成对应于所述首读区间的线谱对;所述LSP增加装置线性内插所述处理帧的线性谱对、对应于所述首读区间的线谱对以及前帧的线谱对,增加多个作为量化对象的线频谱对。14.如权利要求13所述的声音编码装置,其特征在于,所述量化和解码装置包括用于对线谱对进行量化,并变换成代码矢量的量化表;从所述量化表读出对应于量化对象的线谱对的代码矢量,生成矢量量化LSP的LSP量化装置;对用所述LSP量化装置生成的矢量量化LSP进行解码,生成解码LSP的LSP解码装置;在从所述量化表读出的代码矢量上乘以增益的乘法运算装置;根据前帧采用的所述乘法运算装置的增益大小和所述LSP量化装置的LSP量化误差的大小,自适应调节所述乘法装置的增益的装置。15.一种声音编码装置,其特征在于,包括存储过去的声源矢量的声源储存装置;对从所述声源矢量读出的1个或者多个过去的声源矢量,按照标号施加不同的加工,生成随机的新的声源矢量的声源矢量加工装置;对从所述声源矢量加工装置输出的声源矢量进行LPC合成,生成合成话音的合成滤波器;切换供给到所述声源矢量加工装置的标号,另一方面对应于各标号,估算生成的合成话音的失真,特定评价值成为最大的标号号码的检索装置。16.如权利要求15所述的声音编码装置,其特征在于,所述声源矢量加工装置包括根据所述标号,决定施加到过去的声源矢量的处理内容的装置;对从所述声源存储装置读出的过去的声源矢量,顺次地执行对应于决定的处理内容的处理的多个处理单元。17.一种CELP型声音编码装置,其特征在于,包括存储眼前的声源信息作为自适应矢量的自适应码本;随机发生噪声矢量的噪声码本,和分别对所述自适应矢量和所述噪声矢量进行LPC合成的合成滤波器;所述噪声码本由包括存储多个振种的振种储存装置、对应于振种的值输出不同的矢量系列的振荡器,以及切换从所述振种存储装置供给所述振荡器的振种的切换装置的矢量生成装置构成。18.一种声音编码装置,其特征在于,包括存储多个振种的振种存储装置;对应于振种的值输出不同的矢量系列的振荡器;将从所述振荡器输出的矢量系列作为声源矢量进行LPC合成,生成合成话音的合成滤波器;切换从所述振种存储装置供给所述振荡器的振种,另一方面对应于各振种,估算生成的合成话音的失真,指定估算值成为最大的振种号码的装置;对被指定的振种号码求得生成的合成话音的最佳增益的装置;矢量量化最佳增益的矢量量化装置。19.如权利要求18所述的声音编码装置,其特征在于,所述矢量量化装置包括将所述最佳增益成为一方的码矢量的CELP系统的2个增益信息、自适应码矢量增益和噪声码矢量增益,变换成它们的和以及对于所述和的比率,以求得量化对象矢量的参数变换装置;存储解码码矢量的解码矢量存储装置;存储预测系数的预测系数存储装置;用所述量化对象矢量、所述解码码矢量和所述预测系数,求得目标矢量的目标提取装置;存储多个码矢量的矢量码本;用所述预测系数,计算所述多个码矢量和所述目标矢量的距离的距离计算装置...

【专利技术属性】
技术研发人员:安永和敏森井利幸渡边泰助江原宏幸
申请(专利权)人:松下电器产业株式会社
类型:发明
国别省市:JP[日本]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1