语音编码方法及语音编码装置制造方法及图纸

技术编号:3047161 阅读:158 留言:0更新日期:2012-04-11 18:40
提供一种可以适当地选择给出较好音质的声源并能使由语音译码装置将所求得的语音代码译码后得到的译码音的主观质量即音质得到改善的语音编码方法及语音编码装置。备有按每种声源模式对从输入语音1求得的编码对象信号进行编码并将编码时的编码失真输出的驱动声源编码装置9~11、将编码失真与固定的阈值或根据上述输入语音的信号功率决定的阈值或根据编码对象信号的信号功率决定的阈值进行比较的比较装置15、及根据编码失真及比较装置的比较结果进行声源模式的选择的最小失真选择装置17。(*该技术在2022年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利技术涉及将数字语音信号压缩到很少的信息量的语音编码方法及语音编码装置,尤其是,涉及语音编码方法及语音编码装置中的声源的编码方法。图8是表示特开平3-156498号公报中公开的现有的语音编码装置的结构的框图。在图中,1是输入语音,2是线性预测分析装置,3是线性预测系数编码装置,7是多路复用装置,8是语音代码,47是声源编码部。此外,在声源编码部47内,48是分类装置,49、50是切换装置,51是多脉冲声源编码装置,52是元音部声源编码装置。以下,说明该特开平3-156498号公报中公开的现有的语音编码装置的动作。这里,在结构如图所示的现有的语音编码装置中,将预先规定的区间长度、例如10ms作为1帧而以帧为单位进行处理。首先,将输入语音1输入到线性预测分析装置2、分类装置48和切换装置49。线性预测分析装置2,对该输入语音1进行分析,并抽出作为语音的声谱包络信息的线性预测系数。线性预测系数编码装置3,对所抽出的该线性预测系数进行编码,并将其代码输出到多路复用装置7,同时输出为进行声源的编码而被量化了的线性预测系数。分类装置48,通过分析输入语音1的音响特征而将其分类为元音性信号和其他信号,并将分类结果输出到切换装置49和切换装置50。切换装置49,当分类装置48的分类结果为元音性信号时,将输入语音1连接于元音部声源编码装置52,当分类装置48的分类结果不是元音性信号时,将输入语音1连接于多脉冲声源编码装置51。多脉冲声源编码装置51,根据多个脉冲串的组合对声源进行编码,并将编码结果输出到切换装置50。元音部声源编码装置52,计算可变时间长度的区段长度,同时例如用改进的基音插补多脉冲声源模型对该区段的声源信号进行编码,并将其编码结果输出到切换装置50。切换装置50,当分类装置48的分类结果为元音性信号时,将元音部声源编码装置52输出的编码结果连接于多路复用装置7,当分类装置48的分类结果不是元音性信号时,将多脉冲声源编码装置51输出的编码结果连接于多路复用装置7。多路复用装置7,对从线性预测系数编码装置3输入的代码及从切换装置50输入的编码结果进行多路复用,并输出所求得的语音代码8。如上所述,在特开平3-156498号公报所公开的现有的语音编码装置中,报告了根据输入语音1的音响特征从预先准备好的多种声源模型中选择一种并用所选定的声源模型进行编码从而能以较少的信息量良好地表示语音信号。另外,图9是表示国际公开WO98/40877号公报中公开的现有的语音编码装置的结构的框图。在图中,1是输入语音,2是线性预测分析装置,3是线性预测系数编码装置,4是自适应声源编码装置,7是多路复用装置,8是语音代码,53、54是驱动声源编码装置,55、56是增益编码装置,57是最小失真选择装置。以下,说明该国际公开WO98/40877号公报中公开的现有的语音编码装置的动作。这里,在结构如图所示的现有的语音编码装置中,将长度为5~50ms左右的语音作为1帧而以帧为单位进行处理。对于声源的编码,按将1帧分为2半后的每个子帧进行处理。而为易于理解说明,在以下的说明中,不再特意地区别帧和子帧而只简单地记作帧。首先,将输入语音1输入到线性预测分析装置2、自适应声源编码装置4及驱动声源编码装置53。线性预测分析装置2,对输入语音1进行分析,并抽出作为语音的声谱包络信息的线性预测系数。线性预测系数编码装置3,对该线性预测系数进行编码,并将其代码输出到多路复用装置7,同时输出为进行声源的编码而被量化了的线性预测系数。在自适应声源编码装置4中,以自适应声源代码簿的形式存储着过去的规定长度的声源(信号)。该自适应声源代码簿,当输入以几位的二进数值表示的自适应声源代码时,从该自适应声源代码计算重复周期,并利用该重复周期生成和输出使过去的声源周期反复的时间序列向量。自适应声源编码装置4,使通过将各自适应声源代码输入该自适应声源代码簿而得到的时间序列向量通过采用了来自线性预测系数编码装置3的量化后的线性预测系数的合成滤波器,从而求得临时合成音。然后,检查使该临时合成音乘以适当增益后的信号与输入语音1之间的失真。对所有的自适应声源代码进行上述处理,并选择给出最小失真的自适应声源代码,同时将与所选定的自适应声源代码对应的时间序列向量作为自适应声源输出。另外,将从输入语音1减去使自适应声源产生的合成音乘以适当增益的信号后所得到的信号作为编码对象信号输出。在驱动声源编码装置54中,以驱动声源代码簿的形式存储着多个时间序列向量。该驱动声源代码簿,当输入以几位的二进数值表示的驱动声源代码时,将存储在与该驱动声源代码对应的位置上的时间序列向量读出后输出。驱动声源编码装置54,通过将各自适应声源代码输入该驱动声源代码簿而求出各时间序列向量,并使其通过采用了来自线性预测系数编码装置3的量化后的线性预测系数的合成滤波器,从而求得临时合成音。然后,检查使该临时合成音乘以适当增益后的信号与从自适应声源编码装置4输入的编码对象信号之间的失真。对所有的驱动声源代码进行上述处理,并选择给出最小失真的驱动声源代码,同时将与所选定的驱动声源代码对应的时间序列向量作为驱动声源输出。在增益编码装置56中,以增益代码簿的形式存储着表示与自适应声源和驱动声源对应的2个增益值的多个增益向量。该增益代码簿,当输入以几位的二进数值表示的增益代码时,将存储在与该增益代码对应的位置上的增益向量读出后输出。增益编码装置56,通过将各增益代码输入该增益代码簿而求出增益向量,并使从自适应声源编码装置4输出的自适应声源乘以其第一要素,使从驱动声源编码装置54输出的驱动声源乘以第二要素,并将所得到的2个信号相加,从而生成临时声源。接着,使该临时声源通过采用了来自线性预测系数编码装置3的量化后的线性预测系数的合成滤波器,从而求得临时合成音,并检查该临时合成音与通过驱动声源编码装置54输入的输入语音1之间的失真。对所有的增益代码进行上述处理,并选择给出最小失真的增益代码。然后,将由所选定的增益代码、从自适应声源编码装置4通过驱动声源编码装置54输入的自适应声源代码及从驱动声源编码装置54输入的驱动声源代码构成的声源代码、最小失真、与所选定的增益代码对应的临时声源输出到最小失真选择装置57。另一方面,在驱动声源编码装置53中,以驱动声源代码簿的形式存储着多个时间序列向量。该驱动声源代码簿,当输入以几位的二进数值表示的驱动声源代码时,将存储在与该驱动声源代码对应的位置上的时间序列向量读出后输出。驱动声源编码装置53,通过将各自适应声源代码输入该驱动声源代码簿而求出各时间序列向量,并使其通过采用了来自线性预测系数编码装置3的量化后的线性预测系数的合成滤波器,从而求得临时合成音。然后,检查使该临时合成音乘以适当增益后的信号与输入语音1之间的失真。对所有的驱动声源代码进行上述处理,并选择给出最小失真的驱动声源代码,同时将与所选定的驱动声源代码对应的时间序列向量作为驱动声源输出。在增益编码装置55中,以第一增益代码簿的形式存储着与驱动声源对应的对应多个增益值。该增益代码簿,当输入以几位的二进数值表示的增益代码时,将存储在与该增益代码对应的位置上的增益值读出后输出。增益编码装置55,通过将各增益代码输入该增本文档来自技高网...

【技术保护点】
一种语音编码方法,从多种声源模式中选择一种声源模式,并使用该声源模式按每个由规定长度区间构成的帧对输入语音进行编码,该语音编码方法的特征在于:在编码步骤中,按上述每种声源模式对从上述输入语音求得的编码对象信号进行编码,并将编码时的编码失真输出,在比较步骤中,将由上述编码步骤编码后的编码失真与固定的阈值或根据上述输入语音的信号功率决定的阈值或根据上述编码对象信号的信号功率决定的阈值进行比较,在选择步骤中,根据由上述编码步骤编码后的编码失真及上述比较步骤的比较结果进行上述声源模式的选择。

【技术特征摘要】
JP 2001-2-27 52944/011.一种语音编码方法,从多种声源模式中选择一种声源模式,并使用该声源模式按每个由规定长度区间构成的帧对输入语音进行编码,该语音编码方法的特征在于在编码步骤中,按上述每种声源模式对从上述输入语音求得的编码对象信号进行编码,并将编码时的编码失真输出,在比较步骤中,将由上述编码步骤编码后的编码失真与固定的阈值或根据上述输入语音的信号功率决定的阈值或根据上述编码对象信号的信号功率决定的阈值进行比较,在选择步骤中,根据由上述编码步骤编码后的编码失真及上述比较步骤的比较结果进行上述声源模式的选择。2.一种语音编码方法,一种语音编码方法,从多种声源模式中选择一种声源模式,并使用该声源模式按每个由规定长度区间构成的帧对输入语音进行编码,该语音编码方法的特征在于在编码步骤中,按上述每种声源模式对从上述输入语音求得的编码对象信号进行编码,并将编码时的编码失真输出,在选择步骤中,对由上述编码步骤编码后的编码失真进行相互比较,并根据该比较结果选择一种声源模式,在比较步骤中,将与由上述选择步骤选定的声源模式对应的编码失真与固定的阈值或根据上述输入语音的信号功率决定的阈值或根据上述编码对象信号的信号功率决定的阈值进行比较,在置换步骤中,根据上述比较步骤的比较结果对由上述选择步骤选定的声源模式进行置换。3.根据权利要求1所述的语音编码方法,其特征在于在选择步骤中,对所得到的比较结果为编码失真超过阈值的声源模式的选择进行抑制。4.根据权利要求1所述的语音编码方法,其特征在于按每种声源模式准备阈值。5.根据权利要求1所述的语音编码方法,其特征在于在进行编码失真的输出变换的变换步骤中,当比较步骤的编码失真与阈值的比较结果为上述编码失真超过上述阈值时,可以用上述阈值的值置换该编码失真,在选择步骤中,从包含着由上述变换步骤输出的编码失真的所有声源模式的编码失真中选择与最小编码失真对应的声源模式。6.根据权利要求2所述的语音编码方法,其特征在于在置换步骤中,当与选择步骤选定的声源模式对应的编码失真超过阈值时,选择预先决定的声源模式。7.根据权利要求1或2所述的语音编码方法,其特征在于将阈值设定为对输入语音或编码对象信号规定的失真系数。8.根据权利要求1所述的语音编码方法,其特征在于设置判定步骤,通过对输入语音或编码对象信号...

【专利技术属性】
技术研发人员:田崎裕久
申请(专利权)人:三菱电机株式会社
类型:发明
国别省市:JP[日本]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1