【技术实现步骤摘要】
本专利技术涉及能得到高品质合成声音的声源矢量生成装置以及能用低位速率对高品质的声音信号进行编码/解码的声音编码装置和声音解码装置。
技术介绍
CELP(Code Excited Linear Prediction编码激励线性预测)型的声音编码装置,是对每个以一定的时间划分声音的帧进行线性预测,用存储过去的驱动声源的自适应码本和存储多个噪声矢量的噪声码本,对每帧线性预测的预测残差(激励信号)进行编码的方式。例如在“低位速率高品质量话音”(“High Quality Speechat Low Bit Rate”M.R.Schroeder,Proc.ICASSP’85,PP937-940)中公开的CELP型声音编码装置。附图说明图1表示CELP型的声音编码装置的概略结构。CELP型的声音编码装置将声音信息分离成声源信息和声道信息并进行编码。对于声道信息,将输入声音信号10输入到滤波器系数分析单元11中并进行线性预测,在滤波器系数量化单元12对线性预测系数(LPG)进行编码。借助于对合成滤波器13提供线性预测系数,在合成滤波器13能将声道信号掺人声源信息中。对于声源信息,在每个进一步细分帧的区间(称为子帧)进行自适应码本14的检索和噪声码本15的声源检索。自适应码本14的检索和噪声码本15的声源检索,是决定使式(1)的编码失真最小的自适应码矢量的码号及其增益(音调增益)、和噪声码矢量的码号及其增益(噪声码增益)的处理。‖v·(gaHp+gcHc)‖2(1)V声音信号(矢量)H合成滤波器的脉冲响应卷积矩阵 其中,h合成滤波器的脉冲响应(矢量)L帧长p自适应码矢量 ...
【技术保护点】
一种声源矢量生成装置,其特征在于,包括 存储多个振种的振种存储装置; 对应于振种的值输出不同的矢量系列的振荡器; 切换从所述振种存储装置供给所述振荡器的振种的切换装置。
【技术特征摘要】
JP 1996-11-7 294738/96;JP 1996-11-21 310324/96;JP 1.一种声源矢量生成装置,其特征在于,包括存储多个振种的振种存储装置;对应于振种的值输出不同的矢量系列的振荡器;切换从所述振种存储装置供给所述振荡器的振种的切换装置。2.如权利要求1所述的声源矢量生成装置,其特征在于,所述振荡器是非线性滤波器。3.如权利要求2所述的声源矢量生成装置,其特征在于,所述非线性振荡器是非线性数字滤波器。4.如权利要求3所述的声源矢量生成装置,其特征在于,所述非线性数字滤波器包含具有基于非线性加法特性的加法器、将所述加法器的输出作为状态变量依次传送的多个状态变量保持单元,以及对从所述各状态变量保持单元输出的状态变量乘以增益,并将相乘所得的值输出到所述加法器的多个乘法器,所述状态变量保持单元提供从所述振种存储装置读出的振种作为所述状态变量的初始值,所述加法器以从外部供给的矢量系列和所述乘法器输出的相乘所得值作为输入值,对于所述输入值的总和产生遵循所述非线性加法特性的加法器输出,所述乘法器对增益进行限定,使数字滤波器的极点在Z平面的单位圆外。5.如权利要求4所述的声源矢量生成装置,其特征在于,所述非线性数字滤波器具有所述状态变量保持单元用2级构成,将所述乘法器并行连接到这些状态变量保持单元的输出上的2阶全极结构,所述加法器的非线性加法特性是2的补数特性。6.一种声源矢量生成装置,其特征在于,包括存储过去的声源矢量的声源存储装置;对从所述声源矢量读出的1个或者多个过去的声源矢量,根据由外部提供的标号施加不同的加工,以生成随机的新的声源矢量的声源矢量加工装置;和切换提供给所述声源矢量加工装置的标号的切换装置。7.如权利要求6所述的声源矢量生成装置,其特征在于,所述声源矢量加工装置包括对应于所述标号判定施加到过去的声源矢量上的处理内容的判定装置;对从所述声源存储装置读出的过去的声源矢量,顺次地执行对应于已判定的处理内容的处理的多个处理单元。8.如权利要求7所述的声源矢量生成装置,其特征在于,所述多个处理单元包括进行从所述声源存储装置的不同的位置读出不同长度的要素矢量的处理的读出处理单元;进行对读出处理后的多个矢量作倒置排列变换处理的倒置处理单元;进行对倒置处理后的多个矢量分别乘以不同增益的处理的乘法运算单元;进行缩短乘法处理后的多个矢量的向量的长度的处理的间抽处理单元;进行伸长间抽处理后的多个矢量的矢量长度的处理的内插处理单元;进行对内插处理后的多个矢量进行相加的处理的加法处理单元;从形成的组中进行选择的处理单元。9.一种声音编码装置,其特征在于,包括存储多个振种的振种存储装置;对应于振种的值输出不同的矢量系列的振荡器;将从所述振荡器输出的矢量系列作为声源矢量进行LPC合成,生成合成话音的合成滤波器;切换从所述振种存储装置供给到所述振荡器的振种,另一方面对应于所述振种,估算生成的合成话音的失真,指定估算值为最大的振种号码的检索装置。10.如权利要求9所述的声音编码装置,其特征在于,所述振荡器是非线性数字滤波器。11.如权利要求10所述的声音编码装置,其特征在于,所述非线性数字滤波器包含具有基于非线性加法特性的加法器,将所述加法器的输出作为状态变量依次地传送的多个状态变量保持单元,以及对从所述各状态变量保持单元输出的状态变量乘以增益,并将相乘所得的值输出到所述加法器的多个乘法器,所述状态变量保持单元提供从所述振种存储装置读出的振种作为所述状态变量的初始值,所述加法器以从外部供给的矢量系列和所述乘法器输出的相乘所得值作为输入值,对所述输入值的总和产生遵循所述非线性加法特性的加法器输出,所述乘法器对增益进行限定,使数字滤波器的极点在Z平面的单位圆外。12.如权利要求9所述的声音编码装置,其特征在于,包括存储成为声音编码的对象的输入声音信号的缓存器;对所述缓存器内的处理帧进行线性预测分析,求得线性预测系数(LPC),将求得的线性预测系数变换成线频谱对(LSP)的LPC分析装置;除与用所述LPC分析装置生成的处理帧相关的线谱对外,增加多个线谱对的LSP增加装置;对所述LPC分析装置和所述LSP增加装置生成的全部线谱对进行量化并解码,从而对全部线谱对生成解码LSP的量化和解码装置;从所述多个解码LSP中选择异常噪声最少的解码LSP的装置;对选择的解码LSP进行编码的装置。13.如权利要求12所述的声音编码装置,其特征在于,所述LPC分析装置对所述缓存器内的首读区间进行线性预测分析,求得对所述首读区间的线性预测系数,并从求得的线性预测系数生成对应于所述首读区间的线谱对;所述LSP增加装置线性内插所述处理帧的线性谱对、对应于所述首读区间的线谱对以及前帧的线谱对,增加多个作为量化对象的线频谱对。14.如权利要求13所述的声音编码装置,其特征在于,所述量化和解码装置包括用于对线谱对进行量化,并变换成代码矢量的量化表;从所述量化表读出对应于量化对象的线谱对的代码矢量,生成矢量量化LSP的LSP量化装置;对用所述LSP量化装置生成的矢量量化LSP进行解码,生成解码LSP的LSP解码装置;在从所述量化表读出的代码矢量上乘以增益的乘法运算装置;根据前帧采用的所述乘法运算装置的增益大小和所述LSP量化装置的LSP量化误差的大小,自适应调节所述乘法装置的增益的装置。15.一种声音编码装置,其特征在于,包括存储过去的声源矢量的声源储存装置;对从所述声源矢量读出的1个或者多个过去的声源矢量,按照标号施加不同的加工,生成随机的新的声源矢量的声源矢量加工装置;对从所述声源矢量加工装置输出的声源矢量进行LPC合成,生成合成话音的合成滤波器;切换供给到所述声源矢量加工装置的标号,另一方面对应于各标号,估算生成的合成话音的失真,特定评价值成为最大的标号号码的检索装置。16.如权利要求15所述的声音编码装置,其特征在于,所述声源矢量加工装置包括根据所述标号,决定施加到过去的声源矢量的处理内容的装置;对从所述声源存储装置读出的过去的声源矢量,顺次地执行对应于决定的处理内容的处理的多个处理单元。17.一种CELP型声音编码装置,其特征在于,包括存储眼前的声源信息作为自适应矢量的自适应码本;随机发生噪声矢量的噪声码本,和分别对所述自适应矢量和所述噪声矢量进行LPC合成的合成滤波器;所述噪声码本由包括存储多个振种的振种储存装置、对应于振种的值输出不同的矢量系列的振荡器,以及切换从所述振种存储装置供给所述振荡器的振种的切换装置的矢量生成装置构成。18.一种声音编码装置,其特征在于,包括存储多个振种的振种存储装置;对应于振种的值输出不同的矢量系列的振荡器;将从所述振荡器输出的矢量系列作为声源矢量进行LPC合成,生成合成话音的合成滤波器;切换从所述振种存储装置供给所述振荡器的振种,另一方面对应于各振种,估算生成的合成话音的失真,指定估算值成为最大的振种号码的装置;对被指定的振种号码求得生成的合成话音的最佳增益的装置;矢量量化最佳增益的矢量量化装置。19.如权利要求18所述的声音编码装置,其特征在于,所述矢量量化装置包括将所述最佳增益成为一方的码矢量的CELP系统的2个增益信息、自适应码矢量增益和噪声码矢量增益,变换成它们的和以及对于所述和的比率,以求得量化对象矢量的参数变换装置;存储解码码矢量的解码矢量存储装置;存储预测系数的预测系数存储装置;用所述量化对象矢量、所述解码码矢量和所述预测系数,求得目标矢量的目标提取装置;存储多个码矢量的矢量码本;用所述预测系数,计算所述多个码矢量和所述目标矢量的距离的距离计算装置...
【专利技术属性】
技术研发人员:安永和敏,森井利幸,渡边泰助,江原宏幸,
申请(专利权)人:松下电器产业株式会社,
类型:发明
国别省市:JP[日本]
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。