在编码处理中,对将来自音响信号的频域的样本串除以加权包络、除以增益所得的结果进行量化,从而将各样本进行可变长编码。使用此时在可变长编码中可节省的信息,对量化前的样本和量化后的样本的误差进行量化。决定根据可节省的比特数来量化哪个样本的误差的规则而进行量化。在解码处理中,对输入的码串的可变长码进行解码而获得频域的样本串,进而,以与可变长码的比特数对应的规则来解码误差信号,并从该获得的样本串基于辅助信息而获得原来的样本串。
【技术实现步骤摘要】
【国外来华专利技术】【专利摘要】在编码处理中,对将来自音响信号的频域的样本串除以加权包络、除以增益所得的结果进行量化,从而将各样本进行可变长编码。使用此时在可变长编码中可节省的信息,对量化前的样本和量化后的样本的误差进行量化。决定根据可节省的比特数来量化哪个样本的误差的规则而进行量化。在解码处理中,对输入的码串的可变长码进行解码而获得频域的样本串,进而,以与可变长码的比特数对应的规则来解码误差信号,并从该获得的样本串基于辅助信息而获得原来的样本串。【专利说明】编码方法、解码方法、编码装置、解码装置、程序、记录介质
本专利技术涉及音响信号的编码技术以及通过该编码技术而获得的码串的解码技术。更详细而言,涉及将音响信号变换为频域而获得的频域的样本串的编码和其解码。
技术介绍
作为低比特(例如10kbit/s?20kbit/s左右)的声音信号或音响信号的编码方法,已知DFT (离散傅里叶变换)或MDCT (变形离散余弦变换)等的对于正交变换系数的自适应编码。例如作为标准规格技术的AMR-WB+(Extended Adaptive Mult1-Rate Wideband)具有TCX (transform coded excitation:变换编码励振)编码模式,其中,将DFT系数按每8个样本进行归一化而进行矢量量化(例如,参照非专利文献I。)。现有技术文献非专利文献非专利文献1:ETSI TS126290V6.3.0 (2005-06)
技术实现思路
专利技术要解决的课题以AMR-WB+为首,由于在基于TCX的编码中不考虑基于周期性的频域的系数的幅度的偏差,所以若汇集偏差大的幅度而编码则编码效率降低。在TCX中的量化或编码中有各种变形例,但例如考虑通过算术码等的熵编码对将通过将系数除以增益所得的信号的量化而成为了离散值的MDCT系数从频率低到高进行了排列的序列进行压缩的情况。此时,将多个样本设为I码元(编码单位),依赖就在该码元之前的码元而自适应性地控制分配码。一般,幅度越小则越分配短码,在幅度大的情况下分配长码。其结果,每个帧的比特数平均地降低,但在每个帧的分配比特数固定的情况下,存在被降低的比特不能有效利用的可能性。本专利技术鉴于这样的技术的背景,其目的在于,提供一种能够以低运算量改善离散信号、尤其是声音音响数字信号的低比特的编码的质量的编码、解码技术。用于解决课题的手段本专利技术的一个方式的编码方法,将来自规定的时间区间的音响信号的频域的样本串以规定的个数的比特进行编码,包括:编码步骤,将与频域的样本串的各样本的值对应的整数值通过可变长编码进行编码而生成可变长码;误差计算步骤,计算从频域的样本串的各样本的值减去与该各样本的值对应的整数值所得的误差值的串;以及误差编码步骤,使用作为从规定的个数减去可变长码的比特的个数所得的个数的比特的剩余比特,对误差值的串进行编码而生成误差码。 本专利技术的一个方式的解码方法解码方法,对输入的由规定的个数的比特构成的码进行解码,包括:解码步骤,对在码中包含的可变长码进行解码而生成整数值的串;误差解码步骤,对由作为从规定的个数减去可变长码的比特的个数所得的个数的比特的剩余比特构成的、码中包含的误差码进行解码,从而生成误差值的串;以及加法运算步骤,将整数值的串的各样本与误差值的串的对应的误差样本进行相加。专利技术效果通过以能够通过对于整数值的可变长码而节省的比特即剩余比特解码误差值,从而即使是在每个帧的比特数固定的情况下也能够实现编码效率的提高或量化失真的减轻坐寸ο【专利附图】【附图说明】图1是用于说明实施方式的编码装置的构成的方框图。图2是用于说明实施方式的编码装置的处理的流程图。图3是用于说明加权归一化MDCT系数和功率谱包络的关系的图。图4是用于说明剩余比特数多的情况下的处理的例的图。图5是用于说明实施方式的解码装置的构成的方框图。图6是用于说明实施方式的编码装置的处理的流程图。【具体实施方式】参照【专利附图】【附图说明】本专利技术的实施方式。另外,对于重复的构成要素分配相同的参照标号并省略重复说明。 该实施方式的一个特征在于,将规定的时间区间设为帧,将对来自帧内的音响信号的频域的样本串进行量化的框架中,进行频域的样本的加权平坦化后的序列的可变长编码,以及通过使用可通过该可变长编码而节省的剩余比特决定优先级而量化误差信号来减少编码的失真的编码的改善。尤其,即使是在每个帧的分配比特数固定的情况下,也产生可变长编码的优点。作为来自音响信号的频域的样本串、换言之基于音响信号的频域的样本串,例如能够例示将帧单位的声音音响数字信号从时域变换为频域而获得的DFT系数串或MDCT系数串、对这样的系数串应用了归一化或加权或量化等的处理的系数串等。以下,以MDCT系数串为例说明实施方式。最初,参照图1至图4说明编码处理。如图1所示,编码装置I例如包括频域变换部11、线性预测分析部12、线性预测系数量化编码部13、功率谱包络计算部14、加权包络归一化部15、归一化增益计算部16、量化部17、误差计算部18、编码部19、误差编码部110。编码装置I进行图2中例示的编码方法的各处理。以下,说明编码装置I的各处理。“频域变换部11”首先,频域变换部11以帧单位将声音音响数字信号变换为频域的N点的MDCT系数串(步骤S11)。一般,在编码侧量化MDCT系数串,将已量化的MDCT系数串进行编码,并将获得的码串传输到解码侧,在解码侧从该码串再构成已量化的MDCT系数串,进一步,通过MDCT反变换能够再构成时域的声音音响数字信号。另外,MDCT系数的幅度具有与通常的DFT的功率谱近似相同的幅度包络(功率谱包络)。因此,通过进行与幅度包络的对数值成比例的信息分配,能够使全部频带的MDCT系数的量化失真(量化误差)均匀地分散,能够减小整体的量化失真,除此之外,还实现信息压缩。另外,功率谱包络能够使用通过线性预测分析而求出的线性预测系数而高效地估计。作为控制这样的量化误差的方法,有自适应性地分配各MDCT系数的量化比特的(将幅度平坦化后调整量化的步骤幅度的)方法或、通过加权矢量量化而自适应性地加权而决定码的方法。这里,说明在本专利技术的实施方式中执行的量化方法的一例,但希望留意并不限定于说明的量化方法。“线性预测分析部12”线性预测分析部12以帧单位对声音音响数字信号进行线性预测分析,求出预定的次数为止的线性预测系数而输出(步骤S12)。“线性预测系数量化编码部13”线性预测系数量化编码部13求出与线性预测分析部12求出的线性预测系数对应的码和已量化线性预测系数而输出(步骤S13)。此时,也可以进行将线性预测系数变换为LSP (Line Spectral Pairs,线谱对),求出与LSP对应的码与已量化LSP,将已量化LSP变换为已量化线性预测系数的处理。作为与线性预测系数对应的码的线性预测系数码成为对解码装置2发送的码的一部分。“功率谱包络计算部14”功率谱包络计算部14将线性预测系数量化编码部13输出的已量化线性预测系数变换为频域而求出功率谱包络(步骤S14)。求出的功率谱包络发送到加权包络归一化部15。此外,如图1中虚线所示,根据需要而发送到误差编码部110。与N点的MDCT系数串的各系数X(I)、……、X(N)对应的功率谱包络系数本文档来自技高网...
【技术保护点】
【技术特征摘要】
【国外来华专利技术】...
【专利技术属性】
技术研发人员:守谷健弘,原田登,鎌本优,日和崎佑介,福井胜宏,
申请(专利权)人:日本电信电话株式会社,
类型:
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。