一种在预测语音编码器中使用编码方案选择模型(pattern)以减少对帧差错状态敏感性的方法和设备包括配置用于从多种预测编码模式中进行选择的语音编码器。在预定数量的语音帧已经预测编码之后,语音编码器用非预测编码模式或轻度预测编码模式对帧进行编码。预定数量的帧可以提前由听众的主观立场确定。预定数量的帧可以进行周期性变化。通过对每个连续模型或组或预测编码语音帧保持平均编码位率,就能保持语音编码器的平均编码位率,所述语音帧包括至少一种非预测编码或轻度预测编码的语音帧。(*该技术在2020年保护过期,可自由使用*)
【技术实现步骤摘要】
本专利技术通常涉及语音处理领域,具体说涉及用于减少预测语音编码器中对帧差错情况的敏感性的方法和设备。
技术介绍
通过数字技术进行语音传输已经被广为应用,特别是在长距离和数字无线电话应用中。因此,这就使得人们对在维持重构语音可感知质量的情况下,如何判定可以在信道上发送的最少信息量产生兴趣。如果语音仅是通过简单的采样和数字化就能发送,那么,就需要大约64千位/秒(kbps)的数据率来达到传统模拟电话的语音质量。然而,通过使用语音分析,继之以进行合适的编码、发送以及在接收机端的再合成,就可以实现数据率的明显减少。使用通过提取有关人声生成模型的参数以压缩语音的技术的装置称为语音编码器。语音编码器将输入的语音信号分成时间块或分析帧。语音编码器通常包括编码器和解码器。编码器对输入的语音帧进行分析以提取某些相关参数,并随后将参数量化成二进制表示,即一组位或二进制数据包。数据包在通信信道上发送给接收机和解码器。解码器对数据包进行处理,将它们去量化以产生参数,并且使用这些去量化参数进行语音帧的再合成。语音编码器的一个功能在于通过去除语音中固有的所有自然冗余以便将数字化语音信号压缩为低位率信号。数字压缩通过用一组参数代表输入语音帧,并使用量化以便用一组位来表示这些参数来实现。如果输入的语音帧具有位数Ni,并且由语音编码器产生的数据包具有位数No,则语音编码器达到的压缩系数为Cr=Ni/No。其关键是在达到目标压缩系数的情况下,保持经解码语音的高品质语音。一种语音编码器的性能取决于(1)上述语音模型或分析和合成处理组合执行效果如何,以及(2)在目标No位/帧的位率下,执行参数量化处理的效果如何。语音模型的目的是对每个帧用一小组参数捕获语音信号的本质或目标语音品质。语音编码器设计中最重要的方面可能是对能描述语音信号的一组较好参数(包括矢量)的检索。一组较好参数需要一较低系统带宽用于重构精确语音信号的再合成。间距(pitch)、信号功率、谱包络(或共振峰)、振幅和相频谱是语音编码参数的一些示例。语音编码器可以作为时域编码器实现。该编码器试图通过使用高时间分辨率处理以每次对语音的小片断进行编码(通常是5微秒(ms)子帧)来捕获时域语音波形。对于每个子帧,依据本领域各种已知算法可以从代码本空间找到高精确的代表。或者,语音编码器可以作为频域编码器实现,该编码器试图用一组参数捕获输入语音帧的短期语音频谱(分析),并且使用相应的合成处理以便从频谱参数中重新创建语音波形。参数量化器通过根据在A.Gersho & R.M.Gray的VectorQuantization and Signal Compression(1992)中所述的已有量化技术用所存储的代码矢量代表来表示这些参数,从而保存了这些参数。一种熟知的时域语音编码器是在L.B.Rabiner & R.W.Schafer的DigitalProcessing of Speech Signals 396-453(1978)(在此通过参考引入)中所述的代码激励线性预测(CELP)编码器。在CELP编码器中,通过线性预测(LP)分析消除了语音信号中的短期相关或冗余,该分析查明短期共振峰滤波器的系数。将短期预测滤波器应用于输入语音帧产生LP残余信号,该信号被长期预测滤波器参数和后续随机代码本进行进一步的模型化和量化。这样,CELP编码将对时域语音波形的编码任务分成对LP短期滤波器系数的编码和对LP残余编码的单独任务。时域编码可以以固定速率(即对每个帧都使用相同的位数No)或以可变速率(对不同帧内容类型使用不同的位率)来执行。可变速率编码器试图仅使用能获得目标品质水平的编译码器参数进行编码所需的位数。一种示范可变速率CELP编码器在美国专利号5,414,796(已转让给本专利技术的受让人,并通过参考完全引入)中有描述。时域编码器例如CELP编码器通常依靠高位数No每帧以保留时域语音波形的精确性。这种编码器通常通过相对较大的位数No每帧(例如8kbps或以上)来提供优异的语音品质。然而,在低位率(4kbps和以下),由于有限的可用位数,时域编码器就不能保持高品质以及稳定的性能。在低位率时,有限的代码本空间限制了传统时域编码器的波形匹配能力,该能力在更高速率商业应用中得到很成功的使用。因此,尽管随着时间进行不断地改进,许多以低位率工作的CELP编码系统遭受到明显的能感知失真的困扰,该失真通常以噪声来表征。现在人们对开发以中等到低位率(即在2.4到4kbps及以下)工作的高质量语音编码器有着浓厚的研究兴趣和强烈的商业需求。其应用领域包括无线电话、卫星通信、因特网电话、各种多媒体以及语音流应用、语音信箱以及其他语音存储系统。其驱动力来自对高性能的需要和对在包丢失情况下稳定性能的需求。近来各种语音编码标准化计划也是推动低速率语音编码算法研究和开发的另一直接驱动力。低速率语音编码器可以在每个容许的应用带宽上创建更多的信道或用户,并且,与适合的信道编码附加层结合的低速率语音编码器能够符合编码器规范的整体位预算,并在信道差错情况下,提供稳固的性能。一种示范低速率编码器是在美国申请序列号09/217,341名为VARIABLE SPEECH CODING,1998.12.21申请(已转让给本专利技术的受让人,并通过参考完全引入)中所述的原型间距周期(PPP)语音编码器。在传统的预测语音编码器中,例如CELP编码器、PPP编码器以及波形插值(WI)编码器,编码方案主要依赖过去的输出。因此,如果解码器接收到帧差错或帧消除,解码器必须自身创建被怀疑帧的最佳替代。解码器通常使用重复先前输出的智能帧。因为解码器必须创建自己的替代,解码器和编码器就丧失了彼此的同步性。因而,当下一帧到达解码器时,如果该帧经过预先编码,解码器就查阅不同于编码器所使用的先前输出。这就在语音品质和语音编码器性能方面引起下降。语音编码器越是依赖预测编码技术(即语音编码器预先对越多的帧进行编码),性能方面就会有越大的下降。这样,就需要一种能减少预测语音编码器中对帧差错情况的敏感性方法。
技术实现思路
本专利技术针对一种减少预测语音编码器中对帧差错情况的敏感性的方法。因此,在本专利技术的一个方面中,提供了一种语音编码器。该语音编码器最好包括至少一种预测编码模式;至少一种非预测编码模式;以及与至少一种预测编码模式和至少一种非预测编码模式结合的处理器,该处理器配置用于通过根据编码语音帧的模型所选的编码模式引起对连续语音帧的编码,该模型包括至少一个用非预测编码模式进行编码的语音帧。在本专利技术的另一方面,提供了一种对语音帧进行编码的方法。该方法最好包括用预测编码模式对预定数量的连续语音帧进行编码的步骤;在执行用预测编码模式对预定数量的连续语音帧进行编码的步骤之后,用非预测编码模式对至少一个语音帧进行编码;以及为了产生多个依据模型编码的语音帧重复两个编码步骤。在本专利技术的另一方面,提供了一种语音编码器。该语音编码器最好包括用于用预测编码模式对预定数量的连续语音帧进行编码的装置;在用预测编码模式对预定数量的连续语音帧进行编码之后,用于用非预测编码模式对至少一个语音帧进行编码的装置;以及用于产生多个依据模型编码的语音帧的装置,该模型包括至少一个用本文档来自技高网...
【技术保护点】
一种语音编码器,其特征在于,包括: 至少一种预测编码模式; 至少一种非预测编码模式;以及 与所述至少一种预测编码模式和至少一种非预测编码模式结合的处理器,所述处理器配置用于通过根据编码语音帧的模型所选的编码模式引起对连续语音帧进行编码,所述模型包括至少一个用所述非预测编码模式进行编码的语音帧。
【技术特征摘要】
US 1999-10-28 09/429,7541.一种语音编码器,其特征在于,包括至少一种预测编码模式;至少一种非预测编码模式;以及与所述至少一种预测编码模式和至少一种非预测编码模式结合的处理器,所述处理器配置用于通过根据编码语音帧的模型所选的编码模式引起对连续语音帧进行编码,所述模型包括至少一个用所述非预测编码模式进行编码的语音帧。2.如权利要求1所述的语音编码器,其特征在于,所述至少一种非预测编码模式包括一种非预测编码模式。3.如权利要求1所述的语音编码器,其特征在于,所述至少一种非预测编码模式是一种轻度预测编码模式。4.如权利要求1所述的语音编码器,其特征在于,所述至少一种非预测编码模式是一种完全的非预测编码模式。5.如权利要求1所述的语音编码器,其特征在于,所述处理器进一步配置用于维持编码语音帧模型的平均编码率。6.如权利要求1所述的语音编码器,其特征在于,所述编码语音帧模型包括用至少一种预测编码模式进行编码的多个语音帧,用至少一种预测编码模式进行编码的语音帧数由听众预先确定。7.如权利要求1所述的语音编码器,其特征在于,所述模型是再现模型。8.如权利要求1所述的语音编码器,其特征在于,所述模型是变化模型。9.一种对语音帧进行编码的方法,其特征在于,包括下述步骤用预测编码模式对预定数量的连续语音帧进行编码;在执行用预测编码模式对预定数量的连续语音帧进行编码的步骤之后,用非预测编码模式对至少一个语音帧进行编码;以及重复所述两个编码步骤,以便产生多个依据模型编码的语音帧。10.如权利要求9所述的方法,其特征在于,所述模型是再现模型。11.如权利要求9所述的方法,其特征在于,所述模型是变化模型。12.如权利要求9所述的方法,其特征在于,所述非预测编码模式是轻度预测编码模式。13.如权利要求9所述的方法,其特征在于,所述非预测编码模式是完全的非预测编码模式。14.如权利要求9所述的方法,其特征在于,进一步包括维持编码语音帧模型的平均编码率的步骤。15.如权利要求9所述的方法,其特征在于,所述预定数量的连续语音帧由听众预先确定。16.如权利要求9所述的方法,其特征在于,进一步包括改变所述预定数量的连续语音帧的步骤。...
【专利技术属性】
技术研发人员:S曼祖那什,AP德佳科,AK阿南萨帕德曼那伯汉,ELT乔依,
申请(专利权)人:高通股份有限公司,
类型:发明
国别省市:US[美国]
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。