当前位置: 首页 > 专利查询>苏州大学专利>正文

一种低比特率语音编码器制造技术

技术编号:3046337 阅读:198 留言:0更新日期:2012-04-11 18:40
本发明专利技术公开了一种语音编码器,特别涉及一种基于局部余弦变换的低比特率语音编码器,适用于要求低比特率语音编码的通信系统中。它应用了一个可以灵活调整的整形函数,利用这个整形函数对Donoho采用的钟函数进行整形,得到一个能够提高谱能量聚集性的新的钟函数;对局部余弦变换系数的编码,采用分维量化方法,对于每一维矢量,均采用LGB方法设计码书;编码中码书的搜索采用树形结构搜索方法,实现了一种在局部余弦变换域内具有优良的低比特语音编码器。经客观参数评价和非正式听力测试表明,该编码器比LPC-10e编码器具有更好的自然度和可理解性。

【技术实现步骤摘要】

本专利技术涉及一种语音编码器,特别涉及一种基于局部余弦变换(LocalCosine Transform,LCT)的低比特率语音编码器,适合于要求低比特率语音编码的通信系统中使用。
技术介绍
低比特率语音编码在过去20年已成为一个主要研究主题,结果导致已经将比特率从16kb/s到2.4kb/s范围的很多语音编码算法标准化。目前语音编码器研究的重点在4kb/s及更低的高质量语音编码。虽然CELP波形编码器在低于6.3kb/s比特率时仍能产生高质量的语音,但当比特率减少至4kb/s及更低时,由于没有足够的比特对波形细节进行编码,波形编码系统将会产生大量量化噪声。另一方面,参数编码(也称声码器)并不企图产生与原始信号相似的波形,而代之,试图找到能够较好地表示语音知觉重要属性的一组参数,但它们对各种特殊环境噪声的鲁棒性较差。然而,对于在4kb/s比特率及更低比特率的语音编码,最近的研究显示在频域进行语音编码比已存在的基于CELP的编码器具有更好语音质量的潜力。谱编码器试图重构语音振幅谱而不是精确地恢复语音波形。尽管以上的编码器广泛应用于低比特率语音编码,它们大多受假设的模型精度的限制,还有它们主要依赖于正确的参数估计,往往这些要求很难得到保证。所以,在特殊环境下,这些编码方法的鲁棒性是很差的,编码后的语音质量具有一定的局限性。由Coifman和Meyer(1991)及Auscher等(1992)先后构造的局部余弦基是由平滑、紧支撑钟函数与余弦函数乘积构成的。这些局部化的余弦函数仍保留着正交性,并且具有较小的Heisenberg乘积。近些年来,局部余弦变换理论方法得到广泛深入的研究,该方法在图像压缩编码中应用较多,而应用在语音信号处理方面的研究相对较少,特别是应用在语音编码中则更少。但在MalvarH.S.“Lapped transforms for efficient transform/subband coding”.IEEETrans.on Acoust.,Speech Signal Processing,1990.,vol.38(6),Page(s)969-978发表的文献中证明了在语音编码中LCT方法的编码增益优于DCT编码,并且十分接近于KL变换编码。特别是与DCT编码方法相比,明显减少了帧之间的“喀嚓”声,不需要象DCT变换编码在编码中为了减少帧之间出现的异常“喀嚓”声音而经常采用半帧长滑动的方法。所以,该LCT方法比DCT方法减少接近一半的计算量。在Wickerhauser M.V.于1994年发表的文献“Comparison of picture compression methodswavelet,waveletpacket and local cosine”.WaveletsTheory,Algorithms,and Applications,Editor(Charles K.Chui and Laura Montefusco and Luigia Puccio),Academic Press,San Diego,California,p.585~621,中进行的几个二维图像编码方法对比研究也表明了在编码增益上LCT方法优于DCT方法,并同样也非常接近于KL变换方法。研究表明,提高变换编码的编码增益的关键在于正交基的选取,同样,在局部余弦变换编码中的关键也是局部余弦正交基的选取,而影响局部余弦正交基选取的主要因素却是钟函数的选取。以上少量的将LCT方法应用于语音编码中的研究只是停留在简单的编码增益对比,并没有真正设计一个可行的语音编码器。
技术实现思路
本专利技术的目的是利用局部余弦变换具有较高的编码增益的特点,提供一种在局部余弦变换域内实用的优良的低比特率语音编码器。实现本专利技术目的的技术方案是一种低比特率语音编码器,它基于局部余弦变换,由高通滤波预处理器对输入编码器的原始语音信号进行处理,然后进行局部余弦变换(LCT)处理,其特征在于所述的LCT变换中的钟函数bnew(n)符合如下条件 ξ[n](n)为采用的整形函数,符合条件ξ[n+1]=defξ[n][sin(πt/2)]]]>和ξ(t)=defξ(t),]]>其中 下标n为该整形函数的迭代次数;钟函数在1~4m的宽度上取值。所述的钟函数bnew(n)确保与余弦函数相乘形成一个局部余弦正交基。所述的整形函数的迭代次数n为8~10。每一帧经过LCT变换后的LCT系数,先按从低频到高频分别40、40、40、20进行分维矢量维数的划分,再利用四个不同的分维矢量量化码书进行分维矢量量化,从第一维矢量到第四维矢量分配的比特位分别依次为12、12、8、8比特,每一帧的增益量化采用8比特标量量化,按照从第一分维矢量比特位到第四分维矢量比特位、增益量化比特位的顺序输出比特位为48比特,用6个字节表示每一帧输出的比特流。所述的语音编码器还有一个与其匹配的语音解码器。本专利技术由于应用了一个可以灵活调整的整形函数,利用这个整形函数对Donoho采用的钟函数进行整形,得到一个能够提高谱能量聚集性的新的钟函数;对局部余弦变换系数的编码,采用分维量化方法,对于每一维矢量,均采用LGB方法设计码书;编码中码书的搜索采用树形结构搜索方法,实现了一种在局部余弦变换域内具有优良的低比特语音编码器。经客观参数评价和非正式听力测试表明,该编码器比LPC-10e编码器具有更好的自然度和可理解性,它适合于各种环境下的语音编码。附图说明图1是本专利技术实施例语音编码器中的整形函数随着递归次数变化的曲线图;图2是本专利技术实施例语音编码器中所采用的整形后的钟函数随着递归次数的增加低半频能量增加百分比图(英语+汉语);图3是本专利技术实施例语音编码器的结构示意图;图4是本专利技术实施例语音解码器的结构示意图;具体实施方式下面结合附图和实施例,对本专利技术所述的技术方案作进一步的阐述。参见附图3、附图4,附图中分别提供了本实施例所述的低比特率编码器和解码器的结构示意图。本专利技术实施例的关键技术为一、最佳整形后的钟函数的获得图3中,对输入编码器的原始语音信号进行高通滤波预处理,然后进行LCT变换处理,在LCT变换中,本专利技术采用整形后的钟函数为 上述整形后的钟函数由如下步骤得到1、采用Donoho的钟函数在Wickerhauser M.V.于1994年出版的专著中阐述局部余弦变换算法时,给出的钟函数对于给定的Ij和r,则钟形函数是固定不变的。下面给出Donoho采用的钟函数简单构造过程。设Ij=2m,r=m,则钟形窗宽度为4m,令t(n)=n-0.5,1≤n≤m. (1)x(n)=(1+t(n)/m)/2 (2)那么,Donoho采用的钟形窗函数为 2、整形函数的构造为令输入实值序列t(n)为t(n)=[2(n-1)-m+0.5]/2m,1≤n≤m (4)定义一个实值连续函数 对于上式重复用sin(πt/2)代替t,对于任意大固定整数d,可以获得d次连续可微函数(ξ∈Cd)。定义如下递归函数 ξ(t)=defξ(t)]]>ξ[n+1]=defξ[n][s本文档来自技高网
...

【技术保护点】
一种低比特率语音编码器,它基于局部余弦变换,由高通滤波预处理器对输入编码器的原始语音信号进行处理,然后进行局部余弦变换处理,其特征在于:所述的局部余弦变换中的钟函数b↓[new](n)符合如下条件:***ξ↓[[n]](n)为采用的整形函数,符合条件ξ↓[[n+1]]↑[def]=ξ↓[[n]][sin(πt/2)]和ξ↓[[0]](t)↑[def]=ξ(t),其中:***下标n为该整形函数的迭代次数;钟函数在1~4m的宽度上取值。

【技术特征摘要】
1.一种低比特率语音编码器,它基于局部余弦变换,由高通滤波预处理器对输入编码器的原始语音信号进行处理,然后进行局部余弦变换处理,其特征在于所述的局部余弦变换中的钟函数bnew(n)符合如下条件 ξ[n](n)为采用的整形函数,符合条件ξ[n+1]=defξ[n][sin(πt/2)]]]>和ξ(t)=defξ(t),]]>其中 下标n为该整形函数的迭代次数;钟函数在1~4m的宽度上取值。2.根据权利要求1所述的一种低比特率语音编码器,其特征在于所述的钟函数bnew(n)确保与余弦函数相乘形成一个局部余弦正交基。3.根据权利要求1所述的...

【专利技术属性】
技术研发人员:董恩清
申请(专利权)人:苏州大学
类型:发明
国别省市:32[中国|江苏]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1