用于嵌入式语音编码的帧擦除隐藏方法及系统技术方案

技术编号:3044487 阅读:189 留言:0更新日期:2012-04-11 18:40
用于嵌入式语音编码的帧擦除隐藏方法,根据采用丢失帧之前接收到的帧的语音信号内插得到的所述丢失帧的线谱频率参数和激励,恢复得到所述丢失帧的合成语音,其特征在于,得到所述激励中的自适应码书的步骤为:    根据所述丢失帧的前一非丢失帧的速率,选择不同的激励内插得到所述丢失帧的自适应码书。

【技术实现步骤摘要】

本专利技术涉及用于嵌入式语音编码的帧擦除隐藏方法及系统。技术背景对于语音的网络传输,在无线通信网络和分组交换网络中,当发生网络拥 塞时,会出现大量的IP帧丢失和较长时间的延迟,这种情况将严重影响接收端 合成语音的质量。承载语音帧的包丟失或者没有及时到达接收端就叫做帧擦除,当帧擦除发 生时,解码器利用已经收到的正常帧,用一类似的结构来代替擦除的语音,这 种方法就叫做帧擦除隐藏。嵌入式语音编码是针对语音的网络传输而提出的一种新的编码方案。它可 以生成一种具有层结构的嵌入式码流,该码流的核心层加栽的是语音的基本信 息,其它增强层则逐层加载对基本信息的补充,用以提高语音的合成质量。该 编码器生成的全码流在网络中传输,当网络质量下降时,则保留核心层而丟弃 若干增强层,从而最大程度的保证了接收端合成语音的质量。嵌入式语音编码的帧擦除包括两种情况第一种,保留核心层而丢弃若干 增强层,它相当于对码流的截断;第二种,整帧信息都丟失。传统的基于CELP模型的编码器,例如G.729、 G722.2等,帧擦除的隐藏 方法仅仅简单的用前几帧的语音信号内插得到丢失帧的各个参数,包括线谱频 率参数、自适应码书及其增益和固定码书及其增益。上述隐藏传统的帧擦除掩 蔽方法简单,复杂度低,但是恢复效果较差。
技术实现思路
本专利技术实施例提供用于嵌入式语音编码的帧擦除的隐藏方法及系统。 一种嵌入式语音编码的帧擦除隐藏方法,根据采用丢失帧之前接收到的帧 的语音信号内插得到的所述丟失帧的线语频率参数和激励,恢复得到所述丢失帧的合成语音,得到所述激励中的自适应码书的步骤为根据所述丢失帧的前一非丢失帧的速率,选择不同的激励内插得到所述丢 失帧的自适应码书。一种用于嵌入式语音编码的帧擦除的隐藏系统,包括存储单元、内插单元、 合成单元和控制单元,其中,所述存储单元,用于存储接收到的帧的语音信号的各参数;所述内插单元,用于将所述控制单元从所述存储单元中调用的所述语音信 号参数中的激励信号进行内插后,得到的丟失帧的各参数发送给控制单元;所述控制单元,用于将接收到的所述丟失帧的各参数发送给所述合成单元 恢复得到所述丢失帧的合成语音;所述控制单元还用于根据所述丢失帧的前一非丟失帧的速率,选择不同的 激励发送给所述内插单元,得到所述丢失帧的自适应码书。上述方法或系统,在帧擦除隐藏时,对于恢复丢失帧的自适应码书所使用 的内插激励根据前一非丢失帧的速率进行选择,这样得到的自适应码书更接近 丢失帧的原始编码信号,从而提高了帧擦除隐藏的质量。附图说明图i是本专利技术实施例中宽带嵌入式编码码流帧擦除的示意图; 图2是本专利技术实施例中宽带嵌入式解码端帧擦除的隐藏方法的原理框图; 图3是本专利技术实施例中语音类型判断的流程图; 图4是本专利技术实施例中丟失帧自适应码书恢复的原理框图; 图5是本专利技术一实施例中于嵌入式语音编码的帧擦除的隐藏系统的结构 示意图。具体实施方式图l示出了宽带嵌入式编码码流发生帧擦除的情况。嵌入式语音编码器码 流的帧擦除情况不同于传统固定速率编码器的码流帧擦除。传统编码器生成的 码流在发生帧擦除时,是将整帧信息全部丢弃;而嵌入式语音编码器生成的码 流发生帧擦除的情况比较复杂,包括丟失增强四层、丟失增强三四层、丢失增强二三四层、丢失增强一二三四层和将整帧全部丢失这五种情况。对于这五种情况,嵌入式语音解码器对帧头进行^r测,得到帧的长度信息。 除了整帧全部丢失,,这种情况的帧长为O,前四种帧擦除的帧长分别为480bits、 320bits、 24bits、 160bits。对于这四种情况,解码器仅根据接收到的码流解码, 从而得到合成语音。而对于整帧全部丢失这种情况的帧擦除,则恢复CELP 模型的各个参数,包括语包络、自适应码书及其增益、固定码书及其增益。本 专利技术实施例帧擦除的隐藏方法针对的是整帧全部丟失的帧擦除情况,具体方 法如下。图2示出了解码端帧擦除的隐藏方法的原理框图。 方框201至206为丢失帧的语音类型估计。本实施例中,对所有接收的帧都进行语音类型估计,如果当前帧为丢失帧 则设当前丢失帧的语音类型与前一非丟失帧的语音类型相同。语音类型分为为静音、浊音、清音、清音向浊音的过渡、浊音向清音的过 渡五种。语音类型分类用到的参数包括方框202中的平均能量A、方框203 中的归一化自相关^、方框204中的过零率o,、方框205中的谱倾斜e,。根据式(1 )计算当前帧的平均能量& ,其中为合成语音根据式(2)计算自相关,其中〗()为合成语音,r为第四子帧的整数基音延 迟,f = 256-r,其中256为采样的样点数。如果r6,则r设为第三子帧和第 四子帧的平均值。如果基音延迟小于子帧的长度(r〈64),则归一化自相关要再计算一次,此时t设为/^-r,且r为第三子帧和第四子帧的平均值,这时的归 一化自相关为两次计算的自相关的平均值。<formula>formula see original document page 7</formula>过零率O,则为当前帧合成语音的波形穿过零值的次数。镨倾斜e,由归一化自相关近似估计,计算公式如下,这里〗()为合成语音。<formula>formula see original document page 8</formula>方框201表示根据以上计算的四个参数来判断当前帧的语音类型。本专利技术 根据语音的特性,逐级分类。具体的判断流程参见图3,其中四个判断条件由经 验得到,具体如下条件l : £,35,如果满足条件1则当前帧为静音帧,否则转入条件2;条件2 : ^ >0.77且^> 0.885 ;或者^ >0.96且 <25,如果满足条 件2的情况之一则为当前帧浊音帧,否则转入条件3;条件3: >53且^<0.75,如果满足条件3则当前帧为清音帧,否则转 入条件4;条件4:当前帧的前一帧的类型为静音帧或者为浊音向清音的过渡帧,如 果满足条件4则当前帧为清音向浊音过渡帧,否则当前帧为浊音向清音过渡 帧。方框207为语包络的恢复。设该丢失帧的ISF参数和前一非丢失帧的ISF 参数相同。方框20为激励的恢复,包括自适应码书及其增益的恢复,和固定码书及 其增益的恢复。方框208为自适应码书的恢复。根据语音的短时平稳特性,通常情况下将 丢失帧的基音周期用过去一帧第四子帧的基音周期代替。但是对于宽带语音, 其基音的动态范围较大。如果仅用过去一子帧的基音周期代替,恢复的效果并 不好。本专利技术采用&722.2标准中对丟失帧基音周期估计的技术对过去一子 帧基音周期的可用性进行判断,如果浊音性和稳定性强,说明该丟失帧和过去 帧比较变化不大,该丢失帧的基音周期可以用过去一子帧的代替;否则,则该 丢失帧的基音周期值在一定范围内随机产生。另外,通过实验证明如果过去 一子帧的基音周期可用,则将此基音周期值加1的效果比直接使用该值的效果 好。所以,本专利技术对所采用的&722.2标准中对丢失帧基音周期估计的技术稍 加改动如果过去一子帧的基音周期可用,则将此基音周期值加l。将此值作 为丢失帧的整氣基音周期。以上过程得到了丢失帧的整数基音周期,分数基音周期设为o本文档来自技高网...

【技术保护点】
用于嵌入式语音编码的帧擦除隐藏方法,根据采用丢失帧之前接收到的帧的语音信号内插得到的所述丢失帧的线谱频率参数和激励,恢复得到所述丢失帧的合成语音,其特征在于,得到所述激励中的自适应码书的步骤为:根据所述丢失帧的前一非丢失帧的速率,选择不同的激励内插得到所述丢失帧的自适应码书。

【技术特征摘要】
1. 用于嵌入式语音编码的帧擦除隐藏方法,根据采用丢失帧之前接收到的帧的语音信号内插得到的所述丢失帧的线谱频率参数和激励,恢复得到所述丢失帧的合成语音,其特征在于,得到所述激励中的自适应码书的步骤为根据所述丢失帧的前一非丢失帧的速率,选择不同的激励内插得到所述丢失帧的自适应码书。2、 根据权利要求1所述的隐藏方法,其特征在于,根据所述丟失帧的前 一非丢失帧的速率,选择不同激励内插得到所述丟失帧的自适应码书的步骤包 括根据所述前一非丢失帧的速率,选择所述前一非丢失帧的各层的激励之和 或核心层的激励内插得到所述丟失帧的自适应码书。3、 根据权利要求1所述的隐藏方法,其特征在于,还包括如下步骤对所述丢失帧的前一非丟失帧的语音类型进行估计,设置所述丢失帧的语 音类型与所述丢失帧前一非丢失帧的语音类型相同。4、 根据权利要求3所述的隐藏方法,其特征在于,所述语音类型包括静 音、浊音、清音、清音向浊音的过渡和浊音向清音的过渡。5、 根据权利要求4所述的隐藏方法,其特征在于,所述语音类型的判断 参数包括平均能量Ex、归一化自相关rx、过零率Ox和谱倾斜ex。6、 根据权利要求5所述的隐藏方法,其特征在于,对接收到的当前帧采 用所述判断参数进行语音类型判断的方法包括如果平均能量Ex《35,则所述当前帧为静音帧,否则转入以下步骤; 如果归一化自相关r 0.77且镨倾斜e一 0.885 ;或者谱倾斜ex> 0.96且过零率0)4<25,则所述当前帧为浊音帧,否则转入以下步骤;如果过零率Ox》53且镨倾斜ex〈0.75,则所述当前帧为清音帧,否则转入以下步骤;如果所述当前帧的前一帧的类型为静音帧或者为浊音向清音的过渡帧,则 所述当前帧为清音向浊音过渡帧,否则所述当前帧为浊音向清音过渡帧。7、 根据权利要求4至6其中之一所述的隐藏方法,其特征在于,还包括 如下步骤对不同语音类型的丢失帧的激励中的固定码书的能量进行调整。8、根据权利要求7所述的隐藏方法,其特征在于,对所述固定码书的能 量进行调整的方法包括如杲所迷丢失帧为浊音帧,所迷固定码书的各样点进行衰減,衰减系数为 预定值;如果所述丢失帧为清音向浊音过渡,则所述丟失帧的第3、 4子帧固定码 书各样点逐点衰减,衰减系数由l渐变到预定值;如果所述丢失帧为浊音向清音过渡,则所述丟失帧的第1、 2子帧固定码 书各样点逐点衰减,衰减系数为预定值渐变到1,所述预定值在0和1之间。9、 根据权利要求8所述的隐藏方法,其特征在于,所述预定值为0.5。10、 根据权利要求1所述的隐藏方法,其特征在于,还包括如下步骤 用能量外推法对所述激励中的自适应码书的增益进行调整。11、 根据权利要求1所述的隐藏方法,其特征在于,还包括如下步骤 如果所述前一非丢失帧的基音周期可...

【专利技术属性】
技术研发人员:鲍长春朱恒李海婷刘泽新范睿李锐贾懋珅李立雄
申请(专利权)人:北京工业大学华为技术有限公司
类型:发明
国别省市:11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利