具有自适应编码配置的语音编码系统技术方案

技术编号:3046929 阅读:203 留言:0更新日期:2012-04-11 18:40
根据本发明专利技术的一个方面,基于是否在输入的语音信号间隔中检测到触发特性,来选择第一编码方案或第二编码方案。第一编码方案具有用于处理输入语音信号的音调预处理过程,以形成趋向于理想浊音和稳态特性的修改的语音信号。预处理过程使编码器充分利用了用于具有大量语音成分的输入语音的有效带宽、长期预测过程的优点。根据本发明专利技术的另一方面,第二编码方案将长期预测模式用于基于逐个子帧对音调编码。长期预测模式适合于一般语音的周期成分不是稳态的或小于完全周期并需要对自适应码本进行更大频率更新的场合,以便在长期预测过程下获得达到理想的感知质量的重构语音。(*该技术在2021年保护过期,可自由使用*)

【技术实现步骤摘要】
与相关申请的交叉参考本申请是1998年11月18日提交的申请序号为09/154,660的申请的部分继续申请。以下共同未决并共同转让的美国专利申请已经在本申请同一天提交。所有这些申请涉及并进一步描述了本申请中公开的实施例的其它方面,在此一并结合以作为参考。美国专利申请号____,“可选择模式的语音编码系统”,代理人参考号98RSS365CIP(10508.4),2000年9月15日提交,且现在是美国专利号____。美国专利申请号____,“向用于低位速率CELP的脉冲激励注入高频噪声”,代理人参考号00CXT0650N(10508.6),2000年9月15日提交,且现在是美国专利号____。美国专利申请号____,“CELP语音编码中的短期增强”,代理人参考号00CXT0666N(10508.6),2000年9月15日提交,且现在是美国专利号____。美国专利申请号____,用于对语音编码中的脉冲样激励进行动态脉冲位置跟踪的系统”,代理人参考号00CXT0537N(10508.7),2000年9月15日提交,且现在是美国专利号____。美国专利申请号____,“带有时域噪声衰减的语音编码系统”,代理人参考号00CXT0554N(10508.8),2000年9月15日提交,且现在是美国专利号____。美国专利申请号____,“用于语音编码的自适应激励模式系统”,代理人参考号98RSS366(10508.9),2000年9月15日提交,且现在是美国专利号____。美国专利申请号____,“使用具有不同分辨级别的自适应码本对语音信息进行编码的系统”,代理人参考号00CXT0670N(10508.13),2000年9月15日提交,且现在是美国专利号____。美国专利申请号____,“用于编码和解码的码本表”,代理人参考号00CXT0669N(10508.14),2000年9月15日提交,且现在是美国专利号____。美国专利申请号____,“用于传输编码的语音信号的比特流协议”,代理人参考号00CXT0668N(10508.15),2000年9月15日提交,且现在是美国专利号____。美国专利申请号____,“用于过滤语音编码信号的频谱内容的系统”,代理人参考号00CXT0667N(10508.16),2000年9月15日提交,且现在是美国专利号____。美国专利申请号____,“用于编码和解码语音信号的系统”,代理人参考号00CXT0665N(10508.17),2000年9月15日提交,且现在是美国专利号____。美国专利申请号____,“通过子码本改进使用音调增强的系统”,代理人参考号00CXT0569N(10508.19),2000年9月15日提交,且现在是美国专利号____。一定的语音编码方案在编码站点存储了详细的数据库,并在解码站点复制了详细数据库。编码基础设施传输用于索引复制详细数据库保持空中接口可用带宽的基准数据。取代以在编码站点的整个语音序号调制载波信号,编码基础设施只是传输表示原始语音信号的较短的基准数据。解码基础设施使用较短的基准数据访问在解码站点的复制详细数据库,以便重构原始语音信号的复制品或表示。如果在详细数据库中没有充分种类的激励向量来精确表示潜在原始语音信号下的语音,则语音信号的质量会受到影响。所支持的码标识符(例如二进制组合)的最大数是对可在详细数据库(例如码本)中表示的激励向量种类的一个限制。对于一定的语音信号成分,诸如短期预测成分,有限数目的可用激励向量可能无法使由激励向量表示的语音信号精确或清晰。于是,有时再生的语音可能是人造声音、失真的、不清晰的、或感知上令用户不愉快的。这样就需要提高再生语音的质量,同时遵循由在有限位数内传输基准或索引信息施加的带宽约束。检测器在一间隔期间检测语音信号是否具有触发特性(例如一般浊音或一般稳态成分)。选择器基于是否检测到触发特性来选择第一编码方案或第二编码方案,以便对与该间隔相关的帧编码。例如,如果在该间隔期间语音信号具有触发特性,则编码器可按照第一编码方案对与该间隔相关的帧中的语音信号编码。第一编码方案具有音调预处理过程,用于处理输入的语音信号以形成趋向于理想浊音和稳态特性的修改的语音信号。音调预处理过程使编码器完全获得了用于具有大量语音成分的输入语音信号的有效带宽、长期预测过程的优点,否则这是不可能的。音调预处理过程从某些稳态和浊音输入语音成分形成修改的语音信号。修改的语音信号具有基本上稳态和基本上浊音质量,便于适用于基本上是浊音和稳态输入语音成分的长期预测编码过程的每帧有效位使用,同时保持语音的目标感知质量。通过稍微偏好于用于输入的语音信号的较多的语音成分的自适应码本,音调预处理过程很好地适用于降低必须的最小带宽或通过空中接口传输信息的传输速率,而在语音信号的感知质量中没有造成明显的或实质的劣化。根据本专利技术的一个方面,与短期预测成分在固定码本中需要的激励向量的数目相比,基本上稳态和浊音输入的语音信号的长期预测成分,可以通过自适应码本中的较少数目的激励向量适当地表示。这样,编码器可使用由音调预处理过程和后继的编码节省的剩余位,提供帧中不同的位分配,以改进用于短期预测成分、残留语音成分或两者的固定码本的精确性或分辨率。根据本专利技术的另一个方面,第二编码方案使长期预测模式逐个子帧地对音调编码。长期预测模式适合一般语音的周期成分不是稳态的或小于完全周期并需要从自适应码本中进行更大频率更新的场合,以便通过长期预测过程获得理想感知质量的再生语音。结合以下附图和详细说明,本专利技术的其它系统、方法、特征和优点对于业内专业人员将是或将成为显而易见的。于是,所有这些附加的系统、方法、特征和优点都包括在本说明中,都在本专利技术的范围内,都受所附权利要求书的保护。 附图说明参照以下附图能够更好地理解本专利技术。在所有不同的图示中相同的标号指示对应的部件或过程。图1是表示编码器和解码器的示意性实施例的框图。图2是用于对语音信号编码的方法的一个实施例的流程图。图3是根据图2的音调预处理技术的流程图。图4是另一编码方法的流程图。图5是位分配过程的流程图。图6和图7是分别用于示意性的较高速率编码方案和较低速率编码方案的位分配的图表。根据本专利技术,图1示出编码器11,它包括与分析部分12及自适应码本部分14连接的输入部分10。进而,自适应码本部分14连接到固定码本部分16。与自适应码本部分14和固定码本部分16两者相关的多路复用器60连接到发送器62。发送器62和接收器66与通信协议一同表示无线相同的空中接口64。来自源或说话者的输入语音加到编码站点的编码器11。发送器62从编码站点向位于编码站点远处的解码站点的接收器66,发送电磁信号(例如射频或微波信号)。用表示输入语音信号的基准信息调制电磁信号。多路信号分离器68对基准信息进行多路信号分离,以便输入到解码器70。解码器70产生输入语音的复制或表示,称为在解码器70处的输出语音。输入部分10具有输入端,用于接收输入的语音信号。输入端馈送给高通滤波器18,该滤波器衰减低于截止频率(例如80Hz)的输入语音信号,以便降低输入语音信号中的噪声。高通滤波器18馈送给感知加权滤波器20及线性预测编码(LPC)分析器30。感知本文档来自技高网...

【技术保护点】
一种语音编码系统包括: 检测器,用于检测输入语音信号在一间隔期间一般是否具有触发特性; 编码器,支持可用于与间隔相关联的帧的语音信号的第一编码方案和第一编码方案至少之一,第一编码方案具有预处理过程,用于处理输入语音信号以形成趋向于一般理想的浊音和稳态特性的修改的语音信号;以及 选择器,用于基于在输入语音信号的间隔中是否检测到触发特性而选择第一编码方案和第二编码方案之一。

【技术特征摘要】
US 2000-9-15 09/663,0021.一种语音编码系统包括检测器,用于检测输入语音信号在一间隔期间一般是否具有触发特性;编码器,支持可用于与间隔相关联的帧的语音信号的第一编码方案和第一编码方案至少之一,第一编码方案具有预处理过程,用于处理输入语音信号以形成趋向于一般理想的浊音和稳态特性的修改的语音信号;以及选择器,用于基于在输入语音信号的间隔中是否检测到触发特性而选择第一编码方案和第二编码方案之一。2.根据权利要求1的语音编码系统,其中触发特性包括语音信号的一般浊音和一般稳态语音成分。3.根据权利要求1的语音编码系统,其中如果检测器确定在帧期间语音信号一般是稳态且一般是周期性的,则选择器选择第一编码方案。4.根据权利要求1的语音编码系统,其中如果检测器确定在帧期间语音信号一般是非稳态的,则选择器选择第二编码方案。5.根据权利要求1的语音编码系统,还包括感知加权滤波器,用于对输入语音信号滤波;音调-预处理模块,具有连接到感知加权滤波器输出端的输入端,该音调-预处理模块确定一目标信号,用于使加权语音信号时间扭曲。6.根据权利要求1的语音编码系统,还包括音调-预处理模块,用于基于语音信号的多个帧确定输入音调的轨迹,并改变与采样相关联的音调滞后中的变化以跟踪输入音调轨迹。7.根据权利要求1的语音编码系统,其中第一编码方案具有在固定码本指标与自适应码本指标之间每帧存储单元的第一分配,第二编码方案具有在固定码本指标与自适应码本指标之间每帧存储单元的第二分配,其中第一分配不同于第二分配。8.根据权利要求7的语音编码系统,其中与存储单元的第一分配相比,每帧存储单元的第二分配向自适应码本指标分配较大数目的存储单元,以便于逐个子帧进行长期预测编码。9.根据权利要求7的语音编码系统,其中与存储单元的第二分配相比,每帧存储单元的第一分配向固定码本指标分配较大数目的存储单元,以降低与固定码本指标相关联的量化误差。10.根据权利要求7的语音编码系统,其中第二编码方案比第一编码方案具有较高的分配比值,分配比值由分配给自适应码本指标的存储单元数除以分配给自适应码本指标的存储单元数与分配给固定码本指标的存...

【专利技术属性】
技术研发人员:HY苏Y高
申请(专利权)人:康奈克森特系统公司
类型:发明
国别省市:US[美国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1