分布式语音识别系统技术方案

技术编号:3047226 阅读:171 留言:0更新日期:2012-04-11 18:40
一种分布式语音识别系统,包括数字信号处理器(DSP)(104)、非易失存储媒体(108)和微处理器(106)。DSP(104)配置成从数字化输入话音采样中提取参数并向微处理器(106)提供所提供的参数。非易失存储媒体包括话音模板的数据库。将微处理器配置成读取非易失媒体(108)的内容、将参数与内容相比较并根据比较结果选择话音模板。非易失存储媒体可以是快闪存储器。DSP(104)可以是声码器。如果DSP(104)是声码器,那么参数可以是由声码器产生的诊断数据。分布式语音识别系统可位于用途特定集成电路(ASIC)上。(*该技术在2020年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利技术一般涉及通信领域,特别涉及语音识别系统。
技术介绍
语音识别(VR)代表赋予机器模拟智能以识别用户或用户发声的命令并促进人机接口的最重要技术之一。VR还代表人们话音理解的关键技术。采用从声学语音信号中恢复语言消息的技术的系统被称为语音识别器。语音识别器一般包括声处理器,它提取获得入局原始话音的VR所需的一系列带信息特征或矢量;字解码器,它解码特征或矢量系列以提供有意义和所需的输出格式,诸如与输入说话(utterance)相对应的一系列语言字。为了增加给定系统的性能,需要进行训练来将系统设置有效参数。换句话说,系统在它能够起到最佳作用之前需要学习。声处理器代表在语音识别器中的前端话音分析子系统。响应于输入话音信号,声处理器提供一种表示时间变化话音信号的特征的适当表示法。声处理器应丢弃无关信息,诸如背景噪声、信道失真、扬声器特征和说话方式。有效的声处理为语音识别器提供增强的声区别(acoustic discrimination)能力。为此,要分析的有用特征是短时间谱包络。表示短时间谱包络的两种常用频谱分析技术是线性预测编码(LPC)和基于滤波器组的频谱建模(filter-bank-basedspectral modeling)。在美国专利号5,414,796(已转让给本专利技术的受让人并作为参考资料在此引入)和L.B.Rabiner与R.W.Schafer所著的“话音信号的数字处理”(Digital Processing of Speech Signals 396-453(1978),作为参考资料在此引入)中描述了示例LPC技术。处于安全原因,VR(一般称为话音识别)的使用变得越来越重要。例如,VR可用来代替在无线电话键盘上人工按键的工作。这在用户在开车时要打电话时特别有用。当使用没有VR的电话时,司机必需从方向盘上腾出一只手并在按键拨号的同时要看着键盘。这种动作增加了交通事故的可能性。话音使能的电话(即,为话音识别设计的电话)允许司机打电话,同时继续看路。此外,车辆上的免提配套系统允许司机在呼叫启动期间将两只手放在方向盘上。话音识别装置分为依赖扬声器或不依赖扬声器装置。不依赖扬声器装置能够接受来自任何用户的语音命令。训练更加普遍的依赖扬声器的装置来识别来自特定用户的命令。依赖扬声器的VR装置一般在两个阶段操作,即,训练阶段和识别阶段。在训练阶段,VR系统提醒用户说在系统词汇表中的每个字一遍或两遍,从而系统能够对于这些特定字或短语学习用户的话音特征。另一方面,对于表示语音的(phonetic)VR装置,通过阅读覆盖语言中的所有音素的一篇或多篇短文可以完成训练。对于免提汽车配套设备的示例词汇表可包括键盘上的数字;关键字“呼叫”、“发送”、“拨号”、“删除”、“清除”、“添加”、“删除”、“历史”、“程序”、“是”和“否”;和预定数量的一般称为共同工作者、朋友或家庭成员的名字。一旦完成训练,用户就能够通过说出训练的关键字在识别阶段启动呼叫。例如,如果名字“John”是一个经训练的名字,那么用户能够通过说出短语“呼叫John”来启动对John的呼叫。VR系统识别字“呼叫(Call)”和“John”,而且能够拨出用户此前作为John的电话号码输入的号码。传统的VR装置一般用数字信号处理器(DSP)或微处理器来分析入局语音采样、提取相关参数、解码参数并将解码的参数与存储的一组字或VR模板(template)相比较,所述模板包括VR装置的词汇表。把词汇表存储在非易失存储器中,诸如,快闪存储器。在具有DSP和微处理器(诸如,数字蜂窝电话)的传统VR系统中,非易失存储器一般可被微处理器访问,但是DSP不能访问。在这样的系统中,如果完全在微处理器中执行VR,那么微处理器通常缺乏计算能力,从而以合理的等待时间传递识别结果。另一方面,如果完全在DSP中执行VR,那么微处理器需要读取快闪存储器并将读取的内容传给DSP,因为DSP的单片存储器(on-chip memory)的尺寸相对较小不足以保持大VR模板。由于在DSP和微处理器之间的接口的典型低带宽限制了可在给定时间内在两个装置之间传递的数据量,因此这是冗长的过程。于是,需要VR装置有效地将DSP的计算能力与微处理器的存储器容量相结合。
技术实现思路
本专利技术提供一种将DSP的计算能力与微处理器的存储器容量有效地结合的VR装置。因此,在本专利技术的一个方面,分布式语音识别系统最好包括数字信号处理器,配置成接收数字化语音采样并从中提取多个参数;存储媒体,包括多个语音模板;和耦合到存储媒体和数字信号处理器的处理器,所述处理器被配置成接收来自数字信号处理器的多个参数并将多个参数与多个语音模板相比较。在本专利技术的另一个方面,分布式语音识别处理的方法最好包括步骤在数字信号处理器中,从多个数字化话音采样中提取多个参数;将该多个参数提供给微处理器;以及在微处理器中,将该多个参数与多个话音模板进行比较。在本专利技术的另一个方面,分布式语音识别系统最好包括从多个数字化话音采样中提取多个参数的装置;永久存储多个话音模板的装置;和接收来自所述提取装置的多个参数并将所述多个参数与所述多个话音模板相比较的装置。附图简述附图说明图1是传统语音识别系统的方框图;图2是分布式语音识别系统的方框图;图3是将声码器用于前端处理的分布式语音识别系统的方框图。较佳实施例的详细描述如图1所示,传统的语音识别系统10包括模拟-数字变换器(A/D)12、声处理器14、VR模板数据库16、模式比较逻辑18和判定逻辑20。例如,VR系统10可位于无线电话或免提汽车配置设备中。当VR系统10处于话音识别阶段,人(未图示)说出一个字或短语,产生话音信号。用传统的变换器(未图示)将话音信号转换成电信号s(t)。向A/D12提供话音信号s(t),其中根据已知采样方法(例如,脉冲编码调制(PCM))将话音信号s(t)转换成数字化话音采样s(n)。向声处理器14提供话音采样s(n)用于参数判定。声处理器14产生一组参数,对输入话音信号s(t)的特征建模。根据多种已知的话音参数判定技术(例如,包括话音编码器编码)并运用基于快速傅利叶变换(FFT)的倒谱系数(如上述美国专利5,414,796所述),可以判定这些参数。可将声处理器14作为数字信号处理器实施。DSP可包括话音编码器。另一方面,可将声处理器14作为话音编码器来实施。在训练VR系统10期间,还执行参数判定,其中将一组用于VR系统10的所有词汇表字的模板路由到VR模板数据库16以永久地存储在其中。VR模板数据库16最好以任一种传统的非易失存储媒体形式来实施,诸如,快闪存储器。这允许当关断到VR系统10的电源时,模板保留在VR模板数据库16中。向模式比较逻辑18提供这组参数。模式比较逻辑18最好检测说话的起点和终点、计算动态声特征(acoustic feature)(诸如,时间导数、第二时间导数,等等)、通过选择相关帧压缩声特征并量化静态和动态声特征。例如,在Lawrence Rabiner & Biing-Hwang Juang所著的话音识别基础(Fundamentalsof Speech Recognition(1993),作为参考资料在此引入)中描述了各种已知的本文档来自技高网
...

【技术保护点】
一种分布式语音识别系统,其特征在于,包括: 数字信号处理器,配置成接收数字化话音采样并从中提取多个参数; 存储媒体,包括多个话音模板;和 耦合到所述存储媒体和数字信号处理器的处理器,所述处理器被配置以接收来自数字信号处理器的多个参数并将多个参数与多个话音模板相比较。

【技术特征摘要】
US 1999-2-8 09/246,4131.一种分布式语音识别系统,其特征在于,包括数字信号处理器,配置成接收数字化话音采样并从中提取多个参数;存储媒体,包括多个话音模板;和耦合到所述存储媒体和数字信号处理器的处理器,所述处理器被配置以接收来自数字信号处理器的多个参数并将多个参数与多个话音模板相比较。2.如权利要求1所述的系统,其特征在于,所述处理器还配置成以将所述多个参数和所述多个话音模板相比较为基础,接收多个话音模板中的一个模板。3.如权利要求1所述的系统,其特征在于,所述数字信号处理器、所述存储媒体和所述处理器位于用途特定集成电路(ASIC)上。4.如权利要求1所述的系统,其特征在于,所述数字信号处理器包括配置成产生声码器分组和诊断数据的声码器,而且多个参数至少包括由声码器产生的一部分诊断数据。5.如权利要求4所述的系统,其特征在于,所述声码器、存储媒体和处理器位于用途特定集成电路(ASIC)上。6.一种分布语音识别处理的方法,其特征在于,包括下列步骤;在数字信号处理器中,从多个数字化话音采样中提取多个参数;向微处理器提供多个参数;和在微处理器中,将多个参数与多个话音模板相比较。7.如权利...

【专利技术属性】
技术研发人员:张承纯
申请(专利权)人:高通股份有限公司
类型:发明
国别省市:US[美国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1