分布式语音识别系统技术方案

技术编号：3047226 阅读：178 留言：0更新日期：2012-04-11 18:40

一种分布式语音识别系统，包括数字信号处理器（ＤＳＰ）（１０４）、非易失存储媒体（１０８）和微处理器（１０６）。ＤＳＰ（１０４）配置成从数字化输入话音采样中提取参数并向微处理器（１０６）提供所提供的参数。非易失存储媒体包括话音模板的数据库。将微处理器配置成读取非易失媒体（１０８）的内容、将参数与内容相比较并根据比较结果选择话音模板。非易失存储媒体可以是快闪存储器。ＤＳＰ（１０４）可以是声码器。如果ＤＳＰ（１０４）是声码器，那么参数可以是由声码器产生的诊断数据。分布式语音识别系统可位于用途特定集成电路（ＡＳＩＣ）上。（*该技术在2020年保护过期，可自由使用*）

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术一般涉及通信领域，特别涉及语音识别系统。
技术介绍
语音识别(VR)代表赋予机器模拟智能以识别用户或用户发声的命令并促进人机接口的最重要技术之一。VR还代表人们话音理解的关键技术。采用从声学语音信号中恢复语言消息的技术的系统被称为语音识别器。语音识别器一般包括声处理器，它提取获得入局原始话音的VR所需的一系列带信息特征或矢量；字解码器，它解码特征或矢量系列以提供有意义和所需的输出格式，诸如与输入说话(utterance)相对应的一系列语言字。为了增加给定系统的性能，需要进行训练来将系统设置有效参数。换句话说，系统在它能够起到最佳作用之前需要学习。声处理器代表在语音识别器中的前端话音分析子系统。响应于输入话音信号，声处理器提供一种表示时间变化话音信号的特征的适当表示法。声处理器应丢弃无关信息，诸如背景噪声、信道失真、扬声器特征和说话方式。有效的声处理为语音识别器提供增强的声区别(acoustic discrimination)能力。为此，要分析的有用特征是短时间谱包络。表示短时间谱包络的两种常用频谱分析技术是线性预测编码(LPC)和基于滤波器组的频谱建模(filter-bank-basedspectral modeling)。在美国专利号5,414,796(已转让给本专利技术的受让人并作为参考资料在此引入)和L.B.Rabiner与R.W.Schafer所著的“话音信号的数字处理”(Digital Processing of Speech Signals 396-453(1978)，作为参考资料在此引入)中描述了示例LPC技术。处于安全原因，VR...

【技术保护点】
一种分布式语音识别系统，其特征在于，包括：数字信号处理器，配置成接收数字化话音采样并从中提取多个参数；存储媒体，包括多个话音模板；和耦合到所述存储媒体和数字信号处理器的处理器，所述处理器被配置以接收来自数字信号处理器的多个参数并将多个参数与多个话音模板相比较。

【技术特征摘要】
US 1999-2-8 09/246,4131.一种分布式语音识别系统，其特征在于，包括数字信号处理器，配置成接收数字化话音采样并从中提取多个参数；存储媒体，包括多个话音模板；和耦合到所述存储媒体和数字信号处理器的处理器，所述处理器被配置以接收来自数字信号处理器的多个参数并将多个参数与多个话音模板相比较。2.如权利要求1所述的系统，其特征在于，所述处理器还配置成以将所述多个参数和所述多个话音模板相比较为基础，接收多个话音模板中的一个模板。3.如权利要求1所述的系统，其特征在于，所述数字信号处理器、所述存储媒体和所述处理器位于用途特定集成电路(ASIC)上。4.如权利要求1所述的系统，其特征在于，所述数字信号处理器包括配置成产生声码器分组和诊断数据的声码器，而且多个参数至少包括由声码器产生的一部分诊断数据。5.如权利要求4所述的系统，其特征在于，所述声码器、存储媒体和处理器位于用途特定集成电路(ASIC)上。6.一种分布语音识别处理的方法，其特征在于，包括下列步骤；在数字信号处理器中，从多个数字化话音采样中提取多个参数；向微处理器提供多个参数；和在微处理器中，将多个参数与多个话音模板相比较。7.如权利...

【专利技术属性】
技术研发人员：张承纯，
申请(专利权)人：高通股份有限公司，
类型：发明
国别省市：US[美国]

全部详细技术资料下载我是这个专利的主人