多识别器语音识别制造技术

技术编号：12671412 阅读：116 留言：0更新日期：2016-01-07 16:25

本说明书的主题可具体体现为方法等，该方法包括接收与发声相对应的音频数据，获得使用有限语音识别器所产生的发声的第一转录。有限语音识别器包括包含通过有限语音识别词汇所训练的语言模型的语音识别器，所述有限语音识别词汇包括来自语音命令语法的一个或多个项，但包括比扩展语法的所有项少。获得使用扩展语音识别器所产生的发声的第二转录。扩展语音识别器包括包含通过扩展语音识别词汇所训练的语言模型的语音识别器，所述扩展语音识别词汇包括扩展语法的所有项。至少基于第一转录或第二转录的一部分来对发声进行分类。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】
本公开通常涉及语音识别。
技术介绍
语音识别包括用于将所讲的词转换成文本的处理。通常，语音识别系统将口头发声映射成一系列计算机可读语音，并且对那些语音与和词相关的已知语音模式进行比较。例如，麦克风可以接受下述模拟信号，所述模拟信号被转换成此后被划分成更小段的数字形式。可对数字段与所讲语言的元素进行比较。根据该比较以及对发出那些语音的环境的分析，系统能够识别语音。典型的语音识别系统可以包括声学模型、语言模型、以及字典。简言之，声学模型包括可组合以生成词语、短语等等的集合的各个语音的数字表示。语言模型分配一系列词语将一起在特定句子或短语中出现的概率。字典将语音序列转换成语言模型可理解的词语。
技术实现思路
通常，本文档描述了用于执行语音识别的系统和技术。通常，通过两个或更多语音识别器对用户的发声进行转录。将每个识别器调到不同词典。例如，一个识别器可以被调成从扩展的(例如多用途)词典识别词，而另一被调到词的子集(例如命令关键字)和/或诸如存储在联系人列表中并且在扩展词典中可能不可用的固有姓名这样的专用词典。可对识别器的转录进行对准以提供包括一个或多个识别器中的所选元素的转录以作为对用户所说的转录。在本说明书中所描述的主题的方面可具体体现为方法、系统、以及存储下述可执行指令的计算机可读介质，所述指令执行包括下述的操作:接收与发声相对应的音频数据；获得使用有限语音识别器所产生的发声的第一转录，其中有限语音识别器包括包含通过有限语音识别词汇所训练的语言模型的语音识别器，所述有限语音识别词汇包括来自语音命令语法的一个或多个项，但包括比扩展语法的所有项少；获得...

【技术保护点】
一种由数据处理装置执行的计算机实现的方法，所述方法包括：接收与发声相对应的音频数据；获得使用有限语音识别器所产生的所述发声的第一转录，其中，所述有限语音识别器包括包含通过有限语音识别词汇训练的语言模型的语音识别器，所述有限语音识别词汇包括来自语音命令语法的一个或多个项，但包括比扩展语法的所有项少；获得使用扩展语音识别器所产生的所述发声的第二转录，其中，所述扩展语音识别器包括包含通过扩展语音识别词汇训练的语言模型的语音识别器，所述扩展语音识别词汇包括所述扩展语法的所有项；以及至少基于所述第一转录或所述第二转录的一部分来对所述发声进行分类。

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员：彼塔尔·阿列克西克，佩德罗·J·莫雷诺门希瓦尔，法迪·比亚德希，
申请(专利权)人：谷歌公司，
类型：发明
国别省市：美国;US

全部详细技术资料下载我是这个专利的主人