作为语音识别错误预测器的用于语法适合度评估的方法和系统技术方案

技术编号：6845012 阅读：272 留言：0更新日期：2012-04-11 18:40

作为语音识别错误预测器的用于语法适合度评估的方法和系统，从语法结构内接收多个语句。多个语句的每一个由多个词集形成。通过在词集的基础上对齐多个语句来识别在多个语句上的多个对齐区域。每一个对齐的词集表示一个对齐区域。在多个语句上识别多个可能的混淆区域。通过来自在对齐区域外部的对应位置处的语句的两个或更多的词来定义每一个可能的混淆区域。对于每个识别的可能混淆区域，分析在可能的混淆区域内的词的语音发音，以确定在计算事件期间在被语音识别系统可听地处理时的词之间的混淆概率的度量。报告在多个语句上的可能混淆区域的标识和它们对应的混淆概率的度量，以方便语法结构改善。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术总体上涉及一种语音识别系统的方法，更具体地涉及用于评估要在语音识别系统中使用的语法的适合度的方法和系统。
技术介绍
系统设计者和制造商将用于系统用户与电子装置连接所实现的强壮和有效的技术作为重要考虑。电子装置的语音控制的操作常常可以提供用于系统用户控制电子装置和与电子装置交互的期望的接口。例如，电子装置的语音控制的操作可以允许用户同时执行其他任务，或在特定类型的操作环境中会是有益的。另外，具有身体限制或特殊要求的用户可能也期望电子装置的免提操作。可以通过各种语音激活的电子装置来实现电子装置的免提操作。语音激活的电子装置有益地允许在使用传统的输入装置不方便或可能危险的情况下用户与电子装置连接。然而，有效地实现语音识别系统对于系统设计者设立了相当大的挑战。在语音识别系统的领域中，语音识别系统输入音频流，该音频流被过滤以提取和分出作为语音的声音片段。语音识别引擎然后通过下述方式来分析语音声音片段将它们与定义的发音词典、语法识别网络和声音模型作比较。子词汇语音识别系统通常配备了一种用于从模型化语音波形的更基本的单元来构成词和语句的方式。例如，在基于音素模型的语音识别系统中，可以将发音词典作为查找表，以从它们的音标建立词。而且，用于词组合的明确规则被提供来由词建立句子。句子构造的规则被看作“识别语法”。识别语法的复杂度取决于要识别的应用的特性。例如，一些简单的命令类的应用要求词分开的语法，而一些对话类应用要求更复杂的句子的构造。不管应用的复杂度如何，应用开发者需要小心地指定语法，并且需要对该语法进行改善以便保证完整性(即，该语法覆盖应用所需要的所有句...

【技术保护点】
１．一种计算机实现的方法，用于在计算事件期间评估在要在语音识别中使用的一组语句的语法结构内的可能混淆，包括：从语法结构内接收多个语句，所述多个语句的每一个由多个词集形成；通过在词集的基础上对齐所述多个语句来识别在所述多个语句上的多个对齐区域，其中，每一个对齐的词集表示一个对齐区域；识别所述多个语句上的多个可能的混淆区域，其中，通过来自在所述多个对齐区域外的对应位置处的所述多个语句中的两个或更多语句的词来定义每一个可能的混淆区域；对于每个所述识别的可能混淆区域，分析在所述可能的混淆区域内的词的音标发音，以确定在所述计算事件期间在被语音识别系统可听地处理时的所述词之间的混淆概率的度量；以及产生报告以传达在所述多个语句上的所述可能混淆区域的标识和它们对应的混淆概率的度量。

【技术特征摘要】
...

【专利技术属性】
技术研发人员：G·A·赫纳德兹阿伯莱格，
申请(专利权)人：索尼计算机娱乐公司，
类型：发明
国别省市：JP

全部详细技术资料下载我是这个专利的主人