用于开发自然语言理解应用的方法和集成开发工具技术

技术编号：2920864 阅读：282 留言：0更新日期：2012-04-11 18:40

一种开发自然语言理解（ＮＬＵ）应用的方法包括使用多遍处理技术从ＮＬＵ训练文本语料库确定ＮＬＵ解释信息。一遍的改变可自动改变随后一遍的输入。ＮＬＵ解释信息可指定ＮＬＵ训练文本语料库的至少一部分的解释。在数据库中存储ＮＬＵ解释信息，并且可在图形编辑器中表现ＮＬＵ解释信息的所选项目。还在图形编辑器中接收用户指定的编辑。（*该技术在2023年保护过期，可自由使用*）

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及自然语言理解领域，特别涉及一种用于构建自然语言理解应用的集成开发工具。自然语言理解(NLU)系统使计算机能够从人类语音理解和提取信息。该系统可以辅助的方式与其中需要理解人类语音的各种其他计算机应用如语音识别系统一起工作。NLU系统可提取包含在文本内的相关信息，然后将该信息提供给另一个应用程序或系统，以用于诸如预订航班、查找文档或总结文本的目的。目前在本
内，NLU系统采用若干不同技术来从文本串提取信息，其中文本串可以是指一组字符、词或句子。最常用的技术是使用上下文无关语法来解析文本串的语言学方法，其中上下文无关语法在本
内通常使用包括终结符和非终结符的巴克斯-诺尔范式(BNF)来表示。终结符是指不能被进一步分解的词或其他符号，而典型地，非终结符是指语音部分或短语如动词短语或名词短语。因此，NLU的语法方法根据BNF语法寻求解析每个文本串而不使用统计处理。为了构建这样的基于语法的NLU系统，典型地需要语言学家，这可能为应用开发增加了大量的时间和开支。然而，由于预测每个潜在用户请求或对提示的响应上的困难，尤其是在有关电话交谈风格的情况下，NLU应用的质量不能令人满意。显然地，尽管使用语言学家，也可能发生这样的不满意结果。NLU系统用来从文本串提取信息的另一种技术是统计方法，其中在分析文本串中不使用语法。目前，该系统从带注解句子的大语料库中学习含义。带注解句子汇集成文本语料库，其可称作训练语料库。用来开发统计NLU系统和对文本进行注解的工具包括了诸如ASCII文件、传统文本编辑器和键盘宏这样的不同元素。使用这些低效工具，可指定词关...

【技术保护点】
一种开发自然语言理解（ＮＬＵ）应用的方法，包括：使用多遍处理技术从ＮＬＵ训练文本语料库确定ＮＬＵ解释信息，其中一遍的改变自动改变随后一遍的输入，所述ＮＬＵ解释信息指定所述ＮＬＵ训练文本语料库的至少一部分的解释；在数据库（２０５）中存储所述ＮＬＵ解释信息；以及在图形编辑器（３１０）中，表现ＮＬＵ解释信息的所选项目（３３０），并且接收对所述ＮＬＵ解释信息的用户指定编辑。

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员：马克爱德华爱普斯坦，莎伦巴巴拉琼斯，罗伯特托德沃德，
申请(专利权)人：国际商业机器公司，
类型：发明
国别省市：US[美国]

全部详细技术资料下载我是这个专利的主人