当前位置: 首页 > 专利查询>微软公司专利>正文

促进口述自然语言接口的开发制造技术

技术编号:12345073 阅读:133 留言:0更新日期:2015-11-18 17:59
描述了一种用于促进口述自然语言(SNL)接口的开发系统。开发系统从开发者接收种子模板,每个种子模板提供可被用于在终端用户口述时调用功能的命令措辞。开发系统随后使用诸如众包系统和改写系统之类的一个或多个开发资源来提供附加模板。这生成一组扩展的模板。生成系统随后基于所述一组扩展的模板生成一个或多个模型。用户设备可安装该模型以供解读终端用户口述的命令时使用。当用户设备识别命令时,系统可自动调用与该命令相关联的功能。总得来说,开发系统提供了一种易于使用的用于产生SNL接口的工具。

【技术实现步骤摘要】
【国外来华专利技术】【专利说明】促进口述自然语言接口的开发 背景 希望为他或她的应用开发口述自然语言(SNL)接口的开发者当前面临令人生畏 的任务。例如,为了从"草稿"构建SNL接口,开发者可能被预期执行以下复杂的任务:定义 用于与应用交互的命令;选择用于识别这些命令的合适类型的模型;选择合适的示例和特 征以供用于训练这些模型;调试这些模型以提供适当的性能等等。这些任务通常由工程师 和科学家来执行,他们在语言学和计算机科学领域方面具有大量的理论知识和经验。绝大 部分应用开发者可能缺少这样的知识和技能。 确实存在一些用于协助开发者将相对简单的语音识别能力添加到某些应用中的 平台。然而,这些平台有许多限制。例如,一些平台在可被用于与语音识别功能进行交互的 命令上设置了约束。另外或替代地,一些平台对于可使用语音识别功能的应用的类型设置 了限制。上述缺点是作为示例而非限制被引述的。 概述 此处描述了促进口述自然语言(SNL)接口的开发的开发系统。在操作中,开发系 统接收来自开发者的一组种子模板。每个种子模板提供在由终端用户口述时调用程序所执 行的功能时使用的命令措辞。开发系统可随后以在线方式依赖于一个或多个开发资源来提 供一组增加的模板,该组增加的模板与种子模板有关。说明性开发资源包括众包系统和改 写系统。所述一组种子模板和所述一组增加的模板在此处被称为一组扩展的模板。 生成系统随后基于所述一组扩展的模板生成一个或多个模型。不作为限制,模型 可包括统计语言模型(供语音识别引擎使用)和向量空间模型(供意图确定引擎使用)。 在实时操作阶段,用户设备可使用这些模型来解读用户口述的命令,并且调用应用所提供 的对应功能。 总得来说,上述功能使得开发者能够通过简单地经由易于使用且易于理解的工具 接口提供高层级信息来提供SNL接口。开发者不需要拥有理论语言学领域的进阶知识或技 能来使用该功能。 以上描述的功能可以显现在各种类型的系统、组件,方法、计算机可读介质、数据 结构、制品等等中。 提供本概述以便以简化形式介绍一些概念;这些概念将在以下的详细描述中进一 步描述。本
技术实现思路
并不旨在标识所要求保护主题的关键特征或必要特征,也不旨在用于 限制所要求保护主题的范围。 附图简述 图1示出用于开发和使用口述自然语言(SNL)接口的说明性环境。环境包括开发 系统、生成系统、以及由终端用户操作的代表性用户设备。 图2是提供图1的环境的一种操作方式的总览的过程。 图3示出供图1的开发系统使用的说明性开发接口。 图4示出了可以使用图1的开发系统来收集的信息的概要。 图5是提供图1的开发系统的一种操作方式的总览的过程。图6是与图5相比提供图1的开发系统的一种操作方式的更详细描述的过程。在 这一示例中,开发系统依赖于众包系统以及改写系统来提供增加的模板。 图7是描述图1的生成系统的一种操作方式的过程。图8示出了可以使用图1的生成系统来提供的分层语言处理模块的一个实施方 式。图9示出了可被用在图8的功能中的统计语言模块的一个实施方式。 图10示出了图1中所示的代表性终端用户设备的一个实施方式。 图11示出了可被用在图10的用户设备中的语音处理模块的一个实施方式。 图12是示出图10的用户设备的一种操作方式的过程。 图13示出了可以被用来实现前面的附图中所示出的特征的任何方面的说明性计 算功能。 贯穿本公开和各附图,相同的编号参考相同的组件和特征。100系列标号指的是最 初在图1中所找到的特征,200系列的标号指的是最初在图2中找到的特征,300系列的标 号指的是最初在图3中找到的特征,依此类推。 详细描述本专利技术是按如下方式来组织的。章节A提供了用于开发口述自然语言接口的环境 的总览。章节B提供了关于可被用于该环境中的开发系统的更多细节。章节C提供了关于 可被用于该环境中的生成系统的更多细节。章节D提供了关于可被用于该环境中的终端用 户设备的更多细节。而章节E描述了可以被用来实现前面章节中所描述的特征的任何方面 的说明性计算功能。作为预备,一些附图在被不同地称为功能、模块、特征、元素等的一个或多个结构 组件的上下文中描述概念。附图中示出的各组件可以由任何物理和有形的机制(例如,由 软件、硬件(例如芯片实现的逻辑功能)、固件等和/或以上的任意组合)以各种方式来实 现。在一种情况下,附图中所示出的将各种组件分离为不同的单元可以反映在实际实现中 使用对应的不同的物理和有形的组件。替换地或附加地,附图中所示出的任何单个组件都 可以通过多个实际物理组件来实现。另选地或另外地,附图中的任何两个或更多分开组件 的描绘可以反映单个实际物理组件所执行的不同功能。图13(将依次讨论)提供关于附图 中所示的功能的一个说明性物理实现的附加细节。 其他附图以流程图形式描述了概念。以此形式,某些操作被描述为构成以某一顺 序执行的不同的框。这些实现是说明性而非限制性的。此处描述的某些框可被分组在一起 并在单个操作中执行,某些框可被分成多个组件框,并且某些框可以按与此处所示出的不 同的次序来执行(包括以并行方式执行这些框)。流程图中示出的框可以任何方式由任何 物理和有形机制来实现,例如由软件、硬件(如芯片实现的逻辑功能)、固件等,和/或它们 的任何组合来实现。 至于术语,短语"被配置成"包含任何类型的物理和有形的功能可以被构建来执行 已标识的操作的任何方式。功能可以被配置成使用例如软件、硬件(例如,芯片实现的逻辑 功能)、固件等,和/或其任何组合来执行操作。 术语"逻辑"包含用于执行任务的任何物理和有形的功能。例如,流程图中示出的 每一个操作都对应于用于执行该操作的逻辑组件。操作可以使用例如软件、硬件(例如,芯 片实现的逻辑功能)、固件等,和/或其任何组合来执行操作。在由计算系统实现时,逻辑组 件表示作为计算系统的物理部分的、无论如何实现的电子组件。 权利要求中的短语"用于…的装置"(如果被使用)旨在援引35U. S.C. § 112第六 段的规定。除了本特定短语之外,没有其他语言旨在援引该法条的该部分的规定。 下列的解释可以将一个或多个特征标识为"任选(optional)"。这种类型的陈述 不应该被解读为可以被视为可选的特征的穷尽的指示;也就是说,其他特征也可以被视为 可选,虽然在文本中没有明确地标识。最后,术语"示例性"或"说明性"指的是可能多个实 现中的一个实现。 A?环境的概览 图1示出用于开发和使用口述自然语言(SNL)接口的说明性环境102。环境102包 括开发系统104、生成系统106、以及由代表性终端用户设备("用户设备")110提供的SNL 接口 108。作为介绍,开发系统104产生定义SNL接口 108的配置的信息。生成系统106使 用由开发系统104提供的信息来生成一个或多个语音处理模型。(值得注意的是开发系统 104和生成系统106可被统称为开发框架112。)用户设备110应用生成系统106所提供的 模型来配置其SNL接口 108。之后,SNL接口 108可使用该模型来解读终端用户口述的命令 并调用与那些命令相关联的功能。 环境102可使用物理系统的任意组合来实现开发系统104、生成系统106、以及SNL 接口 108。此外,环境102所提供的功能可被提本文档来自技高网
...

【技术保护点】
一种由一个或多个计算机设备实现的用于开发口述自然语言接口的开发框架,包括:一种开发系统,包括:被配置成提供开发接口的开发者接口模块,所述开发者接口模块包括:被配置成接收一组种子模板的逻辑,每个种子模板标识在被口述时调用由程序执行的功能时使用的命令措辞;以及被配置成收集一组增加的模板的逻辑,每个增加的模板标识在调用所述功能时使用的另一命令措辞,所述一组种子模板和所述一组增加的模板形成一组扩展的模板;被配置成与一个或多个开发资源进行交互以提供所述一组增加的模板的资源接口模块;以及用于存储与所述功能相关联的所述一组扩展的模板的数据存储,所述一组扩展的模板被用于训练供用户设备上使用的一个或多个模型,并且所述一个或多个模型被用于解读终端用户所口述的命令。

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:YC·居M·菲力普斯S·韩
申请(专利权)人:微软公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1