可扩展对话系统技术方案

技术编号:39301348 阅读:11 留言:0更新日期:2023-11-12 15:52
本公开的实施例涉及可扩展对话系统。一种系统,允许非工程师管理员在没有编程、机器语言或人工智能系统知识的情况下扩展对话系统的能力。对话系统可以具有知识系统、用户界面和学习模型。用户界面允许非工程师利用由一小组原语和简单语言定义的知识系统来注释用户话语。注释可以包括基于话语和后续动作选择要采取的动作,以及配置关联。随着动作和关联的发生,对话状态不断更新并且提供给用户。基于动作、关联和对话状态生成允许计算各种结果的规则。规则。规则。

【技术实现步骤摘要】
可扩展对话系统
[0001]本申请是国际申请号为PCT/US2018/019556、国际申请日为2018年02月23日、于2019年08月15日进入中国国家阶段、中国国家申请号为201880012230.6、专利技术名称为“可扩展对话系统”的专利技术专利申请的分案申请。
[0002]相关申请的交叉引用
[0003]本申请要求于2017年2月23日提交的题为“Expandable Dialogue Systems”的美国临时专利申请No.62/462,736的优先权权益,其公开内容并入本文。

技术介绍

[0004]现有技术的语音生成系统不能以允许非专家管理员扩展系统能力的方式扩展。相反,现有技术的对话系统的改变和修改需要大量的工程和开发人员资源和时间。例如在世界中执行动作(查询API的动作)的面向目标的对话系统的一般问题是它们受到关于合成和预定义对话模式的约束的限制。合成对于支持来自少数基元的丰富功能非常重要。然而,为了在从弱监督中学习时限制组合爆炸,通常使用受约束的语法。这表示很多含义根本无法表达。所需要的是一种改进的对话系统,其在扩展时不需要像现有技术系统那样的大量工程资源。

技术实现思路

[0005]粗略描述的本技术是允许非工程师管理员在没有编程、机器语言或人工智能系统知识的情况下扩展对话系统的能力的系统。对话系统可以具有知识系统、用户界面和学习模型。用户界面允许非工程师利用由一小组原语和简单语言定义的知识系统来注释用户话语。注释可以包括基于话语和后续动作选择要采取的动作,以及配置关联。随着动作和关联的发生,对话状态不断更新并且提供给用户。基于动作、关联和对话状态生成允许计算各种结果的规则。
[0006]在实施例中,一种方法扩展了对话系统。该方法涉及通过用户界面从用户接收话语,该界面由在计算设备上执行的应用提供。基于话语自动提供可能动作列表。通过界面从用户接收一个或多个动作的选择。通过计算设备上的应用从用户接收输入以完成所选择的一个或多个动作中的至少一个。保持对话状态的表示,其中对话状态包括话语、所选择的一个或多个动作。基于话语、所选择的一个或多个动作和对话状态的表示自动生成规则。
附图说明
[0007]图1是实现对话扩展的系统的框图。
[0008]图2是示例性对话扩展系统的框图。
[0009]图3是示例性知识表示模块的框图。
[0010]图4是示例性学习模型的框图。
[0011]图5是示例性数据收集模型的框图。
[0012]图6是用于扩展对话系统的示例性方法。
[0013]图7是用于接收注释数据的示例性方法。
[0014]图8是用于通过用户界面接收注释数据的示例性方法。
[0015]图9是用于将规则应用于话语的示例性方法。
[0016]图10

图27示出了可扩展对话系统的示例性用户界面。
[0017]图28示出了由图8

25的用户界面生成的一组规则。
[0018]具体实施方式
[0019]本技术提供了一种系统,该系统允许非工程师管理员在没有编程、机器语言或人工智能系统知识的情况下扩展对话系统的能力。对话系统可以具有知识系统、用户界面和学习模型。用户界面允许非工程师利用由一小组原语和简单语言定义的知识系统来注释用户话语。注释可以包括基于话语和后续动作选择要采取的动作,以及配置关联。随着动作和关联的发生,对话状态不断更新并且提供给用户。基于动作、关联和对话状态生成允许计算各种结果的规则。
[0020]本文中描述的可扩展对话系统具有优于现有技术的系统的优点。现有技术的语音生成系统不能以允许非专家管理员扩展系统能力的方式扩展。例如在世界上执行动作(查询API的动作)的面向目标的对话系统的一般问题是它们受到关于合成和预定义对话模式的约束的限制。合成对于支持来自少数基元的丰富功能非常重要。然而,为了在从弱监督中学习时限制组合爆炸,通常使用受约束的语法。这表示很多含义根本无法表达。系统通常不支持的一些示例是“12月的最后一周”或“在比赛开始前至少2小时到达那里”。如果只有开始和结束时间可用,即使像“飞行持续时间”这样的单个单词也需要合成;在这种情况下,需要减法。
[0021]现有的对话系统没有解决问题的能力。如果没有航班,现有技术系统不建议替代方案。如果存在歧义,现有技术系统不要求澄清。现有技术系统不向用户提供重要信息并且处理客户支持。这些模式中的每个通常被编码为现有技术系统中的对话模式并且以代码固定。为了扩展现有技术系统中的任何这些能力,需要工程师花费大量时间来开发代码。存在着不同现象的长尾,因此这种方法无法扩展到现实世界的场景。
[0022]图1是用于提供可以检测域外主题的自动化助理的系统的框图。图1的系统100包括客户端110、移动设备120、计算设备130、网络140、网络服务器150、应用服务器160和数据存储库170。客户端110、移动设备120和计算设备130通过网络140与网络服务器150通信。网络140可以包括专用网络、公共网络、因特网和内联网、WAN、LAN、蜂窝网络或适合于在图1的计算设备之间传输数据的某种其他网络。
[0023]客户端110包括应用112。应用112可以提供自动助理、TTS功能、自动语音识别、解析、域检测和本文中讨论的其他功能。应用112可以实现为一个或多个应用、对象、模块或其他软件。应用112可以通过图1的服务器架构或直接(图1中未示出)与应用服务器160和数据存储库170通信以访问数据。
[0024]移动设备120可以包括移动应用122。移动应用可以提供关于应用112描述的相同功能。移动应用122可以实现为一个或多个应用、对象、模块或其他软件,并且可以操作以结合应用服务器160提供服务。
[0025]计算设备130可以包括网络浏览器132。网络浏览器可以接收一个或多个内容页面、脚本代码和其他代码,这些代码在加载到网络浏览器中时提供关于应用112描述的相同功能。内容页面可以操作以结合应用服务器160提供服务。
[0026]网络服务器150可以经由网络140从应用112、移动应用122和网络浏览器132接收请求和数据。请求可以由特定应用或浏览器应用发起。网络服务器150可以处理请求和数据,传输响应,或者向应用服务器160传输请求和数据或其他内容。
[0027]应用服务器160包括应用162。应用服务器可以接收数据,包括从应用112和122以及浏览器132接收的数据请求,处理数据,以及向网络服务器150传输响应。在一些实现中,网络服务器152转发对最初发送的请求的计算机或应用的响应。应用的服务器160还可以与数据存储库170通信。例如,可以从数据存储库170访问数据以供应用使用以提供关于应用112描述的功能。应用服务器160包括应用162,除了全部或部分地在应用服务器160上实现之外,应用162可以与应用112类似地操作。
[0028]框200包括网络服务器150、应用服务器160和数本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用于训练对话学习模型的方法,包括:经由计算设备的用户界面自动呈现话语和基于所述话语的动作列表;经由所述计算设备的所述用户界面接收从所述动作列表对动作的选择;经由所述计算设备的所述用户界面接收比所述话语的整体小的所述话语的指定范围;以及利用所述动作和所述话语的所述指定范围自动训练所述对话学习模型。2.根据权利要求1所述的方法,其中所述话语是计算机生成的代理话语。3.根据权利要求1所述的方法,其中所述话语是来自用户与自动化助理之间的自然语言对话的用户话语。4.根据权利要求1所述的方法,其中所述话语是经由所述用户界面被接收的用户话语。5.根据权利要求1所述的方法,其中所述动作是用于响应所述话语的多个动作中的一个动作,并且所述话语的所述指定范围是所述话语的多个指定范围中的一个指定范围,每个指定范围与所述多个动作中的动作相对应。6.根据权利要求1所述的方法,其中所述自动训练将所述对话学习模型配置为识别所述动作与所述话语的所述指定范围中的自然语言内容之间的关联。7.根据权利要求6所述的方法,其中所述自然语言内容包括所述话语内的一个或多个令牌。8.根据权利要求6所述的方法,还包括:基于所述动作与所述自然语言内容之间的所述关联来自动生成一个或多个规则。9.根据权利要求8所述的方法,其中所述一个或多个规则包括用于基于所述自然语言内容来识别所述动作是否适用的规则。10.根据权利要求8所述的方法,其中所述一个或多个规则包括用于基于所述自然语言内容来确定所述动作的参数的规则。11.根据权利要求8所述的方法,其中所述一个或多个规则包括用于生成描述所述动作的代理话语的规则。12.根据权利要求8所述的方法,其中所述对话学习模型是语法归纳学习模型,并且所述一个或多个规则是由所述语法归纳学习模型基于所述关联而被导出的语法规则。13.根据权利要求8所述的方...

【专利技术属性】
技术研发人员:P
申请(专利权)人:微软技术许可有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1