助理命令的被动消歧制造技术

技术编号：38999589 阅读：19 留言：0更新日期：2023-10-07 10:31

本文阐述的实施方式涉及一种自动化助理，该自动化助理能够初始化与被预测为响应于用户输入的解释相关联的助理命令的执行，同时提供针对与也被预测为响应于用户输入的替代解释相关联的替代助理命令的建议。建议的替代助理命令能够是可选择的，使得当被选择时，自动化助理能够从执行助理命令转向到初始化所选择的替代助理命令的执行。此外，建议的替代助理命令能够在其任何用户选择之前被部分地履行。因此，本文阐述的实施方式能够使自动化助理能够在被预测为响应于用户输入的助理命令之间快速且有效地转向。之间快速且有效地转向。之间快速且有效地转向。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】助理命令的被动消歧

技术介绍

[0001]人类可以与在本文中被称为“自动化助理”(也被称为“数字代理”、“聊天机器人”、“交互式个人助理”、“智能个人助理”、“助理应用”、“会话代理”等)的交互式软件应用进行人机对话。例如，人类(当他们与自动化助理交互时可以被称为“用户”)可以使用口头自然语言输入(即，话语)和/或通过提供文本(例如，键入的)自然语言输入来向自动化助理提供命令和/或请求，口头自然语言输入在一些情况下可以被转换为文本然后被处理。
[0002]在许多情况下，与自动化助理交互能够产生许多误解包括助理请求和/或命令的模糊用户输入的机会。例如，假设用户提供对可通过多个不同媒体应用可获得的媒体内容(例如，歌曲)的回放的请求。在该示例中，自动化助理可以提供输出(例如，听觉和/或视觉输出)，该输出要求用户选择要用于媒体内容回放的特定应用，而不是自动化助理自动地选择特定应用并响应于该请求立即回放媒体内容。此外，还假设存在具有相同名称的多个媒体内容项，自动化助理可以提供要求用户选择具有相同名称的特定媒体内容项的附加或替代输出(例如，听觉和/或视觉输出)，而不是自动化助理响应于请求选择特定媒体内容并使特定媒体内容在特定应用处回放。结果，自动化助理与用户之间的对话被延长，从而浪费了客户端设备处用于实现自动化助理与用户之间的对话的计算资源并浪费了用户的时间。
[0003]在一些情况下，甚至假设自动化助理确实自动地选择要用于回放媒体内容的特定应用和/或响应于该请求自动地选择特定媒体内容，通常没有有效的机制供用户转向到也可以响应于该请求的替...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种由一个或多个处理器实现的方法，所述方法包括：在计算设备处接收指向自动化助理的用户的口头话语，所述口头话语包括要由所述自动化助理履行的助理命令；基于所述口头话语来生成助理输入数据，所述助理输入数据表征被预测为响应于所述口头话语的多个解释，所述解释中的每个解释包括对应意图、与所述对应意图相关联的一个或多个对应参数以及用于所述一个或多个对应参数中的每个参数的一个或多个对应槽值，并且所述解释中的每个解释包括至少一个唯一对应槽值；基于所述助理输入数据生成度量数据，所述度量数据表征在所述多个解释中的每个解释与包括在所述口头话语中的所述助理命令之间的预测对应程度；基于所述度量数据和所述助理输入数据，使得所述自动化助理自动地初始化与所述多个解释中的第一解释相关联的第一操作的执行，以履行所述口头话语中包括的所述助理命令；以及基于所述度量数据和所述助理输入数据，使得一个或多个可选择建议元素被渲染在所述计算设备的显示界面处，所述一个或多个可选择建议元素中的每一个与所述多个解释中的对应替代解释相关联，以履行所述口头话语中包括的所述助理命令，其中，对所述一个或多个可选择建议元素中的给定可选择建议元素的用户选择使得所述自动化助理初始化与所述给定可选择建议元素相关联的对应替代操作的执行。2.根据权利要求1所述的方法，其中，使得所述自动化助理自动地初始化所述第一操作的执行以履行包括在所述口头话语中的所述助理命令使得第一应用生成特定内容的实例。3.根据权利要求1或权利要求2所述的方法，进一步包括：响应于使得所述自动化助理自动地初始化所述第一操作的执行以履行包括在所述口头话语中的所述助理命令：使得自动语音识别ASR处理或自然语言理解NLU处理偏向于与所述一个或多个可选择建议元素相关联的内容。4.根据前述权利要求中任一项所述的方法，进一步包括：基于所述度量数据和所述助理输入数据，使得所述自动化助理访问应用数据，以促进准备履行与所述一个或多个可选择建议元素相关联的所述对应替代操作。5.根据前述权利要求中任一项所述的方法，进一步包括：基于所述口头话语，确定用于与所述多个解释相关联的所述对应参数中的一个或多个对应参数的所述对应槽值中的一个或多个对应槽值不是由所述用户经由所述口头话语指定的，其中，所述自动化助理推断用于与所述第一解释相关联的所述对应参数中的一个或多个对应参数的特定槽值。6.根据权利要求5所述的方法，进一步包括：基于所述口头话语来推断用于所述对应替代解释中的每一个的替代特定槽值，其中，对所述给定可选择建议元素的所述用户选择使得使用所述替代特定槽值来初始化所述替代操作。7.根据权利要求6所述的方法，其中，所述特定槽值标识用于渲染特定内容的第一应
用，并且其中，所述替代特定槽值标识用于渲染替代特定内容的不同的第二应用。8.根据权利要求6所述的方法，其中，所述特定槽值标识用于渲染特定内容的第一实体引用，并且其中，所述替代特定槽值标识用于渲染替代特定内容的不同的第二实体引用。9.根据前述权利要求中任一项所述的方法，其中，使得所述一个或多个可选择建议元素被渲染在所述计算设备的所述显示界面处包括：在使得所述自动化助理自动地初始化所述第一操作的执行以履行包括在所述口头话语中的所述助理命令之后，使得所述一个或多个可选择建议元素在所述计算设备的所述显示界面处被渲染阈值持续时间。10.一种由一个或多个处理器实现的方法，所述方法包括：在计算设备处接收指向自动化助理的用户的口头话语，所述口头话语包括要由所述自动化助理履行的助理命令；基于所述口头话语生成度量数据，所述度量数据标识第一度量和第二度量，所述第一度量表征第一操作被预测为满足所述助理命令的程度，所述第二度量表征第二操作被预测为满足所述助理命令的另一程度；基于所述第一操作和所述第二操作，生成表征响应于所述口头话语的助理图形用户界面GUI的GUI数据，其中，生成所述GUI数据以标识第一可选择元素和第二可选择元素，以及其中，所述第一可选择元素可被选择以控制所述第一操作的执行，并且所述第二可选择元素可被选择以自动地初始化所述第二操作的执行；响应于接收到所述口头话语，使得所述自动化助理自动地初始化所述第一操作的执行；以及使得所述计算设备的显示界面根据所述GUI数据和所述度量数据来渲染所述助理GUI。11.根据权利要求10所述的方法，其中，在所述助理GUI处，当所述第一操作被预测为满足所述助理命令的程度大于所述第二操作被预测为满足所述助理命令的另一程度时，所述第一可选择元素比所述第二可选择元素更突出地布置。12.根据权利要求10或权利要求11所述的方法，其中，使得所述显示界面根据所述GUI数据和所述度量数据来渲染所述助理GUI包括：使得所述第一可选择元素被布置成与所述第二可选择元素相邻，其中，在所述助理GUI处，当所述第一操作被预测为满足所述助理命令的程度大于所述第二操作被预测为满足所述助理命令的另一程度时，所述第一可选择元素的第一区域大于所述第二可选择元素的...

【专利技术属性】
技术研发人员：布雷特，
申请(专利权)人：谷歌有限责任公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人