要经由自动助理执行的一系列所请求的动作的协调执行制造技术

技术编号：27308427 阅读：29 留言：0更新日期：2021-02-10 09:26

本文中阐述了用于经由对自动助理的口头话语创建用户所请求的动作的执行顺序的实施方式。所请求的动作的执行顺序可以是基于每个所请求的动作如何能够或被预测影响其他所请求的动作。在一些实施方式中，可以基于机器学习模型的输出来确定一系列动作的执行顺序，所述机器学习模型诸如是根据监督学习而已训练的模型。至少相对于其他可能的执行顺序，可以选择特定的执行顺序来减轻处理、内存和网络资源的浪费。使用表征自动助理的过去执行的交互数据，可以随时间适应某些执行顺序，从而允许自动助理从与一个或多个用户的过去交互中进行学习。行学习。行学习。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】要经由自动助理执行的一系列所请求的动作的协调执行

技术介绍

[0001]人类可以使用本文称为“自动助理”(也称为“数字代理”、“聊天机器人”、“交互式个人助理”、“智能个人助理”、“助理应用”、“会话代理”等)来参与人机对话。例如，人类(当他们与自动助理交互时可以称为“用户”)可以使用在一些情况下可以被转换为文本并且然后进行处理的口头自然语言输入(即，话语)和/或通过提供文本(例如，键入的)自然语言输入来向自动助理提供命令和/或请求。自动助理通过提供响应的用户界面输出来响应请求，该用户界面输出可以包括可听和/或可视的用户界面输出。
[0002]在许多情况下，自动助理可以根据用户在指定所请求的动作时阐述的顺序来排他地执行动作。这能够证明是有问题的，特别是当用户提供包括对要执行的多个不同动作的请求的单个自然语言输入时。例如，用户能够按照用户在讲出请求之前可能尚未充分地考虑的顺序阐述对要执行的一系列动作的请求。结果，可能无意地延迟否则可能被相对较快地执行的某些动作，从而将等待时间和其他计算低效引入到自动助理的某些性能方面中。
[0003]作为一个示例，如果用户请求提供媒体流并执行web搜索，则自动助理可以因此优先考虑提供媒体流，从而延迟web查询的执行—其在许多情况下否则能够被相对较快地执行。如果当正在提供连续媒体回放时用户忘记web查询，则用户可以随后重新发出同一请求，从而在处理重复请求上浪费计算资源。此外，当自动助理排他地依靠用户指示要执行的动作序列的顺序时，可能不顺序地安排诸如下载、缓存和/或渲染数据的某些过程以便以最佳方式执...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种由一个或多个处理器实现的方法，所述方法包括：从用户接收表征口头话语的音频数据，其中，所述口头话语包括对要经由自动助理执行的多个动作的请求，并且在计算设备的自动助理界面处接收所述口头话语；基于表征所述口头话语的所述音频数据，标识由所述用户请求的要经由所述自动助理执行的所述多个动作中的每个动作，其中，对要执行的所述多个动作的请求根据第一动作顺序在所述口头话语中被提出；基于标识所述多个动作中的每个动作，确定所述多个动作中的每个动作的执行特性，其中，当所述多个动作由一个或多个计算设备根据所述第一动作顺序来执行时所述多个动作中的动作的特定执行特性影响所述多个动作的执行的时间方面，并且其中，确定所述多个动作中的每个动作的执行特性包括访问在所述计算设备和/或单独的计算设备处基于所述多个动作中的一个或多个动作的过去执行来生成的数据；基于所述多个动作中的动作的特定执行特性，确定用于执行所述多个动作的第二动作顺序，其中，所述第二动作顺序在由所述一个或多个计算设备执行时使所述一个或多个计算设备展出所述多个动作的执行的不同时间方面；以及基于确定所述第二动作顺序，使所述自动助理根据所述第二动作顺序来初始化所述多个动作中的一个或多个动作的执行。2.根据权利要求1所述的方法，其中，确定第二动作顺序包括：处理来自经训练的神经网络模型的输出数据，所述经训练的神经网络模型已使用表征所述用户与所述自动助理之间的至少一个或多个先前交互的历史交互数据来训练。3.根据权利要求2所述的方法，其中，所述历史交互数据进一步表征涉及先前已与所述自动助理交互以促进使所述自动助理执行各种动作序列的其他用户的多个交互。4.根据权利要求2所述的方法，其中，所述历史交互数据进一步表征由所述用户提供给所述自动助理以便影响先前请求的动作的执行顺序的反馈。5.根据前述权利要求中的任一项所述的方法，其中，所述多个动作中的动作的特定执行特性将该动作表征为对话发起动作，并且其中，将在所述用户与所述自动助理之间发生补充对话会话以便所述用户标识要指配给所述动作的参数的值。6.根据权利要求5所述的方法，其中，根据所述第一动作顺序的所述多个动作的执行的时间方面包括至少所述多个动作中的一个或多个动作的估计执行时间，并且其中，所述方法进一步包括：当根据所述第一动作顺序执行所述多个动作时确定所述补充对话会话被预测延长所述一个或多个动作的估计执行时间。7.根据权利要求5和6中的任一项所述的方法，其中，所述多个动作中的另一动作包括提供连续媒体回放，并且其中，所述第二动作顺序使所述对话发起动作优先于包括提供所述连续媒体回放的其他动作。8.根据权利要求5所述的方法，其中，使所述自动助理根据所述第二动作顺序来初始化所述多个动作中的至少一个动作的执行包括：生成向所述用户提供已根据所述第二动作顺序初始化了所述多个动作中的所述至少一个动作的指示的自然语言输出。
9.一种由一个或者多个处理器实现的方法，所述方法包括：处理表征来自用户的请求自动助理执行多个动作的口头话语的音频数据，其中，所述多个动作由所述用户根据第一动作顺序表征在所述口头话语中；基于处理所述音频数据，确定用于由所述用户请求的所述多个动作中的每个动作的动作分类，其中，所述多个动作中的特定动作的特定动作分类包括根据至少一个参数执行的对话发起动作；确定所述用户是否在所述口头话语中指定了所述至少一个参数的值；以及当在所述口头话语中未指定所述至少一个参数的值时：生成用于所述多个动作的第二动作顺序，其中，所述第二动作顺序使所述对话发起动作基于在所述口头话语中未指定至少一个参数的所述值而相对于所述多个动作中的另一动作具有降低的优先级。10.根据权利要求9所述的方法，进一步包括：当在所述口头话语中指定了所述至少一个参数时：生成用于所述多个动作的第三动作顺序，其中，所述第三动作顺序使所述对话发起动作具有不受所述用户在所述口头话语中指定至少一个参数的值影响的优先级。11.根据权利要求10所述的方法，...

【专利技术属性】
技术研发人员：穆古雷尔，
申请(专利权)人：谷歌有限责任公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人