语音动作偏置系统技术方案

技术编号：21737240 阅读：185 留言：0更新日期：2019-07-31 19:41

提供一种由计算机实现的执行语音动作的方法。所述方法包括：接收用于新语音动作的用户发声，用户发声在与用户设备分离并通信地耦合到用户设备的语音动作系统中接收，该用户设备安装有与用于执行语音动作的触发词语相关联的应用；使用该语音动作系统确定该用户发声的多个候选转录；使用该语音动作系统确定多个候选转录中的任一个是否包含一个或多个触发词语；以及基于该确定来偏置语音动作系统，使得语音动作系统偏好与新语音动作相关联的多个候选转录中的一个，其中当语音动作系统从用户设备接收用户发声时，语音动作系统向用户设备发送动作触发，动作触发使应用执行该新语音动作。

Voice Action Bias System

全部详细技术资料下载

【技术实现步骤摘要】
语音动作偏置系统本申请为申请日为2017年5月31日、申请号为201710398592.0的专利技术名称为“语音动作偏置系统”的申请案的分案申请。
本说明书涉及语音动作，并且一种特定实现方式涉及语音动作检测技术。
技术介绍
软件应用中的一个任务是用户在执行特定作业时与之交互的一个或多个活动的收集，其中每个活动是在软件应用中定义的。每个活动是活动类的一个实例，并且总体上集合中的一个或多个活动控制任务的执行的生命周期，使得在任务内执行的多个活动可允许用户执行该作业。在一些实现方式中，命令可与活动或者与活动有关的动作相关联，使得用户对该命令的提交可触发该活动或动作。特定的意图可被发射(fire)以触发活动的开始或动作的执行。从而，为了触发活动的开始或动作的执行，用户必须拥有关于跟用于发射与活动或动作相对应的意图的活动或动作相关联的命令的知识。
技术实现思路
本说明书描述了一种由计算机实现的方法。所述方法包括：接收用于新语音动作的用户发声，用户发声在与用户设备分离并通信地耦合到用户设备的语音动作系统中接收，该用户设备安装有与用于执行语音动作的触发词语相关联的应用；使用该语音动作系统确定该用户发声的多个候选转录；使用该语音动作系统确定多个候选转录中的任一个是否包含一个或多个触发词语；以及基于该确定来偏置语音动作系统，使得语音动作系统偏好与新语音动作相关联的多个候选转录中的一个，其中当语音动作系统从用户设备接收用户发声时，语音动作系统向用户设备发送动作触发，动作触发使应用执行该新语音动作。本说明书还描述了一种系统。该系统包括：一个或多个计算机和存储指令的一个或多个存储设备...

【技术保护点】
1.一种由计算机实现的方法，包括：接收用于新语音动作的用户发声，用户发声在与用户设备分离并通信地耦合到用户设备的语音动作系统中接收，该用户设备安装有与用于执行语音动作的触发词语相关联的应用；使用该语音动作系统确定该用户发声的多个候选转录；使用该语音动作系统确定多个候选转录中的任一个是否包含一个或多个触发词语；以及基于该确定来偏置语音动作系统，使得语音动作系统偏好与新语音动作相关联的多个候选转录中的一个，其中当语音动作系统从用户设备接收用户发声时，语音动作系统向用户设备发送动作触发，动作触发使应用执行该新语音动作。

【技术特征摘要】
2016.08.19 US 15/241,5381.一种由计算机实现的方法，包括：接收用于新语音动作的用户发声，用户发声在与用户设备分离并通信地耦合到用户设备的语音动作系统中接收，该用户设备安装有与用于执行语音动作的触发词语相关联的应用；使用该语音动作系统确定该用户发声的多个候选转录；使用该语音动作系统确定多个候选转录中的任一个是否包含一个或多个触发词语；以及基于该确定来偏置语音动作系统，使得语音动作系统偏好与新语音动作相关联的多个候选转录中的一个，其中当语音动作系统从用户设备接收用户发声时，语音动作系统向用户设备发送动作触发，动作触发使应用执行该新语音动作。2.如权利要求1所述的由计算机实现的方法，其中，偏置语音动作系统以偏好多个候选转录中的一个包括：调整由语音动作系统使用的语言模型以使得使用经调整的语言模型的语音动作系统具有提高的检测到新语音动作的触发词语的可能性。3.如权利要求1所述的由计算机实现的方法，其中，使应用执行该新语音动作包括触发所述应用执行与所述新语音动作相关联的动作。4.如权利要求1所述的由计算机实现的方法，包括：由语音动作系统确定安装在用户设备上的应用与一个或多个其他语音动作兼容；由所述语音动作系统识别用于触发所述应用执行一个或多个其他语音动作的一个或多个触发词语；以及由所述语音动作系统对所述新语音动作和所述一个或多个其他语音动作进行排名，其中所述语音动作系统是至少基于所述排名被偏置的。5.如权利要求4所述的由计算机实现的方法，包括：接收指示所述用户设备的状态或安装在所述用户设备上的所述应用的状态的信息；并且至少基于接收到的指示所述用户设备的状态或安装在所述用户设备上的所述应用的状态的信息对所述新语音动作和所述一个或多个其他语音动作进行排名。6.如权利要求1所述的由计算机实现的方法，其中语音动作系统基于所接收的用户发声生成包括节点和在节点之间的边缘的图形，并且其中使用所生成的图形确定多个候选转录，以及语音动作系统被偏置。7.如权利要求1所述的由计算机实现的方法，其中节点对应于词语之间的连接，其中边缘对应于与来自用户发声的音频数据的一部分对应的候选词语，并且其中节点或边缘或两者与概率相关联，该概率指示所确定的用户发声包括与该节点或边缘相对应的特定词语或词语之间的连接的置信。8.如权利要求7所述的由计算机实现的方法，还包括对确定的多个候选转录进行排名，其中偏置语音动作系统包括改变该排名以偏好与新语音动作关联的候选转录。9.如权利要求7所述的由计算机实现的方法，其中偏置语音动作系统包括基于与合格语音动作相对应的触发词语的存在或缺乏而调整各个候选转录的概率。10.如权利要求9所述的由计算机实现的方法，其中调整概率是针对各个节点或边缘完成的。11.一种系统，包括：一个或多个计算机和存储指令的一个或多个存储设备，所述指令当被所述一个或多个计算...

【专利技术属性】
技术研发人员：王波，S维穆里，BJ詹姆斯，PK古普塔，SB霍夫曼，
申请(专利权)人：谷歌公司，
类型：发明
国别省市：美国,US

全部详细技术资料下载我是这个专利的主人