用于热词/关键词检测的用户中介制造技术

技术编号：36155838 阅读：25 留言：0更新日期：2022-12-31 20:02

本文中描述了用于改善在确定是否要启动(多个)自动化助理功能时使用的(多个)机器学习模型的性能和阈值的技术。一种方法包括：经由客户端设备的一个或多个麦克风接收捕捉用户的口头话语的音频数据；使用机器学习模型处理音频数据以生成预测输出，所述预测输出指示音频数据中存在一个或多个热词的概率；确定所述预测输出满足次级阈值，所述次级阈值指示所述音频数据中存在所述一个或多个热词的程度比初级阈值更低；响应于确定预测输出满足次级阈值，提示用户指示口头话语是否包括热词；从用户接收对提示的响应；以及基于所述响应调整初级阈值。初级阈值。初级阈值。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】用于热词/关键词检测的用户中介

技术介绍

[0001]人类能够使用交互式软件应用参与人机对话，交互式软件应用在这里被称为“自动化助理”(也称为“数字代理”、“交互式个人助理”、“智能个人助理”、“助理应用”、“会话代理”等)。例如，人类(当他们与自动化助理交互时，可以被称为“用户”)可以使用口头自然语言输入(即，话语)向自动化助理提供命令和/或请求，在一些情况下，可以通过提供文本(例如，键入的)自然语言输入，和/或通过触摸和/或(多个)无话语的物理运动(例如，手势、眼睛注视、面部运动等)，将口头自然语言输入转换成文本，然后进行处理。自动化助理通过提供响应用户界面输出(例如，听觉和/或视觉用户界面输出)、控制一个或多个智能设备、和/或控制实现自动化助理的设备的一个或多个功能(例如，控制设备的(多个)其他应用)来响应请求。
[0002]如上所述，许多自动化助理被配置成经由口头话语进行交互。为了保护用户隐私和/或节省资源，自动化助理避免基于经由实现(至少部分实现)自动化助理的客户端设备的(多个)麦克风检测到的音频数据中存在的所有口头话语来执行一个或多个自动化助理功能。相反，基于口头话语的某些处理仅响应于确定某些条件存在而发生。
[0003]例如，包括自动化助理和/或与自动化助理接口连接的许多客户端设备包括热词检测模型。当这种客户端设备的(多个)麦克风未被禁用时，客户端设备能够使用热词检测模型来连续处理经由(多个)麦克风检测到的音频数据，以生成指示是否存在一个或多个热词(包括多词短语)的预测输出，例如“Hey Assistant(嘿助...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种由一个或多个处理器实现的方法，所述方法包括：经由客户端设备的一个或多个麦克风接收捕捉用户的口头话语的音频数据；使用机器学习模型处理所述音频数据以生成预测输出，所述预测输出指示所述音频数据中存在一个或多个热词的概率；确定所述预测输出满足次级阈值，所述次级阈值指示所述音频数据中存在所述一个或多个热词的程度比初级阈值低；响应于确定所述预测输出满足所述次级阈值，提示所述用户指示所述口头话语是否包括热词；从所述用户接收对所述提示的响应；以及基于所述响应调整所述初级阈值。2.根据权利要求1所述的方法，进一步包括响应于所述预测输出满足所述初级阈值，启动自动化助理功能。3.根据权利要求1或权利要求2所述的方法，其中，所述机器学习模型是热词检测模型，并且进一步包括基于所述响应使用联合学习来训练所述热词检测模型。4.根据前述权利要求中的任一项所述的方法，其中：所述预测输出不满足所述初级阈值；所述响应指示所述口头话语包括所述热词；并且基于所述响应调整所述初级阈值包括降低所述初级阈值。5.根据前述权利要求中的任一项所述的方法，其中：所述预测输出满足所述初级阈值；所述响应指示所述口头话语不包括所述热词；并且基于所述响应调整所述初级阈值包括提高所述初级阈值。6.根据前述权利要求中的任一项所述的方法，其中，所述提示进一步响应于确定所述用户先前已经被提示的次数没有超过比率限制。7.根据前述权利要求中的任一项所述的方法，其中，所述提示进一步响应于确定免打扰状态被禁用。8.根据前述权利要求中的任一项所述的方法，其中，所述提示进一步响应于确定所述用户在预定时间段期间没有访问所述客户端设备。9.一种由一个或多个处理器实现的方法，所述方法包括：经由客户端设备的一个或多个麦克风接收捕捉用户的口头话语的音频数据；使用机器学习模型处理所述音频数据以生成预测输出，所述预测输出指示所述音频数据中存在一个或多个热词的概率；确定所述预测输出满足阈值；从所述用户接收所述口头话语不包括热词的指示；以及响应于确定所述预测输出满足所述阈值并且接收到所述口头话语不包括所述热词的指示，调整所述阈值。10.根据权利要求9所述的方法，进一步包括响应于确定所述预测输出满足所述阈值，并且在接收到所述口头话语不包括所述热词的所述指示之前，启动自动化助理功能。
11.根据权利要求9或权利要求10所述的方法，其中：所述机器学习模型是热词检测模型，并且所述程序指令进一步能够执行以基于所述口头话语不包括所述热词的所述指示来训练所述热词检测模型。12.根据权利要求9至11中的任一项所述的方法，其中，调整所述阈值包括提高所述阈值。13.根据权利要求9至12中的任一项所述的方法，进一步包括：提示所述用户指示所述口头话语是否包括所述热词，其中，接收所述口头话语不包括所述热词的指示作为对所述提示的响应。14.根据权利要求13所述的方法，其中，所述提示是响应于确定...

【专利技术属性】
技术研发人员：亚历克斯，
申请(专利权)人：谷歌有限责任公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人