语音辅助设备及其方法技术

技术编号:27095066 阅读:17 留言:0更新日期:2021-01-25 18:32
本公开的实施方式涉及语音辅助设备和用于控制语音辅助设备的方法。该语音辅助设备包括接收器,该接收器配置成当以唤醒模式操作时接收来自用户的至少一个语音输入。意图与来自至少一个用户的至少一个语音输入相关联。此外,基于意图、历史数据和一个或多个上下文因素中的至少一个来确定来自至少一个用户的后续语音输入的发出的概率。当概率大于预定阈值时,估计语音辅助设备的延长唤醒持续时间。此外,将唤醒模式的持续时间延长延长唤醒持续时间以接收来自至少一个用户的后续语音输入。间以接收来自至少一个用户的后续语音输入。间以接收来自至少一个用户的后续语音输入。

【技术实现步骤摘要】
【国外来华专利技术】语音辅助设备及其方法


[0001]本申请主题总体涉及数字辅助系统,更具体地,但不排他地涉及用于控制语音辅助设备的装置和方法。

技术介绍

[0002]语音辅助设备为使用语音识别、语音合成与自然语言处理(NLP)以通过特定应用程序提供服务的数字辅助。使用与语音辅助设备相关联的触发字来触发语音辅助设备从休眠模式切换至唤醒模式。用户可通过首先说出触发字、随后说出请求来向语音辅助设备提出请求。
[0003]在与语音辅助设备进行对话期间,尤其是正在与语音辅助设备进行对话时,用户可能必须反复地保持说出触发字以将语音辅助设备保持在唤醒模式中。通过此方法,可由语音辅助设备维护对话的上下文,并且随后的请求可由语音辅助设备容易地解释以用于准确的响应。在用户忘记在对话期间使用触发字的情况下,语音辅助设备可切换至休眠模式。在这种情况下,来自用户的进一步请求可能被语音辅助设备错过。可能必须再次说出触发字来启动新的对话链,新的对话链对于语音辅助设备将为新的上下文。
[0004]在本公开部分的该
技术介绍
中公开的信息仅用于对本专利技术的总体
技术介绍
的理解的增强,而不应被理解为对本领域技术人员已知的现有技术的承认或任何形式的建议。

技术实现思路

[0005][技术问题][0006]语音辅助设备中的一些设备可配置成以追踪模式操作。在这些语音辅助设备中,在唤醒模式期间以及当从用户接收到请求时,语音辅助设备可配置成提供响应并切换至追踪模式。在追踪模式中,语音辅助设备配置成在预定持续时间内保持在唤醒模式中。用户需要在预定持续时间的范围内提供进一步请求。如果在跟踪模式期间没有从用户接收到请求,则语音辅助设备可切换至休眠模式。通常,预定持续时间是静态的,并且可为非常短的时间段。在用户在预定持续时间之后提供进一步请求的情况下,则这种请求可能不被语音辅助设备接收。此外,存在这种跟踪模式的静态时间段,用户可能会为在静态时间段内准备好要传达的进一步请求感到负担。在一些情况下,当提供请求时,用户可能不知道语音辅助设备是否在追踪模式中操作。并且,请求可能必须在预定持续时间结束之前被很好地传达。
[0007][问题的解决方案][0008]在实施方式中,本公开涉及语音辅助设备的方法。首先,在语音辅助设备的唤醒模式期间接收来自至少一个用户的至少一个语音输入,并且识别与至少一个语音输入相关联的意图。基于意图、历史数据和一个或多个上下文因素中的至少一个来确定来自至少一个用户的后续语音输入的概率。当概率大于预定阈值时,估计语音辅助设备的延长唤醒持续时间。另外,将语音辅助设备的唤醒模式的持续时间延长延长唤醒持续时间,以接收来自至少一个用户的后续语音输入。
[0009]在实施方式中,本公开涉及语音辅助设备,该语音辅助设备包括配置成当以唤醒模式操作时接收来自至少一个用户的至少一个语音输入的接收器。语音辅助设备还包括处理器和通信地联接至处理器的存储器。存储器存储可由处理器执行的指令,在执行时该指令使处理器识别与通过语音辅助设备来自至少一个用户的至少一个语音输入相关联的意图。此外,处理器配置成基于意图、历史数据和一个或多个上下文因素中的至少一个来确定来自至少一个用户的后续语音输入的发出的概率。当概率大于预定阈值时,估计语音辅助设备的延长唤醒持续时间。此外,将唤醒模式的持续时间延长延长唤醒持续时间,以接收来自至少一个用户的后续语音输入。
[0010]在实施方式中,本公开涉及用于控制语音辅助设备的方法。首先,识别与由语音辅助设备从至少一个用户接收的至少一个语音输入相关联的意图。基于意图、历史数据和一个或多个上下文因素中的至少一个来确定来自至少一个用户的后续语音输入的发出的概率。当概率大于预定阈值时,估计语音辅助设备的延长唤醒持续时间。此外,将语音辅助设备的唤醒模式的持续时间延长延长唤醒持续时间,以接收来自至少一个用户的后续语音输入。
[0011]在实施方式中,本公开涉及用于控制语音辅助设备的控制装置。控制装置与语音辅助设备相关联,并且包括第一处理器和通信地联接至第一处理器的第一存储器。第一存储器存储可由处理器执行的指令,在执行时该指令使第一处理器控制语音辅助装置。首先,识别与由语音辅助设备从至少一个用户接收的至少一个语音输入相关联的意图。基于意图、历史数据和一个或多个上下文因素中的至少一个来确定来自至少一个用户的后续语音输入的发出的概率。当概率大于预定阈值时,估计语音辅助设备的延长唤醒持续时间。此外,将语音辅助设备的唤醒模式的持续时间延长延长唤醒持续时间,以接收来自至少一个用户的后续语音输入。
[0012]在实施方式中,本公开涉及用于确定向语音辅助设备的后续语音输入的发出的概率的方法。首先,为了确定,基于语音输入的意图,从由语音辅助设备接收的至少一个语音输入中的多个字中提取一个或多个关键字。基于一个或多个关键字来识别与至少一个语音输入相关联的域。此外,利用与至少一个用户相关联的多个预存的域为所识别的域计算域匹配分数。基于域匹配分数、历史数据以及与至少一个用户相关联的一个或多个上下文因素来确定向语音辅助设备的后续语音输入的发出的概率。
[0013]在实施方式中,本专利技术涉及用于确定向语音辅助设备的后续语音输入的发出的概率的概率确定装置。概率确定装置与语音辅助设备相关联,并且包括第二处理器和通信地联接至第二处理器的第二存储器。第二存储器存储可由处理器执行的指令,在执行时该指令使第二处理器确定向语音辅助设备的后续语音输入的发出的概率。首先,为了确定,基于语音输入的意图,从由语音辅助设备接收的至少一个语音输入中的多个字中提取一个或多个关键字。基于一个或多个关键字来识别与至少一个语音输入相关联的域。此外,利用与至少一个用户相关联的多个预存的域为所识别的域计算域匹配分数。基于与至少一个用户相关联的域匹配分数、历史数据以及一个或多个上下文因素来确定向语音辅助设备的后续语音输入的发出的概率。
[0014]上述
技术实现思路
仅为说明性的,并不旨在以任何方式进行限制。除了以上描述的说明性方面、实施方式和特征之外,进一步的方面、实施方式和特征将通过参考附图和以下详
细描述变得显而易见。
[0015][专利技术的有益效果][0016]本公开的实施方式配置成通过动态地确定语音辅助设备的唤醒模式的延长持续时间来提供最佳用户体验。
[0017]本公开的实施方式通过考虑与用户相关联的语音输入的意图、历史数据和上下文因素来提供后续语音输入的发出的精确概率。
附图说明
[0018]包括在本公开中并组成本公开的一部分的附图示出示例性实施方式,并且连同说明书一起用于解释所公开的原理。在附图中,参考标号的最左侧数字标识参考标号首次出现在其中的附图。在所有附图中使用相同的标号来表示相似的特征和组件。现在仅通过示例的方式且针对附图来描述根据本申请主题的实施方式的系统和/或方法的一些实施方式,在附图中:
[0019]图1a至图1c示出根据本公开的一些实施方式的语音辅助设备的示例性环境;
[0020]图2示出根据本公开的一些实施方式的用于控制语音辅助设备的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.语音辅助设备的方法,所述方法包括:在所述语音辅助设备的唤醒模式期间通过语音辅助设备接收来自至少一个用户的至少一个语音输入;通过所述语音辅助设备识别与来自所述至少一个用户的所述至少一个语音输入相关联的意图;通过所述语音辅助设备基于所述意图、历史数据与一个或多个上下文因素中的至少一个确定来自所述至少一个用户的后续语音输入的发出的概率;当所述概率大于预定阈值时通过所述语音辅助设备确定所述语音辅助设备的延长唤醒持续时间;以及通过所述语音辅助设备将所述语音辅助设备的所述唤醒模式的持续时间延长所述延长唤醒持续时间以接收来自所述至少一个用户的所述后续语音输入。2.根据权利要求1所述的方法,其中,经由连接至所述语音辅助设备的设备通过分析所述历史数据来确定所述预定阈值。3.根据权利要求1所述的方法,还包括:通过控制装置确定所述概率小于预定阈值;以及通过所述控制装置将所述语音辅助设备配置为以休眠模式操作,直至检测到以所述唤醒模式操作的触发。4.根据权利要求1所述的方法,还包括:如果在所述延长唤醒持续时间期间没有检测到所述后续语音输入,通过控制装置将所述语音辅助设备配置为以休眠模式操作。5.根据权利要求1所述的方法,其中,通过对所述至少一个语音输入执行自然语言理解来识别与所述至少一个语音输入相关联的所述意图。6.根据权利要求1所述的方法,其中,确定所述后续语音输入的发出的所述概率包括:从所述至少一个语音输入中的多个字中提取一个或多个关键字;基于所述一个或多个关键字来识别与所述至少一个语音输入相关联的域;利用与所述用户相关联的多个预存的域为所识别的域计算域匹配分数;以及基于所述域匹配分数,确定向所述语音辅助设备的所述后续语音输入的发出的概率。7.根据权利要求6所述的方法,其中,提取所述一个或多个关键字包括:为所述至少一个语音输入的所述多个字中的每个分派权重;以及将所述多个字中权重大于预定权重值的一个或多个关键字识别为所述一个或多个关键字。8.语音辅助设备,包括:接收器,配置成当以唤醒模式操作时接收来自至少一个用户的至少一个语音输入;处理器;以及存储器,通信地联接至所述处理器,其中,所述存储器存储能够由处理器执行...

【专利技术属性】
技术研发人员:维贾亚
申请(专利权)人:三星电子株式会社
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1