基于意图的交互式响应方法及其电子设备技术

技术编号:25718158 阅读:35 留言:0更新日期:2020-09-23 03:02
一种用于由电子设备提供基于意图的交互式语音响应的方法。该方法包括:在通过使用图像传感器获得对象的图像时,通过电子设备接收语音输入;以及基于语音输入生成与对象相关联的交互式语音响应。该方法可以进一步包括:从语音输入确定第一意图和第二意图;以及基于第一意图和第二意图生成对语音输入的交互式语音响应。

【技术实现步骤摘要】
【国外来华专利技术】基于意图的交互式响应方法及其电子设备
本公开涉及提供交互式语音响应,更具体地,涉及用于提供基于意图的交互式语音响应的方法和系统。
技术介绍
交互式语音响应(IVR)系统可以与用户或客户进行交互以收集信息并适当地响应。通常,交互式语音响应系统允许用户呈现任何查询并可以提供预先记录的响应。在现有技术中,一些IVR系统采用语音识别来评估来自用户的查询并适当地响应。尽管现有的IVR系统可以从查询中成功确定用户的意图,但通常取决于用户将意图提供作为查询的一部分。通常,IVR系统只能识别一特定组的术语,因此限制了用户使用这些术语。结果,可能损害客户的体验。需要通过确定用户或客户意图来增强IVR系统。以上信息仅作为背景信息呈现,以帮助读者理解本公开。申请人就上述任何内容是否可作为关于本申请的现有技术应用未做出任何确定,也没有任何断言。
技术实现思路
技术问题本公开的实施例提供了一种用于提供针对用户查询的基于意图的语音响应的方法。本公开的实施例提供了一种将意图与物理对象相关联的方法。本公开的实施例提供了一种获得与意图匹配的语音输出响应的方法。本公开的实施例提供了一种用于基于意图和相关联的物理对象来确定超级意图和子意图的方法。本公开的实施例提供了一种系统,该系统在与意图匹配的语音中提供针对用户查询的响应。技术方案根据本公开的实施例,提供了一种电子设备提供基于意图的交互式语音响应的方法。根据本公开的实施例,提供了一种用于操作电子设备的方法。所述方法可以包括:在利用图像传感器获得对象的图像时,从用户获得语音输入;基于所述语音输入和所述图像,生成与所述对象相关联的响应;以及将所述响应输出给所述用户。根据另一实施例,生成所述响应包括:根据与所述语音输入的相关性来对多个响应进行排名;以及从所述多个响应中选择具有最高相关性排名的响应。根据另一实施例,所述方法可以包括基于从所述电子设备的图像传感器接收的信息来识别所述对象。根据另一实施例,生成所述响应包括:从所述语音输入确定所述用户的至少一个意图;以及基于所述至少一个意图生成所述响应。根据另一实施例,确定所述至少一个意图包括:识别所述对象;基于多个上下文特征来确定所述对象的上下文;基于与所述用户和所述对象相关联的使用历史来确定所述对象的使用特征;基于所述对象的上下文从所述语音输入确定第一意图;以及基于所述使用特征从所述语音输入确定第二意图。根据另一实施例,所述多个上下文特征包括以下项中的至少一项:在提供所述语音输入时来自所述用户的视觉提示、所述电子设备的图像传感器的焦距、所述用户与所述对象之间的距离、或所述用户的对象使用行为。根据另一实施例,所述响应包括听觉响应和视觉表示。根据另一实施例,生成所述响应包括:从多个预存储的语音提示中选择用于提供所述响应的语音提示;以及基于所选的语音提示生成所述响应。根据另一实施例,每个语音提示与多个特征相关联,并且所述多个特征包括与所述对象相关联的专家的经验、专家对所述对象的知识水平、专家的指定或所述用户与专家的交互模式中的至少一个。根据另一实施例,所述方法还可以包括显示关于替代响应的信息;以及响应于所述用户的选择输出所述替代响应。根据另一实施例,可以实现一种电子设备,所述电子设备包括:存储器;以及处理器,所述处理器被配置为:在利用图像传感器获得对象的图像时,经由麦克风从用户获得语音输入;基于所述语音输入和所述图像,生成与所述对象相关联的响应;以及控制显示器或扬声器将所述响应输出给所述用户。根据另一实施例,所述处理器进一步被配置为:根据与所述语音输入的相关性来对多个响应进行排名,并且从所述多个响应中选择具有最高相关性排名的响应。根据另一实施例,所述处理器还被配置为:基于从所述图像传感器接收到的信息来识别所述对象。根据另一实施例,所述处理器进一步被配置为:从所述语音输入确定所述用户的至少一个意图;以及基于所述至少一个意图生成所述响应。根据另一实施例,所述处理器还被配置为通过以下步骤确定所述至少一个意图:识别所述对象;基于多个上下文特征来确定所述对象的上下文;基于与所述用户和所述对象相关联的使用历史来确定所述对象的使用特征;基于所述对象的上下文确定所述语音输入的第一意图;以及基于所述使用特征从所述语音输入确定第二意图。根据另一实施例,所述多个上下文特征包括以下项中的至少一项:在提供所述语音输入时来自所述用户的视觉提示、所述电子设备的所述图像传感器的焦距、所述用户与所述对象之间的距离、或所述用户的对象使用行为。根据另一实施例,所述响应包括听觉响应和视觉表示。根据另一实施例,所述处理器进一步被配置为通过以下步骤生成所述响应:从多个预存储的语音提示中选择用于提供所述响应的语音提示;以及基于所选的语音提示生成所述响应。根据另一实施例,每个语音提示与多个特征相关联,并且所述多个特征包括与所述对象相关联的专家的经验、专家对所述对象的知识水平、专家的指定或所述用户与专家的交互模式中的至少一个。根据另一实施例,所述处理器还被配置为:控制显示器以显示关于替代响应的信息;以及响应于所述用户的选择输出所述替代响应。根据又一个实施例,可以提供一种电子装置,并且所述电子装置可以包括:麦克风;图像传感器;扬声器;存储器;以及处理器,所述处理器被配置为:经由所述麦克风从用户获得语音输入;控制图像传感器获得对象的图像;识别所述图像中的所述对象;基于所述语音输入和所识别的对象,生成语音响应;以及控制所述扬声器将所述响应输出给所述用户。根据又一个实施例,可以提供一种操作电子设备的方法,所述方法包括:在显示屏上显示可购买产品的图像;从用户接收与所述可购买产品有关的语音查询;基于所述语音查询和所述可购买产品,生成对所述语音查询的听觉响应;以及将所述听觉响应输出给所述用户。当结合以下说明书和附图考虑时,将更好地评价和理解本文的实施例的这些和其他方面。然而,应当理解,以下说明书虽然指示了优选实施例及其众多具体细节,但是它们是通过示例而非限制的方式给出的。在不脱离本专利技术的精神的情况下,可以在本文的实施例的范围内做出许多改变和修改,并且本文中的实施例包括所有此类修改。附图说明在附图中示出了示例性实施例,贯穿所有附图,相似的附图标记指示各个附图中的相应部分。通过以下参考附图的描述,将会更好地理解本文的实施例,其中:图1A示出了根据本文公开的实施例的电子设备的各种硬件组件;图1B示出了根据本文公开的实施例的交互式语音响应(IVR)引擎的各种硬件组件;图2是示出根据本文公开的实施例的语音交互方法的流程图;图3是示出根据本文公开的实施例的从语音输入确定意图、超级意图和子意图的流程图;图4是示出根据本文公开的实施例的用于生成对语音输入的语音响应的方法的流程图;图5是示出根据本文公开的实施例的基于意图、超级意图和子意图的本文档来自技高网...

【技术保护点】
1.一种用于操作电子设备的方法,所述方法包括:/n在利用图像传感器捕获对象的图像时,从用户获得语音输入;/n基于所述语音输入和所述图像,生成与所述对象相关联的响应;以及/n将所述响应输出给所述用户。/n

【技术特征摘要】
【国外来华专利技术】20180308 IN 2018410085071.一种用于操作电子设备的方法,所述方法包括:
在利用图像传感器捕获对象的图像时,从用户获得语音输入;
基于所述语音输入和所述图像,生成与所述对象相关联的响应;以及
将所述响应输出给所述用户。


2.根据权利要求1所述的方法,其中,生成所述响应包括:根据与所述语音输入的相关性来对多个响应进行排名;以及从所述多个响应中选择具有最高相关性排名的响应。


3.根据权利要求1所述的方法,所述方法还包括:基于从所述电子设备的所述图像传感器接收到的信息来识别所述对象。


4.根据权利要求1所述的方法,其中,生成所述响应包括:从所述语音输入确定所述用户的至少一个意图;以及基于所述至少一个意图生成所述响应。


5.根据权利要求4所述的方法,其中,确定所述至少一个意图包括:
识别所述对象;
基于多个上下文特征来确定所述对象的上下文;
基于与所述用户和所述对象相关联的使用历史来确定所述对象的使用特征;
基于所述对象的上下文从所述语音输入确定第一意图;以及
基于所述使用特征从所述语音输入确定第二意图。


6.根据权利要求5所述的方法,其中,所述多个上下文特征包括以下项中的至少一项:在提供所述语音输入时来自所述用户的视觉提示、所述电子设备的所述图像传感器的焦距、所述用户与所述对象之间的距离、或所述用户的对象使用行为。


7.根据权利要求1所述的方法,其中,所述响应包括听觉响应和视觉表示。


8.根...

【专利技术属性】
技术研发人员:法尼·阿瓦多斯·雷卡帕利·维拉·文卡塔
申请(专利权)人:三星电子株式会社
类型:发明
国别省市:韩国;KR

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1