智能的多轮交互方法及系统技术方案

技术编号:27366838 阅读:25 留言:0更新日期:2021-02-19 13:50
本发明专利技术实施例提供一种智能的多轮交互方法。该方法包括:响应于用户的当前轮的请求语句,从上下文集合中的用户的多条历史语句所对应的多个领域中,选择至少一个能够解析请求语句的领域作为请求语句的响应领域;使用响应领域的解析结果与用户的当前轮的请求语句进行交互。本发明专利技术实施例还提供一种智能的多轮交互系统。本发明专利技术实施例在多轮交互中不需要判断是否是多人交替输入,还是同一用户的多次输入,由后续步骤判断当前的输入应该在哪个领域响应。可以适用于多用户多领域交替交互的场景以及单一用户多领域交替交互的场景。并且让交互更加智能人性化的同时提供了较为准确的交互方式,进一步提高用户的交互体验。进一步提高用户的交互体验。进一步提高用户的交互体验。

【技术实现步骤摘要】
智能的多轮交互方法及系统


[0001]本专利技术涉及语音交互领域,尤其涉及一种智能的多轮交互方法及系统。

技术介绍

[0002]在语音交互的过程中,为了准确的响应用户输入的语音请求,通常会按技能(领域)解析,如果该请求在多个技能中有解析,则根据置信度对多个技能进行优先级排序。根据置信度排序结果选择用于响应的技能。
[0003]有的也会使用解析会话中当前的意图、实体和会话场景,当满足场景切换条件(根据上一轮意图、实体和会话场景判断)时,将所述当前会话场景作为目标会话场景(跳出上一轮的场景)。
[0004]在实现本专利技术过程中,专利技术人发现相关技术中至少存在如下问题:
[0005]现有的这些方法考虑的因素较少,难以应用到复杂的对话当中。
[0006]例如:
[0007][0008]只考虑置信度排序的方法中,未考虑上下文。对第三轮交互的“明天呢”的输入语句在各个领域内解析,无法解析到天气或导航领域,最有可能出现较高置信度的领域是音乐(明天相关的歌曲,或明天的专辑),即出现领域分类错误。在不考虑多轮交互的情况下,可以使用不同技能(领域)对请求语句解析的置信度来判断最合适的响应技能(领域),然而这个方案只可以满足一部分场景,无法应用到复杂的对话场景中。
[0009]只考虑一轮上下文的方法中,未考虑当前会话内所有的上下文。对第3轮交互的“明天呢”的输入语句优先在导航领域解析,而导航领域也无法解析。最终得到和只考虑置信度排序类似的结果。多轮交互的情况下,只考虑上一轮的上下文,虽然可以满足目前部分场景,但未考虑到更复杂的交互场景。比如:车载场景下的多用户对车载语音设备交替交互,或一个用户在不同领域交替交互;电视前多用户交替交互,或一个用户在不同领域交替交互。

技术实现思路

[0010]为了至少解决现有技术中语音交互无法应对复杂的对话场景,不够智能的问题。
[0011]第一方面,本专利技术实施例提供一种智能的多轮交互方法,包括:
[0012]响应于用户的当前轮的请求语句,从上下文集合中的用户的多条历史语句所对应的多个领域中,选择至少一个能够解析所述请求语句的领域作为所述请求语句的响应领域;
[0013]使用所述响应领域的解析结果与所述用户的当前轮的请求语句进行交互。
[0014]第二方面,本专利技术实施例提供一种智能的多轮交互系统,包括:
[0015]响应领域选择程序模块,用于响应于用户的当前轮的请求语句,从上下文集合中的用户的多条历史语句所对应的多个领域中,选择至少一个能够解析所述请求语句的领域作为所述请求语句的响应领域;
[0016]交互程序模块,用于使用所述响应领域的解析结果与所述用户的当前轮的请求语句进行交互。
[0017]第三方面,提供一种电子设备,其包括:至少一个处理器,以及与所述至少一个处理器通信连接的存储器,其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本专利技术任一实施例的智能的多轮交互方法的步骤。
[0018]第四方面,本专利技术实施例提供一种存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现本专利技术任一实施例的智能的多轮交互方法的步骤。
[0019]本专利技术实施例的有益效果在于:多轮交互中不需要判断是否是多人交替输入,还是同一用户的多次输入,由后续步骤判断当前的输入应该在哪个领域响应。可以适用于多用户多领域交替交互的场景以及单一用户多领域交替交互的场景。并且让交互更加智能人性化的同时提供了较为准确的交互方式,进一步提高用户的交互体验。
附图说明
[0020]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0021]图1是本专利技术一实施例提供的一种智能的多轮交互方法的流程图;
[0022]图2是本专利技术一实施例提供的一种智能的多轮交互方法的详细结构流程图;
[0023]图3是本专利技术一实施例提供的一种智能的多轮交互系统的结构示意图。
具体实施方式
[0024]为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0025]如图1所示为本专利技术一实施例提供的一种智能的多轮交互方法的流程图,包括如下步骤:
[0026]S11:响应于用户的当前轮的请求语句,从上下文集合中的用户的多条历史语句所对应的多个领域中,选择至少一个能够解析所述请求语句的领域作为所述请求语句的响应领域;
[0027]S12:使用所述响应领域的解析结果与所述用户的当前轮的请求语句进行交互。
[0028]在本实施方式中,可将本方法配置在电子设备中,来解决更复杂的多轮交互场景。
[0029]例如:在一次多轮交互中,用户发出如下对话。
[0030][0031]此时用户输入当前第五轮对话,
[0032]第五轮
ꢀꢀꢀꢀꢀꢀꢀꢀ
明天呢
[0033]对于步骤S11,用户对电子设备进行请求语句输入,用户可以对电子设备直接进行语音形式的请求输入,也可以使用文本的方式,将文本输入至电子设备中。
[0034]电子设备通过输入模块(对于不同种类的电子设备,模块名称不做限定)获取当前轮的请求语句,电子设备获取到当前轮的请求语句“明天呢”之后,由于是多轮对话,具有上下文集合。作为一种实施方式,在本实施例中,所述用户的多条历史语句所对应的多个领域包括:在多轮交互中从第一轮至所述当前轮的所有历史语句所对应的多个领域。在本实施方式中,如果当前轮是第五轮,那么就在第一轮至第四轮(由于此时第五轮中的语句是当前输入的,还没有确定领域,无法作为参考)确定:第一轮-音乐领域;第二轮-天气领域;第三轮-通话领域;第四轮-导航领域。
[0035]通过上下文集合中的多条历史语句所对应的多个领域(音乐领域、天气领域、通话领域、导航领域),选择出至少一个能够解析“明天呢”的领域。
[0036]例如,“通话领域”和“导航领域”是无法解析“明天呢”这句话,而“音乐领域”和“天气领域”是可以解析“明天呢”这句话。由于人类的思维灵活自由,在日常唠嗑对话时,不仅仅是“一个问题问到底”的模式。也有可能存在,在聊A内容时,突然想到B问题,问完B问题之后,又将话题重新引回A内容,也有可能,在多人与电子设备交互时,甲用户向电子设备的第一轮输入A内容,此时乙用户插嘴,乙用户向电子设备第二轮输入B内容,甲用户再向电子设备的第三轮输入A内容。
[本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种智能的多轮交互方法,包括:响应于用户的当前轮的请求语句,从上下文集合中的用户的多条历史语句所对应的多个领域中,选择至少一个能够解析所述请求语句的领域作为所述请求语句的响应领域;使用所述响应领域的解析结果与所述用户的当前轮的请求语句进行交互。2.根据权利要求1所述的方法,其中,所述用户的多条历史语句所对应的多个领域包括:在多轮交互中从第一轮至所述当前轮的所有历史语句所对应的多个领域。3.根据权利要求1所述的方法,其中,所述选择至少一个能够解析所述请求语句的领域作为所述请求语句的响应领域包括:按照优先级,在所述上下文集合中依次获取所述历史语句对应的领域,对所述当前轮的请求语句进行解析;确定首个能够解析所述当前轮的请求语句的历史语句对应的领域,将这一条历史语句对应的领域确定为所述当前轮的请求语句的响应领域。4.根据权利要求1所述的方法,其中,所述选择至少一个能够解析所述请求语句的领域作为所述请求语句的响应领域还包括:按照优先级,在所述上下文集合中依次获取所述历史语句对应的领域,对所述当前轮的请求语句进行解析;确定预设数量的能够解析所述当前轮的请求语句的响应领域,将所述预设数量的响应领域向用户反馈,以供用户选择。5.根据权利...

【专利技术属性】
技术研发人员:石韡斯朱成亚宋洪博樊帅
申请(专利权)人:苏州思必驰信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1