对话交互方法、装置及系统、电子设备和存储介质制造方法及图纸

技术编号:38368766 阅读:14 留言:0更新日期:2023-08-05 17:33
本公开公开了一种对话交互方法、装置及系统、电子设备和存储介质,涉及计算机技术领域,具体为大数据技术领域。所述方法包括:获获取对话上文信息,所述对话上文信息为用户与对话系统的历史对话记录;将所述对话上文信息输入预先训练好的多阶段对话模型,以依据所述对话上文信息从多个候选对话决策中确定目标对话决策;通过所述多阶段对话模型生成所述目标对话决策的查询信息,并基于所述查询信息获取对话知识,所述对话知识为生成所述对话上文信息的对话回复信息的知识;依据所述对话知识生成所述对话上文信息的所述对话回复信息,以完成对话交互。本公开通过多阶段对话模型实现了跨领域的对话交互,改善了对话体验、降低了优化配置的成本。配置的成本。配置的成本。

【技术实现步骤摘要】
对话交互方法、装置及系统、电子设备和存储介质


[0001]本公开涉及计算机
,具体为大数据
,尤其涉及一种对话交互方法、装置及系统、电子设备和存储介质。

技术介绍

[0002]人机智能对话按照应用的场景不同一般可以分为任务式对话、知识型对话、开放域对话。任务型对话主要支持某类任务的完成,知识型对话主要是支持用户对某些知识的询问,开放域对话主要是闲聊为主,满足用户情感陪伴方面的需要。不同类型的对话在实际应用中往往是同时需要的,不同类型对话的边界也存在一定的模糊。
[0003]相关技术通常通过对话中控联合部署来实现跨类型的对话交互,存在对话效果差,优化配置成本高,交互机器感较明显等问题。

技术实现思路

[0004]本公开提供了一种对话交互方法、装置及系统、电子设备和存储介质,主要目的在于解决相关技术通过对话中控联合部署来实现跨类型的对话交互存在的对话效果差,优化配置成本高,交互机器感较明显等问题。
[0005]根据本公开的第一方面,提供了一种对话交互方法,包括:获取对话上文信息,所述对话上文信息为用户与对话系统的历史对话记录;将所述对话上文信息输入预先训练好的多阶段对话模型,以依据所述对话上文信息从多个候选对话决策中确定目标对话决策;通过所述多阶段对话模型生成所述目标对话决策的查询信息,并基于所述查询信息获取对话知识,所述对话知识为生成所述对话上文信息的对话回复信息的知识;依据所述对话知识生成所述对话上文信息的所述对话回复信息,以完成对话交互。
[0006]根据本公开的第二方面,提供了一种多阶段对话模型训练方法,包括:获取多个样本对话信息;依据所述样本对话信息对所述对话决策层进行训练,以通过所述对话决策层从多个候选对话决策中确定目标对话决策;将所述目标对话决策输入所述信息查询层,对所述信息查询层进行训练,以通过所述信息查询层生成所述目标对话决策的查询信息;基于所述查询信息获取对话知识,并将所述对话知识输入所述对话答复层,对所述对话答复层进行训练,以通过所述对话答复层生成对话回复信息。
[0007]根据本公开的第三方面,提供了一种对话交互装置,包括:对话上文获取模块,被配置为执行获取对话上文信息,所述对话上文信息为用户与对话系统的历史对话记录;目标对话决策模块,被配置为执行将所述对话上文信息输入预先训练好的多阶段对话模型,以依据所述对话上文信息从多个候选对话决策中确定目标对话决策;对话知识查询模块,被配置为执行通过所述多阶段对话模型生成所述目标对话决策的查询信息,并基于所述查询信息获取对话知识,所述对话知识为生成所述对话上文信息的对话回复信息的知识;对话回复生成模块,被配置为执行依据所述对话知识生成所述对话上文信息的所述对话回复信息,以完成对话交互。
[0008]根据本公开的第四方面,提供了一种多阶段对话模型训练装置,包括:样本对话信息获取模块,被配置为执行获取多个样本对话信息;对话决策层训练模块,被配置为执行依据所述样本对话信息对所述对话决策层进行训练,以通过所述对话决策层从多个候选对话决策中确定目标对话决策;信息查询层训练模块,被配置为执行将所述目标对话决策输入所述信息查询层,对所述信息查询层进行训练,以通过所述信息查询层生成所述目标对话决策的查询信息;对话答复层查询模块,被配置为执行基于所述查询信息获取对话知识,并将所述对话知识输入所述对话答复层,对所述对话答复层进行训练,以通过所述对话答复层生成对话回复信息。
[0009]根据本公开的第五方面,提供了一种对话交互系统,包括:交互模块,用于接收与用户进行交互的对话上文信息,以及输出通过处理模块生成的对话回复信息;处理模块,包括对话决策单元、信息查询单元及对话答复单元,其中,所述对话决策单元用于依据所述对话上文信息从多个候选对话决策中确定目标对话决策;所述信息查询单元用于生成所述目标对话决策的查询信息,并基于所述查询信息获取对话知识;所述对话答复单元用于依据所述对话知识生成所述对话上文信息的所述对话回复信息;知识仓库层,用于存储所述对话知识。
[0010]根据本公开的第五方面,提供了一种电子设备,包括:
[0011]至少一个处理器;以及
[0012]与所述至少一个处理器通信连接的存储器;其中,
[0013]所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行前述一方面中任一项所述的方法。
[0014]根据本公开的第六方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行前述一方面中任一项所述的方法。
[0015]根据本公开的第七方面,提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现前述一方面中任一项所述的方法。
[0016]在本公开一个或多个实施例中,获取对话上文信息,该对话上文信息为用户与对话系统的历史对话记录;将对话上文信息输入预先训练好的多阶段对话模型,以依据对话上文信息从多个候选对话决策中确定目标对话决策;通过多阶段对话模型生成目标对话决策的查询信息,并基于查询信息获取对话知识;依据对话知识生成对话上文信息的对话回复信息,以完成对话交互。本公开通过预先训练好的多阶段对话模型进行对话交互,实现了跨类型的对话交互,提高了人机对话交互的灵活性,改善了对话效果,降低了优化配置的成本。
[0017]应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0018]附图用于更好地理解本方案,不构成对本公开的限定。其中:
[0019]图1示出本公开实施例提供的相关技术中对话交互方法的示意图;
[0020]图2是根据本公开第一实施例的对话交互方法的流程示意图;
[0021]图3是根据本公开第一实施例的对话交互方法的对话示例的示意图;
[0022]图4是根据本公开第一实施例的对话交互方法的多阶段OnePass并行推理机制的示意图;
[0023]图5是根据本公开第二实施例的对话交互方法的对话示例的示意图;
[0024]图6是根据本公开实施例的多阶段对话模型训练方法的流程示意图;
[0025]图7是根据本公开实施例的多阶段对话模型训练方法的生成样本对话信息的示意图;
[0026]图8是根据本公开实施例的多阶段对话模型训练方法训练得到的多阶段对话模型的示意图;
[0027]图9是用来实现本公开实施例的对话交互装置的结构示意图;
[0028]图10是用来实现本公开实施例的多阶段对话模型训练装置的结构示意图;
[0029]图11是用来实现本公开实施例的电子设备的框图。
具体实施方式
[0030]以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种对话交互方法,其特征在于,包括:获取对话上文信息,所述对话上文信息为用户与对话系统的历史对话记录;将所述对话上文信息输入预先训练好的多阶段对话模型,以依据所述对话上文信息从多个候选对话决策中确定目标对话决策;通过所述多阶段对话模型生成所述目标对话决策的查询信息,并基于所述查询信息获取对话知识,所述对话知识为生成所述对话上文信息的对话回复信息的知识;依据所述对话知识生成所述对话上文信息的所述对话回复信息,以完成对话交互。2.根据权利要求1所述的对话交互方法,其特征在于,所述多阶段对话模型包括对话编码层;所述将所述对话上文信息输入预先训练好的多阶段对话模型,以依据所述对话上文信息从多个候选对话决策中确定目标对话决策,包括:通过所述对话编码层对所述对话上文信息进行编码,生成所述对话上文信息对应的目标对话向量;依据所述目标对话向量从多个候选对话决策中确定目标对话决策。3.根据权利要求2所述的对话交互方法,其特征在于,所述多阶段对话模型包括对话决策层;所述依据所述目标对话向量从多个候选对话决策中确定目标对话决策,包括:通过所述对话决策层确定所述目标对话向量与所述候选对话决策的相似度,并依据所述相似度从所述候选对话决策中确定多个相关对话决策;通过所述对话决策层匹配所述目标对话向量及所述相关对话决策,以从所述相关对话决策中确定所述目标对话决策。4.根据权利要求3所述的对话交互方法,其特征在于,所述多阶段对话模型包括信息查询层;所述通过所述多阶段对话模型生成所述目标对话决策的查询信息,并基于所述查询信息获取对话知识,包括:在所述信息查询层依据所述目标对话决策的类型生成对应的所述查询信息,并基于所述查询信息在对应的知识库中获取所述对话知识。5.根据权利要求4所述的对话交互方法,其特征在于,所述目标对话决策为数据库查询;所述在所述信息查询层依据所述目标对话决策的类型生成对应的所述查询信息,并基于所述查询信息在对应的知识库中获取所述对话知识,包括:通过所述信息查询层生成数据库的查询语句,并在所述数据库中查询所述对话知识。6.根据权利要求4所述的对话交互方法,其特征在于,所述目标对话决策为调用接口查询;所述在所述信息查询层依据所述目标对话决策的类型生成对应的所述查询信息,并基于所述查询信息在对应的知识库中获取所述对话知识,包括:通过所述信息查询层生成调用接口的命令语句,并基于所述命令语句获取所述对话知识。7.根据权利要求4所述的对话交互方法,其特征在于,所述多阶段对话模型包括对话答复层;所述依据所述对话知识生成所述对话上文信息的所述对话回复信息,包括:在所述对话决策层依据所述对话上文信息的所述目标对话向量在所述对话知识中确定所述对话答复层的输入知识;在所述对话答复层中依据所述输入知识生成所述对话上文信息的所述对话回复信息。8.根据权利要求1

7任一项所述的对话交互方法,其特征在于,所述多阶段对话模型包
括知识仓库层,所述知识仓库层用于存储所述对话知识。9.一种多阶段对话模型训练方法,其特征在于,所述多阶段对话模型包括对话决策层、信息查询层及对话答复层,所述方法包括:获取多个样本对话信息;依据所述样本对话信息对所述对话决策层进行训练,以通过所述对话决策层从多个候选对话决策中确定目标对话决策;将所述目标对话决策输入所述信息查询层,对所述信息查询层进行训练,以通过所述信息查询层生成所述目标对话决策的查询信息;基于所述查询信息获取对话知识,并将所述对话知识输入所述对话答复层,对所述对话答复层进行训练,以通过所述对话答复层生成对话回复信息。10.根据权利要求9所述的多阶段对话模型训练方法,其特征在于,所述多阶段对话模型包括对话编码层,所述方法还包括:依据所述样本对话信息对所述对话编码层进行训练,以通过所述对话编码层对所述样本对话信息编码,生成所述样本对话信息的目标对话向量。11.根据权利要求9或10任一项所述的多阶段对话模型训练方法,其特征在于,所述获取多个样本对话信息,包括:依据目标任务生成所述样本对话信息,所述目标任务包括生成任务、分类任务及匹配任务中的一项或多项。12.根据权利要求11所述的多阶段对话模型训练方法,其特征在于,所述多阶段对话模型包括知识仓库层,所述知识仓库层用于存储所述对话知识。13.一种对话交互装置,其特征在于,包括:对话上文获取模块,被配置为执行获取对话上文信息,所述对话上文信息为用户与对话系统的历史对话记录;目标对话决策模块,被配置为执行将所述对话上文信息输入预先训练好的多阶段对话模型,以依据所述对话上文信息从多个候选对话决策中确定目标对话决策;对话知识查询模块,被配置为执行通过所述多阶段对话模型生成所述目标对话决策的查询信息,并基于所述查询信息获取对话知识,所述对话知识为生成所述对话上文信息的对话回复信息的知识;对话回复生成模块,被配置为执行依据所述对话知识生成所述对话上文信息的所述对话回复信息,以完成对话交互。14.根据权利要求13所述的对话交互装置,其特征在于,所述多阶段对话模型包括对...

【专利技术属性】
技术研发人员:焦振宇孙叔琦张红阳吴华王海峰
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1