针对多轮对话的问题识别方法和装置制造方法及图纸

技术编号:24853583 阅读:20 留言:0更新日期:2020-07-10 19:07
本说明书实施例提供一种针对多轮对话的问题识别方法和装置,方法基于预先建立的知识图谱进行问题识别,知识图谱包括多个类型的节点,节点之间通过对应类型的连接边进行连接,方法包括:获取当前多轮对话的当前用户文本;通过要素预测模型输出当前用户文本中包括的第一业务要素和/或第一诉求要素;确定知识图谱中对应于当前用户文本的第一文本节点,对应于第一业务要素的第一业务节点和/或对应于第一诉求要素的第一诉求节点;在知识图谱中,以第一文本节点作为初始的当前节点,搜索下一跳节点,直到搜索到标准问句节点,返回对应的标准问句,作为当前用户文本的问题识别结果。能够使得针对多轮对话的问题识别结果具有可解释性。

【技术实现步骤摘要】
针对多轮对话的问题识别方法和装置
本说明书一个或多个实施例涉及计算机领域,尤其涉及针对多轮对话的问题识别方法和装置。
技术介绍
当前,在智能客服中,由机器与用户进行对话,解答用户问题,由于用户的表达口语化,一轮对话往往无法明确用户诉求,需要机器与用户之间进行多轮对话,针对多轮对话进行问题识别,才能最终明确用户诉求。其中,问题识别是根据用户的问题描述等来识别用户的问题对应的标准问题。标准问题是根据业务整理的一些用户可能问的问题。每个问题有一个问题标识(identity,id)。现有技术中,针对多轮对话的问题识别方法,一般都是将多轮对话中的用户文本输入深度学习模型,通过深度学习模型输出对应于标准问题的分类结果,由于深度学习模型的分类结果不具有可解释性,因此很难理解为什么用户文本会分类到一个标准问题。因此,希望能有改进的方案,能够使得针对多轮对话的问题识别结果具有可解释性。
技术实现思路
本说明书一个或多个实施例描述了一种针对多轮对话的问题识别方法和装置,能够使得针对多轮对话的问题识别结果具有可解释性。第一方面,提供了一种针对多轮对话的问题识别方法,所述方法基于预先建立的知识图谱进行问题识别,所述知识图谱包括多个类型的节点,所述多个类型的节点包括与用户文本对应的文本节点、与业务要素对应的业务节点、与诉求要素对应的诉求节点和与标准问句对应的标准问句节点,所述多个类型的节点之间通过对应类型的连接边进行连接,方法包括:获取当前多轮对话的当前用户文本;将所述当前用户文本输入预先训练的要素预测模型,通过所述要素预测模型输出所述当前用户文本中包括的第一业务要素和/或第一诉求要素;确定所述知识图谱中对应于所述当前用户文本的第一文本节点,对应于所述第一业务要素的第一业务节点和/或对应于所述第一诉求要素的第一诉求节点;至少将所述第一业务节点和/或所述第一诉求节点作为所述第一文本节点的关联节点;在所述知识图谱中,以所述第一文本节点作为初始的当前节点,执行不超过预定次数的迭代,每次迭代包括,根据当前节点确定当前状态,根据所述当前状态从所述当前节点的各关联节点中搜索下一跳节点,并将该下一跳节点更新为当前节点;若所述当前节点的类型为标准问句节点,则停止迭代,返回所述当前节点对应的标准问句,作为所述当前用户文本的问题识别结果。在一种可能的实施方式中,所述确定所述知识图谱中对应于所述当前用户文本的第一文本节点,包括:将所述知识图谱中的已有节点,确定为所述知识图谱中对应于所述当前用户文本的第一文本节点;或者,在所述知识图谱中添加节点,将添加的节点确定为所述知识图谱中对应于所述当前用户文本的第一文本节点。在一种可能的实施方式中,所述方法还包括:若执行所述预定次数的迭代之后,所述当前节点的类型不为标准问句,则将所述当前用户文本的上一轮用户文本对应的节点更新为当前节点,执行所述不超过预定次数的迭代。在一种可能的实施方式中,所述第一文本节点与所述当前节点之间的各节点和连接边构成搜索路径;所述根据当前节点确定当前状态,根据所述当前状态从所述当前节点的各关联节点中搜索下一跳节点,包括:根据所述搜索路径,将所述当前节点开始往回数,指定步数的路径节点的节点嵌入向量和连接边的边嵌入向量组成的集合作为当前状态,根据所述当前节点的各关联节点确定可选动作集合,利用强化学习模型,根据所述当前状态输出所述可选动作集合中的目标动作,将所述目标动作作为所述下一跳节点。进一步地,所述知识图谱中的各节点对应各自的节点嵌入向量;各连接边对应各自的边嵌入向量;各节点嵌入向量和各边嵌入向量通过如下方式确定:将文本节点、业务节点和诉求节点利用预训练的语言表示模型转换成第一初始嵌入向量;将标准问句节点随机初始化转换成第二初始嵌入向量;基于各第一初始嵌入向量和各第二初始嵌入向量,利用知识图谱的结构化信息,得到各节点各自对应的节点嵌入向量,以及各连接边各自对应的边嵌入向量。进一步地,所述强化学习模型包括预测网络,所述利用强化学习模型,根据所述当前状态输出所述可选动作集合中的目标动作,包括:将所述当前状态输入所述预测网络,通过所述预测网络输出所述可选动作集合中的目标动作,所述预测网络基于强化学习的策略梯度算法实现。进一步地,所述强化学习模型还包括判别网络,所述通过所述预测网络输出所述可选动作集合中的目标动作之后,所述方法还包括:将所述当前状态和所述目标动作输入所述判别网络,通过所述判别网络输出本次决策的打分,所述判别网络基于强化学习的Q学习算法实现;若所述目标动作对应标准问句节点,则确定所述当前状态和所述目标动作对应的奖励;根据所述奖励,优化所述判别网络;根据所述打分,优化所述预测网络。进一步地,所述根据所述当前节点的各关联节点确定可选动作集合,包括:通过计算当前节点的各关联节点的权重对各关联节点排序;根据各关联节点的排序,将排序在前预设数目的关联节点组成所述可选动作集合。进一步地,所述确定所述当前状态和所述目标动作对应的奖励,包括:确定从所述第一文本节点到返回的标准问句对应的标准问句节点之间的目标路径;确定所述目标路径中包含的各业务节点与该标准问句节点之间的第一奖励;确定所述目标路径中包含的各诉求节点与该标准问句节点之间的第二奖励;确定所述目标路径中包含的各文本节点与该标准问句节点之间的第三奖励;根据所述第一奖励、所述第二奖励和所述第三奖励,综合确定所述当前状态和所述目标动作对应的奖励。第二方面,提供了一种针对多轮对话的问题识别装置,所述装置基于预先建立的知识图谱进行问题识别,所述知识图谱包括多个类型的节点,所述多个类型的节点包括与用户文本对应的文本节点、与业务要素对应的业务节点、与诉求要素对应的诉求节点和与标准问句对应的标准问句节点,所述多个类型的节点之间通过对应类型的连接边进行连接,装置包括:获取单元,用于获取当前多轮对话的当前用户文本;预测单元,用于将所述获取单元获取的当前用户文本输入预先训练的要素预测模型,通过所述要素预测模型输出所述当前用户文本中包括的第一业务要素和/或第一诉求要素;确定单元,用于确定所述知识图谱中对应于所述获取单元获取的当前用户文本的第一文本节点,对应于所述预测单元输出的第一业务要素的第一业务节点和/或对应于所述预测单元输出的第一诉求要素的第一诉求节点;至少将所述第一业务节点和/或所述第一诉求节点作为所述第一文本节点的关联节点;识别单元,用于在所述知识图谱中,以所述确定单元确定的第一文本节点作为初始的当前节点,执行不超过预定次数的迭代,每次迭代包括,根据当前节点确定当前状态,根据所述当前状态从所述当前节点的各关联节点中搜索下一跳节点,并将该下一跳节点更新为当前节点;若所述当前节点的类型为标准问句节点,则停止迭代,返回所述当前节点对应的标准问句,作为所述当前用户文本的问题识别结果。<本文档来自技高网...

【技术保护点】
1.一种针对多轮对话的问题识别方法,所述方法基于预先建立的知识图谱进行问题识别,所述知识图谱包括多个类型的节点,所述多个类型的节点包括与用户文本对应的文本节点、与业务要素对应的业务节点、与诉求要素对应的诉求节点和与标准问句对应的标准问句节点,所述多个类型的节点之间通过对应类型的连接边进行连接,所述方法包括:/n获取当前多轮对话的当前用户文本;/n将所述当前用户文本输入预先训练的要素预测模型,通过所述要素预测模型输出所述当前用户文本中包括的第一业务要素和/或第一诉求要素;/n确定所述知识图谱中对应于所述当前用户文本的第一文本节点,对应于所述第一业务要素的第一业务节点和/或对应于所述第一诉求要素的第一诉求节点;至少将所述第一业务节点和/或所述第一诉求节点作为所述第一文本节点的关联节点;/n在所述知识图谱中,以所述第一文本节点作为初始的当前节点,执行不超过预定次数的迭代,每次迭代包括,根据当前节点确定当前状态,根据所述当前状态从所述当前节点的各关联节点中搜索下一跳节点,并将该下一跳节点更新为当前节点;若所述当前节点的类型为标准问句节点,则停止迭代,返回所述当前节点对应的标准问句,作为所述当前用户文本的问题识别结果。/n...

【技术特征摘要】
1.一种针对多轮对话的问题识别方法,所述方法基于预先建立的知识图谱进行问题识别,所述知识图谱包括多个类型的节点,所述多个类型的节点包括与用户文本对应的文本节点、与业务要素对应的业务节点、与诉求要素对应的诉求节点和与标准问句对应的标准问句节点,所述多个类型的节点之间通过对应类型的连接边进行连接,所述方法包括:
获取当前多轮对话的当前用户文本;
将所述当前用户文本输入预先训练的要素预测模型,通过所述要素预测模型输出所述当前用户文本中包括的第一业务要素和/或第一诉求要素;
确定所述知识图谱中对应于所述当前用户文本的第一文本节点,对应于所述第一业务要素的第一业务节点和/或对应于所述第一诉求要素的第一诉求节点;至少将所述第一业务节点和/或所述第一诉求节点作为所述第一文本节点的关联节点;
在所述知识图谱中,以所述第一文本节点作为初始的当前节点,执行不超过预定次数的迭代,每次迭代包括,根据当前节点确定当前状态,根据所述当前状态从所述当前节点的各关联节点中搜索下一跳节点,并将该下一跳节点更新为当前节点;若所述当前节点的类型为标准问句节点,则停止迭代,返回所述当前节点对应的标准问句,作为所述当前用户文本的问题识别结果。


2.如权利要求1所述的方法,其中,所述确定所述知识图谱中对应于所述当前用户文本的第一文本节点,包括:
将所述知识图谱中的已有节点,确定为所述知识图谱中对应于所述当前用户文本的第一文本节点;或者,在所述知识图谱中添加节点,将添加的节点确定为所述知识图谱中对应于所述当前用户文本的第一文本节点。


3.如权利要求1所述的方法,其中,所述方法还包括:
若执行所述预定次数的迭代之后,所述当前节点的类型不为标准问句,则将所述当前用户文本的上一轮用户文本对应的节点更新为当前节点,执行所述不超过预定次数的迭代。


4.如权利要求1所述的方法,其中,所述第一文本节点与所述当前节点之间的各节点和连接边构成搜索路径;所述根据当前节点确定当前状态,根据所述当前状态从所述当前节点的各关联节点中搜索下一跳节点,包括:
根据所述搜索路径,将所述当前节点开始往回数,指定步数的路径节点的节点嵌入向量和连接边的边嵌入向量组成的集合作为当前状态,根据所述当前节点的各关联节点确定可选动作集合,利用强化学习模型,根据所述当前状态输出所述可选动作集合中的目标动作,将所述目标动作作为所述下一跳节点。


5.如权利要求4所述的方法,其中,所述知识图谱中的各节点对应各自的节点嵌入向量;各连接边对应各自的边嵌入向量;
各节点嵌入向量和各边嵌入向量通过如下方式确定:
将文本节点、业务节点和诉求节点利用预训练的语言表示模型转换成第一初始嵌入向量;
将标准问句节点随机初始化转换成第二初始嵌入向量;
基于各第一初始嵌入向量和各第二初始嵌入向量,利用知识图谱的结构化信息,得到各节点各自对应的节点嵌入向量,以及各连接边各自对应的边嵌入向量。


6.如权利要求4所述的方法,其中,所述强化学习模型包括预测网络,所述利用强化学习模型,根据所述当前状态输出所述可选动作集合中的目标动作,包括:
将所述当前状态输入所述预测网络,通过所述预测网络输出所述可选动作集合中的目标动作,所述预测网络基于强化学习的策略梯度算法实现。


7.如权利要求6所述的方法,其中,所述强化学习模型还包括判别网络,所述通过所述预测网络输出所述可选动作集合中的目标动作之后,所述方法还包括:
将所述当前状态和所述目标动作输入所述判别网络,通过所述判别网络输出本次决策的打分,所述判别网络基于强化学习的Q学习算法实现;
若所述目标动作对应标准问句节点,则确定所述当前状态和所述目标动作对应的奖励;
根据所述奖励,优化所述判别网络;根据所述打分,优化所述预测网络。


8.如权利要求4所述的方法,其中,所述根据所述当前节点的各关联节点确定可选动作集合,包括:
通过计算当前节点的各关联节点的权重对各关联节点排序;
根据各关联节点的排序,将排序在前预设数目的关联节点组成所述可选动作集合。


9.如权利要求7所述的方法,其中,所述确定所述当前状态和所述目标动作对应的奖励,包括:
确定从所述第一文本节点到返回的标准问句对应的标准问句节点之间的目标路径;
确定所述目标路径中包含的各业务节点与该标准问句节点之间的第一奖励;
确定所述目标路径中包含的各诉求节点与该标准问句节点之间的第二奖励;
确定所述目标路径中包含的各文本节点与该标准问句节点之间的第三奖励;
根据所述第一奖励、所述第二奖励和所述第三奖励,综合确定所述当前状态和所述目标动作对应的奖励。


10.一种针对多轮对话的问题识别装置,所述装置基于预先建立的知识图谱进行问题识别,所述知识图谱包括多个类型的节点,所述多个类型的节点包括与用户文本对应的文本节点、与...

【专利技术属性】
技术研发人员:王雅芳孔心宇张杰
申请(专利权)人:支付宝杭州信息技术有限公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1