对话处理方法、设备及系统技术方案

技术编号:37496024 阅读:22 留言:0更新日期:2023-05-07 09:33
本申请提供一种对话处理方法、设备及系统,该方法中,响应于对话处理请求,从包含半结构化文档内容的文档库中,获取与本次对话内容相关的候选文本,根据候选文本的结构信息以及对话内容,构建动态对话图,对话图包含候选文本、与候选文本相关的邻近文本以及对话内容。通过对对话图进行数据处理,获得对话内容对应的候选回复文本,基于候选回复文本确定目标回复文本,输出目标回复文本。上述方案利用文档库中半结构化文档内容,获取与对话内容相关的候选文本和候选文本的结构化信息,能够更精准地定位当前轮次所需的候选回复文本。通过动态构建对话图,充分利用候选文本和对话内容信息,提升对话处理效率,满足用户实时性的要求。满足用户实时性的要求。满足用户实时性的要求。

【技术实现步骤摘要】
对话处理方法、设备及系统


[0001]本申请涉及人工智能领域,尤其涉及一种对话处理方法、设备及系统。

技术介绍

[0002]对话系统(dialogue system)是一种通过自然语言模仿人与人之间的对话方式,使得用户能够用更自然的方式与机器交流的计算机系统。对话系统在现实生活中应用广泛,例如线上店铺的客服系统、聊天机器人等。
[0003]目前,大多数的对话系统的构建都是基于纯文本形式的文档内容,即以纯文本文档作为对话系统的知识源。然而,在现实环境下,文档通常会包含一定的结构信息,例如,文档中段落之间、段落与标题之间的关系等。现有的对话系统暂无法学习到该类信息。

技术实现思路

[0004]本申请实施例提供一种对话处理方法、设备及系统,通过学习知识文档的结构化信息,能够更加精准地为用户输出回复文本。
[0005]本申请实施例的第一方面提供一种对话处理方法,该方法可应用于云侧设备或终端设备,终端设备可以是例如智能机器人。该方法,包括:
[0006]接收对话处理请求,所述对话处理请求包括当前轮次用户输入的对话内容;
[0007]响应于所述对话处理请求,从文档库中获取与所述对话内容的相似度大于预设阈值的候选文本;所述文档库包括半结构化的文档内容;
[0008]根据所述候选文本的结构信息以及所述对话内容,构建包含所述候选文本与所述对话内容的对话图;
[0009]通过对所述对话图进行数据处理,获得所述对话内容对应的候选回复文本;
[0010]基于所述候选回复文本确定目标回复文本;
[0011]输出对话处理响应,所述对话处理响应包括所述目标回复文本。
[0012]本申请第一方面的一个可选实施例中,所述从文档库中获取与所述对话内容的相似度大于预设阈值的候选文本,包括:
[0013]获取所述对话内容对应的对话表示以及所述文档库中第一文本对应的文本表示;所述第一文本为所述文档库中的任一文本;
[0014]确定所述对话表示与所述文档库中第一文本对应的文本表示的相似度;
[0015]确定与所述对话表示的相似度大于所述预设阈值的目标文本表示;
[0016]获取所述目标文本表示对应的所述候选文本。
[0017]本申请第一方面的一个可选实施例中,所述获取所述对话内容对应的对话表示以及所述文档库中第一文本对应的文本表示,包括:
[0018]将所述对话内容输入预训练模型,得到所述对话内容对应的对话表示;
[0019]从数据库获取预存的所述文档库中第一文本对应的文本表示,所述第一文本对应的文本表示是所述预训练模型基于所述第一文本生成的。
[0020]本申请第一方面的一个可选实施例中,所述候选文本的结构信息包括邻近文本信息,以及如下信息的至少一项:标题信息、段落信息、序号信息、表格信息。
[0021]本申请第一方面的一个可选实施例中,根据所述候选文本的结构信息以及所述对话内容,构建包含所述候选文本与所述对话内容的对话图,包括:
[0022]获取预存的文档图,所述文档图是基于所述文档库中的半结构化的文档内容构建的,所述文档图用于指示所述文档库中文档的结构信息;
[0023]从所述文档图中获取所述候选文本的结构信息;
[0024]根据所述候选文本、所述候选文本的结构信息以及所述对话内容,构建所述对话图。
[0025]本申请第一方面的一个可选实施例中,根据所述候选文本、所述候选文本的结构信息以及所述对话内容,构建所述对话图,包括:
[0026]将所述对话内容分别拼接至所述候选文本以及所述候选文本的邻近文本,获得所述对话图。
[0027]本申请第一方面的一个可选实施例中,通过对所述对话图进行数据处理,获得所述对话内容对应的候选回复文本,包括:
[0028]通过预训练模型获取所述对话图的初始特征表示,所述对话图的初始特征表示包括所述对话图中多个文本的文本表示;
[0029]将所述对话图的初始特征表示输入图神经网络模型,得到所述对话图的上下文特征表示;
[0030]将所述对话图的上下文特征表示输入前馈神经网络模型,获得所述对话内容对应的候选回复文本。
[0031]本申请第一方面的一个可选实施例中,所述对话图的上下文特征表示包括所述对话图中多个文本的上下文特征表示;将所述对话图的上下文特征表示输入前馈神经网络模型,获得所述对话内容对应的候选回复文本,包括:
[0032]遍历所述对话图的文本,执行将所述对话图中第二文本的上下文特征表示输入所述前馈神经网络模型,获取所述第二文本的得分信息;所述第二文本为所述对话图中多个文本的任一个;
[0033]从所述对话图的多个文本中,获取得分大于预设得分的所述候选回复文本;所述候选回复文本包括所述对话图中的至少一个文本。
[0034]本申请第一方面的一个可选实施例中,基于所述候选回复文本确定目标回复文本,包括:
[0035]将所述候选回复文本输入生成模型的编码器,得到所述候选回复文本的文本序列;
[0036]将所述候选回复文本的文本序列输入所述生成模型的解码器,获取所述目标回复文本。
[0037]本申请实施例的第二方面提供一种对话处理方法,包括:
[0038]获取当前轮次用户输入的对话内容;
[0039]从文档库中获取与所述对话内容的相似度大于预设阈值的候选文本;所述文档库包括半结构化的文档内容;
[0040]根据所述候选文本的结构信息以及所述对话内容,构建包含所述候选文本与所述对话内容的对话图;
[0041]通过对所述对话图进行数据处理,确定所述对话内容对应的候选回复文本。
[0042]本申请实施例的第三方面提供一种对话处理设备,包括:接收单元和处理单元。
[0043]接收单元,用于接收对话处理请求,所述对话处理请求包括当前轮次用户输入的对话内容;
[0044]处理单元,用于响应于所述对话处理请求,从文档库中获取与所述对话内容的相似度大于预设阈值的候选文本;根据所述候选文本的结构信息以及所述对话内容,构建包含所述候选文本与所述对话内容的对话图;通过对所述对话图进行数据处理,获得所述对话内容对应的候选回复文本;基于所述候选回复文本确定目标回复文本;其中,所述文档库包括半结构化的文档内容
[0045]发送单元,用于输出对话处理响应,所述对话处理响应包括所述目标回复文本。
[0046]本申请实施例的第四方面提供一种对话处理设备,包括:获取单元和处理单元。
[0047]获取单元,用于获取当前轮次用户输入的对话内容;
[0048]处理单元,用于从文档库中获取与所述对话内容的相似度大于预设阈值的候选文本;所述文档库包括半结构化的文档内容;根据所述候选文本的结构信息以及所述对话内容,构建包含所述候选文本与所述对话内容的对话图;通过对所述对话图进行数据处理,确定所述对话内容对应的候选回复文本。
[004本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种对话处理方法,其特征在于,包括:接收对话处理请求,所述对话处理请求包括当前轮次用户输入的对话内容;响应于所述对话处理请求,从文档库中获取与所述对话内容的相似度大于预设阈值的候选文本;所述文档库包括半结构化的文档内容;根据所述候选文本的结构信息以及所述对话内容,构建包含所述候选文本与所述对话内容的对话图;通过对所述对话图进行数据处理,获得所述对话内容对应的候选回复文本;基于所述候选回复文本确定目标回复文本;输出对话处理响应,所述对话处理响应包括所述目标回复文本。2.根据权利要求1所述的方法,其特征在于,所述从文档库中获取与所述对话内容的相似度大于预设阈值的候选文本,包括:获取所述对话内容对应的对话表示以及所述文档库中第一文本对应的文本表示;所述第一文本为所述文档库中的任一文本;确定所述对话表示与所述文档库中第一文本对应的文本表示的相似度;确定与所述对话表示的相似度大于所述预设阈值的目标文本表示;获取所述目标文本表示对应的所述候选文本。3.根据权利要求2所述的方法,其特征在于,所述获取所述对话内容对应的对话表示以及所述文档库中第一文本对应的文本表示,包括:将所述对话内容输入预训练模型,得到所述对话内容对应的对话表示;从数据库获取预存的所述文档库中第一文本对应的文本表示,所述第一文本对应的文本表示是所述预训练模型基于所述第一文本生成的。4.根据权利要求1至3任一项所述的方法,其特征在于,所述候选文本的结构信息包括邻近文本信息,以及如下信息的至少一项:标题信息、段落信息、序号信息、表格信息。5.根据权利要求1至4任一项所述的方法,其特征在于,根据所述候选文本的结构信息以及所述对话内容,构建包含所述候选文本与所述对话内容的对话图,包括:获取预存的文档图,所述文档图是基于所述文档库中的半结构化的文档内容构建的,所述文档图用于指示所述文档库中文档的结构信息;从所述文档图中获取所述候选文本的结构信息;根据所述候选文本、所述候选文本的结构信息以及所述对话内容,构建所述对话图。6.根据权利要求5所述的方法,其特征在于,根据所述候选文本、所述候选文本的结构信息以及所述对话内容,构建所述对话图,包括:将所述对话内容分别拼接至所述候选文本以及所述候选文本的邻近文本,获得所述对话图。7.根据权利要求1至6任一项所述的方法,其特征在于,通过对所述对话图进行数据处理,获得所述对话内容对应的候选回复文本,包括:通过预训练模型获取所述对话图的初始特征表示,所述对话图的初始特征表示包括所述对话图中多个文本的文本表示;将所述对话图的初始特征表示输入图神经网络模型,得到所述对话图的上下文特征表示;
将所述对话图的上下文特征表示输入前馈神经网络模型,获得所述对话内容对应的候选回复文本。8.根据权利要求7所述的方法,其特征在于,所述对话图的上下文特征表示包括所述对话图中多个文本的上下文特征表示;将所述对话图的上下文特征表示输入前馈神经网络模型,获得所述对话内容对应的候选回...

【专利技术属性】
技术研发人员:傅浩敏张业勤余海洋黄非李永彬
申请(专利权)人:阿里巴巴中国有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1