对话处理方法、设备及系统技术方案

技术编号：37496024 阅读：22 留言：0更新日期：2023-05-07 09:33

本申请提供一种对话处理方法、设备及系统，该方法中，响应于对话处理请求，从包含半结构化文档内容的文档库中，获取与本次对话内容相关的候选文本，根据候选文本的结构信息以及对话内容，构建动态对话图，对话图包含候选文本、与候选文本相关的邻近文本以及对话内容。通过对对话图进行数据处理，获得对话内容对应的候选回复文本，基于候选回复文本确定目标回复文本，输出目标回复文本。上述方案利用文档库中半结构化文档内容，获取与对话内容相关的候选文本和候选文本的结构化信息，能够更精准地定位当前轮次所需的候选回复文本。通过动态构建对话图，充分利用候选文本和对话内容信息，提升对话处理效率，满足用户实时性的要求。满足用户实时性的要求。满足用户实时性的要求。

全部详细技术资料下载

【技术实现步骤摘要】
对话处理方法、设备及系统

[0001]本申请涉及人工智能领域，尤其涉及一种对话处理方法、设备及系统。

技术介绍

[0002]对话系统(dialogue system)是一种通过自然语言模仿人与人之间的对话方式，使得用户能够用更自然的方式与机器交流的计算机系统。对话系统在现实生活中应用广泛，例如线上店铺的客服系统、聊天机器人等。
[0003]目前，大多数的对话系统的构建都是基于纯文本形式的文档内容，即以纯文本文档作为对话系统的知识源。然而，在现实环境下，文档通常会包含一定的结构信息，例如，文档中段落之间、段落与标题之间的关系等。现有的对话系统暂无法学习到该类信息。

技术实现思路

[0004]本申请实施例提供一种对话处理方法、设备及系统，通过学习知识文档的结构化信息，能够更加精准地为用户输出回复文本。
[0005]本申请实施例的第一方面提供一种对话处理方法，该方法可应用于云侧设备或终端设备，终端设备可以是例如智能机器人。该方法，包括：
[0006]接收对话处理请求，所述对话处理请求包括当前轮次用户输入的对话内容；
[0007]响应于所述对话处理请求，从文档库中获取与所述对话内容的相似度大于预设阈值的候选文本；所述文档库包括半结构化的文档内容；
[0008]根据所述候选文本的结构信息以及所述对话内容，构建包含所述候选文本与所述对话内容的对话图；
[0009]通过对所述对话图进行数据处理，获得所述对话内容对应的候选回复文本；
[0010]基于所述候选回复...

【技术保护点】

【技术特征摘要】
1.一种对话处理方法，其特征在于，包括：接收对话处理请求，所述对话处理请求包括当前轮次用户输入的对话内容；响应于所述对话处理请求，从文档库中获取与所述对话内容的相似度大于预设阈值的候选文本；所述文档库包括半结构化的文档内容；根据所述候选文本的结构信息以及所述对话内容，构建包含所述候选文本与所述对话内容的对话图；通过对所述对话图进行数据处理，获得所述对话内容对应的候选回复文本；基于所述候选回复文本确定目标回复文本；输出对话处理响应，所述对话处理响应包括所述目标回复文本。2.根据权利要求1所述的方法，其特征在于，所述从文档库中获取与所述对话内容的相似度大于预设阈值的候选文本，包括：获取所述对话内容对应的对话表示以及所述文档库中第一文本对应的文本表示；所述第一文本为所述文档库中的任一文本；确定所述对话表示与所述文档库中第一文本对应的文本表示的相似度；确定与所述对话表示的相似度大于所述预设阈值的目标文本表示；获取所述目标文本表示对应的所述候选文本。3.根据权利要求2所述的方法，其特征在于，所述获取所述对话内容对应的对话表示以及所述文档库中第一文本对应的文本表示，包括：将所述对话内容输入预训练模型，得到所述对话内容对应的对话表示；从数据库获取预存的所述文档库中第一文本对应的文本表示，所述第一文本对应的文本表示是所述预训练模型基于所述第一文本生成的。4.根据权利要求1至3任一项所述的方法，其特征在于，所述候选文本的结构信息包括邻近文本信息，以及如下信息的至少一项：标题信息、段落信息、序号信息、表格信息。5.根据权利要求1至4任一项所述的方法，其特征在于，根据所述候选文本的结构信息以及所述对话内容，构建包含所述候选文本与所述对话内容的对话图，包括：获取预存的文档图，所述文档图是基于所述文档库中的半结构化的文档内容构建的，所述文档图用于指示所述文档库中文档的结构信息；从所述文档图中获取所述候选文本的结构信息；根据所述候选文本、所述候选文本的结构信息以及所述对话内容，构建所述对话图。6.根据权利要求5所述的方法，其特征在于，根据所述候选文本、所述候选文本的结构信息以及所述对话内容，构建所述对话图，包括：将所述对话内容分别拼接至所述候选文本以及所述候选文本的邻近文本，获得所述对话图。7.根据权利要求1至6任一项所述的方法，其特征在于，通过对所述对话图进行数据处理，获得所述对话内容对应的候选回复文本，包括：通过预训练模型获取所述对话图的初始特征表示，所述对话图的初始特征表示包括所述对话图中多个文本的文本表示；将所述对话图的初始特征表示输入图神经网络模型，得到所述对话图的上下文特征表示；
将所述对话图的上下文特征表示输入前馈神经网络模型，获得所述对话内容对应的候选回复文本。8.根据权利要求7所述的方法，其特征在于，所述对话图的上下文特征表示包括所述对话图中多个文本的上下文特征表示；将所述对话图的上下文特征表示输入前馈神经网络模型，获得所述对话内容对应的候选回...

【专利技术属性】
技术研发人员：傅浩敏，张业勤，余海洋，黄非，李永彬，
申请(专利权)人：阿里巴巴中国有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人