多轮对话数据增强方法、装置、计算机设备及存储介质制造方法及图纸

技术编号：40916504 阅读：4 留言：0更新日期：2024-04-18 14:43

本发明专利技术公开了多轮对话数据增强方法、装置、计算机设备及存储介质，该方法包括：获取文本语料创建知识点树状结构，对树状结构中的节点进行遍历，以创建知识单链表路径；根据单链表路径中的节点进行问答配对，得到第一问答对；获取种子任务填充至单链表路径中，利用生成式语言模型对单链表路径生成答案，然后将单链表路径中的节点和答案配对得到第二问答对；将第一问答对和第二问答对拼接合并为第三问答对，并转换为问答对向量，以构建数据集对生成式语言模型进行增强训练，得到对话预测模型进行对话预测。本发明专利技术通过数据增强训练得到对话预测模型，并进行对话预测，解决了生成式语言模型在多轮对话任务中，对话预测生成的内容准确程度较低的问题。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及自然语言处理，特别涉及多轮对话数据增强方法、装置、计算机设备及存储介质。

技术介绍

1、数据增强是一种用于增加训练数据量和多样性的技术，旨在改善机器学习模型的性能和泛化能力，通过在原始数据的基础上引入一些变换或扰动，生成新的训练样本，以此增加训练数据的多样性，并模拟现实世界中可能出现的各种情况和变化，减轻过拟合问题，使机器学习模型在面对新数据时具有更强的鲁棒性和适应能力，提高了机器学习模型在真实世界数据上的性能，从而能够更好地泛化和应对不同的情况。数据增强技术可以应用于各种领域的机器学习任务，例如计算机视觉、自然语言处理和语音识别等领域。

2、生成式语言模型是一类能够自动地生成文本或句子的机器学习模型，可以通过概率建模的方法从给定的输入数据中学习语言的概率分布，从而生成符合语法和语义规则的连续文本。生成式语言模型一般需要通过训练得到，并且训练的过程需要对大量文本数据进行学习，以捕捉词语之间的上下文关系和语义信息，同时，生成式语言模型还会根据训练数据中的频率和顺序统计信息，学习词语或字符的分布规律，并利用分布规律生成新的文本。

3、生成式语言模型可以通过所提供的上下文的知识点来对用户问题进行多轮对话，在这过程中，生成式语言模型会接收到包含用户问题和上下文信息的输入，基于上下文信息中提供的知识点来进行知识检索，以获取与用户问题相关的知识。其中，知识检索包括使用检索算法、数据库查询或其他信息检索技术来查找相关的知识资源。同时，生成式语言模型还会将获取到的相关知识与用户问题进行融合，根据上下文提供的

技术实现思路

1、本专利技术实施例提供了一种多轮对话数据增强方法、装置、计算机设备及存储介质，旨在解决生成式语言模型在多轮对话任务中，对话预测生成的内容准确程度较低的问题。

2、第一方面，本专利技术实施例提供了一种多轮对话数据增强方法，包括：

3、获取业务数据库中的知识文本语料，并根据所述知识文本语料创建知识点树状结构，然后对所述知识点树状结构中的知识节点进行遍历，以创建知识单链表路径；

4、根据所述知识单链表路径中的路径节点进行两两问答配对，得到第一问答对，并对所述第一问答对进行格式转换；

5、获取种子任务问题，将所述种子任务问题填充至所述知识单链表路径中，并利用生成式语言模型对填充后的所述知识单链表路径生成答案，然后将填充后的所述知识单链表路径中的路径节点和生成的答案进行两两问答配对，得到第二问答对；

6、将所述第一问答对和第二问答对拼接合并为第三问答对，并通过分词器将所述第三问答对转换为问答对向量，以构建得到微调数据集；

7、通过所述微调数据集对生成式语言模型进行增强训练，以此建立得到对话预测模型；

8、利用所述对话预测模型进行对话预测。

9、第二方面，本专利技术实施例提供了一种多轮对话数据增强的装置，包括：

10、路径创建单元，用于获取业务数据库中的知识文本语料，并根据所述知识文本语料创建知识点树状结构，然后对所述知识点树状结构中的知识节点进行遍历，以创建知识单链表路径；

11、第一问答配对单元，用于根据所述知识单链表路径中的路径节点进行两两问答配对，得到第一问答对，并对所述第一问答对进行格式转换；

12、种子任务获取单元，用于获取种子任务问题，将所述种子任务问题填充至所述知识单链表路径中，并利用生成式语言模型对填充后的所述知识单链表路径生成答案，然后将填充后的所述知识单链表路径中的路径节点和生成的答案进行两两问答配对，得到第二问答对；

13、问答拼接单元，用于将所述第一问答对和第二问答对拼接合并为第三问答对，并通过分词器将所述第三问答对转换为问答对向量，以构建得到微调数据集；

14、增强训练单元，用于通过所述微调数据集对生成式语言模型进行增强训练，以此建立得到对话预测模型；

15、对话预测单元，用于利用所述对话预测模型进行对话预测。

16、第三方面，本专利技术实施例提供了一种计算机设备，包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现如第一方面所述的多轮对话数据增强方法。

17、第四方面，本专利技术实施例提供了一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机程序，所述计算机程序被处理器执行时实现如第一方面所述的多轮对话数据增强方法。

18、本专利技术实施例公开了一种多轮对话数据增强方法、装置及相关介质。本专利技术实施例首先通过知识文本语料创建知识点树状结构，并对知识点树状结构中的知识节点进行遍历，从而创建知识单链表路径，其次根据所述知识单链表路径中的路径节点进行两两问答配对，得到第一问答对，再次将种子任务问题填充至知识单链表路径中，并利用生成式语言模型生成答案，然后将知识单链表路径中的路径节点和生成的答案进行两两问答配对得到第二问答对，然后将第一问答对和第二问答对拼接合并为第三问答对，并构建得到微调数据集对生成式语言模型进行增强训练，从而得到对话预测模型，最后利用对话预测模型进行对话预测。本专利技术实施例通过将树状结构转换为知识单链表路径的形式，使得对话预测模型能够更准确地匹配上下文知识点，提升了对于多轮对话任务中知识点的理解能力，再结合问答对的拼接合并，使对话预测模型能够更好地理解和回答问题，并通过微调数据集进行增强训练，提高了对话预测模型的鲁棒性和适应能力，从而提高了对话预测生成的回答准确程度，解决了生成式语言模型在多轮对话任务中，对话预测生成的内容准确程度较低的问题。

本文档来自技高网...

【技术保护点】

1.一种多轮对话数据增强方法，其特征在于，包括：

2.根据权利要求1所述的多轮对话数据增强方法，其特征在于，所述获取业务数据库中的知识文本语料，并根据所述知识文本语料创建知识点树状结构，然后对所述知识点树状结构中的知识节点进行遍历，以创建知识单链表路径，包括：

3.根据权利要求1所述的多轮对话数据增强方法，其特征在于，所述根据所述知识单链表路径中的路径节点进行两两问答配对，得到第一问答对，包括：

4.根据权利要求2所述的多轮对话数据增强方法，其特征在于，所述对所述第一问答对进行格式转换，包括：

5.根据权利要求2所述的多轮对话数据增强方法，其特征在于，所述获取种子任务问题，将所述种子任务问题填充至所述知识单链表路径中，并利用生成式语言模型对填充后的所述知识单链表路径生成答案，然后将填充后的所述知识单链表路径中的路径节点和生成的答案进行两两问答配对，得到第二问答对，包括：

6.根据权利要求1所述的多轮对话数据增强方法，其特征在于，所述将所述第一问答对和第二问答对拼接合并为第三问答对，并通过分词器将所述第三问答对转换为问答对

7.根据权利要求6所述的多轮对话数据增强方法，其特征在于，所述通过所述微调数据集对生成式语言模型进行增强训练，以此建立得到对话预测模型，包括：

8.一种多轮对话数据增强装置，其特征在于，包括：

9.一种计算机设备，其特征在于，包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现如权利要求1至7任一项所述的多轮对话数据增强方法。

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储有计算机程序，所述计算机程序被处理器执行时实现如权利要求1至7任一项所述的多轮对话数据增强方法。

...

【技术特征摘要】

1.一种多轮对话数据增强方法，其特征在于，包括：

3.根据权利要求1所述的多轮对话数据增强方法，其特征在于，所述根据所述知识单链表路径中的路径节点进行两两问答配对，得到第一问答对，包括：

4.根据权利要求2所述的多轮对话数据增强方法，其特征在于，所述对所述第一问答对进行格式转换，包括：

5.根据权利要求2所述的多轮对话数据增强方法，其特征在于，所述获取种子任务问题，将所述种子任务问题填充至所述知识单链表路径中，并利用生成式语言模型对填充后的所述知识单链表路径生成答案，然后将填充后的所述知识单链表路径中的路径节点和生成的答案进行两两问答配对，得到第二问...

【专利技术属性】
技术研发人员：黄志远，陈嘉维，苏红梅，郭威远，袁戟，
申请(专利权)人：武汉市万睿数字运营有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人