基于排序的摘要生成训练方法、系统和存储介质技术方案

技术编号：38827472 阅读：27 留言：0更新日期：2023-09-15 20:06

本发明专利技术涉及人工智能技术领域，特别涉及一种基于排序的摘要生成训练方法、系统和存储介质，该基于排序的摘要生成训练方法包括以下步骤：获取训练样本，训练样本包括正样本和负样本，基于正样本和负样本组合构建训练数据；获取打分模型，将训练数据输入打分模型进行训练，使打分模型对正样本和负样本的事实一致性进行打分；获取摘要模型并进行训练，对摘要模型的输出进行采样，得到同一个输入的具有不同生成概率的多个初始摘要，基于打分模型对初始摘要进行打分；基于生成概率和打分后的初始摘要进行排序，根据排序结果计算损失函数，并训练摘要模型，使事实一致性打分更高的初始摘要具有更大的生成概率；通过该方法提高了生成摘要的事实一致性。要的事实一致性。要的事实一致性。

全部详细技术资料下载

【技术实现步骤摘要】
基于排序的摘要生成训练方法、系统和存储介质

[0001]本专利技术涉及人工智能
，其特别涉及一种基于排序的摘要生成训练方法、系统和存储介质。

技术介绍

[0002]随着技术的发展，通过电话、网络文本及第三方软件与客户对话的渠道不断增加，导致网络数据量迅速增长，且与客户沟通后，用户需要对沟通过程进行总结以精准概括沟通内容并形成摘要，便于后续对于数据的使用。
[0003]现有的生成式的文档摘要模型通常采取encoder
‑
decoder架构，由于模型没有对生成摘要内容进行任何约束，生成式摘要模型会有一定概率产生幻觉内容，即生成的内容没有在原文中出现过，或者与现实的知识相违背。
[0004]而为了解决这个问题，现有的方法主要分为三类，第一种是利用输出增强的方式来帮助模型补助文档中的事实一致性信息，这类方法通常需要增加额外的输入，这些输入可以是对原始文档解析的重要的句子、实体及实体之间的关系，但是这种方法需要利用额外的工具，来解析输入文档中的内容，生成摘要的步骤较为繁琐，影响生成效率；第二种是利用针对生成式摘要模型通常以最大似然估计（MLE）作为代价函数，但是这种方法没有考虑到生成内容的事实一致性这一个问题，其需要利用强化学习的方法来引入额外的关于摘要事实一致性的反馈信息才能提升模型的相关性能，训练难度较大，模型不利于收敛，反馈信息的选择也严重影响模型的性能；第三种是通过后处理的方法，训练一个打分函数，能够判断摘要和输入文档之间的蕴含程度，在生成式摘要模型通过集束搜索算法输出的多种不同...

【技术保护点】

【技术特征摘要】
1.一种基于排序的摘要生成训练方法，其特征在于：包括以下步骤：获取训练样本，所述训练样本包括正样本和负样本，基于正样本和负样本组合构建训练数据；获取打分模型，将训练数据输入打分模型进行训练，使打分模型对正样本和负样本的事实一致性进行打分；获取摘要模型并进行训练，对摘要模型的输出进行采样，得到同一个输入的具有不同生成概率的多个初始摘要，基于打分模型对初始摘要进行打分；基于生成概率和打分后的初始摘要进行排序，根据排序结果计算损失函数，并训练摘要模型，使事实一致性打分更高的初始摘要具有更大的生成概率。2.如权利要求1所述的基于排序的摘要生成训练方法，其特征在于：所述正样本包括从现有资料库搜集的人工标注的满足事实一致性的样本数据。3.如权利要求2所述的基于排序的摘要生成训练方法，其特征在于：所述负样本的获取方法具体包括以下步骤：获取源文本，源文本包括源摘要和源正文，基于词表标注模型对源文本进行标记，分别将源正文和源摘要中的实体名词或动词进行标记；基于正样本中的实体名词或动词进行采样，选择至少一处的实体名词或动词；基于标记后的实体名词或动词对选择后的实体名词或动词进行替换生成内容不同、词性相同的样本数据。4.如权利要求1所述的基于排序的摘要生成训练方法，其特征在于：所述打分模型为BERT模型。5.如权利要求4所述的基于排序的摘要生成训练方法，其特征在于：获取打分模型，将训练数据输入打分模型进行训练，使打分模型对正样本和负样本的事实一致性进行打分具体为：训练数据为文档和摘要构造的样本对，将所述样本对进行拼接输入BERT模型，基于BERT模型对样本对进行0
‑
1标记，所述正样本标记为1，所述负样本标记为0。6.如权利要求1所述的基于排序的摘要生成训练方法，其特征在于：获取摘要模型并进行训练...

【专利技术属性】
技术研发人员：马永亮，徐旺，周明，
申请(专利权)人：北京澜舟科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人