文本摘要模型的训练方法及装置制造方法及图纸

技术编号：34442228 阅读：27 留言：0更新日期：2022-08-06 16:33

本申请实施例提供了一种文本摘要模型的训练方法及装置，包括：获取训练数据集，训练数据集包括：至少一个标注摘要样本，标注摘要样本关联有至少一个相关文本样本；从标注摘要样本中获取至少一个关键句子，并在与标注摘要样本关联的相关文本样本中，获取与关键句子匹配的相似句子；利用关键句子与相似句子的对应关系训练初始文本摘要模型，获得第一文本摘要模型；利用标注摘要样本与相关文本样本的对应关系训练第一文本摘要模型，获得第二文本摘要模型。本申请采用输入多个相似句子的训练方式，可以较大幅度的降低模型的输入量，从而减少计算量，另外，由于关键句子和相似句子的提取减少了其他冗余内容带来的干扰，因此也提高了整体的训练效率。体的训练效率。体的训练效率。

全部详细技术资料下载

【技术实现步骤摘要】
文本摘要模型的训练方法及装置

[0001]本申请涉及计算机
，特别是涉及一种文本摘要模型的训练方法、文本摘要的获取方法及装置、电子设备、机器可读介质。

技术介绍

[0002]多文本摘要是一种归纳总结多篇文本的核心内容的技术，能够有效提高对文本的处理能力。
[0003]相关技术中，在多文本摘要场景的模型训练过程中，需要构建不同训练文本之间的语义关系图，来帮助模型学习多文本之间摘要的逻辑关系。
[0004]但是，专利技术人经过研究发现，目前的方案中，构建语义关系图需要耗费较多计算资源、时间以及人工标注成本，导致训练效率低下。

技术实现思路

[0005]本申请实施例提供了一种文本摘要模型的训练方法及文本摘要的获取方法，以解决相关技术中训练效率低下的问题。
[0006]相应的，本申请实施例还提供了一种文本摘要模型的训练装置及文本摘要的获取装置、电子设备以及存储介质，用以保证上述方法的实现及应用。
[0007]为了解决上述问题，本申请实施例公开了一种文本摘要模型的训练方法，所述方法包括：
[0008]获取训练数据集，所述训练数据集包括：至少一个标注摘要样本，所述标注摘要样本关联有至少一个相关文本样本；
[0009]从所述标注摘要样本中获取至少一个关键句子，并在与所述标注摘要样本关联的相关文本样本中，获取与所述关键句子匹配的相似句子；
[0010]利用所述关键句子与所述相似句子的对应关系训练初始文本摘要模型，获得第一文本摘要模型；
[0011]...

【技术保护点】

【技术特征摘要】
1.一种文本摘要模型的训练方法，其特征在于，包括：获取训练数据集，所述训练数据集包括：至少一个标注摘要样本，所述标注摘要样本关联有至少一个相关文本样本；从所述标注摘要样本中获取至少一个关键句子，并在与所述标注摘要样本关联的相关文本样本中，获取与所述关键句子匹配的相似句子；利用所述关键句子与所述相似句子的对应关系训练初始文本摘要模型，获得第一文本摘要模型；利用所述标注摘要样本与所述相关文本样本的对应关系训练第一文本摘要模型，获得第二文本摘要模型，所述第二文本摘要模型用于根据至少一个相关文本生成摘要文本。2.根据权利要求1所述的方法，其特征在于，所述利用所述关键句子与所述相似句子的对应关系训练初始文本摘要模型，包括：将所述相似句子拼接后输入初始文本摘要模型，获得初始文本摘要模型输出的第一句子；根据所述关键句子、第一句子和预设的第一损失函数对所述初始文本摘要模型的参数进行训练。3.根据权利要求2所述的方法，其特征在于，所述将所述相似句子拼接后输入初始文本摘要模型，包括：在所述相似句子拼接后的文本总长度小于或等于预设输入长度阈值的情况下，将所述相似句子拼接后输入所述初始文本摘要模型；在所述相似句子拼接后的文本总长度大于所述预设输入长度阈值的情况下，从所述相似句子拼接后的文本中截取获得部分文本，并将所述部分文本输入所述初始文本摘要模型，所述部分文本的文本总长度小于或等于所述预设输入长度阈值。4.根据权利要求1所述的方法，其特征在于，所述从所述标注摘要样本中获取至少一个关键句子，并在与所述标注摘要样本关联的相关文本样本中，获取与所述关键句子匹配的相似句子，包括：从所述标注摘要样本中获取至少一个关键句子；计算所述关键句子与所述相关文本样本中的第二句子之间的文本相似度；按照所述文本相似度的大小对所述第二句子进行排序，并从排序结果中文本相似度最大的一端开始，选取至少一个第二句子作为所述相似句子。5.根据权利要求4所述的方法，其特征在于，还包括：在与所述关键句子关联的相似句子拼接后的文本总长度，大于预设输入长度阈值的情况下，减少选取的第二句子的数量，直至与所述关键句子关联的相似句子拼接后的文本总长度，小于或等于所述预设输入长度阈值。6.根据权利要求1所述的方法，其特征在于，所述相关文本样本具有对应的标注概率值；所述利用所述标注摘要样本与所述相关文本样本的对应关系训练第一文本摘要模型，包括：将所述相关文本样本拼接后输入所述第一文本摘要模型，提取所述相关文本样本中的第三句子；
计算所述相关文本样本中的第三句子属于所述标注摘要样本的第一概率值；根据所述标注概率值、所述第一概率值和预设的第二损失函数对所述第一文本摘要模型...

【专利技术属性】
技术研发人员：张琳涵，陈谦，邓憧，王雯，
申请(专利权)人：阿里巴巴中国有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人