本申请实施例提供了一种文本摘要模型的训练方法及装置,包括:获取训练数据集,训练数据集包括:至少一个标注摘要样本,标注摘要样本关联有至少一个相关文本样本;从标注摘要样本中获取至少一个关键句子,并在与标注摘要样本关联的相关文本样本中,获取与关键句子匹配的相似句子;利用关键句子与相似句子的对应关系训练初始文本摘要模型,获得第一文本摘要模型;利用标注摘要样本与相关文本样本的对应关系训练第一文本摘要模型,获得第二文本摘要模型。本申请采用输入多个相似句子的训练方式,可以较大幅度的降低模型的输入量,从而减少计算量,另外,由于关键句子和相似句子的提取减少了其他冗余内容带来的干扰,因此也提高了整体的训练效率。体的训练效率。体的训练效率。
【技术实现步骤摘要】
文本摘要模型的训练方法及装置
[0001]本申请涉及计算机
,特别是涉及一种文本摘要模型的训练方法、文本摘要的获取方法及装置、电子设备、机器可读介质。
技术介绍
[0002]多文本摘要是一种归纳总结多篇文本的核心内容的技术,能够有效提高对文本的处理能力。
[0003]相关技术中,在多文本摘要场景的模型训练过程中,需要构建不同训练文本之间的语义关系图,来帮助模型学习多文本之间摘要的逻辑关系。
[0004]但是,专利技术人经过研究发现,目前的方案中,构建语义关系图需要耗费较多计算资源、时间以及人工标注成本,导致训练效率低下。
技术实现思路
[0005]本申请实施例提供了一种文本摘要模型的训练方法及文本摘要的获取方法,以解决相关技术中训练效率低下的问题。
[0006]相应的,本申请实施例还提供了一种文本摘要模型的训练装置及文本摘要的获取装置、电子设备以及存储介质,用以保证上述方法的实现及应用。
[0007]为了解决上述问题,本申请实施例公开了一种文本摘要模型的训练方法,所述方法包括:
[0008]获取训练数据集,所述训练数据集包括:至少一个标注摘要样本,所述标注摘要样本关联有至少一个相关文本样本;
[0009]从所述标注摘要样本中获取至少一个关键句子,并在与所述标注摘要样本关联的相关文本样本中,获取与所述关键句子匹配的相似句子;
[0010]利用所述关键句子与所述相似句子的对应关系训练初始文本摘要模型,获得第一文本摘要模型;
[0011]利用所述标注摘要样本与所述相关文本样本的对应关系训练第一文本摘要模型,获得第二文本摘要模型,所述第二文本摘要模型用于根据至少一个相关文本生成摘要文本。
[0012]可选的,还包括:
[0013]将至少一个相关文本拼接后输入所述第二文本摘要模型,获得所述第二文本摘要模型输出的摘要文本。
[0014]可选的,在所述训练数据集中,所述标注摘要样本关联的至少一个相关文本样本各自的所属领域不同。
[0015]本申请实施例公开了一种文本摘要的获取方法,包括:
[0016]获取至少一个待处理文本;
[0017]将所述待处理文本输入第二文本摘要模型,获得所述第二文本摘要模型输出的摘
要文本,其中,所述第二文本摘要模型由所述的文本摘要模型的训练方法训练获得。
[0018]本申请实施例公开了一种文本摘要模型的训练装置,所述装置包括:
[0019]第一获取模块,用于获取训练数据集,所述训练数据集包括:至少一个标注摘要样本,所述标注摘要样本关联有至少一个相关文本样本;
[0020]第二获取模块,用于从所述标注摘要样本中获取至少一个关键句子,并在与所述标注摘要样本关联的相关文本样本中,获取与所述关键句子匹配的相似句子;
[0021]第一训练模块,用于利用所述关键句子与所述相似句子的对应关系训练初始文本摘要模型,获得第一文本摘要模型;
[0022]第二训练模块,用于利用所述标注摘要样本与所述相关文本样本的对应关系训练第一文本摘要模型,获得第二文本摘要模型,所述第二文本摘要模型用于根据至少一个相关文本生成摘要文本。
[0023]本申请实施例公开了一种文本摘要的获取装置,所述装置包括:
[0024]第三获取模块,用于获取至少一个待处理文本;
[0025]处理模块,用于将所述待处理文本输入第二文本摘要模型,获得所述第二文本摘要模型输出的摘要文本,其中,所述第二文本摘要模型由所述的文本摘要模型的训练装置训练获得。
[0026]本申请实施例还公开了一种电子设备,包括:处理器;和存储器,其上存储有可执行代码,当所述可执行代码被执行时,使得所述处理器执行如本申请实施例中一个或多个所述的方法。
[0027]本申请实施例还公开了一个或多个机器可读介质,其上存储有可执行代码,当所述可执行代码被执行时,使得处理器执行如本申请实施例中一个或多个所述的方法。
[0028]与相关技术相比,本申请实施例包括以下优点:
[0029]本申请实施例中,通过提取关键句子和相似句子构建数据对进行文本摘要模型的训练,关键句子和相似句子可以反映文本样本的精华内容,关键句子和相似句子的提取降低了文本样本中冗余内容带来的干扰,相较于直接输入多个相关文本样本的训练方式,本申请实施例采用输入多个相似句子的训练方式,可以较大幅度的降低模型的输入量,从而减少计算量,另外,由于关键句子和相似句子的提取减少了其他冗余内容带来的干扰,因此也提高了训练过程的训练精度,提升了整体的训练效率。
附图说明
[0030]图1是本申请实施例的一种系统架构图;
[0031]图2是本申请实施例的一种训练数据处理示意图;
[0032]图3是本申请实施例的一种训练数据关系示意图;
[0033]图4是本申请实施例的一种音视频会议管理场景下文本摘要的实现示意图;
[0034]图5是本申请实施例的一种新闻信息管理场景下文本摘要的实现示意图;
[0035]图6是本申请实施例的一种论文信息管理场景下文本摘要的实现示意图;
[0036]图7是本申请实施例的一种文本摘要模型的训练方法的步骤流程图;
[0037]图8是本申请实施例的一种文本摘要的获取方法的步骤流程图;
[0038]图9是本申请实施例的一种文本摘要模型的训练装置的框图;
[0039]图10是本申请实施例的一种文本摘要的获取装置的框图;
[0040]图11是本申请一实施例提供的装置的结构示意图。
具体实施方式
[0041]为使本申请的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本申请作进一步详细的说明。
[0042]为使本领域技术人员更好地理解本申请,以下对本申请涉及的概念进行说明:
[0043]多文本摘要:一种从多篇不同文本中分别提取信息组建摘要的技术,如,从多篇不同论文中提取信息,将这些提取的信息合并后,可以得到能反映这些论文核心内容的摘要文本。
[0044]单文本摘要:一种从一篇文本中提取信息组建摘要的技术。
[0045]预训练模型:在一个原始特定任务上利用大量数据集预先训练一个模型,后续可以在目标任务上使用该模型,针对目标任务的特性,可以对该模型进行精调,从而达到提高目标任务的执行效果目的,其本质利用了迁移学习的理论。
[0046]本申请实施例的一种实现方式中,文本摘要模型的训练方法可应用于多文本摘要场景下的文本摘要模型的训练过程,具体可以获取由多个标注摘要样本和多个相关文本样本组成的训练数据集,其中,每个标注摘要样本关联有多个不同的相关文本样本,获取了训练数据集后,可以对训练数据集中的数据进行改造,从标注摘要样本中获取多个关键句子,并在与标注摘要样本关联的相关文本样本中,获取与关键句子匹配的相似句子,从而建立由关键句子和对应多个相似句子构建的数据对,最后利用关键句子与相似本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种文本摘要模型的训练方法,其特征在于,包括:获取训练数据集,所述训练数据集包括:至少一个标注摘要样本,所述标注摘要样本关联有至少一个相关文本样本;从所述标注摘要样本中获取至少一个关键句子,并在与所述标注摘要样本关联的相关文本样本中,获取与所述关键句子匹配的相似句子;利用所述关键句子与所述相似句子的对应关系训练初始文本摘要模型,获得第一文本摘要模型;利用所述标注摘要样本与所述相关文本样本的对应关系训练第一文本摘要模型,获得第二文本摘要模型,所述第二文本摘要模型用于根据至少一个相关文本生成摘要文本。2.根据权利要求1所述的方法,其特征在于,所述利用所述关键句子与所述相似句子的对应关系训练初始文本摘要模型,包括:将所述相似句子拼接后输入初始文本摘要模型,获得初始文本摘要模型输出的第一句子;根据所述关键句子、第一句子和预设的第一损失函数对所述初始文本摘要模型的参数进行训练。3.根据权利要求2所述的方法,其特征在于,所述将所述相似句子拼接后输入初始文本摘要模型,包括:在所述相似句子拼接后的文本总长度小于或等于预设输入长度阈值的情况下,将所述相似句子拼接后输入所述初始文本摘要模型;在所述相似句子拼接后的文本总长度大于所述预设输入长度阈值的情况下,从所述相似句子拼接后的文本中截取获得部分文本,并将所述部分文本输入所述初始文本摘要模型,所述部分文本的文本总长度小于或等于所述预设输入长度阈值。4.根据权利要求1所述的方法,其特征在于,所述从所述标注摘要样本中获取至少一个关键句子,并在与所述标注摘要样本关联的相关文本样本中,获取与所述关键句子匹配的相似句子,包括:从所述标注摘要样本中获取至少一个关键句子;计算所述关键句子与所述相关文本样本中的第二句子之间的文本相似度;按照所述文本相似度的大小对所述第二句子进行排序,并从排序结果中文本相似度最大的一端开始,选取至少一个第二句子作为所述相似句子。5.根据权利要求4所述的方法,其特征在于,还包括:在与所述关键句子关联的相似句子拼接后的文本总长度,大于预设输入长度阈值的情况下,减少选取的第二句子的数量,直至与所述关键句子关联的相似句子拼接后的文本总长度,小于或等于所述预设输入长度阈值。6.根据权利要求1所述的方法,其特征在于,所述相关文本样本具有对应的标注概率值;所述利用所述标注摘要样本与所述相关文本样本的对应关系训练第一文本摘要模型,包括:将所述相关文本样本拼接后输入所述第一文本摘要模型,提取所述相关文本样本中的第三句子;
计算所述相关文本样本中的第三句子属于所述标注摘要样本的第一概率值;根据所述标注概率值、所述第一概率值和预设的第二损失函数对所述第一文本摘要模型...
【专利技术属性】
技术研发人员:张琳涵,陈谦,邓憧,王雯,
申请(专利权)人:阿里巴巴中国有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。