【技术实现步骤摘要】
摘要生成模型的训练方法、装置、电子设备及存储介质
[0001]本公开涉及计算机
,具体涉及一种摘要生成模型的训练方法、装置、电子设备及存储介质。
技术介绍
[0002]随着时间的推移,人们在生活和工作中产生了越来越多的文本数据。在一些应用场景下,为了能够了解相关文本数据中的内容,需要花费大量的人力物力阅读这些文本数据,效率低下,并且成本较高。例如,在司法场景下,庭审过程中产生的对话内容均会被记录为文本数据,为了便于相关人员了解庭审过程,在庭审结束后需要对该文本数据进行总结,生成案件相关的事实认定,而据不完全统计,每年的受理案件高达千万件,人工形成上述事实认定效率极低。而其他行业也存在同样的问题,会议结束后进行人工归纳总结耗费较大。因此,如何采用智能的方式对文本数据进行总结,高效地获得文本数据对应的摘要是当前需要解决的技术问题之一。
技术实现思路
[0003]本公开实施例提供一种摘要生成模型的训练方法、装置、电子设备及计算机可读存储介质。
[0004]第一方面,本公开实施例中提供了一种摘要生成模型的训练方法,其中,包括:
[0005]获取训练文本,并利用摘要生成模型获取所述训练文本的摘要;
[0006]针对所述训练文本和所述摘要执行相同的预测任务,分别得到文本预测结果和摘要预测结果;
[0007]根据所述文本预测结果和所述摘要预测结果对所述摘要生成模型进行自监督训练。
[0008]进一步地,所述预测任务包括:
[0009]根据所述训练文本中的前nr/>‑
1个句子生成所述训练文本的第n个句子;
[0010]根据所述摘要中的前n
‑
1个句子生成所述训练文本的第n个句子;
[0011]其中,n为大于1的整数。
[0012]进一步地,所述根据所述文本预测结果和所述摘要预测结果对所述摘要生成模型进行自监督训练,包括:
[0013]根据所述训练文本中的第n个句子、所述预测任务分别根据所述摘要和所述训练文本生成的第n个句子两两之间的相似度,对所述摘要生成模型进行自监督训练。
[0014]进一步地,所述预测任务包括:
[0015]根据所述训练文本在包括所述训练文本中第m个句子的多个候选句子中筛选出与所述第m个句子相似度最高的第一句子;
[0016]根据所述摘要从所述多个候选句子中筛选与所述第m个句子相似度最高的第二句子;
[0017]其中,m为大于1的整数。
[0018]进一步地,所述根据所述文本预测结果和所述摘要预测结果对所述摘要生成模型进行自监督训练,包括:
[0019]根据所述第m个句子、第一句子和所述第二句子两两之间的相似度,对所述摘要生成模型进行自监督训练。
[0020]进一步地,所述利用摘要生成模型获取所述训练文本的摘要,包括:
[0021]利用所述摘要生成模型从所述训练文本中抽取句子形成摘要;或者,
[0022]利用所述摘要生成模型从所述训练文本中抽取单词形成摘要。
[0023]第二方面,本专利技术实施例中提供了一种摘要生成模型的训练方法,其中,包括:
[0024]获取训练文本集;其中,所述训练文本集包括多个训练文本;
[0025]调用第一预设服务接口,以便由所述预设服务接口利用摘要生成模型获取所述训练文本的摘要,针对所述训练文本和所述摘要执行相同的预测任务,分别得到文本预测结果和摘要预测结果,以及根据所述文本预测结果和所述摘要预测结果对所述摘要生成模型进行自监督训练;
[0026]输出所述摘要生成模型。
[0027]第三方面,本专利技术实施例中提供了一种摘要生成方法,其中,包括:
[0028]获取文本;
[0029]将所述文本输入至摘要生成模型,生成所述文本对应的摘要;其中,所述摘要生成模型利用第一方面或第二方面所述的方法训练得到。
[0030]第四方面,本专利技术实施例中提供了一种摘要生成方法,其中,包括:
[0031]获取对话文本;
[0032]调用第二预设服务接口,以便由所述第二预设服务接口将所述对话文本输入至摘要生成模型,并生成所述对话文本对应的摘要;所述摘要生成模型利用第一方面或第二方面所述的方法训练得到;
[0033]输出所述摘要。
[0034]第五方面,本专利技术实施例中提供了一种摘要生成模型的训练装置,其中,包括:
[0035]第一获取模块,被配置为获取训练文本,并利用摘要生成模型获取所述训练文本对应的摘要;
[0036]第一预测模块,被配置为针对所述训练文本和所述摘要执行相同的预测任务,分别得到文本预测结果和摘要预测结果;
[0037]训练模块,被配置为根据所述文本预测结果和所述摘要预测结果对所述摘要生成模型进行自监督训练。
[0038]第六方面,本专利技术实施例中提供了一种摘要生成模型的训练装置,其中,包括:
[0039]第二获取模块,被配置为获取训练文本集;其中,所述训练文本集包括多个训练文本;
[0040]第一调用模块,被配置为调用第一预设服务接口,以便由所述预设服务接口利用摘要生成模型获取所述训练文本的摘要,针对所述训练文本和所述摘要执行相同的预测任务,分别得到文本预测结果和摘要预测结果,以及根据所述文本预测结果和所述摘要预测结果对所述摘要生成模型进行自监督训练;
[0041]第一输出模块,被配置为输出所述摘要生成模型。
[0042]第七方面,本专利技术实施例中提供了一种摘要生成装置,其中,包括:
[0043]第三获取模块,被配置为获取文本;
[0044]生成模块,被配置为将所述文本输入至摘要生成模型,生成所述文本对应的摘要;其中,所述摘要生成模型利用第五方面或第六方面所述的方法训练得到。
[0045]第八方面,本专利技术实施例中提供了一种摘要生成装置,其中,包括:
[0046]第四获取模块,被配置为获取对话文本;
[0047]第二调用模块,被配置为调用第二预设服务接口,以便由所述第二预设服务接口将所述对话文本输入至摘要生成模型,并生成所述对话文本对应的摘要;所述摘要生成模型利用第五方面或第六方面所述的方法训练得到;
[0048]第二输出模块,被配置为输出所述摘要。
[0049]所述功能可以通过硬件实现,也可以通过硬件执行相应的软件实现。所述硬件或软件包括一个或多个与上述功能相对应的模块。
[0050]在一个可能的设计中,上述装置的结构中包括存储器和处理器,所述存储器用于存储一条或多条支持上述装置执行上述对应方法的计算机指令,所述处理器被配置为用于执行所述存储器中存储的计算机指令。上述装置还可以包括通信接口,用于上述装置与其他设备或通信网络通信。
[0051]第九方面,本公开实施例提供了一种电子设备,包括存储器、处理器以及存储在存储器上的计算机程序,其中,所述处理器执行所述计算机程序以实现上述任一方面所述的方法。
本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种摘要生成模型的训练方法,其中,包括:获取训练文本,并利用摘要生成模型获取所述训练文本的摘要;针对所述训练文本和所述摘要执行相同的预测任务,分别得到文本预测结果和摘要预测结果;根据所述文本预测结果和所述摘要预测结果对所述摘要生成模型进行自监督训练。2.根据权利要求1所述的方法,其中,所述预测任务包括:根据所述训练文本中的前n
‑
1个句子生成所述训练文本的第n个句子;根据所述摘要中的前n
‑
1个句子生成所述训练文本的第n个句子;其中,n为大于1的整数。3.根据权利要求2所述的方法,其中,所述根据所述文本预测结果和所述摘要预测结果对所述摘要生成模型进行自监督训练,包括:根据所述训练文本中的第n个句子、所述预测任务分别根据所述摘要和所述训练文本生成的第n个句子两两之间的相似度,对所述摘要生成模型进行自监督训练。4.根据权利要求1所述的方法,其中,所述预测任务包括:根据所述训练文本在包括所述训练文本中第m个句子的多个候选句子中筛选出与所述第m个句子相似度最高的第一句子;根据所述摘要从所述多个候选句子中筛选与所述第m个句子相似度最高的第二句子;其中,m为大于1的整数。5.根据权利要求4所述的方法,其中,所述根据所述文本预测结果和所述摘要预测结果对所述摘要生成模型进行自监督训练,包括:根据所述第m个句子、第一句子和所述第二句子两两之间的相似度,对所述摘要生成模型进行自监督训练。6.根据权利要求1
‑
5中任一项所述的方法,其中,所述利用摘要生成模型获取所述训练文本的摘要,包括:利用所述摘要生成模型从所述训练文本中抽取句子形成摘要;或者,利用所述摘要生成模型从所述训练文本中抽取单词形成摘要。7.一种摘要生成模型的训练方法,其中,包括:获取训练文本集;其中,所述训练文本集包括多个训练文本;调用第一预设服务接口,以便由所述预设服务接口利用摘要生成模型获取所述训练文本的摘要,针对所述训练文本和所述摘要执行相同的预测任务,分别得到文本预测结果和摘要预测结果,以及根据所述文本预测结果和所述摘要预测结果对所述摘要生成模型进行自监督训练;输出所述摘要生成模型。8.一种摘要生成方法,其中,包括:获取文本;将所述文本输入至摘要生成模型,生成所述文本对应的摘要;其中,所述摘要生成模型利用权利要求1
‑
7任一项所述的方法训练得到。9.一种摘要生成方法...
【专利技术属性】
技术研发人员:付曦燕,
申请(专利权)人:阿里巴巴集团控股有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。