训练方法、装置、设备以及计算机可读存储介质制造方法及图纸

技术编号：32891578 阅读：33 留言：0更新日期：2022-04-07 11:38

本公开涉及模型训练领域，并具体涉及一种训练方法、装置、设备以及计算机可读存储介质。训练方法包括：获取第一训练数据集以及所述第一训练数据集的第一预处理结果；利用所述第一训练数据集以及所述第一预处理结果训练第一模型以获得第二模型；获取第二训练数据集以及所述第二训练数据集的第二预处理结果；以及利用所述第二训练数据集以及所述第二预处理结果训练所述第二模型以获得第三模型，其中，所述第一预处理结果是基于与所述第三模型相关的第四模型获得的，且所述第二训练数据集的数量小于所述第一训练数据集的数量。本公开的训练方法利用较少标注的数据集就能获得期望得到的目标模型，降低了处理复杂度和标注成本并加快了开发周期。加快了开发周期。加快了开发周期。

全部详细技术资料下载

【技术实现步骤摘要】
训练方法、装置、设备以及计算机可读存储介质

[0001]本申请涉及模型训练领域，并且具体涉及一种训练方法、装置、设备以及计算机可读存储介质。

技术介绍

[0002]近年来，随着计算机处理技术的高速发展，使得更精炼快速地捕获文本中的重要信息成为可能。句子压缩是一种将冗长句子转换成精炼简洁的句子的方法。该技术广泛用于主题的自动获取、摘要生成、问答系统等技术中。
[0003]现有的句子压缩方法有：构建关于句子的语法树，通过删减语法树的整个分支来生成压缩句子，或者通过训练基于神经网络的压缩模型来进行句子压缩。通过删减语法树的整个分支来生成压缩句子的方法可能会导致语法问题，而通过训练基于神经网络的压缩模型来进行句子压缩则需要大量的训练数据，人工成本较大。

技术实现思路

[0004]鉴于上述问题，本公开提供了一种训练方法、装置、设备以及计算机可读存储介质。
[0005]根据本公开的一个方面，提供了一种训练方法，包括：获取第一训练数据集以及所述第一训练数据集的第一预处理结果；利用所述第一训练数据集以及所述第一预处理结果训练第一模型以获得第二模型；获取第二训练数据集以及所述第二训练数据集的第二预处理结果；以及利用所述第二训练数据集以及所述第二预处理结果训练所述第二模型以获得第三模型，其中，所述第一预处理结果是基于与所述第三模型相关的第四模型获得的，且所述第二训练数据集的数量小于所述第一训练数据集的数量。
[0006]根据本公开的一个示例，所述利用所述第一训练数据集以及所述第一预处理结果训练第一...

【技术保护点】

【技术特征摘要】
1.一种训练方法，包括：获取第一训练数据集以及所述第一训练数据集的第一预处理结果；利用所述第一训练数据集以及所述第一预处理结果训练第一模型以获得第二模型；获取第二训练数据集以及所述第二训练数据集的第二预处理结果；以及利用所述第二训练数据集以及所述第二预处理结果训练所述第二模型以获得第三模型，其中，所述第一预处理结果是基于与所述第三模型相关的第四模型获得的，且所述第二训练数据集的数量小于所述第一训练数据集的数量。2.根据权利要求1所述的训练方法，其中，所述利用所述第一训练数据集以及所述第一预处理结果训练第一模型以获得第二模型包括：利用所述第一训练数据集、所述第一预处理结果以及判别器来训练所述第一模型以获得第二模型，其中所述判别器基于所训练的所述第一模型的输出结果是否符合预定规则来训练所述第一模型。3.根据权利要求1所述的训练方法，其中，所述利用所述第二训练数据集以及所述第二预处理结果训练所述第二模型以获得第三模型包括：利用所述第二训练数据集、所述第二预处理结果以及判别器来训练所述第二模型以获得第三模型，其中所述判别器基于所训练的所述第二模型的输出结果是否符合预定规则来训练所述第二模型。4.根据权利要求2或3所述的训练方法，其中，所述判别器是基于所述第一模型的输入和输出预先训练得到的。5.根据权利要求2-4任一项所述的训练方法，其中，所述训练方法应用于文本处理领域，所述第二模型、所述第三模型、所述第四模型被用于文本压缩、文本翻译、信息提取和文本生成中的至少一个，所述判别器用于判断输出结果是否符合预定句子规则。6.根据权利要求5所述的训练方法，其中，所述第一预处理结果是基于所述第四模型通过以下步骤获得的压缩结果：接收一个或多个输入语句；从所述一个...

【专利技术属性】
技术研发人员：郭垿宏，关雅卓，刘巍，李安新，陈岚，中村一成，藤本拓，池田大志，
申请(专利权)人：株式会社NTT都科摩，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人