模型训练方法、装置、存储介质及电子设备制造方法及图纸

技术编号：30406003 阅读：18 留言：0更新日期：2021-10-20 11:10

本申请公开一种模型训练方法、装置、存储介质及电子设备。其中，获取多个数据集；将多个数据集逐个输入初始多任务模型；其中，所述初始多任务模型包含模型参数，所述模型参数包含共享参数和任务参数；其中，所述共享参数为所述初始多任务模型中多个任务共有的模型参数，所述任务参数为所述初始多任务模型中多个任务中每个任务独有的模型参数；基于所述初始多任务模型的输出结果调整所述模型参数，得到训练后的多任务模型。本方法能够避免针对同一训练样本进行重复计算的问题，提高了训练效率，节省了计算资源。节省了计算资源。节省了计算资源。

全部详细技术资料下载

【技术实现步骤摘要】
模型训练方法、装置、存储介质及电子设备

[0001]本公开涉及人工智能
，特别是涉及一种模型训练方法、装置、存储介质及电子设备。

技术介绍

[0002]深度学习在图像识别，语音识别，自然语言处理等相关领域都取得很多成果，但是由于深度学习模型计算复杂，效率低，如果对于一些相近的任务，往往都各自使用一个模型，无疑增加了计算量和资源占用。

技术实现思路

[0003]根据本公开的一个方面，提供以下技术方案：
[0004]一种模型训练方法，包括：
[0005]获取多个数据集；
[0006]将多个数据集逐个输入初始多任务模型；其中，所述初始多任务模型包含模型参数，所述模型参数包含共享参数和任务参数；其中，所述共享参数为所述初始多任务模型中多个任务共有的模型参数，所述任务参数为所述初始多任务模型中多个任务中每个任务独有的模型参数；
[0007]基于所述初始多任务模型的输出结果调整所述模型参数，得到训练后的多任务模型。
[0008]进一步地，根据所述初始多任务模型的输出结果计算损失函数的总损失值，并根据所述损失值对所述多任务模型的模型参数进行调整。
[0009]进一步地，若每个数据集的任务标签数量为一个，则将该任务标签对应的任务的损失值作为该数据集的损失值，其中，根据每个数据集的损失值计算得到损失函数的总损失值。
[0010]进一步地，每个数据集包含一个或多个任务标签，若所述数据集的任务标签数量为多个，则将多个任务标签对应的多个任务的损失值之和作为该数据集...

【技术保护点】

【技术特征摘要】
1.一种模型训练方法，包括：获取多个数据集；将多个数据集逐个输入初始多任务模型；其中，所述初始多任务模型包含模型参数，所述模型参数包含共享参数和任务参数；其中，所述共享参数为所述初始多任务模型中多个任务共有的模型参数，所述任务参数为所述初始多任务模型中多个任务中每个任务独有的模型参数；基于所述初始多任务模型的输出结果调整所述模型参数，得到训练后的多任务模型。2.根据权利要求1所述的训练方法，其特征在于，基于所述初始多任务模型的输出结果调整所述模型参数，得到训练后的多任务模型，包括：根据所述初始多任务模型的输出结果计算损失函数的总损失值，并根据所述损失值对所述多任务模型的模型参数进行调整。3.根据权利要求2所述的训练方法，其特征在于，每个数据集包含一个或多个任务标签，若每个数据集的任务标签数量为一个，则将该任务标签对应的任务的损失值作为该数据集的损失值，其中，根据每个数据集的损失值计算得到损失函数的总损失值。4.根据权利要求2所述的训练方法，其特征在于，每个数据集包含一个或多个任务标签，若所述数据集的任务标签数量为多个，则将多个任务标签对应的多个任务的损失值之和作为该数据集的损失值，其中，根据每个数据集的损失值计算得到损失函数的总损失值。5.根据权利要求2所述的训练方法，其特征在于，所述总损失值为多个数据集对应的所有任务的损失值之和。6.根据权利要求5所述的训练方法，其特征在于，多个数据集中的每个数据集对应的损失函数乘以c，其中，c为每个数据集占所有数据集的比重。7.根据权利要求5所述的训练方法，其特征在于，所述损失函数中还包含动态系数，其中，所述动态系数可根据当前模型训练自适应调整。8.根据权利要求1所述的训练方法，其特征在于，所述获取多个数据集包括：将所述多个数据集按照第一顺序加载入数据加载器，并将加载入数据加载器中的数据集按照预设批数量进行划分。9.根据权利要求8所述的训练方法，其特征在于，所述将加载入数据加载器中...

【专利技术属性】
技术研发人员：陈子予，陶训强，何苗，郭彦东，
申请(专利权)人：OPPO广东移动通信有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人