模型联合训练方法、装置以及存储介质制造方法及图纸

技术编号:35014764 阅读:19 留言:0更新日期:2022-09-21 15:15
本公开提供了一种模型联合训练方法、装置以及存储介质,其中的方法包括:使用训练样本对编码器网络模型和第一目标任务网络模型进行训练,得到训练好的编码器网络模型以及对应的编码网络参数、训练好的第一目标任务网络模型以及对应的第一网络参数;依次将多个任务网络模型中的各个其它任务网络模型设置为第二目标任务网络模型,在保持编码网络参数的状态下,依次对各个第二目标任务网络模型进行训练,获得训练好的各个第二目标任务网络模型以及对应的第二网络参数。本公开提高了模型训练速度,降低了训练复杂度,并且能够满足不同任务对于数据质量的需求,提高了任务网络模型的处理精度,提高了用户的使用感受度。提高了用户的使用感受度。提高了用户的使用感受度。

【技术实现步骤摘要】
模型联合训练方法、装置以及存储介质


[0001]本公开涉及人工智能
,尤其涉及一种模型联合训练方法、装置以及存储介质。

技术介绍

[0002]随着机器学习应用的发展,在车联网、视频监控、智慧城市等领域中采用了许多的智能平台,智能平台与大量的传感器之间产生了海量的数据通信。智能平台在实际场景下包含着多种机器学习模型,机器学习模型实现机器视觉任务,包括目标检测、目标跟踪、行为识别、姿态估计等任务。面向机器视觉的视频编码以及解码,不仅需要满足高压缩率的性能,还需要满足多种机器视觉任务的需求。目前,对于执行多种机器视觉任务的机器学习模型的训练,训练复杂度高,并且难以保证多种机器视觉任务的处理精度。

技术实现思路

[0003]有鉴于此,本专利技术要解决的一个技术问题是提供一种模型联合训练方法、装置以及存储介质。
[0004]根据本公开的第一方面,提供一种模型联合训练方法,其中,待训练的模型包括:编码器网络模型和多个任务网络模型;所述方法包括:从所述多个任务网络模型中选取一个任务网络模型,作为第一目标任务网络模型;使用训练样本对所述编码器网络模型和所述第一目标任务网络模型进行训练,得到训练好的所述编码器网络模型以及对应的编码网络参数、训练好的所述第一目标任务网络模型以及对应的第一网络参数;依次将所述多个任务网络模型中的各个其它任务网络模型设置为第二目标任务网络模型;在保持所述编码网络参数的状态下,使用所述训练样本依次对所述编码器网络模型和各个第二目标任务网络模型进行训练,获得训练好的各个第二目标任务网络模型以及对应的第二网络参数。
[0005]可选地,所述使用训练样本对所述编码器网络模型和所述第一目标任务网络模型进行训练包括:基于所述训练样本生成至少一个训练样本批次;使用所述编码器网络模型并基于所述训练样本批次,获得与所述训练样本批次相对应的编码信息;使用所述第一目标任务网络模型并基于编码信息,生成对应的解码信息以及任务处理结果;基于损失函数对所述编码网络参数和所述第一网络参数进行调整处理。
[0006]可选地,所述使用所述训练样本依次对所述编码器网络模型和各个第二目标任务网络模型进行训练包括:使用训练好的所述编码器网络模型并基于所述训练样本批次和所述编码网络参数,获得所述编码信息;使用所述第二目标任务网络模型并基于编码信息,生成对应的解码信息以及任务处理结果;在保持所述编码网络参数的状态下,基于损失函数对所述第二网络参数进行调整处理。
[0007]可选地,判断所述第一目标任务网络模型或所述第二目标任务网络模型是否需要对解码结果进行机器自动处理;其中,解码结果包括图像或视频解码结果;基于判断结果确定所述损失函数。
[0008]可选地,如果所述判断结果为不需要对解码结果进行机器自动处理,则根据像素特征、编码质量损失系数以及解码图像与原始图像的损失函数,构建第一函数,作为所述损失函数。
[0009]可选地,如果所述判断结果为需要对解码结果进行机器自动处理,则根据像素特征、编码质量损失系数、解码图像与原始图像的损失函数、任务损失函数,构建第二函数,作为所述损失函数。
[0010]可选地,所述编码器网络模型和所述任务网络模型包括:神经网络模型;所述编码网络参数包括:所述编码器网络模型的权重信息;所述第一网络参数包括:所述第一目标任务网络模型的权重信息;所述第二网络参数包括:所述第二目标任务网络模型的权重信息。根据本公开的第二方面,提供一种模型联合训练装置,其中,待训练的模型包括:编码器网络模型和多个任务网络模型;所述模型联合训练装置包括:第一模型确定模块,用于从所述多个任务网络模型中选取一个任务网络模型,作为第一目标任务网络模型;第一模型训练模块,用于使用训练样本对所述编码器网络模型和所述第一目标任务网络模型进行训练,得到训练好的所述编码器网络模型以及对应的编码网络参数、训练好的所述第一目标任务网络模型以及对应的第一网络参数;第二模型确定模块,用于依次将所述多个任务网络模型中的各个其它任务网络模型设置为第二目标任务网络模型;第二模型训练模块,用于在保持所述编码网络参数的状态下,使用所述训练样本依次对所述编码器网络模型和各个第二目标任务网络模型进行训练,获得训练好的各个第二目标任务网络模型以及对应的第二网络参数。
[0011]可选地,所述第一模型训练模块,具体用于基于所述训练样本生成至少一个训练样本批次;使用所述编码器网络模型并基于所述训练样本批次,获得与所述训练样本批次相对应的编码信息;使用所述第一目标任务网络模型并基于编码信息,生成对应的解码信息以及任务处理结果;基于损失函数对所述编码网络参数和所述第一网络参数进行调整处理。
[0012]可选地,所述第二模型训练模块,用于使用训练好的所述编码器网络模型并基于所述训练样本批次和所述编码网络参数,获得所述编码信息;使用所述第二目标任务网络模型并基于编码信息,生成对应的解码信息以及任务处理结果;在保持所述编码网络参数的状态下,基于损失函数对所述第二网络参数进行调整处理。
[0013]可选地,损失函数确定模块,用于判断所述第一目标任务网络模型或所述第二目标任务网络模型是否需要对解码结果进行机器自动处理;其中,解码结果包括图像或视频解码结果;基于判断结果确定所述损失函数。
[0014]可选地,所述损失函数确定模块,用于如果所述判断结果为不需要对解码结果进行机器自动处理,则根据像素特征、编码质量损失系数以及解码图像与原始图像的损失函数,构建第一函数,作为所述损失函数。
[0015]可选地,所述损失函数确定模块,用于如果所述判断结果为需要对解码结果进行机器自动处理,则根据像素特征、编码质量损失系数、解码图像与原始图像的损失函数、任务损失函数,构建第二函数,作为所述损失函数。
[0016]可选地,所述编码器网络模型和所述任务网络模型包括:神经网络模型;所述编码网络参数包括:所述编码器网络模型的权重信息;所述第一网络参数包括:所述第一目标任
务网络模型的权重信息;所述第二网络参数包括:所述第二目标任务网络模型的权重信息。
[0017]根据本公开的第三方面,提供一种模型联合训练装置,包括:存储器;以及耦接至所述存储器的处理器,所述处理器被配置为基于存储在所述存储器中的指令,执行如上所述的模型联合训练方法。
[0018]根据本公开的第四方面,提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,所述指令被处理器执行如上的方法。
[0019]本公开的模型联合训练方法、装置以及存储介质,通过选择一个任务网络模型进行联合训练,生成编码器网络模型权重,利用网络模型间的关联性,固定编码器网络模型权重对其余任务网络模型进行训练;提高了模型训练速度,降低了训练复杂度,并且能够满足不同任务对于数据质量的需求,提高了任务网络模型的处理精度,提高了用户的使用感受度。
附图说明
[0020]为了更清楚地说明本公开实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种模型联合训练方法,其中,待训练的模型包括:编码器网络模型和多个任务网络模型;所述方法包括:从所述多个任务网络模型中选取一个任务网络模型,作为第一目标任务网络模型;使用训练样本对所述编码器网络模型和所述第一目标任务网络模型进行训练,得到训练好的所述编码器网络模型以及对应的编码网络参数、训练好的所述第一目标任务网络模型以及对应的第一网络参数;依次将所述多个任务网络模型中的各个其它任务网络模型设置为第二目标任务网络模型;在保持所述编码网络参数的状态下,使用所述训练样本依次对所述编码器网络模型和各个第二目标任务网络模型进行训练,获得训练好的各个第二目标任务网络模型以及对应的第二网络参数。2.如权利要求1所述的方法,所述使用训练样本对所述编码器网络模型和所述第一目标任务网络模型进行训练包括:基于所述训练样本生成至少一个训练样本批次;使用所述编码器网络模型并基于所述训练样本批次,获得与所述训练样本批次相对应的编码信息;使用所述第一目标任务网络模型并基于编码信息,生成对应的解码信息以及任务处理结果;基于损失函数对所述编码网络参数和所述第一网络参数进行调整处理。3.如权利要求2所述的方法,所述使用所述训练样本依次对所述编码器网络模型和各个第二目标任务网络模型进行训练包括:使用训练好的所述编码器网络模型并基于所述训练样本批次和所述编码网络参数,获得所述编码信息;使用所述第二目标任务网络模型并基于编码信息,生成对应的解码信息以及任务处理结果;在保持所述编码网络参数的状态下,基于损失函数对所述第二网络参数进行调整处理。4.如权利要求3所述的方法,还包括:判断所述第一目标任务网络模型或所述第二目标任务网络模型是否需要对解码结果进行机器自动处理;其中,解码结果包括图像或视频解码结果;基于判断结果确定所述损失函数。5.如权利要求4所述的方法,所述基于判断结果确定所述损失函数包括:如果所述判断结果为不需要对解码结果进行机器自动处理,则根据像素特征、编码质量损失系数以及解码图像与原始图像的损失函数,构建第一函数,作为所述损失函数。6.如权利要求4所述的方法,所述基于判断结果确定所述损失函数包括:如果所述判断结果为需要对解码结果进行机器自动处理,则根据像素特征、编码质量损失系数、解码图像与原始图像的损失函数、任务损失函数,构建第二函数,作为所述损失函数。7.如权利要求1至6任一项所述的方法,其中,
所述编码器网络模型和所述任务网络模型包括:神经网络模型;所述编码网络参数包括:所述编码器网络模型的权重信息;所述第一网络参数包括:所述第一目标任务网络模型的权重信息;所述第二网络参数包括:所述第二目标任务网络模型的权重信息。8.一种模型联合训练装置,其中,待训练的模型包括:编码器网络模型和多个任务网络模型;所述模型联合训练装置包括:第一模型确定模块,用于从所述多个任务网络模型中选取一个任务网络模...

【专利技术属性】
技术研发人员:王慧芬张园杨明川
申请(专利权)人:中国电信股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1