模型联合训练方法、装置以及存储介质制造方法及图纸

技术编号：35014764 阅读：19 留言：0更新日期：2022-09-21 15:15

本公开提供了一种模型联合训练方法、装置以及存储介质，其中的方法包括：使用训练样本对编码器网络模型和第一目标任务网络模型进行训练，得到训练好的编码器网络模型以及对应的编码网络参数、训练好的第一目标任务网络模型以及对应的第一网络参数；依次将多个任务网络模型中的各个其它任务网络模型设置为第二目标任务网络模型，在保持编码网络参数的状态下，依次对各个第二目标任务网络模型进行训练，获得训练好的各个第二目标任务网络模型以及对应的第二网络参数。本公开提高了模型训练速度，降低了训练复杂度，并且能够满足不同任务对于数据质量的需求，提高了任务网络模型的处理精度，提高了用户的使用感受度。提高了用户的使用感受度。提高了用户的使用感受度。

全部详细技术资料下载

【技术实现步骤摘要】
模型联合训练方法、装置以及存储介质

[0001]本公开涉及人工智能
，尤其涉及一种模型联合训练方法、装置以及存储介质。

技术介绍

[0002]随着机器学习应用的发展，在车联网、视频监控、智慧城市等领域中采用了许多的智能平台，智能平台与大量的传感器之间产生了海量的数据通信。智能平台在实际场景下包含着多种机器学习模型，机器学习模型实现机器视觉任务，包括目标检测、目标跟踪、行为识别、姿态估计等任务。面向机器视觉的视频编码以及解码，不仅需要满足高压缩率的性能，还需要满足多种机器视觉任务的需求。目前，对于执行多种机器视觉任务的机器学习模型的训练，训练复杂度高，并且难以保证多种机器视觉任务的处理精度。

技术实现思路

[0003]有鉴于此，本专利技术要解决的一个技术问题是提供一种模型联合训练方法、装置以及存储介质。
[0004]根据本公开的第一方面，提供一种模型联合训练方法，其中，待训练的模型包括：编码器网络模型和多个任务网络模型；所述方法包括：从所述多个任务网络模型中选取一个任务网络模型，作为第一目标任务网络模型；使用训练样本对所述编码器网络模型和所述第一目标任务网络模型进行训练，得到训练好的所述编码器网络模型以及对应的编码网络参数、训练好的所述第一目标任务网络模型以及对应的第一网络参数；依次将所述多个任务网络模型中的各个其它任务网络模型设置为第二目标任务网络模型；在保持所述编码网络参数的状态下，使用所述训练样本依次对所述编码器网络模型和各个第二目标任务网络模型进行训练，获得训练好的各个第二目标任务...

【技术保护点】

【技术特征摘要】
1.一种模型联合训练方法，其中，待训练的模型包括：编码器网络模型和多个任务网络模型；所述方法包括：从所述多个任务网络模型中选取一个任务网络模型，作为第一目标任务网络模型；使用训练样本对所述编码器网络模型和所述第一目标任务网络模型进行训练，得到训练好的所述编码器网络模型以及对应的编码网络参数、训练好的所述第一目标任务网络模型以及对应的第一网络参数；依次将所述多个任务网络模型中的各个其它任务网络模型设置为第二目标任务网络模型；在保持所述编码网络参数的状态下，使用所述训练样本依次对所述编码器网络模型和各个第二目标任务网络模型进行训练，获得训练好的各个第二目标任务网络模型以及对应的第二网络参数。2.如权利要求1所述的方法，所述使用训练样本对所述编码器网络模型和所述第一目标任务网络模型进行训练包括：基于所述训练样本生成至少一个训练样本批次；使用所述编码器网络模型并基于所述训练样本批次，获得与所述训练样本批次相对应的编码信息；使用所述第一目标任务网络模型并基于编码信息，生成对应的解码信息以及任务处理结果；基于损失函数对所述编码网络参数和所述第一网络参数进行调整处理。3.如权利要求2所述的方法，所述使用所述训练样本依次对所述编码器网络模型和各个第二目标任务网络模型进行训练包括：使用训练好的所述编码器网络模型并基于所述训练样本批次和所述编码网络参数，获得所述编码信息；使用所述第二目标任务网络模型并基于编码信息，生成对应的解码信息以及任务处理结果；在保持所述编码网络参数的状态下，基于损失函数对所述第二网络参数进行调整处理。4.如权利要求3所述的方法，还包括：判断所述第一目标任务网络模型或所述第二目标任务网络模型是否需要对解码结果进行机器自动处理；其中，解码结果包括图像或视频解码结果；基于判断结果确定所述损失函数。5.如权利要求4所述的方法，所述基于判断结果确定所述损失函数包括：如果所述判断结果为不需要对解码结果进行机器自动处理，则根据像素特征、编码质量损失系数以及解码图像与原始图像的损失函数，构建第一函数，作为所述损失函数。6.如权利要求4所述的方法，所述基于判断结果确定所述损失函数包括：如果所述判断结果为需要对解码结果进行机器自动处理，则根据像素特征、编码质量损失系数、解码图像与原始图像的损失函数、任务损失函数，构建第二函数，作为所述损失函数。7.如权利要求1至6任一项所述的方法，其中，
所述编码器网络模型和所述任务网络模型包括：神经网络模型；所述编码网络参数包括：所述编码器网络模型的权重信息；所述第一网络参数包括：所述第一目标任务网络模型的权重信息；所述第二网络参数包括：所述第二目标任务网络模型的权重信息。8.一种模型联合训练装置，其中，待训练的模型包括：编码器网络模型和多个任务网络模型；所述模型联合训练装置包括：第一模型确定模块，用于从所述多个任务网络模型中选取一个任务网络模...

【专利技术属性】
技术研发人员：王慧芬，张园，杨明川，
申请(专利权)人：中国电信股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人