预训练模型的生成方法、装置、电子设备和存储介质制造方法及图纸

技术编号：30824501 阅读：18 留言：0更新日期：2021-11-18 12:17

本公开提出了一种预训练模型的生成方法、装置、电子设备和存储介质，涉及人工智能技术领域，尤其涉及计算机视觉和深度学习技术领域，可应用于图像处理、图像识别等场景。方法为：采用模型集合内选取的多个候选模型，对测试集内的样本进行特征提取，并对各候选模型输出的特征进行特征融合，得到融合特征，根据融合特征执行设定的目标识别任务，以得到预测信息，根据预测信息与样本的标准信息之间的差异，确定多个候选模型的组合性能，在组合性能满足设定性能指标的情况下，根据多个候选模型生成预训练模型，本公开中根据候选模型的组合在目标识别任务上的综合性能表现，确定多个候选模型的组合是否为较优的模型组合，提高了预训练模型的精度。训练模型的精度。训练模型的精度。

全部详细技术资料下载

【技术实现步骤摘要】
预训练模型的生成方法、装置、电子设备和存储介质

[0001]本公开涉及人工智能
，尤其涉及计算机视觉和深度学习
，可应用于图像处理、图像识别等场景，具体涉及预训练模型的生成方法、装置、电子设备和存储介质。

技术介绍

[0002]最近几年，预训练模型取得了巨大的成功。预训练模型在上游任务上通过大量的数据进行训练，进而，在下游任务上，只需要少量数据训练就可以取得较好的结果。而相关技术中的预训练模型在场景迁移上具有较大的局限性，无法满足精度的要求。因此，如何提高生成的预训练模型的精度是亟待解决的技术问题。

技术实现思路

[0003]本公开提供了一种预训练模型的生成方法、装置、电子设备和存储介质。
[0004]根据本公开的一方面，提供了一种预训练模型的生成方法，包括：
[0005]采用模型集合内选取的多个候选模型，对测试集内的样本进行特征提取，得到各所述候选模型输出的特征；
[0006]对各所述候选模型输出的特征进行特征融合，得到融合特征；
[0007]根据所述融合特征执行设定的目标识别任务，以得到预测信息；
[0008]根据所述预测信息与所述样本的标准信息之间的差异，确定所述多个候选模型的组合性能；
[0009]在所述组合性能满足设定性能指标的情况下，根据所述多个候选模型生成预训练模型。
[0010]根据本公开的另一方面，提供了一种预训练模型的生成装置，包括：
[0011]提取模块，用于采用模型集合内选取的多个候选模型，对测试集内的...

【技术保护点】

【技术特征摘要】
1.一种预训练模型的生成方法，包括：采用模型集合内选取的多个候选模型，对测试集内的样本进行特征提取，得到各所述候选模型输出的特征；对各所述候选模型输出的特征进行特征融合，得到融合特征；根据所述融合特征执行设定的目标识别任务，以得到预测信息；根据所述预测信息与所述样本的标准信息之间的差异，确定所述多个候选模型的组合性能；在所述组合性能满足设定性能指标的情况下，根据所述多个候选模型生成预训练模型。2.根据权利要求1所述的方法，其中，所述采用模型集合内选取的多个候选模型，对测试集内的样本进行特征提取，得到各所述候选模型输出的特征之前，还包括：获取模型集合；将所述模型集合内的各模型组合得到超网络；对所述超网络进行训练；采用设定搜索算法从所述超网络中搜索得到目标子网络；将所述目标子网络中的各所述模型作为所述模型集合内选取的所述候选模型。3.根据权利要求2所述的方法，其中，所述对所述超网络进行训练，包括：采用训练集内的训练样本输入所述超网络；根据所述超网络中各子网络输出的特征，确定各所述子网络的损失函数值；对各所述子网络的损失函数值融合得到融合损失函数；根据所述融合损失函数，对所述超网络中的各模型进行模型参数调整。4.根据权利要求1所述的方法，其中，所述采用模型集合内选取的多个候选模型，对测试集内的样本进行特征提取，得到各所述候选模型输出的特征之前，还包括：采用训练集，分别对所述模型集合内的各模型进行训练；根据模型训练过程中各模型的损失函数的梯度，从所述模型集合中选取多个所述候选模型。5.根据权利要求1
‑
4任一项所述的方法，其中，所述目标识别任务为多个，所述根据所述预测信息与所述样本的标准信息之间的差异，确定所述多个候选模型的组合性能，包括：根据各所述目标识别任务的预测信息，与对应任务的所述标准信息之间的差异，确定各所述目标识别任务的损失函数值；对各所述目标识别任务的损失函数值加权求和，得到总损失函数值；根据所述总损失函数值，确定所述多个候选模型的组合性能。6.根据权利要求1
‑
4任一项所述的方法，其中，所述目标识别任务为多个，所述根据所述预测信息与所述样本的标准信息之间的差异，确定所述多个候选模型的组合性能，包括：根据各所述目标识别任务的预测信息，与对应任务的所述标准信息之间的差异，确定各所述目标识别任务的准召率；根据各所述目标识别任务的准召率，确定所述多个候选模型的组合性能。7.一种预训练模型的生成装置，包括：提取模块，用于采用模型集合内选取的多个候选模型，对测试集内的样本进行特征提
取，得到各所述候选模型输出的特征；融合模块，用于对各所述候选模型输出的特征进行特征融合，得到融合特征；执行模...

【专利技术属性】
技术研发人员：希滕，张刚，
申请(专利权)人：北京百度网讯科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人