一种模型训练方法、装置、电子设备及存储介质制造方法及图纸

技术编号：27106567 阅读：20 留言：0更新日期：2021-01-25 18:56

本申请公开了一种模型训练方法、装置、电子设备及存储介质，涉及深度学习技术领域。具体方案为：接收用户输入的任务类别标签；基于任务类别标签生成与其对应的至少一个训练样本；在任务类别标签对应的全部训练样本中提取出一个训练样本作为当前训练样本；响应于待训练的模型不满足预先设置的收敛条件，将当前训练样本输入至待训练的模型中，使用当前训练样本对待训练的模型进行训练；重复执行上述提取当前训练样本的操作，直到待训练的模型满足预先设置的收敛条件。本申请实施例无需预先获取带有标注的训练样本即可实现模型训练，极大地减少了人力消耗和人工标注的资金成本。减少了人力消耗和人工标注的资金成本。减少了人力消耗和人工标注的资金成本。

全部详细技术资料下载

【技术实现步骤摘要】
一种模型训练方法、装置、电子设备及存储介质

[0001]本申请涉及人工智能领域，进一步涉及深度学习
，尤其是一种模型训练方法、装置、电子设备及存储介质。

技术介绍

[0002]随着大数据时代的到来，数据获取变得相对容易，但用于训练的数据往往需要人工筛选、标注后才可以训练。大量的训练数据意味着需要耗费大量的人力、时间、资金进行数据标注，极大的限制了人工智能模型的训练速度，进而影响模型迭代速度及模型上线时间。
[0003]在现有技术中，通常采用有监督的人工智能模型训练方法，以图像分类任务为例，人工标注适量带有标签的训练数据，基于传统的特征提取算子或基于深度学习网络等提取训练数据特征，对提取后的特征使用分类器进行分类预测，并将标注的标签作为期望输出进行训练。该方法依赖大量的人工标注数据，需要耗费大量的人力、资金和时间投入到数据标注工作中；当任务紧急的情况下，可能会出现无法获取大量的带有标注的数据的情况，进而导致模型短期内达不到性能要求无法上线；若该训练任务是需要控制极其重要的风险，那么如有风险漏出则会对公司造成无法挽回的后果。由此可见，采用现有的模型训练方法，不仅模型训练效率低，而且还可能会导致不可估量的后果。

技术实现思路

[0004]本申请提供了一种模型训练方法、装置、电子设备及存储介质，无需预先获取带有标注的训练样本即可实现模型训练，极大地减少了人力消耗和人工标注的资金成本。
[0005]第一方面，本申请提供了一种模型训练方法，所述方法包括：
[0006]接收用户输入的任...

【技术保护点】

【技术特征摘要】
1.一种模型训练方法，所述方法包括：接收用户输入的任务类别标签；基于所述任务类别标签生成与其对应的至少一个训练样本；在所述任务类别标签对应的全部训练样本中提取出一个训练样本作为当前训练样本；响应于待训练的模型不满足预先设置的收敛条件，将所述当前训练样本输入至所述待训练的模型中，使用所述当前训练样本对所述待训练的模型进行训练；重复执行上述提取所述当前训练样本的操作，直到所述待训练的模型满足所述预先设置的收敛条件。2.根据权利要求1所述的方法，所述基于所述任务类别标签生成与其对应的至少一个训练样本，包括：基于预先构建的知识图谱生成所述任务类型标签对应的至少一个下义词；将所述任务类型标签对应的各个下义词作为关键词抓取各个下义词对应的至少一个图像；将各个下义词和各个下义词对应的各个图像组合为各个训练样本，得到所述任务类别标签对应的至少一个训练样本。3.根据权利要求2所述的方法，在所述将所述任务类型标签对应的各个下义词作为关键词抓取各个下义词对应的至少一个图像之后，所述将各个下义词和各个下义词对应的各个图像组合为各个训练样本之前，所述方法还包括：在全部的下义词对应的图像中提取出一个图像作为当前图像；采用预先设定的质量评估算法对所述当前样本图像进行质量评估，确定出所述当前图像为脏数据或者干净数据；重复执行上述操作，直到确定出各个下义词对应的各个图像为脏数据或者干净数据；得到各个下义词对应的干净数据；执行将各个下义词和各个下义词对应的各个干净数据组合为各个训练样本的操作。4.根据权利要求3所述的方法，所述方法还包括：采用预先设定的聚类算法对全部的下义词对应的干净数据进行聚类，得到全部的下义词对应的至少一组干净数据；在所述预先构建的知识图谱中确定出各组干净数据的位置；并计算各组干净数据的位置与预先确定的中心位置之间的距离；响应于在全部的干净数据中存在至少一组与所述预先确定的中心位置之间的距离大于或者等于预设阈值的干净数据，在全部的干净数据中除去与所述预先确定的中心位置之间的距离大于或者等于所述预设阈值的干净数据，得到与所述预先确定的中心位置之间的距离小于所述预设阈值的干净数据；将与所述预先确定的中心位置之间的距离小于所述预设阈值的干净数据样本作为全部的下义词对应的干净数据。5.根据权利要求4所述的方法，所述方法还包括：采用预先设定的数据增广方法对各个下义词对应的各个干净数据进行数据增广，得到各个下义词对应的数据增广后的干净数据；将各个下义词对应的数据增广后的干净数据作为全部的下义词对应的干净数据。6.根据权利要求5所述的方法，所述预先设定的质量评估算法包括以下至少其中之一：清晰度检测、纯色图检测、图像损坏检测；所述预先设定的聚类算法包括以下至少其中之一：K均值聚类算法、均值偏移聚类算法；所述预先设定的数据增广方法包括以下至少其中
之一：仿射变换、透视变换、颜色扰动、数据增强、生成判别网络。7.一种模型训练装置，所述装置包括：接收模块、生成模块、提取模块和训练模块；其中，所述接收模块，用于接收用户输入的任务类别标签；所述生成模块，用于基于所述任务类别标签生成与其对应的至少一个训练样本；所述提取模块，用于在所述任务类别标签...

【专利技术属性】
技术研发人员：张言，梁晓旭，邓远达，
申请(专利权)人：百度中国有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人