图像识别的方法、装置、设备及存储介质制造方法及图纸

技术编号:21972126 阅读:40 留言:0更新日期:2019-08-28 01:37
本公开是关于一种图像识别的方法、装置、设备及存储介质,方法包括:获取识别模型,基于识别模型对目标训练数据集中的训练数据进行识别,得到每一个训练数据的识别结果,将识别结果作为训练数据的标签;在目标训练数据集中,获取满足目标条件的训练数据;基于满足目标条件的训练数据训练识别模型,得到更新后的识别模型;基于更新后的识别模型对目标训练数据集中的训练数据进行识别,得到每一个训练数据的识别结果;根据识别结果更新训练数据的标签,得到更新后的目标训练数据集,将更新后的目标训练数据集中的训练数据作为用于训练机器学习模型的训练数据,利用基于目标训练数据集中的训练数据训练得到的目标识别物的识别模型进行图像识别。

Image Recognition Method, Device, Equipment and Storage Media

【技术实现步骤摘要】
图像识别的方法、装置、设备及存储介质
本公开涉及人工智能领域,尤其涉及一种图像识别的方法、装置、设备及存储介质。
技术介绍
深度学习在视频图像、语音识别、自然语言处理等相关领域得到了广泛应用。以卷积神经网络(convolutionneuralnetwork,CNN)为例,CNN因其超强的拟合能力以及端到端的全局优化能力,使得机器识别准确率大幅提高。虽然使用CNN模型,机器学习模型的识别准确率得到了显著的提升。但得到一个满足识别要求的机器学习模型需要依赖大量的、标注准确率满足要求的训练数据。相关技术中,一般是通过人工对数据进行标注来获取训练数据。但一般训练数据的需求量庞大,标注大量数据不仅需要消耗巨大的人力,而且标注速率慢,严重影响机器学习模型的训练效率;且依靠人工标注的方式获取训练数据,易出现标注错误,影响基于训练数据得到的识别模型的识别结果的准确性。
技术实现思路
本公开提供一种图像识别的方法、装置、设备及存储介质,能够克服相关技术中通过人工标注获得训练数据的方式,影响机器学习模型迭代效率和识别模型的识别结果的准确性问题。根据本公开实施例的第一方面,提供一种图像识别的方法,所述方法包括:获取识别模型,所述识别模型由隶属于不同标签体系下的参考训练数据训练得到;基于所述识别模型,对目标训练数据集中的训练数据进行识别,得到每一个训练数据的识别结果,将所述识别结果作为所述训练数据的标签;在所述目标训练数据集中,获取满足目标条件的训练数据;基于所述满足目标条件的训练数据对所述识别模型进行训练,得到更新后的识别模型;基于所述更新后的识别模型对所述目标训练数据集中的训练数据进行识别,得到每一个训练数据的识别结果;根据所述识别结果更新所述训练数据的标签,得到更新后的目标训练数据集,将所述更新后的目标训练数据集中的训练数据作为用于训练机器学习模型的训练数据;利用基于所述目标训练数据集中的训练数据训练得到的目标识别物的识别模型进行图像识别。可选地,所述获取满足目标条件的训练数据,包括:根据训练数据的识别结果,对所述目标训练数据集中的训练数据进行分组;获取每一个训练数据的识别结果对应的预测概率;在每一组训练数据中,将预测概率大于第一目标概率的训练数据作为满足目标条件的训练数据。可选地,所述在每一组训练数据中,将预测概率大于第一目标概率的训练数据作为满足目标条件的训练数据之后,还包括:在每一组训练数据中,获取预测概率小于第二目标概率的训练数据,所述第二目标概率小于所述第一目标概率,所述预测概率小于第二目标概率的训练数据表征噪声数据;将所述预测概率小于第二目标概率的训练数据中第一目标个数的训练数据的标签设置为参考标签,将更新标签的训练数据作为满足目标条件的训练数据。可选地,所述获取满足目标条件的训练数据,包括:根据训练数据的识别结果,对所述目标训练数据集中的训练数据进行分组;获取每一个训练数据的识别结果对应的预测概率;按照预测概率对每一组训练数据进行排序;根据排序结果,在每一组训练数据中获取第一参考数量的训练数据作为满足目标条件的训练数据。可选地,所述根据排序结果,在每一组训练数据中获取第一参考数量的训练数据作为满足目标条件的训练数据之后,所述方法还包括:在每一组训练数据中,获取第二参考数量的训练数据;将所述第二参考数量的训练数据中第二目标个数的训练数据的标签设置为参考标签,将更新标签的训练数据作为满足目标条件的训练数据,所述标签为参考标签的训练数据表征噪声数据。可选地,所述根据所述识别结果更新所述训练数据的标签,得到更新后的目标训练数据集,将所述更新后的目标训练数据集中的训练数据作为用于训练机器学习模型的训练数据,包括:确定所述更新后的目标训练数据集中是否包含标签为参考标签的训练数据;当所述更新后的目标训练数据集中包含标签为参考标签的训练数据时,在标签为参考标签的训练数据中去除标准数量的训练数据;将去除标签为参考标签训练数据后的目标训练数据集中的训练数据作为用于训练机器学习模型的训练数据。可选地,所述根据所述识别结果更新所述训练数据的标签,得到更新后的目标训练数据集,将所述更新后的目标训练数据集中的训练数据作为用于训练机器学习模型的训练数据之后,还包括:根据在所述目标训练数据集中,获取满足目标条件的训练数据,得到更新后的目标训练数据的方法,在所述更新后的目标训练数据集中,获取满足目标条件的训练数据,直至得到的更新后的目标训练数据集中识别结果的预测概率满足参考概率的训练数据的数量满足目标数量时,将所述更新后的目标训练数据集中的训练数据作为用于训练机器学习模型的训练数据。根据本公开实施例的第二方面,提供一种图像识别的装置,所述装置包括:第一获取模块,被配置为执行获取识别模型,所述识别模型由隶属于不同标签体系下的参考训练数据训练得到;第一识别模块,被配置为执行基于所述识别模型,对目标训练数据集中的训练数据进行识别,得到每一个训练数据的识别结果,将所述识别结果作为所述训练数据的标签;第二获取模块,被配置为执行在所述目标训练数据集中,获取满足目标条件的训练数据;训练模块,被配置为执行基于所述满足目标条件的训练数据训练所述识别模型,得到更新后的识别模型;第二识别模块,被配置为执行基于所述更新后的识别模型对所述目标训练数据集中的训练数据进行识别,得到每一个训练数据的识别结果;更新模块,被配置为执行根据所述识别结果更新所述训练数据的标签,得到更新后的目标训练数据集,将所述更新后的目标训练数据集中的训练数据作为用于训练机器学习模型的训练数据;图像识别模块,被配置为执行利用基于所述目标训练数据集中的训练数据训练得到的目标识别物的识别模型进行图像识别。可选地,所述第二获取模块,被配置为执行根据训练数据的识别结果,对所述目标训练数据集中的训练数据进行分组;获取每一个训练数据的识别结果对应的预测概率;在每一组训练数据中,将预测概率大于第一目标概率的训练数据作为满足目标条件的训练数据。可选地,所述第二获取模块,还被配置为在每一组训练数据中,获取预测概率小于第二目标概率的训练数据,所述第二目标概率小于所述第一目标概率,所述预测概率小于第二目标概率的训练数据表征噪声数据;将所述预测概率小于第二目标概率的训练数据中第一目标个数的训练数据的标签设置为参考标签,将更新标签的训练数据作为满足目标条件的训练数据。可选地,所述第二获取模块,被配置为执行根据训练数据的识别结果,对所述目标训练数据集中的训练数据进行分组;获取每一个训练数据的识别结果对应的预测概率;按照预测概率对每一组训练数据进行排序;根据排序结果,在每一组训练数据中获取第一参考数量的训练数据作为满足目标条件的训练数据。可选地,所述第二获取模块,还被配置为执行在每一组训练数据中,获取第二参考数量的训练数据;将所述第二参考数量的训练数据中第二目标个数的训练数据的标签设置为参考标签,将更新标签的训练数据作为满足目标条件的训练数据,所述标签为参考标签的训练数据表征噪声数据。可选地,所述更新模块,被配置为执行确定所述更新后的目标训练数据集中是否包含标签为参考标签的训练数据;当所述更新后的目标训练数据集中包含标签为参考标签的训练数据时,在标签为参考标签的训练数据中去除标准数量的训练数据;将去除标签为参考标本文档来自技高网...

【技术保护点】
1.一种图像识别的方法,其特征在于,所述方法包括:获取识别模型,所述识别模型由隶属于不同标签体系下的参考训练数据训练得到;基于所述识别模型,对目标训练数据集中的训练数据进行识别,得到每一个训练数据的识别结果,将所述识别结果作为所述训练数据的标签;在所述目标训练数据集中,获取满足目标条件的训练数据;基于所述满足目标条件的训练数据训练所述识别模型,得到更新后的识别模型;基于所述更新后的识别模型对所述目标训练数据集中的训练数据进行识别,得到每一个训练数据的识别结果;根据所述识别结果更新所述训练数据的标签,得到更新后的目标训练数据集,将所述更新后的目标训练数据集中的训练数据作为用于训练机器学习模型的训练数据;利用基于所述目标训练数据集中的训练数据训练得到的目标识别物的识别模型进行图像识别。

【技术特征摘要】
1.一种图像识别的方法,其特征在于,所述方法包括:获取识别模型,所述识别模型由隶属于不同标签体系下的参考训练数据训练得到;基于所述识别模型,对目标训练数据集中的训练数据进行识别,得到每一个训练数据的识别结果,将所述识别结果作为所述训练数据的标签;在所述目标训练数据集中,获取满足目标条件的训练数据;基于所述满足目标条件的训练数据训练所述识别模型,得到更新后的识别模型;基于所述更新后的识别模型对所述目标训练数据集中的训练数据进行识别,得到每一个训练数据的识别结果;根据所述识别结果更新所述训练数据的标签,得到更新后的目标训练数据集,将所述更新后的目标训练数据集中的训练数据作为用于训练机器学习模型的训练数据;利用基于所述目标训练数据集中的训练数据训练得到的目标识别物的识别模型进行图像识别。2.根据权利要求1所述的图像识别的方法,其特征在于,所述获取满足目标条件的训练数据,包括:根据训练数据的识别结果,对所述目标训练数据集中的训练数据进行分组;获取每一个训练数据的识别结果对应的预测概率;在每一组训练数据中,将预测概率大于第一目标概率的训练数据作为满足目标条件的训练数据。3.根据权利要求2所述的图像识别的方法,其特征在于,所述在每一组训练数据中,将预测概率大于第一目标概率的训练数据作为满足目标条件的训练数据之后,还包括:在每一组训练数据中,获取预测概率小于第二目标概率的训练数据,所述第二目标概率小于所述第一目标概率,所述预测概率小于第二目标概率的训练数据表征噪声数据;将所述预测概率小于第二目标概率的训练数据中第一目标个数的训练数据的标签设置为参考标签,将更新标签的训练数据作为满足目标条件的训练数据。4.根据权利要求1所述的图像识别的方法,其特征在于,所述获取满足目标条件的训练数据,包括:根据训练数据的识别结果,对所述目标训练数据集中的训练数据进行分组;获取每一个训练数据的识别结果对应的预测概率;按照预测概率对每一组训练数据进行排序;根据排序结果,在每一组训练数据中获取第一参考数量的训练数据作为满足目标条件的训练数据。5.根据权利要求4所述的图像识别的方法,其特征在于,所述根据排序结果,在每一组训练数据中获取第一参考数量的训练数据作为满足目标条件的训练数据之后,所述方法还包括:在每一组训练数据中,获取第二参考数量的训练数据;将所述第二参考数量的训练数据中第二目标个数的训练数据的标签设置为参考标签,将更新标签的训练数据作为满足目标条件的训练数据,所述标签为参考标签的训练数据表征噪声数据。6.根...

【专利技术属性】
技术研发人员:张志伟王希爱郑仲奇
申请(专利权)人:北京达佳互联信息技术有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1