一种图像分类模型的训练方法及图像分类方法、存储介质技术

技术编号:25088049 阅读:15 留言:0更新日期:2020-07-31 23:32
一种图像分类模型的训练方法及图像分类方法、存储介质,其中训练方法包括:建立关于一分类对象的第一数据集和第二数据集,根据第一数据集对第二数据集中的第二图像进行分类标签的预测以得到第二图像对应的分类标签,根据第二图像及其对应的分类标签得到标注有分类标签的第三图像以建立第三数据集,利用第一数据集和第三数据集对预设的深度神经网络进行训练,学习得到图像分类模型。由于第一数据集中的各幅第一图像标注有分类标签,第二数据集中的各幅第二图像没有标注分类标签,使得有分类标签的图像和无分类标签的图像均参与了深度神经网络的训练过程,利于提高图像分类模型对场景图像的分类适应能力和分类精度。

【技术实现步骤摘要】
一种图像分类模型的训练方法及图像分类方法、存储介质
本专利技术涉及图像处理的
,具体涉及一种图像分类模型的训练方法及图像分类方法、存储介质。
技术介绍
计算机视觉是使用计算机及相关设备对生物视觉的一种模拟,它的主要任务就是通过对采集的图片或视频进行处理以获得相应场景的三维信息。在计算机视觉的运用过程中,通常会进行图像预处理和模式识别的操作,除此之外,还会涉及图像分类、图像识别、景物分析、形状描述、几何建模和图象理解的操作。其中,图像分类是计算机视觉的核心领域之一,可以将它看作是从给定的分类集合中为图像分配一个标签的任务,具体就是分析一个输入图像并返回一个将图像分类的标签,并且这个标签是用来自预定义类别集合。目前,随着计算机运算能力的发展和图像数据的爆炸式的增长,深度学习取得了巨大的成果,研究图像分类任务往往需要大量的标注数据进行监督学习。虽然,存在一些方法可以减少对数据的依赖,比如迁移学习、少样本学习等,但是到目前为止,此类方法的应用性能依然还没法与监督学习进行相比。在实际的工程实现中,往往短期内是无法收集并标注完成大量提供深度学习训练的可用数据。这对实际的算法落地造成很多不确定的因素,如此会严重影响到图像分类研究项目的进度。此外,通过普通方式采集的数据与现场的数据之间会造成过度的拟合,不利于后期通过此类数据进行训练学习。一般情况下,深度神经网络在基准数据集上表现很好,但在数据集之外的真实世界图像上,效果就不那么让人满意了,这往往是图像分类处理时对真实场景过于敏感而导致的结果。对于这样的情况,即使局部存在不相同之处也会会造成很大的识别误差,而识别误差的产生会对算法的落地和推广产生很严重的影响。
技术实现思路
本专利技术主要解决的技术问题是如何提高图像分类的精确度和泛化能力,以满足实际的工程需求。为解决上述技术问题,本申请公开一种图像分类模型的训练方法及图像分类方法、存储介质。根据第一方面,一种实施例中提供一种图像分类模型的训练方法,包括:建立关于一分类对象的第一数据集和第二数据集,所述第一数据集包含多幅标注有分类标签的第一图像,所述第二数据集包含多幅没有标注分类标签的第二图像;根据所述第一数据集对所述第二数据集中的所述第二图像进行分类标签的预测,得到所述第二图像对应的分类标签,并根据所述第二图像及其对应的分类标签得到标注有分类标签的第三图像以建立第三数据集;利用所述第一数据集和所述第三数据集对预设的深度神经网络进行训练,学习得到图像分类模型。所述根据所述第一数据集对所述第二数据集中的所述第二图像进行分类标签的预测,得到所述第二图像对应的分类标签,并根据所述第二图像及其对应的分类标签得到标注有分类标签的第三图像以建立第三数据集,包括:从所述第一数据集中选取多幅第一图像,对预设的网络模型进行训练,得到预测模型;从所述第二数据集中选取多幅第二图像,根据所述预测模型对所选取的第二图像进行分类标签的预测处理,得到各所选取的第二图像的预测标签;对各幅第二图像的预测标签进行标签锐化处理,得到相应的第二图像的分类标签;对各选取的第二图像及其对应的分类标签进行处理,得到第三图像及其对应的分类标签,并根据第三图像及其对应的分类标签建立第三数据集。所述从所述第二数据集中选取多幅第二图像,根据所述预测模型对所选取的第二图像进行分类标签的预测处理,得到各所选取的第二图像的预测标签,包括:对各幅所选取的第二图像,分别进行一次或多次的图像增强处理;将各幅所选取的第二图像及其图像增强处理后的第二图像分别输入至所述预测模型,分别得到对应的数据标签;对于每幅所选取的第二图像,将其对应的数据标签和其图像增强处理后的第二图像所对应的数据标签进行标签平均化处理,得到其预测标签。所述对各幅第二图像的预测标签进行标签锐化处理,得到相应的第二图像的分类标签,包括:定义任意一幅第二图像的预测标签为多维向量Lˊ且Lˊ内的每一维数值表示所述第二图像从属于一分类类别的预测概率;根据预设的prob函数对多维向量Lˊ内的每一维数值进行预测概率的修正,利用修正后的概率值更新多维向量Lˊ,得到多维向量L且作为所述第二图像的分类标签;所述prob函数用公式表示为:其中,p为所述第二图像从属于一分类类别的预测概率,T为预设的超参数,a为分类类别的序号,j为累加序号,N为分类类别的数目或多维向量Lˊ的维数。所述利用所述第一数据集和所述第三数据集对预设的深度神经网络进行训练,学习得到图像分类模型,包括:从所述第一数据集中选取多幅第一图像,并对各所选取的第一图像分别进行数据增强处理;对数据增强处理之后的各第一图像和所述第三数据集中的各幅第三图像进行数据分组,得到参与训练的多组训练数据;利用得到的多组训练数据对预设的深度神经网络进行训练,学习得到图像分类模型。所述对数据增强处理之后的各第一图像和所述第三数据集中的各幅第三图像进行数据分组,得到参与训练的多组训练数据,包括:将数据增强处理之后的各幅第一图像和所述第三数据集中的各幅第三图像进行混合重排,得到混合数据集;从所述混合数据集中获取若干幅图像,与从所述第一数据集中选取的多幅第一图像进行数据增强处理,得到一组训练数据,该组训练数据用公式表示为其中,λ~beta(α,α),λ′=max(λ,1-λ),X表示从所述第一数据集中选取的多幅第一图像,为X中的第i幅图像,为X中第i幅图像的分类标签,W表示所述混合数据集,为W中的第i幅图像,为W中第i幅图像的分类标签,|X′|为X中的图像数目,i为图像序号;从所述混合数据集中获取余下的各幅图像,与所述第三数据集中的各幅第三图像进行数据增强处理,得到另一组训练数据,该组训练数据用公式表示为其中,Z表示第三数据集,为Z中的第i幅图像,为Z中第i幅图像的分类标签,为W中的第i+|Xˊ|幅图像,为W中第i+|Xˊ|幅图像的分类标签,|Y′|为Z中的图像数目。所述利用得到的多组训练数据对预设的深度神经网络进行训练,学习得到图像分类模型,包括:对于多组训练数据中的一组训练数据Xˊ,计算对应的交叉熵损失量且用公式表示为其中,H()为分类交叉熵,x为任意一幅图像,p为Xˊ中x对应从属于一分类类别的预测概率,pm(y|x,θ)中的y为所述深度神经网络在输入x时对应的分类标签,θ为所述深度神经网络的网络参数;对于多组训练数据中的另一组训练数据Zˊ,计算对应的均方差损失量且用公式表示为其中,N为分类类别的数目,q为Zˊ中x对应从属于一分类类别的预测概率;利用总损失函数Loss=LossX+γLossZ且γ为超参数,反向计算所述深度神经网络中各层的梯度并对网络参数θ进行更新,学习得到所述图像分类模型。得到所述图像分类模型之后还包括对所述图像分类模型进行更新:重建步骤:从所述第二数据集中再次选取多幅第二图像,通过预测处理和标签锐化处理得到各所选取的第二图像对应的分类标签,且重新建立所述第三数据集;更新步骤:利用所述第一数据集和重新建立的所述第三数据集,对所述深度神经网络进行再次训练以本文档来自技高网
...

【技术保护点】
1.一种图像分类模型的训练方法,其特征在于,包括:/n建立关于一分类对象的第一数据集和第二数据集,所述第一数据集包含多幅标注有分类标签的第一图像,所述第二数据集包含多幅没有标注分类标签的第二图像;/n根据所述第一数据集对所述第二数据集中的所述第二图像进行分类标签的预测,得到所述第二图像对应的分类标签,并根据所述第二图像及其对应的分类标签得到标注有分类标签的第三图像以建立第三数据集;/n利用所述第一数据集和所述第三数据集对预设的深度神经网络进行训练,学习得到图像分类模型。/n

【技术特征摘要】
1.一种图像分类模型的训练方法,其特征在于,包括:
建立关于一分类对象的第一数据集和第二数据集,所述第一数据集包含多幅标注有分类标签的第一图像,所述第二数据集包含多幅没有标注分类标签的第二图像;
根据所述第一数据集对所述第二数据集中的所述第二图像进行分类标签的预测,得到所述第二图像对应的分类标签,并根据所述第二图像及其对应的分类标签得到标注有分类标签的第三图像以建立第三数据集;
利用所述第一数据集和所述第三数据集对预设的深度神经网络进行训练,学习得到图像分类模型。


2.如权利要求1所述的训练方法,其特征在于,所述根据所述第一数据集对所述第二数据集中的所述第二图像进行分类标签的预测,得到所述第二图像对应的分类标签,并根据所述第二图像及其对应的分类标签得到标注有分类标签的第三图像以建立第三数据集,包括:
从所述第一数据集中选取多幅第一图像,对预设的网络模型进行训练,得到预测模型;
从所述第二数据集中选取多幅第二图像,根据所述预测模型对所选取的第二图像进行分类标签的预测处理,得到各所选取的第二图像的预测标签;
对各幅第二图像的预测标签进行标签锐化处理,得到相应的第二图像的分类标签;
对各选取的第二图像及其对应的分类标签进行处理,得到第三图像及其对应的分类标签,并根据第三图像及其对应的分类标签建立第三数据集。


3.如权利要求2所述的训练方法,其特征在于,所述从所述第二数据集中选取多幅第二图像,根据所述预测模型对所选取的第二图像进行分类标签的预测处理,得到各所选取的第二图像的预测标签,包括:
对各幅所选取的第二图像分别进行一次或多次的图像增强处理;
将各幅所选取的第二图像及其图像增强处理后的第二图像分别输入至所述预测模型,分别得到对应的数据标签;
对于每幅所选取的第二图像,将其对应的数据标签和其图像增强处理后的第二图像所对应的数据标签进行标签平均化处理,得到其预测标签。


4.如权利要求2所述的训练方法,其特征在于,所述对各幅第二图像的预测标签进行标签锐化处理,得到相应的第二图像的分类标签,包括:
定义任意一幅第二图像的预测标签为多维向量Lˊ且Lˊ内的每一维数值表示所述第二图像从属于一分类类别的预测概率;
根据预设的prob函数对多维向量Lˊ内的每一维数值进行预测概率的修正,利用修正后的概率值更新多维向量Lˊ,得到多维向量L且作为所述第二图像的分类标签;
所述prob函数用公式表示为:



其中,p为所述第二图像从属于一分类类别的预测概率,T为预设的超参数,a为分类类别的序号,j为累加序号,N为分类类别的数目或多维向量Lˊ的维数。


5.如权利要求1-4中任一项所述的训练方法,其特征在于,所述利用所述第一数据集和所述第三数据集对预设的深度神经网络进行训练,学习得到图像分类模型,包括:
从所述第一数据集中选取多幅第一图像,并对各幅所选取的第一图像分别进行数据增强处理;
对数据增强处理之后的各幅第一图像和所述第三数据集中的各幅第三图像进行数据分组,得到参与训练的多组训练数据;
利用得到的多组训练数据对预设的深度神经网络进行训练,学习得到图像分类模型。


6.如权利要求5所述的训练方法,其特征在于,所述对数据增强处理之后的各幅第一图像和所述第三数据集中的各幅第三图像进行数据分组,得到参与训练的多组训练数据,包括:
将数据增强处理之后的各幅第一图像和所述第三数据集中的各幅第三图像进行混合重排,得到混合数据集;
从所述混合...

【专利技术属性】
技术研发人员:徐明邵新庆宋咏君刘强
申请(专利权)人:深圳力维智联技术有限公司南京中兴力维软件有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1