当前位置: 首页 > 专利查询>东北大学专利>正文

适用于深度学习图像分类的基于模型反馈的数据生成方法技术

技术编号:39409977 阅读:13 留言:0更新日期:2023-11-19 16:01
本发明专利技术提供一种适用于深度学习图像分类的基于模型反馈的数据生成方法,涉及图像分类技术领域

【技术实现步骤摘要】
适用于深度学习图像分类的基于模型反馈的数据生成方法


[0001]本专利技术涉及图像分类
,尤其涉及一种适用于深度学习图像分类的基于模型反馈的数据生成方法


技术介绍

[0002]在近年的深度学习研究中,为了得到性能良好的图像分类模型,往往需要大量的标注数据对模型进行端到端的训练

实验证明,数据量的提升通常对模型性能的全面提升有着巨大的影响

然而,高质量数据的采集与标注往往需要大量的人力物力与财力

因此,为了减少这一部分的支出,一些图像的数据增强算法被提出用来生成虚拟数据,希望可以利用这些新的图像数据达到提升模型性能的目的

[0003]数据增强算法主要有两大类,一个是利用网络模型进行数据直接生成,包括利用对抗生成网络
(adversarial generative network,GAN)
和变分自编码器
(variational Auto

Encoder,AVE)


另一类是利用已有的数据生成新的数据,包括一些数据增强算法:数据的翻转,旋转,镜像,颜色变换等,这些数据可以被认为是在某一个类的范围内的新数据

另外,数据增强也可以利用一个权重参数将两个或者多个类进行组合后得到新的数据,比如数据的凸组合,这些组合得到的新数据被认为是位于两个或多个类之间

[0004]目前,虽然有以上所提到的方法可以得到新的虚拟数据用来对模型进行训练,但在新数据的生成过程中中仍然有一些问题没有被解决:
[0005]有效性问题:
GAN
网络是根据人类的预设目标进行训练的,其结果是可以生产出人类理解范围之内的数据
。VAE
假设原始数据服从高斯分布,因此其可以利用分布创造出新数据

虽然这些方法可以大量的生成人类可理解的新数据,但对如此巨量的数据进行模型训练往往会造成算力消耗巨大的问题

目前的生成技术可以通过将两个或多个数据进行加权组合后得到新数据,但由于这些新数据大多是基于数据本身进行的简单的组合,没有考虑深度学习中模型对生成过程的影响,因此这些新数据在对提升模型性能方面也具有一定的局限性

[0006]多样性问题:目前的生成技术的主要参数,即上文所提到的权重参数,一般是通过在某个分布中随机采集得到的,因此限制了新数据的多样性


技术实现思路

[0007]本专利技术要解决的技术问题是针对上述现有技术的不足,提供一种适用于深度学习图像分类的基于模型反馈的数据生成方法,可以增加生成的新数据的多样性,使得深度学习模型在训练时可以获得更多的数据支撑,提高其综合性能,具有一定的普遍性和通用性

[0008]为解决上述技术问题,本专利技术所采取的技术方案是:
[0009]一种适用于深度学习图像分类的基于模型反馈的数据生成方法,包括以下步骤:
[0010]步骤1:数据的获取与整合;
[0011]通过网络获取已经制作完成的图像数据集,通过8:2的比例将其划分为训练数据
集和验证数据集;
[0012]步骤2:权重生成器模型的设计;
[0013]以卷积神经网络为基础设计权重生成器模型,其输入是需要组合的图像数据,其输出为一个与输入数据相同长宽的权重矩阵,该权重矩阵中每一个值都位于0到1之间;
[0014]步骤3:新图像数据的生成;
[0015]利用步骤2的权重矩阵对图像数据集中的原始图像数据进行组合得到新的图像数据;然后,将权重矩阵求平均后得到一个常数,利用该常数对原始图像数据的标签进行组合,得到新图像数据的标签;
[0016]步骤4:模型参数优化;
[0017]使用损失最大化算法优化权重生成器模型的参数,使用损失最小化算法优化深度学习分类模型的参数;权重生成器模型根据优化过程不断生成新的权重矩阵,并将由该新的权重矩阵得到的新图像数据作为训练数据,增加数据集数据的多样性,帮助深度学习分类模型更好的进行图像类别辨识

[0018]进一步地,所述步骤1的具体过程为:
[0019]步骤
1.1
:从网上下载分类网络训练所需要的图像数据集;
[0020]步骤
1.2
:将步骤
1.1
的图像数据根据8:2的比例划分成训练数据集和验证数据集;
[0021]步骤
1.3
:对训练数据集进行数据预处理,包括填充

随机裁剪

水平翻转

归一化处理

[0022]进一步地,所述步骤2的具体方法为:以卷积神经网络为基础单元建立权重生成器
G
,包括三层卷积神经网络,其结构自上到下分别为:卷积核为3且步长为1的卷积层,批归一化层,
GELU
激活层,卷积核为3且步长为1的卷积层,批归一化层,
GELU
激活层,特征融合层,卷积核为1且步长为1的卷积层,标准化层,
sigmoid
激活层

[0023]进一步地,所述步骤3的具体方法为:
[0024]步骤
3.1
:将两个采集自图像数据集的图像数据
x1、x2输入权重生成器模型
G
,经过生成器内部的卷积计算后得到一个权重矩阵
m
,即:
m

G(x1,x2)

[0025]步骤
3.2
:利用生成的权重矩阵
m
对原始图像进行组合得到新的图像数据,并将权重的平均值与两个图像数据的标签
y1、y2进行加权后生成新图像数据的标签:
[0026][0027]r

mean(m)
[0028][0029]其中,分别为新图像数据及其标签,
r
为权重
m
的平均值

[0030]进一步地,权重生成器模型的参数优化步骤为:将新图像数据输入到深度学习分类模型中,根据该模型的输出计算得到损失函数,并由此损失反向传播得到权重生成器模型参数的梯度信息,然后利用梯度信息作为反馈对权重生成器模型进行参数优化

[0031]进一步地,深度学习分类模型的参数优化步骤为:将新图像数据输入到深度学习分类模型中,根据该模型的输出计算得到损失函数,并由此损失反向传播得到分类模型参数的梯度信息,然后利用梯度信息作为反馈对分类模型进行参数优化

[0032]进一步地,所述步骤4的具体方法为:
[0033]步骤
4.1
:构建以卷积为基本单元的深度学习分类网络模型
F
,并利用生成的新图
像和新标签对该模型进行训练;
本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种适用于深度学习图像分类的基于模型反馈的数据生成方法,其特征在于:所述方法包括以下步骤:步骤1:数据的获取与整合;通过网络获取已经制作完成的图像数据集,通过8:2的比例将其划分为训练数据集和验证数据集;步骤2:权重生成器模型的设计;以卷积神经网络为基础设计权重生成器模型,其输入是需要组合的图像数据,其输出为一个与输入数据相同长宽的权重矩阵,该权重矩阵中每一个值都位于0到1之间;步骤3:新图像数据的生成;利用步骤2的权重矩阵对图像数据集中的原始图像数据进行组合得到新的图像数据;然后,将权重矩阵求平均后得到一个常数,利用该常数对原始图像数据的标签进行组合,得到新图像数据的标签;步骤4:模型参数优化;使用损失最大化算法优化权重生成器模型的参数,使用损失最小化算法优化深度学习分类模型的参数;权重生成器模型根据优化过程不断生成新的权重矩阵,并将由该新的权重矩阵得到的新图像数据作为训练数据,增加数据集数据的多样性,帮助深度学习分类模型更好的进行图像类别辨识
。2.
根据权利要求1所述的适用于深度学习图像分类的基于模型反馈的数据生成方法,其特征在于:所述步骤1的具体过程为:步骤
1.1
:从网上下载分类网络训练所需要的图像数据集;步骤
1.2
:将步骤
1.1
的图像数据根据8:2的比例划分成训练数据集和验证数据集;步骤
1.3
:对训练数据集进行数据预处理,包括填充

随机裁剪

水平翻转

归一化处理
。3.
根据权利要求2所述的适用于深度学习图像分类的基于模型反馈的数据生成方法,其特征在于:所述步骤2的具体方法为:以卷积神经网络为基础单元建立权重生成器
G
,包括三层卷积神经网络,其结构自上到下分别为:卷积核为3且步长为1的卷积层,批归一化层,
GELU
激活层,卷积核为3且步长为1的卷积层,批归一化层,
GELU
激活层,特征融合层,卷积核为1且步长为1的卷积层,标准化层,
sigmoid
激活层
。4.
根据权利要求3所述的适用于深度学习图像分类的基于模型反馈的数据生成方法,其特征在于:所述步骤3的具体方法为:步骤
3.1
:将两个采集自图像数据集的图像数据
x1、x2输入权重生成器模型
G
,经过生成器内部的卷积计算后得到一个权重矩阵
m
,即:
m

...

【专利技术属性】
技术研发人员:付俊冀先锐冯夏庭
申请(专利权)人:东北大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1