当前位置: 首页 > 专利查询>宁夏大学专利>正文

基于空间和通道注意力机制的图像分类方法与系统技术方案

技术编号:31163490 阅读:27 留言:0更新日期:2021-12-04 10:35
本发明专利技术公开了一种基于空间和通道注意力机制的图像分类方法与系统,包括:S1、获取样本数据集;S2、从样本数据集中抽取特定数量的图像,利用深度卷积生成对抗网络DCGAN生成假样本,得到扩充数据集;S3、对扩充数据集进行处理,包括降维、去噪及数据增强;S4、将扩充数据集按比例进行划分,得到训练集和测试集;S5、将训练集中的图像输入到已构建的图像分类网络模型中进行调参训练,从中提取图像的特征,最后保存训练好的图像分类网络模型;S6、将测试集中的图像加载到训练好的图像分类网络模型中进行判别,模型输出的结果即为分类结果。本发明专利技术可以实现目标类型图像的准确分类。发明专利技术可以实现目标类型图像的准确分类。发明专利技术可以实现目标类型图像的准确分类。

【技术实现步骤摘要】
基于空间和通道注意力机制的图像分类方法与系统


[0001]本专利技术涉及图像分类的
,尤其是指一种基于空间和通道注意力机制的图像分类方法与系统。

技术介绍

[0002]图像分类是对输入的原始图像进行特征提取,将其分到所属类别中的图像处理方法。主要过程包括图像预处理、特征和分类器设计。特征提取是图像分类任务中最为关键的一部分。传统的图像分类是基于特征编码实现的,而现代的图像分类是基于深度学习实现的。
[0003]近年来,图像分类技术受到了普遍关注,在很多不同的领域中发挥着重要作用。目前该技术已广泛应用于农业、环境、医学和其它领域。图像分类技术的发展取得了巨大的进展,尤其是深度卷积神经网络(CNNs)取得了成功,通过一系列方法,成功将数据量庞大的图像识别问题不断降维,是图像特征提取最好的方式。CNN最早由YanLeCun提出的LeNet

5并应用于手写体识别上,之后出现了AlexNet、VGG、GoogleNet,到现在广泛使用的ResNet和DenseNet。使卷积神经网络在计算机视觉方面发挥着重要作用。
[0004]不论是现代方法还是传统方法特征提取是整个分类的难点,一旦找到好的特征,分类就变的很容易了。现代的图像分类相较于传统的图像分类方法,提取出更高维、抽象的特征,并且这些特征与分类器关系紧密。但在处理庞大的图像数据、图像干扰生等问题的数据时,其特征提取并不能满足实际需求,不能做到分类的精确度。因此,提出一种提取出更高维图像特征的方法。

技术实现思路

[0005]本专利技术的第一目的在于克服现有技术的缺点与不足,提供一种基于空间和通道注意力机制的图像分类方法,可以实现目标类型图像的准确分类。
[0006]本专利技术的第二目的在于提供一种基于空间和通道注意力机制的图像分类系统。
[0007]本专利技术的第一目的通过下述技术方案实现:基于空间和通道注意力机制的图像分类方法,包括以下步骤:
[0008]S1、获取待判别分类的目标类型的图像样本,并构建相应的样本数据集;
[0009]S2、从获取的样本数据集中抽取特定数量的图像,利用深度卷积生成对抗网络DCGAN生成假样本,从而对获取的样本数据集进行扩充,得到扩充数据集;
[0010]S3、对扩充数据集进行处理,包括降维、去噪及数据增强;
[0011]S4、将步骤S3处理后的扩充数据集按比例进行划分,将大部分数据划分为训练集,小部分数据划分为测试集;
[0012]S5、将训练集中的图像输入到已构建的图像分类网络模型中进行调参训练,从中提取图像的特征,最后保存训练好的图像分类网络模型;其中,所构建的图像分类网络模型由DenseNet、空间注意力机制、通道注意力机制SE

Net和分类子模块组成,DenseNet为模型
的主干网络,用于提取图像的全局特征及特征复用;空间注意力机制嵌入于DenseNet中,将图片的空间域信息做对应的空间变换,只关心感兴趣的位置,从而将关键信息提取出来;通道注意力机制SE

Net通过建模各个特征通道的重要程度,针对特征的重要性抑制或增强不同的通道;分类子模块利用Softmax作为核心,将各类图像做到精准分类;该图像分类网络模型通过空间注意力机制获取感兴趣部位,利用通道注意力机制SE

Net获取特征的权重,强调有用信息抑制无用信息,并将其输入到分类子模块;
[0013]S6、将测试集中的图像加载到训练好的图像分类网络模型中进行判别,模型输出的结果即为分类结果。
[0014]进一步,在步骤S2中,从获取的样本数据集中抽取特定数量的图像生成假样本,采用无监督学习的深度卷积生成对抗网络DCGAN,通过DCGAN的生成器G与判别器D相互博弈最终达到纳什均衡,使生成器G生成的样本能欺骗过判别器D,最终判别样本为真;其中,生成假样本的具体过程如下:
[0015]S21、生成器G从给定噪声中产生合成数据,经过上采样与反卷积操作,最终将高层表征转换成分辨率小的像素图像,全过程没有使用全连接层和池化层,其中给定噪声服从均匀分布或者正态分布;
[0016]S22、判别器D分辨生成器G的输出是否为真实数据;后者试图产生更接近真实的数据,相应地,前者试图更好地分辨真实数据与生成数据;由此,生成器G与判别器D在对抗中进步,在进步后继续对抗,由生成器G得到的数据也就越来越完美,逼近真实数据,从而能够生成想要得到的图像;其优化目标函数如下:
[0017][0018]式中,V(D,G)为生成器G和判别器D的向量表示;x表示真实图片;表示真实图片服从均匀分布或者正态分布;表示噪声服从均匀分布或者正态分布;D(x)表示判别器D判别真实图片是否为真实的概率;G(z)代表生成器G生成的图片;D(G(z))表示判别器D判断生成器G生成的图片是否为真的概率。
[0019]进一步,在步骤S3中,采用主成分分析方法PCA对扩充数据集进行降维、去噪,从而减少数据冗余,其包括以下内容:
[0020]a、将图像变成矩阵;
[0021]b、对所有特征进行去均值操作;
[0022]c、求协方差矩阵;
[0023]d、求协方差的特征值和相对应的特征向量;
[0024]e、将特征值排序;
[0025]f、保留前N个最大的特征值对应的特征向量;
[0026]g、将原始特征投影到得到的N个特征向量构建的新空间中,最终达到降维的目的。
[0027]进一步,在步骤S3中,通过对扩充数据集中的图像进行旋转、翻转、裁剪、平移、调整亮度与对比度,实现对图像的数据增强。
[0028]进一步,在步骤S5中,DenseNet中的卷积层由BN、Relu和1
×
1Conv组成,利用1
×
1Conv不仅能够降低图像的维度,而且还能够降低特征图输出的数量;DenseNet中的Dense Block模块是DenseNet的重要组成部分,由BN、Relu、1
×
1Conv和3
×
3Conv组成,用于改善层
间信息流,其中Dense Block内部采用Bottleneck来减少计算量,将原有的结构增加1
×
1Conv;DenseNet中的Transition层位于两个密集块之间,用于改变特征图的大小,由BN、Relu、1
×
1Conv和2
×
2平均池化组成。
[0029]进一步,在步骤S5中,空间注意力机制首先将通道本身进行降维,分别获取最大池化和均值池化结果,然后拼接成一个特征图,再使用一个卷积层进行学习。
[0030]进一步,在步骤S5中,通道注意力机制SE

Net是由全局平均池化、全连接层、Relu、全连接层和Sigmoid五部分组成;其压缩是通过全局平均池化实现压缩操作继而生成通道统计,将每个二维的特征通道变成一个实数,本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于空间和通道注意力机制的图像分类方法,其特征在于,包括以下步骤:S1、获取待判别分类的目标类型的图像样本,并构建相应的样本数据集;S2、从获取的样本数据集中抽取特定数量的图像,利用深度卷积生成对抗网络DCGAN生成假样本,从而对获取的样本数据集进行扩充,得到扩充数据集;S3、对扩充数据集进行处理,包括降维、去噪及数据增强;S4、将步骤S3处理后的扩充数据集按比例进行划分,将大部分数据划分为训练集,小部分数据划分为测试集;S5、将训练集中的图像输入到已构建的图像分类网络模型中进行调参训练,从中提取图像的特征,最后保存训练好的图像分类网络模型;其中,所构建的图像分类网络模型由DenseNet、空间注意力机制、通道注意力机制SE

Net和分类子模块组成,DenseNet为模型的主干网络,用于提取图像的全局特征及特征复用;空间注意力机制嵌入于DenseNet中,将图片的空间域信息做对应的空间变换,只关心感兴趣的位置,从而将关键信息提取出来;通道注意力机制SE

Net通过建模各个特征通道的重要程度,针对特征的重要性抑制或增强不同的通道;分类子模块利用Softmax作为核心,将各类图像做到精准分类;该图像分类网络模型通过空间注意力机制获取感兴趣部位,利用通道注意力机制SE

Net获取特征的权重,强调有用信息抑制无用信息,并将其输入到分类子模块;S6、将测试集中的图像加载到训练好的图像分类网络模型中进行判别,模型输出的结果即为分类结果。2.根据权利要求1所述的基于空间和通道注意力机制的图像分类方法,其特征在于,在步骤S2中,从获取的样本数据集中抽取特定数量的图像生成假样本,采用无监督学习的深度卷积生成对抗网络DCGAN,通过DCGAN的生成器G与判别器D相互博弈最终达到纳什均衡,使生成器G生成的样本能欺骗过判别器D,最终判别样本为真;其中,生成假样本的具体过程如下:S21、生成器G从给定噪声中产生合成数据,经过上采样与反卷积操作,最终将高层表征转换成分辨率小的像素图像,全过程没有使用全连接层和池化层,其中给定噪声服从均匀分布或者正态分布;S22、判别器D分辨生成器G的输出是否为真实数据;后者试图产生更接近真实的数据,相应地,前者试图更好地分辨真实数据与生成数据;由此,生成器G与判别器D在对抗中进步,在进步后继续对抗,由生成器G得到的数据也就越来越完美,逼近真实数据,从而能够生成想要得到的图像;其优化目标函数如下:式中,V(D,G)为生成器G和判别器D的向量表示;x表示真实图片;表示真实图片服从均匀分布或者正态分布;表示噪声服从均匀分布或者正态分布;D(x)表示判别器D判别真实图片是否为真实的概率;G(z)代表生成器G生成的图片;D(G(z))表示判别器D判断生成器G生成的图片是否为真的概率。3.根据权利要求1所述的基于空间和通道注意力机制的图像分类方法,其特征在于,在步骤S3中,采用主成分分析方法PCA对扩充数据集进行降维、去噪,从而减少数据冗余,其包
括以下内容:a、将图像变成矩阵;b、对所有特征进行去均值操作;c、求协方差矩阵;d、求协方差的特征值和相对应的特征向量;e、将特征值排序;f、保留前N个最大的特征值对应的特征向量;g、将原始特征投影到得到的N个特征向量构建的新空间中,最终达到降维的目的。4.根据权利要求1所述的基于空间和通道注意力机制的图像分类方法,其特征在于,在步骤S3中,通过对扩充数据集中的图像进行旋转、翻转、裁剪、平移、调整亮度与对比度,实现对图像的数据增强。5.根据权利要求1所述的基于...

【专利技术属性】
技术研发人员:杨军刘孟鑫马利亚
申请(专利权)人:宁夏大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1