基于混合深度可分离膨胀卷积的图像分类模型及其分类方法技术

技术编号:27110230 阅读:18 留言:0更新日期:2021-01-25 19:04
本发明专利技术公开了一种基于混合深度可分离膨胀卷积的图像分类模型,构建过程包括:从前至后将深度可分离膨胀卷积层、特征信息拼接层、卷积层、批标准化层和修正线性单元层封装成混合深度可分离膨胀卷积模块;从前至后将卷积层、批量归一化层、修正线性单元层、混合深度可分离膨胀卷积模块、最大值池化层、压平层、随机失活层和全连接层封装构成深度神经网络的主干网络;对主干网络的参数权重进行随机初始化,并预设迭代次数和批量归一化层的动量参数;采用随机梯度下降法优化网络模型的参数,重复迭代计算,直至损失值收敛,得到最优的网络模型。通过上述方案,本发明专利技术具有架构简单、计算工作量少、分类精准等优点。分类精准等优点。分类精准等优点。

【技术实现步骤摘要】
基于混合深度可分离膨胀卷积的图像分类模型及其分类方法


[0001]本专利技术涉及图像处理
,尤其是基于混合深度可分离膨胀卷积的图像分类模型及其分类方法。

技术介绍

[0002]图像是可以客观地展示自然事物,是人们认知世界的重要资源,而且技术人员可以通过分析图像获得有益的信息,发展相关算法。图像分类属于计算机视觉方向,在医疗、食品安全等领域广泛应用。
[0003]目前,现有技术中的图像分类算法主要思想就是给需要分类的图像集合分配对应的标签,对于计算机来说,一张图像就是一个像素矩阵,其利用相关算法技术提取像素矩阵中有效的信息,这与人对图像的认知方式不同。传统图像分类算法主要分为手工特征提取、特征编码、分类器分类这三步骤;其中,常用的手工特征有局部二值化模式特征(Local Binary Pattern,LBP)、尺度不变特征变换(Scale-Invariant Feature Transform,SIFT)以及方向梯度直方图特征(Histogram of Oriented Gradient,HOG)等。特征编码是为了去除冗余的特征信息,提高表征信息的鲁棒性。通用的分类器有支持向量机(Support Vector Machine,SVM)和自适应增强分类器(Adaptive Boosting,AdaBoost)等。由于手工特征泛化性差,从而影响到传统图像分类算法在实际场景中的应用,在精度和速度上都没有多大的优势。随着计算机算力的提升,深度学习算法得到了迅速的发展,深度学习的图像分类算法也因此开始崛起。
>[0004]2012年Alex Krizhevsky等人提出了Alexnet网络结构,对ImageNet数据集进行学习,取得了2012年ImageNet比赛的冠军,从此之后不断出现深度学习算法应用到大数据图像分类上。深度学习的图像分类算法通过利用卷积神经网络提取样本的卷积特征,具有更加丰富的语义信息,能让算法模型学习到更加高效的表达能力,与手工特征相比,更为精准。但是,深度学习算法的图像分类算法在训练网络模型时,为了减少特征维度,都会添加特征下采样操作,一定程度上避免网络出现过拟合现象,如池化层,这样会造成卷积特征丢失细节信息。Jonathan Long等人提出全卷积网络结构,其中,使用反卷积层增大特征图的分辨率,一定程度上恢复些细节信息但较为粗糙。同年,Kaiming He等人提出残差深度神经网络,采用跳跃连接结构将深层网络层特征和浅层网络层特征融合,提升特征图中细节信息的使用率。
[0005]现有技术中的深度学习的图像分类算法中采用池化层或步长为2的卷积层对特征图像进行下采样操作,减少数量,扩大感受野,增加特征图的语义信息,但是,其会丢失特征图的细节信息。
[0006]综上所述,上述方法都只能一定程度上修补特征图的细节信息,但是会增加网络模型的参数量,使网络模型变得复杂,难优化,所以特征图细节信息的丢失问题还是影响着分类检测精度。
[0007]另外,在专利申请号为“201910818758.9”、名称为“基于轻量级深度神经网络的工
业产品缺陷图像分类方法”的中国专利技术专利中,其包含:1、工业产品图像数据集的准备;2、搭建轻量级深度神经网络;3、将工业产品缺陷图像数据集输入到搭建好的轻量级深度神经网络中,经过网络训练,提取偏光片图像多尺度特征,将提取到的特征输入Softmax层进行分类,得到分类模型;4、将测试图像输入分类模型中,将图像属于某一类别的概率和图像对应的标签输入到Accuracy层,输出图像的正确分类结果。但是,该技术存在以下缺陷:
[0008]第一,该技术主要将卷积核大小为3x3的深度可分离卷积处理后的特征与卷积核大小为1x1的普通卷积处理后的特征融合,因两部分的特征感受野不同、尺度不同,互补之后达到增加感受野的目的,虽然提高了感受野大小,但是感受野还是比较单一,容易忽略小目标的分类;
[0009]第二,该技术中使用最大池化层对特征图进行下采样,但未修补特征图的分辨率,大幅度丢失特征的细节信息,降低分类精度;
[0010]第三,该技术中提及的并行深度可分离卷积模块通过堆叠卷积提高特征图的语义性,大大增加网络结构的参数量,不易优化,并且未结合上下文信息进行分类,一定程度上限制了分类精度。
[0011]因此,急需提出一种结构简单、不增加原有模型计算量的基于混合深度可分离膨胀卷积的图像分类模型及其分类方法,以减少特征图的细节信息的丢失,提高网络模型的泛化性和鲁棒性,提高网络模型的分类精度。

技术实现思路

[0012]针对上述问题,本专利技术的目的在于提供一种基于混合深度可分离膨胀卷积的图像分类模型及其分类方法,本专利技术采用的技术方案如下:
[0013]基于混合深度可分离膨胀卷积的图像分类模型,所述图像分类模型构建过程如下:
[0014]从前至后将深度可分离膨胀卷积层、特征信息拼接层、卷积层、批标准化层和修正线性单元层封装成混合深度可分离膨胀卷积模块;
[0015]从前至后将卷积层、批量归一化层、修正线性单元层、混合深度可分离膨胀卷积模块、最大值池化层、压平层、随机失活层和全连接层封装构成深度神经网络的主干网络;
[0016]对主干网络的参数权重进行随机初始化,并预设迭代次数和批量归一化层的动量参数;采用随机梯度下降法优化网络模型的参数,重复迭代计算,直至损失值收敛,得到最优的网络模型。
[0017]进一步地,所述混合深度可分离膨胀卷积模块中的深度可分离膨胀卷积层采用3个、且并行布设。
[0018]优选地,所述混合深度可分离膨胀卷积模块设置有8个,并按2、3、3进行分块,且任一分块后设置有一最大值池化层。
[0019]优选地,所述混合深度可分离膨胀卷积模块中从上至下的3个深度可分离膨胀卷积层的膨胀率依次取值为1、2、3,卷积核大小都为3
×
3,步长都为1。
[0020]进一步地,所述混合深度可分离膨胀卷积模块中的卷积层的卷积核大小都为1
×
1,步长都为1。
[0021]进一步地,所述随机失活层的失活率为0.5。
[0022]更进一步地,任一所述最大值池化层的采样核大小为2,步长为2。
[0023]优选地,所述批量归一化层的动量参数为0.975,学习率设为0.1。
[0024]优选地,所述迭代次数取值为30000。
[0025]一种图像分类方法,采用基于混合深度可分离膨胀卷积的图像分类模型进行分类。
[0026]与现有技术相比,本专利技术具有以下有益效果:
[0027](1)本专利技术巧妙地采用设置了混合深度可分离膨胀卷积模块,其可以在原始网络参数不变的情况下保留特征的细节信息,快速增大感受野;另外,本专利技术搭建混合深度可分离膨胀卷积模块,通过调节膨胀率大小调整原始卷积核,如此一来,其既不会增加原始网络模型的参数量,还能增补特征图中的上下文信息,弥补下采样等操作造成的信息丢失,提升网络模型的表达能力。
[002本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.基于混合深度可分离膨胀卷积的图像分类模型,其特征在于,所述图像分类模型构建过程如下:从前至后将深度可分离膨胀卷积层、特征信息拼接层、卷积层、批标准化层和修正线性单元层封装成混合深度可分离膨胀卷积模块;从前至后将卷积层、批量归一化层、修正线性单元层、混合深度可分离膨胀卷积模块、最大值池化层、压平层、随机失活层和全连接层封装构成深度神经网络的主干网络;对主干网络的参数权重进行随机初始化,并预设迭代次数和批量归一化层的动量参数;采用随机梯度下降法优化网络模型的参数,重复迭代计算,直至损失值收敛,得到最优的网络模型。2.根据权利要求1所述的基于混合深度可分离膨胀卷积的图像分类模型,其特征在于,所述混合深度可分离膨胀卷积模块中的深度可分离膨胀卷积层采用3个、且并行布设。3.根据权利要求1所述的基于混合深度可分离膨胀卷积的图像分类模型,其特征在于,所述混合深度可分离膨胀卷积模块设置有8个,并按2、3、3进行分块,且任一分块后设置有一最大值池化层。4.根据权利要求2所述的基于混合深度可分离膨胀卷积的图像分类模型,其特征在于,所述混合深...

【专利技术属性】
技术研发人员:闫超黄俊洁陶陶
申请(专利权)人:成都东方天呈智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利