图像分类卷积神经网络结构的构建方法技术

技术编号：15691549 阅读：241 留言：0更新日期：2017-06-24 04:50

一种图像分类卷积神经网络结构的构建方法，由构建卷积神经网络结构、卷积神经网络训练和测试步骤组成。构建卷积神经网络结构的步骤为：获得训练样本图像和测试样本图像并对其进行预处理、设定卷积神经网络初始结构、引入激活函数、确定池化方法、确定滤波器、确定卷积层个数，得到图像分类卷积神经网络结构；卷积神经网络的训练和测试步骤为：用K‑Means聚类方法获得含有20个特征图的卷积层的滤波器，经前向传播和反向传播更新网络权值矩阵至最大训练次数，得到训练好的卷积神经网络，对测试样本图像进行测试，得到验证后的图像分类卷积神经网络结构，具有构建方法简单、有效等优点，适用于门牌号码、手写数字、邮政编码等图像分类。

Construction method of image classification convolution neural network structure

A method of constructing image classification convolution neural network consists of constructing convolutional neural network structure, training and testing steps of convolutional neural network. Construction of convolutional neural network comprises the following steps: acquire the training sample and test sample image and the image pre-processing, setting the initial structure, convolutional neural network is introduced to determine the activation function, pooling method, determine the filter, determine the number of image convolution layer, classified convolutional neural network structure; convolutional neural network training and the test method comprises the following steps: obtaining filter volume laminated contains 20 feature maps using K Means clustering method, the propagation and back propagation network update weight matrix to the maximum number of training, training the convolution neural network to the testing sample image, image classification of convolutional neural network structure after verification the construction, has the advantages of simple and effective method, suitable for numbers, handwriting recognition, image classification and post encoding.

全部详细技术资料下载

【技术实现步骤摘要】
图像分类卷积神经网络结构的构建方法
本专利技术属于图像处理及模式识别
，具体涉及到适用于图像分类的卷积神经网络结构。
技术介绍
深度学习是机器学习研究中的一个新的领域，其动机在于建立、模拟人脑进行分析学习的神经网络。它通过模仿人脑的机制来解释数据，例如图像、声音和文本，其核心是通过构建具有多个隐层的机器学习模型和大量的训练数据，来学习更有用的特征，从而最终提升分类或预测的准确性。现有的LeNet-5、AlexNet、GoogLeNet、ResNet等代表性网络都是基于卷积神经网络结构。其中，LeNet-5由7层组成，其1、3、5层为卷积层，2、4层为池化层；AlexNet由8层组成，其前5层是卷积层，后3层是全连接层；GoogLeNet由22层组成，其中有21个卷积层，1个全连接层；ResNet由152层组成，其中有151个卷积层，最后一层为全连接层。这些网络模型都是在卷积神经网络模型的基础上，通过加深网络深度完成对网络模型的改进。此外，还有人提出将卷积神经网络学习算法与其它思想或方法相结合，如隐马尔科夫模型(HiddenMarkovModel,HMM)与CNN相结合的混合模型，快速PCA和CNN相结合的模型等。上述基于神经网络在图像分类方法中所存在的主要技术问题是网络结构设计过程中，关于滤波器个数和大小、池化方法、激活函数往往是依赖经验确定，不恰当的网络结构会极大地增加网络参数个数，导致网络计算复杂度增加。
技术实现思路
本专利技术所要解决的技术问题在于克服现有技术的缺点，提供一种结构简单、易实现、收敛速度快的图像分类卷积神经网络结构的构建方法。解决上...

【技术保护点】
一种图像分类卷积神经网络结构的构建方法，由构建卷积神经网络结构、卷积神经网络训练和测试步骤组成，其特征在于所述的构建卷积神经网络结构步骤如下：(1)获得训练样本图像和测试样本图像并对其进行预处理(a)从图像数据集中选取50400～73257张训练样本图像和6000～26032张测试样本图像；(b)对50400～73257张训练样本图像进行预处理包括图像灰度化、图像减均值步骤：图像灰度化：用(1)式对被训练的样本图像进行灰度化处理，将彩色图像转为灰度图像：I＝W1×R+W2×G+W3×B (1)式中I为灰度化后的图像，R为彩色图像的红色分量，G为彩色图像的绿色分量，B为彩色图像的蓝色分量，W1为彩色图像的红色分量的权重，W2为彩色图像的绿色分量的权重，W3为彩色图像的蓝色分量的权重；图像减均值：用(2)式对已被灰度化的训练样本图像进行减均值处理：

【技术特征摘要】
1.一种图像分类卷积神经网络结构的构建方法，由构建卷积神经网络结构、卷积神经网络训练和测试步骤组成，其特征在于所述的构建卷积神经网络结构步骤如下：(1)获得训练样本图像和测试样本图像并对其进行预处理(a)从图像数据集中选取50400～73257张训练样本图像和6000～26032张测试样本图像；(b)对50400～73257张训练样本图像进行预处理包括图像灰度化、图像减均值步骤：图像灰度化：用(1)式对被训练的样本图像进行灰度化处理，将彩色图像转为灰度图像：I＝W1×R+W2×G+W3×B(1)式中I为灰度化后的图像，R为彩色图像的红色分量，G为彩色图像的绿色分量，B为彩色图像的蓝色分量，W1为彩色图像的红色分量的权重，W2为彩色图像的绿色分量的权重，W3为彩色图像的蓝色分量的权重；图像减均值：用(2)式对已被灰度化的训练样本图像进行减均值处理：式中Z为减均值后的图像，vi为n个图像中的第i个图像的像素矩阵，n为50400～73257整数个图像；(c)对6000～26032张测试样本图像进行预处理测试样本图像的预处理与对训练样本进行预处理步骤(b)相同；(2)设定卷积神经网络初始结构设定卷积神经网络初始结构：输入层(1)是50400～73257张大小为28×28或32×32的训练样本图像，输入层(1)后连接含有20个特征图的卷积层(2)，含有20个特征图的卷积层(2)后连接含有20个特征图的池化层(3)，含有20个特征图的池化层(3)后连接含有64个特征图的卷积层(2)，含有64个特征图的卷积层(2)后连接含有64个特征图的池化层(3)，含有64个特征图的池化层(3)后连接含有500个特征图的卷积层(2)，含有500个特征图的卷积层(2)后连接全连接层(4)，全连接层(4)后连接输出层(5)；(3)引入激活函数在每个卷积层(2)后引入ReLu激活函数为：yi＝max{xi,0}(3)式中xi为与前一层输出相连的第i个权值矩阵与当前层输入的内积，即卷积结果，yi为第i个特征图的输出，20≤i≤500；(4)确定池化方法卷积神经网络中的池化层(3)选用最大池化方法或均值池化方法或随机池化方法进行池化；(5)确定滤波器在3×3～9×9方阵之间、以图像宽度28或32为步长，在20～500内进行网格搜索，得到滤波器，为卷积层(2)的权值矩阵，滤波器的大小在3×3～9×9方阵之间，个数在20～500之间；(6)确定卷积层(2)个数在含有20个特征图的池化层(3)后增加一层卷积层(2)，其滤波器大小和个数与含有20个特征图的卷积层(2)的滤波器大小和个数相同，通过式(4)得到该卷积层(2)特征图的大小，在含有64个特征图的池化层(3)后增加或不增加一层卷积层(2)，若增加一层卷积层，其滤波器大小和个数与含有64个特征图的卷积层(2)的滤波器大小和个数相同，通过式(4)得到该卷积层(2)特征图的大小，卷积层(2)个...

【专利技术属性】
技术研发人员：马苗，刘琳，武杰，陈昱莅，裴炤，
申请(专利权)人：陕西师范大学，
类型：发明
国别省市：陕西,61

全部详细技术资料下载我是这个专利的主人