基于深度卷积神经网络的典型红外目标分类方法技术

技术编号:22944816 阅读:35 留言:0更新日期:2019-12-27 17:12
本发明专利技术公开了基于深度卷积神经网络的典型红外目标分类方法。传统神经网络因为结构比较简单,属于典型的浅层模型,很难获得更为细致有效的识别特征,在红外图像识别问题中性能欠佳。本发明专利技术方法首先获取不同距离和角度以及有无遮挡物情况下两种车辆模型的红外图像样本作为数据集,然后将数据集分为不重叠的训练集和测试集,并对数据集样本进行预处理,再通过VGG16深度神经网络模型获取红外目标图像特征,最后将提取出的特征信息输入到归一化函数softmax进行分类。本发明专利技术方法可以减小红外目标图像特征提取的难度,降低模型的复杂程度,实现良好的分类效果和实时计算效率。

Typical infrared target classification method based on deep convolution neural network

【技术实现步骤摘要】
基于深度卷积神经网络的典型红外目标分类方法
本专利技术属于计算机
,尤其是红外图像识别
,具体涉及一种基于深度卷积神经网络的典型红外目标分类方法。
技术介绍
在可见光比较弱的条件下,目标很难成像。例如光线不足或者黑暗条件下,目标可见光图像难以获取,而红外图像是依据目标的热辐射产生的,不依赖可见光,在光线不足条件下具有优异的成像能力。因此,红外成像技术广泛应用于导弹红外制导、航空航天设备检测、森林火源检测与定位、夜间目标搜索等领域。现有的红外图像识别分类算法,主要采用传统的神经网络,由于传统神经网络因为结构比较简单,属于典型的浅层模型,很难获得更为细致有效的识别特征,在红外图像识别问题中性能欠佳。因此,深度卷积神经网络成为图像识别的发展方向。而最初的神经网络训练时,由于训练数据不足,计算能力欠缺,而高性能的卷积神经网络训练,容易导致“过拟合”问题。近年来,计算能力的提高,特别是以GPU为代表的高性能计算发展迅速,使得数据标记过程更为容易,网络模型的训练更为有效,实现实时的计算效率。
技术实现思路
本专利技术针对现有技术的不足,提供一种基于深度卷积神经网络的典型红外目标分类方法。本专利技术方法具体是:步骤(1).数据集的获取及预处理:通过红外热像仪采集得到目标的红外图像,所述的红外图像包括不同距离和角度以及有无遮挡物情况下红外传感器获取的目标不同红外图像样本;将获取的红外图像样本归为数据集X,X={(xi,yi)/i∈Λ};其中,xi表示第i个红外图像样本输入,yi表示xi对应的真实标记,yi∈(1,2,…,C),C为红外目标图像的类别数,Λ是样本的索引集合;将数据集X分为不重叠的训练集和测试集,其中训练集占数据集X的85~95﹪,其他为测试集;将数据集X图像尺寸裁剪为VGG16深度神经网络模型的输入图像尺寸(224×224),并进行数据在线增强操作。步骤(2).建立深度卷积神经网络模型获取红外目标图像特征:选用的深度卷积神经网络模型为含13层卷积层的VGG16深度神经网络模型,每层卷积核个数分别为2、2、3、3、3,卷积核尺寸为(3.3),延拓的尺寸与步长为(1,1)。VGG16深度神经网络模型结构在训练过程中选择批大小为16,随机失活比例为0.5,迭代次数为40000,起始学习速率为0.001,每隔10000次降低为原来的0.1倍,共训练2000次。动量常数和权重正则系数分别为0.9和0.000005。步骤(2.1)卷积操作;将训练集红外图像样本输入VGG16深度神经网络模型,H、W、D分别表示高度、宽度、通道数,表示属于实数域;xl为红外图像样本输入xi进入卷积层l的张量,卷积核卷积操作如下:式中(il+1,jl+1)表示红外图像样本输入xi经过卷积运算之后的像素所在位置的坐标,dl表示通道数,d表示卷积核个数,为学习的权重。每次都是同一个卷积核对不同位置的样本输入进行卷积运算,即参数共享特性。步骤(2.2)池化运算:pl为第l层池化核,最大值池化操作公式如下:Max-pooling:池化层中池化窗口尺寸和步长都为(2.2),所有池化层均采用最大值池化的方法。步骤(2.3)非线性变换:激活函数采用ReLu函数,定义为:当时,ReLu硬饱和;当时,则不存在不饱和问题。所以ReLu函数在时保持梯度不衰减,缓解梯度消失问题。步骤(3).红外目标图像分类;经过卷积层、池化层和激活函数层等操作之后学习得到的特征信息通过全连接层映射到样本标记空间,从而实现分类。所述VGG16深度神经网络模型有2个全连接特征层以及1个全连接分类层;通过训练学习得到的红外目标图像特征,每个像素与三层全连接层的神经元(个数分别为4096,4096,c)进行连接,分别得到1×1×4096、1×1×4096和1×1×c的输出,记VGG16深度神经网络模型的最终输出为hi(c),即样本i的预测结果。通过softmax函数得到网络预测概率pi(c):其中,m为总类别C中的一类。根据样本的预测结果和真实结果产生的误差,目标函数通过反向传播方法进行深度神经网络参数学习,采用交叉熵损失函数L(θ)解析该分类问题:其中为softmax分类器的模型参数,损失函数L(θ)对于最终输出hi(c)的导数为:根据预测结果和真实标记之间产生的误差,不断向前层传递即反向传播,VGG16深度神经网络模型的权重参数将不断更新,从而完成VGG16深度神经网络模型训练,最后根据网络预测概率pi(c)实现对红外目标图像的结果分类。本专利技术方法利用基于VGG16深度神经网络模型的深度学习,对红外目标识别分类。该方法选择增加深度的卷积神经网络,并通过GPU加速实现算法的完成。本专利技术方法可以减小红外目标图像特征提取的难度,降低模型的复杂程度,实现良好的分类效果和实时计算效率。附图说明图1为本专利技术的实现流程图;图2为数据集X的部分截取示意图;图3为VGG16深度神经网络模型架构图。具体实施方式以下结合附图对本专利技术作进一步说明。如图1所示,基于深度卷积神经网络的典型红外目标分类方法,方法具体是:步骤(1).数据集的获取及预处理:通过红外热像仪采集得到目标(卡车模型和坦克模型)的红外图像,红外图像包括不同距离和角度,以及有无遮挡物情况下,红外传感器获取的目标不同红外图像样本,共采集了607张图像数据,包括451张坦克和156张卡车红外图像。图2是所收集的红外图像数据集的部分截取。将获取的红外图像样本归为数据集X,X={(xi,yi)/i∈Λ};其中,xi表示第i个红外图像样本输入,yi表示xi对应的真实标记,yi∈(1,2,…,C),C为红外目标图像的类别数,Λ是样本的索引集合;将数据集X分为不重叠的训练集和测试集,其中训练集占数据集X的85~95﹪,其他为测试集,本实施例训练集占数据集X的90﹪,测试集占数据集X的10﹪。将数据集分成三组不同训练集,分别记为folder1、folder2和folder3,其中folder1中有60﹪存在目标遮挡情况,folder2和folder3无遮挡情况。将数据集X图像尺寸裁剪为VGG16深度神经网络模型的输入图像尺寸(224×224),并进行数据在线增强操作。步骤(2).建立深度卷积神经网络模型获取红外目标图像特征:选用的深度卷积神经网络模型为含13层卷积层的VGG16深度神经网络模型,每层卷积核个数分别为2、2、3、3、3,卷积核尺寸为(3.3),延拓的尺寸与步长为(1,1)。VGG16深度神经网络模型架构如图3所示。VGG16深度神经网络模型结构在训练过程中选择批大小为16,随机失活比例为0.5,迭代次数为40000,起始学习速率为0.001,每隔10000次降低为原来的0.1倍,共训练2000次。动量常数和权重正则系数分别为0.9本文档来自技高网...

【技术保护点】
1.基于深度卷积神经网络的典型红外目标分类方法,其特征在于该方法具体如下:/n步骤(1).数据集的获取及预处理:/n通过红外热像仪采集得到目标的红外图像,所述的红外图像包括不同距离和角度以及有无遮挡物情况下红外传感器获取的目标不同红外图像样本;/n将获取的红外图像样本归为数据集X,X={(x

【技术特征摘要】
1.基于深度卷积神经网络的典型红外目标分类方法,其特征在于该方法具体如下:
步骤(1).数据集的获取及预处理:
通过红外热像仪采集得到目标的红外图像,所述的红外图像包括不同距离和角度以及有无遮挡物情况下红外传感器获取的目标不同红外图像样本;
将获取的红外图像样本归为数据集X,X={(xi,yi)/i∈Λ};其中,xi表示第i个红外图像样本输入,yi表示xi对应的真实标记,yi∈(1,2,…,C),C为红外目标图像的类别数,Λ是样本的索引集合;
将数据集X分为不重叠的训练集和测试集,其中训练集占数据集X的85~95﹪,其他为测试集;将数据集X图像尺寸裁剪为VGG16深度神经网络模型的输入图像尺寸(224×224),并进行数据在线增强操作;
步骤(2).建立深度卷积神经网络模型获取红外目标图像特征,选用的深度卷积神经网络模型为含13层卷积层的VGG16深度神经网络模型,具体为:
步骤(2.1)卷积操作;
将训练集红外图像样本输入VGG16深度神经网络模型,H、W、D分别表示高度、宽度、通道数,表示属于实数域;xl为红外图像样本输入xi进入卷积层l的张量,卷积核
卷积操作:其中,(il+1,jl+1)表示红外图像样本输入xi经过卷积运算之后的像素所在位置的坐标,dl表示通道数,d表示卷积核个数,为学习的权重;
步骤(2.2)池化运算:

pl为第l层池化核,最大值池化操作公式如下:



步骤(2.3)非线性变换:
激活函数采用ReLu函数,定义为:
当时,ReLu硬饱和;
当时,则不存在不饱和问题;
步骤(3).红外目标图像分类;
所述VG...

【专利技术属性】
技术研发人员:刘伟峰张倩文王亚宁
申请(专利权)人:杭州电子科技大学
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1