一种基于深信度网络的人车分类方法技术

技术编号:10022119 阅读:538 留言:0更新日期:2014-05-09 03:59
本发明专利技术提出了一种基于深信度网络的人车分类方法。所述方法将训练图像归一化为灰度图像,提取HOG算子,得到HOG特征直方图,将灰度图像拉直后与HOG特征直方图串联,训练DBN,构造基于DBN的人车分类网络;将待分类图像进行归一化和HOG特征提取后,输入基于DBN的人车分类网络中分类。本发明专利技术方法的深信度网络具有多个隐含层,拥有比浅层网络更加优异的特征表达能力;将原始图像和特征直方图相结合作为输入数据,在保留图像外观信息的基础上突出了局部梯度方向的统计信息;本发明专利技术对于光照、外观大幅变化的人车图像,仍可以获得优良的分类性能。

【技术实现步骤摘要】
一种基于深信度网络的人车分类方法
本专利技术属于图像处理和人工智能
,具体涉及一种基于深信度网络的人车分类方法。
技术介绍
随着我国智慧城市建设不断走向深入,智能视频监控系统以其高清化、网络化和智能化等优点已经成为智慧城市的必不可少重要特征之一。其中,行人和车辆是智能视频监控系统重点关注的两类目标,进行人车分类信息是公安图像侦查和交通状态分析的重要组成部分。因此,基于图像分析和人工智能的人车分类方法是智能视频监控系统的关键技术,已成为国内外相关领域的研究热点。人车分类的一般流程包括目标图像获取、目标特征提取、构造分类器和人车分类判别等步骤。在目标特征提取方面,HOG算子、LBP算子、不变距特征和几何比例特征等方法被用来进行目标特征表征。然而,每种特征提取方法都有相应的最佳使用场合,且不可避免的要丢失原始图像的部分信息,很难在目标光照,外观,尺寸大幅变化的情况下维持有效的特征表征;在分类器方面,SVM,神经网络,贝叶斯决策等理论广泛应用于图像分类领域。其中,基于SVM的方法分类性能最佳,并且能在小样本条件下取得良好的识别性能。但是,对于智能视频监控系统中获取的海量人车图像构成的大数据图像样本,SVM方法则存在寻优时间漫长和易陷入局部最优的问题。
技术实现思路
本专利技术所要解决的技术问题是为了克服现有技术的不足,提出一种基于深信度网络的人车分类方法。所述方法应用于智能视频监控系统中,可以对在光照、视角、分辨率等方面存在大幅差异的人车图像,实现稳健和高性能的分类功能。本专利技术为解决上述技术问题,采用如下技术方案:一种基于深信度网络的人车分类方法,包括步骤如下:步骤A,图像特征提取:将不同尺寸的训练图像归一化为同一大小的灰度图像Ig,提取灰度图像Ig的方向梯度直方图HOG算子,得到灰度图像的HOG特征直方图Hg;将灰度图像Ig拉直后与HOG特征直方图Hg串联,构成联合图像特征Vi;步骤B,构造深信度网络DBN:所述DBN基于受限波尔兹曼机RBM,确定DBN的网络层数及各层节点数量;步骤C,训练DBN:将联合图像特征Vi输入DBN,先逐层贪婪训练DBN,再使用反向传播BP算法,调整DBN参数,完成DBN的训练;步骤D,进行人车分类:将待分类图像进行归一化和HOG特征提取后,形成联合图像特征Vt,输入步骤C训练完成的DBN中,进行人车分类。步骤A中,所述图像特征提取,具体过程如下:步骤A-1,将训练图像归一化为96×144的灰度图像Ig;步骤A-2,使用HOG算子对Ig进行特征提取,获得1×6732维的HOG特征直方图Hg;步骤A-3,将Ig拉直后和Hg串联成联合图像特征Vi,为一个1×20556的向量。步骤B中,所述构造深信度网络DBN,具体包括以下步骤:步骤B-1,构造基于RBM的5层DBN,包括1个输入层,3个隐藏层和1个分类层;步骤B-2,指定DBN的输入层节点数为20556;第一个隐藏层节点数为500;第二个隐藏层节点数为500;第三个隐藏层节点数为2000;分类层的节点数为2。步骤C中,所述训练DBN,具体包括以下步骤:步骤C-1,使用对比散度CD算法对DBN的前4层进行逐层训练,计算3个隐藏层的输出值和各层之间的权值及偏置;步骤C-2,使用softmax回归模型训练DBN的分类层;步骤C-3,使用BP算法对整个DBN进行调整,优化DBN参数,完成DBN的全局训练。有益效果:本专利技术提出了一种基于深信度网络的人车分类方法。所述方法将训练图像归一化为灰度图像,提取HOG算子,得到HOG特征直方图,将灰度图像拉直后与HOG特征直方图串联,训练DBN,构造基于DBN的人车分类网络;将待分类图像进行归一化和HOG特征提取后,输入基于DBN的人车分类网络中分类。本专利技术方法的深信度网络具有多个隐藏层,拥有比浅层网络更加优异的特征表达能力;将原始图像和特征直方图相结合作为输入数据,在保留图像外观信息的基础上突出了局部梯度方向的统计信息;本专利技术对于光照、外观大幅变化的人车图像,仍可以获得优良的分类性能。附图说明图1是本专利技术中基于深信度网络的人车分类方法流程图。图2是本专利技术中深信度分类网络DBN示意图。具体实施方式下面结合附图,进一步具体说明本专利技术的一种基于深信度网络的人车分类方法。如图1所示,本专利技术所提供的一种基于深信度网络的人车分类方法,包括如下步骤:1)图像特征提取:将不同尺寸的训练图像归一化为同一大小的灰度图像,对灰度图像进行HOG算子提取,得到灰度图像对应的HOG特征直方图;将灰度图像拉直后与HOG特征直方图串联构造成联合图像特征Vi作为输入数据;2)构造分类网络:构造基于RBM的深信度网络(DeepBeliefNet,DBN),确定DBN的网络层数及各层的节点数量;3)训练分类网络:将联合图像特征Vi作为输入层数据输入DBN,逐层贪婪训练DBN,对输入数据进行模式学习和分类推导,完成基于DBN的人车分类网络CDBN;4)分类时,将待分类图像进行归一化和HOG特征提取后,形成联合图像特征Vt,输入网络CDBN中分类,判别待分类图像是行人还是车辆。所述步骤1)具体包括以下步骤:11)将从监控视频中获取的包含目标的彩色图像归一化为96×144的灰度图像Ig;12)使用矩形HOG(R-HOG)算子对Ig进行特征提取。其中,HOG算子的块(block)尺寸为16×16,每块等分为不重叠的4个单元(cell),每个单元中获取的梯度方向(范围是0-180°)合并为9个区间,即20°为一个区间,也就是说一个单元的特征是一个9维向量。本算法进行特征提取时,将图像Ig划分为相互交叠的块,每个块与相邻块有50%的面积相互重叠。则图像Ig中存在((96-8)/8)*((144-8)/8)=187个块,每个块内有4个单元,每个单元用一个9维特征向量表示,则每个块有4*9=36维特征。因此,每个图像Ig获取的HOG特征直方图Hg为36*187=6732维。13)将Ig拉直后和Hg串联成为联合图像特征Vi,是一个96*144+6732=20556维向量。所述步骤2)具体包括以下步骤:21)本专利技术中采用深信度网络(DBN)是目前研究和应用最为广泛的深度学习结构,深度学习与传统的浅层学习的最大区别在于:a)强调了网络结构的深度,网络层数通常达到5层以上;b)突出了特征学习的重要性,通过多个隐藏层的非线性变化,深度网络拥有比浅层网络更加优异的特征表达能力。DBN由多层受限波尔兹曼机(RestrictedBoltzmannMachine,RBM)组成,RBM是一个两层(输入层、隐藏层)神经网络,层间全连接,层内无连接。RBM也可被视为一个无向图模型,输入层用于表示观测数据,隐藏层可视为一种特征检测器。综合考虑人车分类性能和训练时间开销,本专利技术构造基于RBM的5层深信度网络CDBN,包括1个输入层,3个隐藏层和1个分类层;最后的分类层使用Softmax回归模型产生最终的网络输出。22)由于采用步骤1)所述的联合图像特征,输入层节点数为联合样本的维数20556;2-4层的隐藏节点数参考文献(G.E.Hinton,R.R.Salakhutdinov,”ReducingtheDimensionalityofDatawithNeuralNetwor本文档来自技高网...
一种基于深信度网络的人车分类方法

【技术保护点】

【技术特征摘要】
1.一种基于深信度网络的人车分类方法,其特征在于,包括步骤如下:步骤A,图像特征提取:将不同尺寸的训练图像归一化为同一大小的灰度图像Ig,提取灰度图像Ig的方向梯度直方图HOG算子,得到灰度图像的HOG特征直方图Hg;将灰度图像Ig拉直后与HOG特征直方图Hg串联,构成联合图像特征Vi;步骤B,构造深信度网络DBN:所述DBN基于受限波尔兹曼机RBM,确定DBN的网络层数及各层节点数量;步骤C,训练DBN:将联合图像特征Vi输入DBN,先逐层贪婪训练DBN,再使用反向传播BP算法,微调DBN参数,完成DBN的训练;步骤D,进行人车分类:将待分类图像进行归一化和HOG特征提取后,形成联合图像特征Vt,输入步骤C训练完成的DBN中,进行人车分类。2.根据权利要求1所述的一种基于深信度网络的人车分类方法,其特征在于,步骤A中,所述图像特征提取,具体过程如下:步骤A-1,将训练图像归一化为96×144的灰度图像Ig;步骤A-2,使用HOG算子对Ig进行...

【专利技术属性】
技术研发人员:孙宁吴秦龙韩光李晓飞
申请(专利权)人:南京邮电大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1