一种基于多特征融合的深度学习人脸识别方法技术

技术编号:17033459 阅读:29 留言:0更新日期:2018-01-13 19:43
本发明专利技术公开了一种基于多特征融合的深度学习人脸识别方法。本发明专利技术首先用局部二值模式和方向梯度直方图算法对ORL人脸库中的图像进行特征提取,然后,将得到的纹理特征和梯度特征进行融合,将两个特征向量通过向量连接的方式,连接成一个特征向量,最后用深度学习里面的深度信念网络的方式进行识别,将融合特征作为深度信念网络的输入,逐层训练网络,来完成对人脸的识别。本发明专利技术融合了多特征后,准确率会提高,而且算法会更加稳定,对复杂的场景更具适应性。

【技术实现步骤摘要】
一种基于多特征融合的深度学习人脸识别方法
本专利技术属于模式识别和深度学习
,涉及一种深度学习人脸识别方法,特别是涉及一种基于多特征融合的深度学习人脸识别方法。
技术介绍
近年来,随着互联网信息的快速发展,使得信息安全得到了极大的重视,而人脸识别作为一种重要的生物信息鉴别方法,在信息安全领域有着很多实际应用场合,如视频监控、访问控制、智能身份认证等,一直是当下机器视觉和模式识别领域的一大研究热点。人脸识别是基于人的脸部特征信息进行身份认证的一种身份识别技术。人脸识别算法主要由:①基于几何特征的方法:主要对面部器官如眼睛、鼻子、嘴巴等的形状和几何关系进行分析,进而识别。基于几何特征的人脸识别比较直观,识别速度快,但是对光照、表情、姿态、遮挡的鲁棒性差。而且由于只利用了图像的几何特征,忽略了局部的细节,算法的识别率较低。目前,这类方法以及很少被单独使用,通常只是作为其他识别方法的有益补充。②基于子空间的方法:将原始数据变换到一个低维的子空间,使数据在这一子空间中的分布更加紧凑,不仅降低了计算的复杂度,也使分类更加准确。空间变换包括线性变换和非线性变换两种。主成分分析法(PCA)是应用最广泛的一种特征提取方法,通过线性变换找到一组最优的单位正交向量机,利用他们的线性组合来重建图像,使重建后的图像与原图像的误差最小。该方法可以用比较少的特征对样本进行很好的描述,但是没有考虑不同样本间的差异,对于分类来说特征并不充分。线性判别分析(LDA)以样本的可分性为目标,寻找一组线性变换使降维后同类样本尽量集中,异类样本尽量分离。该方法在样本可分的情况下识别效果很好,但是当数据不具备线性可分时,识别率较低。③基于深度学习的人脸识别:不同于传统的人脸识别方法,该方法对特征选择不敏感,当达到一定的特征维度后,即使采用下采样同样能达到很好的识别效果,并且对光照、表情、伪装、姿态变化等都有较好的鲁棒性。
技术实现思路
为了解决上述技术问题,本专利技术提供了一种基于多特征融合的深度学习人脸识别方法。本专利技术方法包括以下步骤:步骤1:初始化迭代次数、学习率、隐藏层;步骤2:分别提取测试样本的HOG特征、LBP特征,来描述测试样本不同的属性;步骤3:分别对提取的人脸特征表达进行主成分分析来降低特征的维数和压缩特征中含有的噪声和冗余的信息;步骤4:分别对降维后的特征进行归一化处理,使得每一种特征的协方差矩阵为单位矩阵,得到标准化后的特征向量;步骤5:将两种特征向量采用连接的方式进行融合,得到融合后的特征向量;步骤6:利用深度信念网络(DBN)算法构建一个包含两个隐藏层的深度信念网络;步骤7:训练第一个隐藏层的受限玻尔兹曼机;步骤8:训练第二个隐藏层的受限玻尔兹曼机;步骤9:微调;步骤10:检验深度信念网络训练是否成功;若是,则通过微调后,对未知样本进行预测,并计算出准确率,流程结束;若否,则直接结束流程。作为优选,初始化参数迭代次数numepochs=30、每次处理数据batchsize=1、学习率=0.001、隐藏层L1=100、隐藏层L2=100。作为优选,图像的特征提取,包括对原始的ORL人脸库进行LBP特征提取和对原始的ORL人脸库进行HOG特征提取;所述对原始的ORL人脸库进行HOG特征提取,是利用HOG基本函数分别对原始的ORL人脸库进行特征提取,并组成一个HOG的人脸库;所述HOG基本函数定义为:将灰度化后图像归一化,再计算各像素点的梯度,多个像素组成一个区域,在区域中统计梯度直方图,再将多个相邻的区域组成块,块中的梯度直方图是由各个区域直方图串联归一化而成,这些块的直方图便是图像块的特征,则多个块特征串联组合得到HOG特征。定义如下:计算图像每个像素的梯度(包括大小和方向);计算像素梯度能够获取边缘信息,同时进一步弱化光照的干扰,图像中像素点(x,y)的梯度为:Gx(x,y)=H(x+1,y)-H(x-1,y)Gy(x,y)=H(x,y+1)-H(x,y-1)式中H(x,y),Gx(x,y),Gy(x,y)分别表示图像中像素点(x,y)的像素点、书平方向梯度和垂直方向梯度。图像中像素点(x,y)的梯度幅值和方向分别为:所述对原始的ORL人脸库进行LBP特征提取,是利用LBP基本函数分别对原始的ORL人脸库进行特征提取,并且组成一个LBP的人脸库;LBP基本函数定义为:对图像中的每个像素,通过计算以其为中心的邻域内各像素和中心像素的大小关系,把像素的灰度值转化为一个二进制序列,图像的局部纹理特征就用此二进制码来描述。具体计算过程即:选取图像的中心像素作为阈值,小于阈值的像素值记为0;反之,则记为1,按照这样的计算方法,依次读取该二进制码,按位加权再转换为十进制数,得到的值就是中心点的LBP值,当某个局部二进制模式所对应的循环二进制从0到1最多有两次跳变时,这个二进制序列首尾相连,该局部二进制模式所对应的二进制就称为一个等价模式类;检验某种模式是否为等价模式的方法是将其和其移动一位后的二进制模式按位相减的绝对值求和,其定义如下如下:其中:gc:表示的是局部区域的中心点的灰度值:gp(p=0,1,.....,p):表示对应于中心点周围等距分布的p个点:若某种模式计算得到的U(Gp)小于等于2,则将其归于等价模式。作为优选,步骤三采用PCA降维处理,是利用PCA基本函数分别对提取的人脸特征表达进行主成分分析来降低特征的维数;PCA基本函数定义为:令集合X=[x1,x2,...,xM]表示M个人脸特征的样本集,Xi的维数为N×1,样本集合的平均脸为从人脸特征的样本集合中减去平均脸得到PCA对集合中的样本数据进行分析,找到一个正交矩阵U=[u1,u2,...uk],K<M满足如下条件:最大化且UTU=1式中tr[]表示对矩阵求迹。通常情况下,人脸特征的维数N远远高于样本集中的样本数量M,直接求解N×N的矩阵ψ的特征向量是十分耗时的,因此通过求解矩阵的特征向量来表示ψ的特征向量减少计算量。的特征向量Vk如公式所示:将上式两边同时乘以得到:则人脸特征X在主成分子空间的特征表达为作为优选,步骤四利用GammaCompression方法对图像全局归一化;这能够调节图像的对比度,减少图像局部的阴影和光照变化的影响,同时还可以抑制噪声的干扰。Gamma的压缩公式:I(x,y)=I(x,y)gamma作为优选,步骤五中所述融合特征向量,采用向量连接的方式进行融合;其具体实现包括以下子步骤:给定人脸特征集合X={x},x∈RN,通过步骤三,样本X在主成分子空间中的投影为并且通过公式使得主成分y的协方差矩阵为单位矩阵。给定向量分别表示人脸图像的LBP特征、HOG特征,则其主成分分别为通过步骤三和步骤四,在融合特征向量的主成分之前,将不同特征的主成分归一化到相同的尺度下。通过归一化公式,分别将主成分向量yLBP、yHOG的协方差矩阵归一化到单位矩阵,标准化后的主成分向量分别为然后,将标准化后的主成分向量采用连接的方式融合为特征向量作为优选,步骤6中所述深度信念网络是一个隐藏层等于2的概率模型,由两个受限玻尔兹曼机(RBM)层组成。一个RBM模型是一个二部图,每一层的节点之间没有连接,一层是可见层(v),即输入数据层,一层是隐藏层(h本文档来自技高网
...
一种基于多特征融合的深度学习人脸识别方法

【技术保护点】
一种基于多特征融合的深度学习人脸识别方法,其特征在于,包括以下步骤:步骤1:初始化迭代次数、学习率、隐藏层;步骤2:分别提取测试样本的HOG特征、LBP特征,来描述测试样本不同的属性;步骤3:分别对提取的人脸特征表达进行主成分分析来降低特征的维数和压缩特征中含有的噪声和冗余的信息;步骤4:分别对降维后的特征进行归一化处理,使得每一种特征的协方差矩阵为单位矩阵,得到标准化后的特征向量;步骤5:将两种特征向量采用连接的方式进行融合,得到融合后的特征向量;步骤6:利用深度信念网络(DBN)算法构建一个包含两个隐藏层的深度信念网络;步骤7:训练第一个隐藏层的受限玻尔兹曼机;步骤8:训练第二个隐藏层的受限玻尔兹曼机;步骤9:微调;步骤10:检验深度信念网络训练是否成功;若是,则通过微调后,对未知样本进行预测,并计算出准确率,流程结束;若否,则直接结束流程。

【技术特征摘要】
1.一种基于多特征融合的深度学习人脸识别方法,其特征在于,包括以下步骤:步骤1:初始化迭代次数、学习率、隐藏层;步骤2:分别提取测试样本的HOG特征、LBP特征,来描述测试样本不同的属性;步骤3:分别对提取的人脸特征表达进行主成分分析来降低特征的维数和压缩特征中含有的噪声和冗余的信息;步骤4:分别对降维后的特征进行归一化处理,使得每一种特征的协方差矩阵为单位矩阵,得到标准化后的特征向量;步骤5:将两种特征向量采用连接的方式进行融合,得到融合后的特征向量;步骤6:利用深度信念网络(DBN)算法构建一个包含两个隐藏层的深度信念网络;步骤7:训练第一个隐藏层的受限玻尔兹曼机;步骤8:训练第二个隐藏层的受限玻尔兹曼机;步骤9:微调;步骤10:检验深度信念网络训练是否成功;若是,则通过微调后,对未知样本进行预测,并计算出准确率,流程结束;若否,则直接结束流程。2.根据权利要求1中所述的基于多特征融合的深度学习人脸识别方法,其特征在于:初始化参数迭代次数numepochs=30、每次处理数据batchsize=1、学习率=0.001、隐藏层L1=100、隐藏层L2=100。3.根据权利要求1中所述的基于多特征融合的深度学习人脸识别方法,其特征在于:步骤2中图像的特征提取,包括对原始的ORL人脸库进行LBP特征提取和对原始的ORL人脸库进行HOG特征提取;所述对原始的ORL人脸库进行HOG特征提取,是利用HOG基本函数分别对原始的ORL人脸库进行特征提取,并组成一个HOG的人脸库;所述HOG基本函数定义为:将灰度化后图像归一化,再计算各像素点的梯度,多个像素组成一个区域,在区域中统计梯度直方图,再将多个相邻的区域组成块,块中的梯度直方图是由各个区域直方图串联归一化而成,这些块的直方图便是图像块的特征,则多个块特征串联组合得到HOG特征;定义如下:计算图像每个像素的梯度(包括大小和方向);计算像素梯度能够获取边缘信息,同时进一步弱化光照的干扰,图像中像素点(x,y)的梯度为:Gx(x,y)=H(x+1,y)-H(x-1,y)Gy(x,y)=H(x,y+1)-H(x,y-1)式中H(x,y),Gx(x,y),Gy(x,y)分别表示图像中像素点(x,y)的像素点、书平方向梯度和垂直方向梯度;图像中像素点(x,y)的梯度幅值和方向分别为:所述对原始的ORL人脸库进行LBP特征提取,是利用LBP基本函数分别对原始的ORL人脸库进行特征提取,并且组成一个LBP的人脸库;LBP基本函数定义为:对图像中的每个像素,通过计算以其为中心的邻域内各像素和中心像素的大小关系,把像素的灰度值转化为一个二进制序列,图像的局部纹理特征就用此二进制码来描述;具体计算过程即:选取图像的中心像素作为阈值,小于阈值的像素值记为0;反之,则记为1,按照这样的计算方法,依次读取该二进制码,按位加权再转换为十进制数,得到的值就是中心点的LBP值,当某个局部二进制模式所对应的循环二进制从0到1或从1到0最多有两次跳变时,这个二进制序列首尾相连,该局部二进制模式所对应的二进制就称为一个等价模式类;检验某种模式是否属于等价模式的方法是将其和其移动一位后的二进制模式按位相减的绝对值求和,定义如下:其中:gc:表示的是局部区域的中心点的灰度值:gp(p=0,1,.....,p):表示对应于中心点周围等距分布的p个点:若某种模式计算得到的U(Gp)小于等于2,则将其归于等价模式。4.根据权利要求1中所述的基于多特征融合的深度学习人脸识别方法,其特征在于:步骤三采用PCA降维处理,是利用PCA基本函数分别对提取的人脸特征表达进行主成分分析来降低特征的维数;PCA基本函数定义为:令集合X=[x1,x2,...,xM]表示M个人脸特征的样本集,Xi的维数为N×1,样本集合的平均脸为从人脸特征的样本集合中减去平均脸得到PCA对集合中的样本数据进行分析,找到一个...

【专利技术属性】
技术研发人员:李训根章舸
申请(专利权)人:杭州电子科技大学
类型:发明
国别省市:浙江,33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1