一种复杂场景下人脸识别的深度卷积网络及学习方法技术

技术编号:16270493 阅读:45 留言:0更新日期:2017-09-22 22:07
本发明专利技术提出一种复杂场景下人脸识别的深度卷积网络及学习方法,该网络结构由于四个个全卷积模块和三个全连接模块组成,利用随机剃度下降算法对深度卷积网络的参数进行优化。设计的人脸识别深度卷积网络期望得到在真实应用场景,针对复杂光照,多视角下都具有稳定的识别性能,在高性能GPU的支持,在较高的计算度下满足工程应用的需求。

【技术实现步骤摘要】
一种复杂场景下人脸识别的深度卷积网络及学习方法
本专利技术涉及一种复杂场景下人脸识别的深度卷积网络及学习方法,属于计算机

技术介绍
早期的人脸识别算法主要包括对图像预处理,提出如LBP等传统人脸特征以及应用向量机对所提取到的特征进行学习和分类。其中图像预处理算法尤为关键,具体包括针对不同光照条件下的预处理算法,针对图像噪声的去噪算法,以及针对不同角度人脸对像的对齐算法。在专门针对某一个人脸识别数据库的优化后,例如经典的LFW人脸识别数据库,已经取得了与人类识别水平相近的结果。而近年来,随着种类繁多的拍摄设备的快速增加,呈指数级增长的人脸图像大量的出现在各类拍摄图像和视频中,尤其是来自手机设备和监控设备的拍摄。随之而来的则是针对人脸识别应用出现了大量需求,其中包括基于人脸的身份认证,基于人脸识别的图像检索,基于监控视频的特定人脸识别等应用。如今的人脸识别技术已告别在小规模数据库上进行算法优化的时期,转而进入了需要对大量各种环境下拍摄的人脸图像进行精确识别的应用时期。然而,随着拍摄自各种环境的包括人脸的数字图像的急速增多,而拍摄者的水平又良莠不齐的环境下,如前所述的早期人脸识别技术在此类真实环境中的人脸识别精度迅速下降,已远不能满足现实的应用需求。
技术实现思路
为解决上述技术问题,本专利技术采用的一个技术方案是:一种复杂场景下人脸识别的深度卷积网络,其特征在于:包括多个卷积模块和全连接模块,所述每个卷积模块或者全连接模块由不同尺度下的卷积核、激活函数和池化函数组成,。进一步的,所述卷积模块一共4个,全连接模块一共3个,其中,前3个卷积模块分别由卷积层,relu曾和最大池化层组成,最大池化层负责下采样的操作,以多层金字塔下采样的结构对图像进行深度多层滤波的操作。进一步的,所述卷积网络从第一层到最后一层的具体算法以及隐藏层输入输出以如下公式实现:1)其中X0∈R224×224×3,w1∈R3×3×32。2)X2=max{0,X1},其中X1∈R224×224×32。3)其中X2∈R224×224×32,w3∈R3×3×32×64。4)X4=max{0,X3},其中X3∈R224×224×64。5)其中X4∈R224×224×64,w5∈R3×3×64×1286)X6=max{0,X5},其中X5∈R224×224×1287)X7=maxpool(X6),其中X6∈R224×224×1288)其中X7∈R112×112×128,w8∈R3×3×128×1289)X9=max{0,X8},其中X8∈R112×112×12810)其中X9∈R112×112×128,w10∈R3×3×128×25611)X11=max{0,X10},其中X10∈R112×112×25612)其中X11∈R112×112×256,w12∈R3×3×256×25613)X13=max{0,X12},其中X12∈R112×112×25614)X14=maxpool(X13),其中X13∈R112×112×25615)其中X14∈R56×56×256,w15∈R3×3×256×25616)X16=max{0,X15},其中X15∈R56×56×25617)其中X16∈R56×56×256,w17∈R3×3×256×51218)X18=max{0,X17},其中X17∈R56×56×51219)其中X18∈R56×56×512,w19∈R3×3×512×51220)X20=max{0,X19},其中X19∈R56×56×51221)X21=maxpool(X20),其中X20∈R56×56×51222)其中X21∈R28×28×512,w22∈R3×3×512×51223)X23=max{0,X22},其中X19∈R28×28×51224)其中X23∈R28×28×512,w24∈R3×3×512×51225)X25=max{0,X24},其中X24∈R28×28×51226)其中X25∈R28×28×512,w26∈R3×3×512×51227)X27=max{0,X26},其中X26∈R28×28×51228)其中X27∈R28×28×512,w28∈R3×3×512×51229)X29=max{0,X28},其中X26∈R14×14×51230)X30=maxpool(X29),其中X29∈R7×7×51231)其中X30∈R7×7×512,w31∈R7×7×512×409632)X32=max{0,X31},其中X31∈R1×1×409633)其中X32∈R1×1×4096,w33∈R1×1×4096×409634)X34=max{0,X33},其中X33∈R1×1×409635)其中X34∈R1×1×4096,w35∈R1×4096×K,其中,Xi代表第i层的输出,wi代表第i层的滤波器系数,K代表需识别的人脸的类别数。还提供一种复杂场景下人脸识别的深度卷积网络的学习方法,其特征在于:所述学习方法通过如下步骤实现:步骤1:对真实场景中的采集到的人脸图片进行随机采样,利用随机采样生成的数据初始化网络数据,手动将偏置参数置零;步骤2:对已有的人脸训练图像进行数据增广操作,将所有训练图像的尺寸统一归一化到224*224,在输入进网络以前,减去均值图像,以达到更快速的收敛。具体的,所述增广操作包括如下具体方式:(1)随机剪裁识别到的人脸图片的70%-90%,再进行居中并缩放至224*224,可以有效的提高对这当人脸的识别率;(2)对于图片倾斜的情况,随机将原始图片人工旋转5、110、15度,再进行训练;(3)将原始人脸训练图随机进行对比度拉伸或者对比度压缩,以提高在光照复杂的环境下人脸识别的性能。进一步的,其学习过程利用随机梯度下降算法对深度卷积网络的参数进行优化。区别于现有技术的情况,本专利技术的有益效果是:本专利技术设计的人脸识别深度卷积网络期望得到在真实应用场景,针对复杂光照,多视角下都具有稳定的的识别性能。在高性能GPU的支持,在较高的计算度下满足工程应用的需求。具体表现为:专门针对复杂场景下人脸识别任务的深度卷积网络有强大的模型表达能力,对复杂的光照条件和多视角的人脸识别对象。附图说明图1是本专利技术复杂场景下人脸识别的深度卷积网络的结构图。图2是本专利技术用于复杂场景下的人脸识别深度卷积网络结构模式图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本专利技术的一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。一种复杂场景下人脸识别的深度卷积网络,如图1所示,包括多个卷积模块和全连接模块,所述每个卷积模块或者全连接模块由不同尺度下的卷积核、激活函数和池化函数组成,其中前三个卷积模块分别由卷积层,relu层和最大池化层(maxpooling)组成,最大池化层负责下采样的操作,以多层金字塔下采样的结构对图像进行深度多层滤波的操作。在本申请中,为了方面描述网络结构,用convi_j表示第i个卷积模块中的第j个卷积核函数,tanhi_j表示第i个卷积模块中的第j个tanh激活函数本文档来自技高网...
一种复杂场景下人脸识别的深度卷积网络及学习方法

【技术保护点】
一种复杂场景下人脸识别的深度卷积网络,其特征在于:包括依次连接的多个卷积模块和全连接模块,所述每个卷积模块和全连接模块由不同尺度下的卷积核、激活函数和池化函数组成。

【技术特征摘要】
1.一种复杂场景下人脸识别的深度卷积网络,其特征在于:包括依次连接的多个卷积模块和全连接模块,所述每个卷积模块和全连接模块由不同尺度下的卷积核、激活函数和池化函数组成。2.根据权利要求1所述的一种复杂场景下人脸识别的深度卷积网络,其特征在于:所述卷积模块一共4个,全连接模块一共3个,其中,前3个卷积模块分别由卷积层,relu曾和最大池化层组成,最大池化层负责下采样的操作,以多层金字塔下采样的结构对图像进行深度多层滤波的操作。3.根据权利要求1所述的一种复杂场景下人脸识别的深度卷积网络,其特征在于:所述卷积网络从第一层到最后一层的具体算法以及隐藏层输入输出以如下公式实现:1)其中X0∈R224×224×3,w1∈R3×3×32。2)X2=max{0,X1},其中X1∈R224×224×32。3)其中X2∈R224×224×32,w3∈R3×3×32×64。4)X4=max{0,X3},其中X3∈R224×224×64。5)其中X4∈R224×224×64,w5∈R3×3×64×1286)X6=max{0,X5},其中X5∈R224×224×1287)X7=maxpool(X6),其中X6∈R224×224×1288)其中X7∈R112×112×128,w8∈R3×3×128×1289)X9=max{0,X8},其中X8∈R112×112×12810)其中X9∈R112×112×128,w10∈R3×3×128×25611)X11=max{0,X10},其中X10∈R112×112×25612)其中X11∈R112×112×256,w12∈R3×3×256×25613)X13=max{0,X12},其中X12∈R112×112×25614)X14=maxpool(X13),其中X13∈R112×112×25615)其中X14∈R56×56×256,w15∈R3×3×256×25616)X16=max{0,X15},其中X15∈R56×56×25617)其中X16∈R56×56×256,w17∈R3×3×256×51218)X18=max{0,X17},其中X17∈R56×56×51219)其中X18∈R56×56×512,w19∈R3×3×512×51220)X20=max{0,X19},其中X19∈R56×56×51221)X21=maxpool(...

【专利技术属性】
技术研发人员:唐良智王兵魏湘臣
申请(专利权)人:上海荷福人工智能科技集团有限公司
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1