基于深度学习的证件照分类识别及免冠检测方法及系统技术方案

技术编号:39733238 阅读:7 留言:0更新日期:2023-12-17 23:35
本发明专利技术公开了基于深度学习的证件照分类识别及免冠检测方法及系统,属于人工智能

【技术实现步骤摘要】
基于深度学习的证件照分类识别及免冠检测方法及系统


[0001]本专利技术涉及人工智能
AI
图像分类与目标检测
,具体地说是一种基于深度学习的证件照分类识别及免冠检测方法及系统


技术介绍

[0002]目标检测是检测图像中目标的位置,对于多类别的目标检测,还需要识别目标对应的标签,常称作“目标检测与
(
目标
)
识别”。
[0003]图像分类是对图像进行识别,判断所属分类

[0004]目标检测和图像分类之间的联系有以下方面:
[0005]从技术来说,图像分类往往是目标检测的必要步骤之一,因此目标检测往往不是一次性完成的,需要经过位置检测和分类;
[0006]从场景来说,目标检测的场景往往是复杂的,包含多个目标,图像分类的图片内必须仅包含与标签对应的一个目标

[0007]政务服务领域业务审批平台,对特定业务办理过程中,存在对办事人上传个人证件照有具体要求的情况,目前来说个人证件照的审批时通过人工审核,造成人工审核工作压力大,且严重影响业务审批效率

[0008]故如何将目标检测和图像分类相结合,实现对证件照的初步审核,减少人工审核的压力,提高业务审批效率是目前亟待解决的技术问题


技术实现思路

[0009]本专利技术的技术任务是提供一种基于深度学习的证件照分类识别及免冠检测方法及系统,来解决如何将目标检测和图像分类相结合,实现对证件照的初步审核,减少人工审核的压力,提高业务审批效率的问题

[0010]本专利技术的技术任务是按以下方式实现的,一种基于深度学习的证件照分类识别及免冠检测方法,该方法具体如下:
[0011]S1、
获取用户上传的图片;
[0012]S2、
采用人脸检测模型检测图片中是否包含人脸:
[0013]①
若包含人脸,则执行步骤
S3

[0014]②
若未包含人脸,则判定该图片不是证件照;
[0015]S3、
采用免冠检测模型检测图片是否包含帽子:
[0016]若否,则执行步骤
S4

[0017]S4、
采用深度神经网络分类模型判定图片属于白底证件照

蓝底证件照

红底证件照或生活照中的哪一种:
[0018]①
若该图片被判定为生活照,则该图片不是证件照;
[0019]②
若该图片被判定为白底证件照

蓝底证件照或红底证件照一种,则该图片为证件照

[0020]作为优选,所述人脸检测模型基于深度学习框架
TensorFlow
搭建,人脸检测模型用于提取图片特征信息,检测图片中是否包含人脸

[0021]更优地,所述人脸检测模型的构建和训练具体如下:
[0022]数据收集及标注:收集包含正面人脸和非正面人脸的图像数据集,并标注每张图像中人脸的位置信息
(bounding box)

[0023]数据预处理:对收集到的图像数据进行图像缩放

归一化

增强技术的预处理操作,提高人脸检测模型的鲁棒性并减少数据样本间的差异性;
[0024]模型选择:选择基于卷积神经网络的模型
SSD、Faster R

CNN

YOLO
或单独设计的人脸检测网络
MTCNN
作为人脸检测模型;
[0025]模型训练:将已标注人脸位置信息的人脸图像数据集输入到人脸检测模型进行训练,训练过程中采用优化算法
(
如梯度下降
)
调整人脸检测模型参数,确保能够准确地检测出人脸并定位人脸的边界框;
[0026]模型评估与模型改进:使用验证数据集或测试数据集对已训练完成的人脸检测模型进行评估,并计算人脸检测模型在人脸检测任务上的准确率及召回率的性能指标;再根据评估结果,调整人脸检测模型的参数或架构以提升检测效果

[0027]作为优选,所述免冠检测模型是由目标检测模型和免冠分类模型组成,目标检测模型和免冠分类模型均采用深度学习框架
Keras
搭建;
[0028]其中,目标检测模型用于检测图片中潜在的帽子区域,推断出帽子在图片中的位置坐标;
[0029]免冠分类模型用于对目标检测模型推断出的潜在帽子区域进行进一步的特征提取,判断该区域是否存在帽子

[0030]作为优选,所述深度神经网络分类模型采用深度学习框架
Keras
搭建,深度神经网络分类模型用于判断图片属于白底证件照

蓝底证件照

红底证件照还是生活照

[0031]更优地,所述深度神经网络分类模型的构建和训练具体如下:
[0032]数据收集:收集并准备用于训练的数据集,具体为:分类标签为
A、B、C
三类,并收集对应的3个子数据集,每个数据集中的图片必须仅包含对应标签属性的目标;
[0033]数据预处理:进行图像大小调整

数据标准化

增广技术和数据集划分;增广技术的内容包括随机裁剪

旋转

翻转;将数据集划分为训练集

验证集和测试集;
[0034]选择网络模型:选择适当的网络结构是构建深度神经网络分类模型的重要任务,决定了模型的类型

使用的开发架构;选择
Convolutional Neural Network

CNN
的卷积神经网络
、Recurrent Neural Network

RNN
的循环神经网络或
Transformer
作为深度神经网络分类模型的网络架构;
[0035]损失函数的参数选择:根据分类任务的特点选择合适的损失函数;具体为:对于二分类任务,损失函数采用交叉熵损失函数;对于多分类任务,损失函数选择
softmax
交叉熵损失函数;其他具体参数按照实际场景来确定;其中,深度神经网络分类模型包括学习率

批量大小

正则化项的超参数,通过交叉验证的方法选择最优的超参数配置进一步优化深度神经网络分类模型的性能;
[0036]模型训练:通过将训练数据输入深度神经网络分类进行前向传播,计算预测值,并将预测值与真实标签进行比较,再使用反向传播算法更新深度神经网络分类参数,使得深
度神经网络分类逐渐优化;训练过程中通常采用随机梯度下降
(Stochastic Gradient Descen本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种基于深度学习的证件照分类识别及免冠检测方法,其特征在于,该方法具体如下:
S1、
获取用户上传的图片;
S2、
采用人脸检测模型检测图片中是否包含人脸:

若包含人脸,则执行步骤
S3


若未包含人脸,则判定该图片不是证件照;
S3、
采用免冠检测模型检测图片是否包含帽子:若否,则执行步骤
S4

S4、
采用深度神经网络分类模型判定图片属于白底证件照

蓝底证件照

红底证件照或生活照中的哪一种:

若该图片被判定为生活照,则该图片不是证件照;

若该图片被判定为白底证件照

蓝底证件照或红底证件照一种,则该图片为证件照
。2.
根据权利要求1所述的基于深度学习的证件照分类识别及免冠检测方法,其特征在于,所述人脸检测模型基于深度学习框架
TensorFlow
搭建,人脸检测模型用于提取图片特征信息,检测图片中是否包含人脸
。3.
根据权利要求1或2所述的基于深度学习的证件照分类识别及免冠检测方法,其特征在于,所述人脸检测模型的构建和训练具体如下:数据收集及标注:收集包含正面人脸和非正面人脸的图像数据集,并标注每张图像中人脸的位置信息;数据预处理:对收集到的图像数据进行图像缩放

归一化

增强技术的预处理操作,提高人脸检测模型的鲁棒性并减少数据样本间的差异性;模型选择:选择基于卷积神经网络的模型
SSD、Faster R

CNN

YOLO
或单独设计的人脸检测网络
MTCNN
作为人脸检测模型;模型训练:将已标注人脸位置信息的人脸图像数据集输入到人脸检测模型进行训练,训练过程中采用优化算法调整人脸检测模型参数,确保能够准确地检测出人脸并定位人脸的边界框;模型评估与模型改进:使用验证数据集或测试数据集对已训练完成的人脸检测模型进行评估,并计算人脸检测模型在人脸检测任务上的准确率及召回率的性能指标;再根据评估结果,调整人脸检测模型的参数或架构以提升检测效果
。4.
根据权利要求1所述的基于深度学习的证件照分类识别及免冠检测方法,其特征在于,所述免冠检测模型是由目标检测模型和免冠分类模型组成,目标检测模型和免冠分类模型均采用深度学习框架
Keras
搭建;其中,目标检测模型用于检测图片中潜在的帽子区域,推断出帽子在图片中的位置坐标;免冠分类模型用于对目标检测模型推断出的潜在帽子区域进行进一步的特征提取,判断该区域是否存在帽子
。5.
根据权利要求1所述的基于深度学习的证件照分类识别及免冠检测方法,其特征在于,所述深度神经网络分类模型采用深度学习框架
Keras
搭建,深度神经网络分类模型用于判断图片属于白底证件照

蓝底证件照

红底证件照还是生活照

6.
根据权利要求1或5所述的基于深度学习的证件照分类识别及免冠检测方法,其特征在于,所述深度神经网络分类模型的构建和训练具体如下:数据收集:收集并准备用于训练的数据集,具体为:分类标签为
A、B、C
三类,并收集对应的3个子数据集,每个数据集中的图片必须仅包含对应标签属性的目标;数据预处理:...

【专利技术属性】
技术研发人员:潘震陈兆亮宁方刚迟钰沛
申请(专利权)人:浪潮软件股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1