The invention relates to a face detection method for mobile terminal based on inverted residual structure and joint angle loss function. The network structure of the invention is inverted residual structure. The inverted residual structure saves memory by unit tensor, and ensures the efficiency of the algorithm in face detection at mobile terminal. The joint function of angle loss is used in the network structure. By adding constraints of parameters M1 and M3 on the basis of ArcFace loss function, the inter-class spacing is increased to a greater extent and the intra-class spacing is reduced. The network structure reduces the memory consumption, improves the accuracy of face detection, and is more suitable for mobile face detection.
【技术实现步骤摘要】
一种基于倒置残差结构和角度联合损失函数的移动端人脸检测方法
本专利技术涉及计算机视觉领域的人脸识别,尤其涉及一种基于倒置残差结构和角度联合损失函数的移动端人脸检测方法。
技术介绍
随着信息化建设的高速发展,各领域对快速有效的自动身份认证的使用越来越广泛。生物特征识别技术以其高安全性、可靠性以及高效性成为身份认证的主流技术,尤其是人脸检测被广泛应用于单位考勤、会议签到、公安刑侦破案、人证比对、养老金领取资格认证、门禁系统、手机解锁等场景中,但在移动端无法做到既能实时运行又具有高精度,不能在精度和速度两个方面同时达到最佳状态。随着深度学习的出现,人脸检测的准确率有了质的飞跃,但在提高精度的同时,随之而来的是深度学习模型需要非常强大的计算能力,更大的磁盘空间以及内存空间。然而对于内存极其有限的移动端,传统的基于深度学习的人脸检测模型无法做到实时性,具有较大的延迟性,无法在精度和速度之间取得较好的平衡,这大大降低了实用性和用户体验。因此,研究在移动端可实时运行且具有高精度的基于深度学习的人脸检测技术很有必要性。目前预提高基于深度学习的移动端人脸检测技术主要从网络结构和损失函数两个方面来改进,主流的网络结构主要有:MobileNets,通过深度可分离卷积代替传统卷积网络来减少计算量。MobileNetV2,结合MobileNets深度可分离卷积的特征引入了一种结构单元:具有线性瓶颈的倒残差块。该结构单元的旨意是先将输入的低维表示扩展到高维,再用深度可分离的卷积来提取特征,最后用线性瓶颈将特征投影回低维压缩表示。由于深度可分离的卷积在推理过程中不实现大的张量,这便大大 ...
【技术保护点】
1.一种基于倒置残差结构和角度联合损失函数的移动端人脸检测方法,其特征在于,包括数据预处理、制作训练集和验证集、网络模型的构建和训练、网络模型基于AgeDB‑30人脸库的验证四个阶段:(1)数据的预处理:(1.1)下载清洗后的MS‑Celeb‑1M人脸数据集;(1.2)对所有人脸图像采用MTCNN算法进行人脸关键点检测、对齐并裁剪成112x112大小;(1.3)对图像像素做归一化处理,归一化到[‑1,1];(1.4)根据图像的标注,生成图像的lst文件;(2)制作训练集和验证集:(2.1)将预处理后的数据转换为MXNet所能读取的二进制人脸数据集作为训练集;(2.2)下载AgeDB‑30人脸库,并制作成agedb_30.bin格式的数据集作为验证集;(3)网络模型的构建和训练,输出训练好的网络模型;(4)网络模型基于AgeDB‑30人脸库的验证:(4.1)基于训练好的网络模型对样本对中的两张图片提取特征然后进行比较,判断是否为同一个人;(4.2)针对所有人脸样本对统计同脸判断错误和异脸判定错误的个数,计算得出判定精度;经过上述步骤的操作,即可实现移动端人脸的快速检测。
【技术特征摘要】
1.一种基于倒置残差结构和角度联合损失函数的移动端人脸检测方法,其特征在于,包括数据预处理、制作训练集和验证集、网络模型的构建和训练、网络模型基于AgeDB-30人脸库的验证四个阶段:(1)数据的预处理:(1.1)下载清洗后的MS-Celeb-1M人脸数据集;(1.2)对所有人脸图像采用MTCNN算法进行人脸关键点检测、对齐并裁剪成112x112大小;(1.3)对图像像素做归一化处理,归一化到[-1,1];(1.4)根据图像的标注,生成图像的lst文件;(2)制作训练集和验证集:(2.1)将预处理后的数据转换为MXNet所能读取的二进制人脸数据集作为训练集;(2.2)下载AgeDB-30人脸库,并制作成agedb_30.bin格式的数据集作为验证集;(3)网络模型的构建和训练,输出训练好的网络模型;(4)网络模型基于AgeDB-30人脸库的验证:(4.1)基于训练好的网络模型对样本对中的两张图片提取特征然后进行比较,判断是否为同一个人;(4.2)针对所有人脸样本对统计同脸判断错误和异脸判定错误的个数,计算得出判定精度;经过上述步骤的操作,即可实现移动端人脸的快速检测。2.根据权利要求1所述的一种基于倒置残差结构和角度联合损失函数的移动端人脸检测方法,其特征在于:所述的人脸关键点包括眼睛中心、鼻尖、嘴角。3.根据权利要求1所述的一种基于倒置残差结构和角度联合损失函数的移动端人脸检测方法,其特征在于:所述的lst文件内容包含对齐标签、图像路径、图像对应的身份标签,性别标签和年龄标签。4.根据权利要求1所述的一种基于倒置残差结构和角度联合损失函数的移动端人脸检测方法,其特征在于:所述训练集的格式为.rec、.idx、property文件;其中train.rec是已经对齐后的图像数据,train.idx是索引,由步骤(1.4)中的lst文件生成rec和idx文件;property是属性文件,文件内容包含身份类别数和图像大小。5.根据权利要求1所述的一种基于倒置残差结构和角度联合损失函数的移动端人脸检测方法,其特征在于:所述的训练集为包括超过380万张、8万7千个身份的训练集。6.根据权利要求1所述的一种基于倒置残...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。