一种基于混合注意力特征金字塔结构的轻量化人脸检测方法和系统技术方案

技术编号:30634208 阅读:19 留言:0更新日期:2021-11-04 00:16
本发明专利技术公开了一种基于混合注意力特征金字塔结构的轻量化人脸检测方法和系统,包括如下步骤:首先对小尺寸人脸训练集图像进行缩放处理及数据增强,得到待提取特征的图像;而后使用轻量化卷积神经网络提取图片特征;在多个特征尺度上对特征进行采样并融合不同尺度的特征;而后使用残差瓶颈层结构处理特征层并通过混合注意力金字塔结构得到最终的检测预测层;使用无锚检测方法和聚焦损失函数对预测层进行计算并回归出图像中所包含的人脸位置;设计并实现一种人脸检测系统,该系统使用本发明专利技术提出的算法进行快速人脸图片检测和视频检测。本发明专利技术对复杂场景中受遮挡、多尺度的密集人脸检测具有鲁棒性,测试结果和对应的人脸检测图片都证明了本发明专利技术方法的有效性。片都证明了本发明专利技术方法的有效性。片都证明了本发明专利技术方法的有效性。

【技术实现步骤摘要】
一种基于混合注意力特征金字塔结构的轻量化人脸检测方法和系统


[0001]本专利技术涉及基于深度学习的人脸检测
,特别涉及基于混合注意力特征金字塔结构的人脸检测方法及系统。

技术介绍

[0002]人脸检测是指在输入图像中确定所有人脸的位置、大小和位姿的过程,是人脸信息处理中一项关键技术,已成为计算机视觉领域的研究热点。人脸检测作为目标检测的具体应用以及人脸识别的关键步骤之一,已成为视觉任务中独立的研究方向并受到了广泛的关注。如今,由于计算机计算能力的提升以及人脸检测数据集的完善,深度学习成为解决计算机视觉任务的主流方法并在人脸检测领域成效卓然。目前基于深度学习的人脸检测按检测阶段可分为一阶段法和二阶段法,按检测时是否设置锚框可分为基于锚框的检测和无锚检测。最近几年来,因一阶段无锚人脸检测表现优良而受到了越来越多的关注。
[0003]文献1(NAJIBI M,SAMANGOUEI P,CHELLAPPA R,et al.Ssh:single stage headless face detector[C].In:IEEE International Conference on Computer Vision,2017:4885

4894.)是典型的一阶段人脸检测方法,该方法在不同特征图尺度下分别检测人脸,同时在网络中加入上下文信息模块,使网络能精确检测出大量尺寸不同的人脸并有较快的检测速度。文献2(DENG J,GUO J,VERVERAS E,et al.Retinaface:single

shot multi

level face localisation in the wild[C].In:the 2020IEEE/CVF Conference on Computer Vision and Pattern Recognition,2020:5205

5211.)该方法是一种单阶段人脸检测方法,其分别使用深度卷积骨干网络和轻量化骨干网络构建检测模型,并增加五个人脸关键点来辅助检测以提升准确率。文献3(LAW H,DENG J.Cornernet:detecting objects as paired keypoints[J].International Journal of Computer Vision,2020.128(3):642

656.)是一种无锚目标检测方法,该算法不在预测环节对检测的目标预先设置锚框,而通过检测目标的左上角和右下角两个关键点来得到目标的预测框。
[0004]当前人脸检测任务往往需要处理数十个或百个人脸目标,这些目标都处于随机的真实场景且具有多尺度、高遮挡、密集性等特点,目前多数人脸检测方法均使用大型卷积神经网络提取图像特征,极大的提升了检测准确性,但也伴随着参数量大,训练复杂,检测速度慢等问题,难以用于实时性检测场景中。虽然已有一些使用轻量化网络的检测方法,但仅使用轻量化网络提升检测速度大大降低了检测精度,并且这些快速的人脸检测方法难以处理人脸尺度变化大,小尺寸人脸数量多的复杂场景。

技术实现思路

[0005]为克服现有轻量化人脸检测中小尺寸人脸带来的检测率低及图片中人脸尺度各异的问题,本专利技术提出一种基于混合注意力特征金字塔结构的人脸检测方法,该方法结合通道注意力机制和空间注意力机制来有效地融合多尺度的上下文信息,使检测器同时关注
分布相对全局的大目标人脸和局部分布的小目标人脸,以应对人脸尺度极端变化的场景,同时具有较快的检测速度和较高的检测精度。
[0006]一种基于混合注意力特征金字塔结构的轻量化人脸检测方法,具体包括以下步骤:
[0007]S1、收集复杂场景中含有多个小尺寸人脸的图像,对图像中人脸进行标注,构成训练集,这里的标注包括用包围框对人脸位置进行标注以及标注图片中人脸数量;所述小尺寸人脸指一幅图像中超过50%以上的人脸尺寸小于25像素*25像素或者小于整幅图像的0.03*0.03;至于复杂场景,这是筛选训练集图像的常识,指筛选背景不同、受遮挡程度不同、图像中人脸尺寸大小不同等涵盖较多情形的图片。此处筛选的图片中人脸数量越多越好。
[0008]S2、对步骤S1中的训练集图像进行缩放处理及数据增强,得到预处理的人脸图像,具体包括如下步骤:
[0009]S21、统一所述训练集图像尺寸,即对所述训练集图像进行缩放处理使其高宽值与网络训练所设定的高宽值相等:在得到所述训练集图像后,确定所述训练集图像的宽高值是否为网络训练所设定的宽高值;当训练集图像的宽高值不是设定的宽高值时,将训练集图像的宽高值设置为网络训练的预设宽高值,并根据训练集图像比例对训练集图像进行处理,得到经缩放尺寸后的图像;
[0010]S22、对S21处理的图像进行数据增强得到待提取特征的图像;所述图像数据增强过程包括图像翻转、图像旋转、图像随机裁剪、图像光照变换和图像色彩变换。
[0011]S3、构建人脸检测卷积神经网络;所述人脸检测卷积神经网络使用轻量化骨干网络对步骤S2中预处理的人脸图像提取特征并对提取的特征进行处理并融合,包括如下步骤:首先使用采样函数对特征层进行尺度变换并在多个特征尺度上分别融合不同特征层的特征,然后依次使用残差结构、瓶颈层结构、混合注意力模块处理融合的特征,最后输出到预测层进行计算。
[0012]所述轻量化骨干网络采用MobileNetV3small网络结构;所述网络结构从前至后依次设置卷积层、批次归一化层、激活函数层和带挤压模块的可逆残差线性瓶颈层;所述带挤压模块的可逆残差线性瓶颈层从前至后包括卷积层、激活函数层、深度可分离卷积层、挤压模块和残差结构;所述网络结构的第一层使用步长为2、卷积核大小为3*3的卷积层对图片进行下采样,然后使用11个带挤压模块的可逆残差线性瓶颈层,并在其第1、2、4、9个瓶颈层中使用步长为2的卷积核进行图片下采样;所述网络结构在所有卷积操作后均使用激活函数层,并在最后一层使用卷积核大小为3*3、步长为2的卷积层进行最后一次下采样操作。
[0013]所述对轻量化骨干网络对提取的特征进行处理和融合,具体包括如下步骤:
[0014]首先使用采样函数对特征层进行尺度变换,对所述轻量化骨干网络提取的特征经过上采样和下采样后分别在不同尺度上进行融合;若骨干网络提取的特征尺度由小到大分别为f1,f2,f3那么所得到的融合后的特征层F1,F2,F3由小到大表示为:
[0015]F1=f1+F
downsample
×
f2+F
downsample
×
f3[0016]F2=F
upsample
×
f1+f2+F
downsample
×
f3[0017]F3=F
upsample
×
f1+F
upsample
×
f2+f3[0018]其中:F...

【技术保护点】

【技术特征摘要】
1.一种基于混合注意力特征金字塔结构的轻量化人脸检测方法,其特征在于,包括以下步骤:S1、收集复杂场景中含有多个小尺寸人脸的图像,对图像中人脸进行标注,构成训练集;所述小尺寸人脸指一幅图像中超过50%以上的人脸尺寸小于25像素*25像素或者小于整幅图像的0.03*0.03;所述标注包括用包围框对图像中的人脸位置进行标注以及标注图像中人脸数量;S2、对步骤S1中的训练集图像进行缩放处理及数据增强,得到预处理的人脸图像;S3、构建人脸检测卷积神经网络;所述人脸检测卷积神经网络使用轻量化骨干网络对步骤S2中预处理的人脸图像提取特征并对提取的特征进行处理并融合,具体包括如下步骤:首先使用采样函数对特征层进行尺度变换并在多个特征尺度上分别融合不同特征层的特征,然后依次使用残差结构、瓶颈层结构、混合注意力模块处理融合的特征,最后输出到预测层进行计算;S4、将步骤S2中的得到的预处理图像输入到步骤S3构建的人脸检测卷积神经网络结构中进行人脸检测神经网络训练;训练时使用无锚检测方法对输入预测层中的图像特征进行计算并将图像中的人脸用矩形框标注,得到带人脸矩形框的图像,损失函数使用聚焦损失函数,所述聚焦损失函数通过网络训练让预测值拟合出真实值,直到损失函数收敛;聚焦损失函数使用平衡因子作为损失函数附加的权重来调节正负样本的优化,使用可调聚焦参数调节简单样本和复杂样本的优化;通过对网络进行循环迭代训练使损失函数不断减小,直到完成设定的迭代次数E;S5、设置优化策略和相关超参数训练人脸检测网络,迭代训练直至损失函数收敛,并保存网络训练权重参数;S6、基于步骤S3构建的人脸检测卷积神经网络和步骤S5获得的网络训练权重参数构建基于混合注意力特征金字塔结构的人脸检测模型,并以该检测模型对待检测图片进行人脸检测,同时,检测模型将记录所有检测得到的人脸矩形框以确定检测到的人脸数量。2.根据权利要求1所述的一种基于混合注意力特征金字塔结构的轻量化人脸检测方法,其特征在于,所述步骤S2包括如下步骤:S21、统一所述训练集图像尺寸:对所述训练集图像进行缩放处理使其高宽值与所述网络训练所设定的高宽值相等;S22、对S21处理的图像进行数据增强得到待提取特征的图像;所述图像数据增强过程包括图像翻转、图像旋转、图像随机裁剪、图像光照变换和图像色彩变换。3.根据权利要求1所述的一种基于混合注意力特征金字塔结构的人脸检测方法,其特征在于,步骤S3中所述轻量化骨干网络采用MobileNetV3small网络结构;所述网络结构从前至后依次设置卷积层、批次归一化层、激活函数层和带挤压模块的可逆残差线性瓶颈层;所述带挤压模块的可逆残差线性瓶颈层从前至后包括卷积层、激活函数层、深度可分离卷积层、挤压模块和残差结构;所述网络结构的第一层使用步长为2、卷积核大小为3*3的卷积层对图片进行下采样,然后使用11个带挤压模块的可逆残差线性瓶颈层,并在其第1、2、4、9个瓶颈层中使用步长为2的卷积核进行图片下采样;所述网络结构在所有卷积操作后均使用激活函数层,并在最后一层使用卷积核大小为3*3、步长为2的卷积层进行最后一次下采样操作。
4.根据权利要求1所述的一种基于混合注意力特征金字塔结构的人脸检测方法,其特征在于,步骤S3中所述对轻量化骨干网络提取的特征进行处理和融合,具体包括如下步骤:首先使用采样函数对特征层进行尺度变换,对所述轻量化骨干网络提取的特征经过上采样和下采样后分别在不同尺度上进行融合;若骨干网络提取的特征尺度由小到大分别为f1,f2,f3那么所得到的融合后的特征层F1,F2,F3由小到大表示为:F1=f1+F
downsample
×
f2+F
downsample
×
f3F2=F
upsample
×
f1+f2+F
downsample
×
f3F3=F
upsample
×
f1+F
upsample
×
f2+f3其中:F
upsample
...

【专利技术属性】
技术研发人员:李志丹田甜潘齐炜曾蕊程吉祥黄思维
申请(专利权)人:西南石油大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1