人眼状态检测方法、装置、电子设备及存储介质制造方法及图纸

技术编号：33745140 阅读：12 留言：0更新日期：2022-06-08 21:44

本申请涉及深度学习技术领域，尤其涉及一种人眼状态检测方法、装置、电子设备及存储介质，该方法包括：将原始图片输入到嵌套残差密集块RRDB网络中，得到特征图；将特征图输入到区域建议网络RPN中，得到多个候选区域定位框，确定多个候选区域定位框中包含眼部图像的目标候选区域定位框，并基于预定义算法计算目标候选区域定位框对应的人眼状态。这样，基于RRDB网络可以获取所有层中的特征数据，进而得到所需的特征图，保留了原始图片眼部的所有特征，进而可以提高人眼状态检测的准确性和鲁棒性。性。性。

全部详细技术资料下载

【技术实现步骤摘要】
人眼状态检测方法、装置、电子设备及存储介质

[0001]本申请涉及深度学习
，尤其涉及一种人眼状态检测方法、装置、电子设备及存储介质。

技术介绍

[0002]随着深度学习技术的发展，衍生出了一系列基于深度学习的目标检测算法如：Fast R
‑
CNN（Region
‑
Convolutional Neural Networks）、Faster R
‑
CNN等，可以用于人脸检测、行人检测、车辆检测等。通过对人眼的定位及眼睛的状态的检测可以有效的辅助人脸检测、表情识别、姿态估计和人机交互等计算机视觉领域相关工作，且通过对人眼的定位及状态检测可以计算眨眼频率并以此判断疲劳状态，相较于利用心电或者脑电监测疲劳的穿戴式设备判断疲劳状态更为简单快捷。
[0003]现有技术中，可以利用基于眼睛外观的统计模型，或基于眼睛的固有特征以及结构信息的算法进行人眼定位，进一步的，通过人工对人眼的形状进行分类，或基于人眼模板的状态进行分类，或基于机器学习的状态分类算法进行人眼状态的检测。
[0004]但是，上述方法通常需要大量的人工参与，花费较多的人力，且上述人眼定位及状态分类的方法经常受到脸部表情、姿态变化、光照、遮挡、背景干扰、图像清晰度等因素的影响，准确性和鲁棒性较差。

技术实现思路

[0005]本申请提供一种人眼状态检测方法、装置、电子设备及存储介质，用于解决现有人眼定位及状态分类的方法易受到脸部表情、姿态变化、光照、遮挡、背景干扰、图像清晰度等因...

【技术保护点】

【技术特征摘要】
1.一种人眼状态检测方法，其特征在于，所述方法包括：将原始图片输入到嵌套残差密集块RRDB网络中，得到特征图；将所述特征图输入到区域建议网络RPN中，得到多个候选区域定位框，确定所述多个候选区域定位框中包含眼部图像的目标候选区域定位框，并基于预定义算法计算目标候选区域定位框对应的人眼状态。2.根据权利要求1所述的方法，其特征在于，所述RRDB网络包括多个残差密集块，每一残差密集块包括多层卷积层；将原始图片输入到嵌套残差密集块RRDB网络中，得到特征图，包括：针对每一残差密集块，将原始图片输入到所述残差密集块中，经过多层卷积层计算，得到第一层和中间层输出的眼部特征数据以及最后一层输出的局部特征图；基于局部特征图所在的位置区域将每一残差密集块计算得到的各层的眼部特征数据融合，得到包括眼部特征数据的特征图；将每一残差密集块对应的融合后的特征图再次进行融合，得到所需的特征图。3.根据权利要求2所述的方法，其特征在于，每一卷积层设置有对应的过滤机制，所述过滤机制用于提取原始图片对应的眼部特征数据；将原始图片输入到所述残差密集块中，经过多层卷积层计算，得到第一层和中间层输出的眼部特征数据以及最后一层输出的局部特征图，包括：将原始图片输入到所述残差密集块中，利用每一层卷积层对应的过滤机制依次对所述原始图片进行降维处理和眼部特征提取，得到第一层和中间层输出的眼部特征数据以及最后一层输出的局部特征图。4.根据权利要求1所述的方法，其特征在于，将所述特征图输入到区域建议网络RPN中，得到多个候选区域定位框，确定所述多个候选区域定位框中包含眼部图像的目标候选区域定位框，包括：将所述特征图输入到RPN中，得到多个候选区域定位框；将所述多个候选区域定位框通过坐标的映射变换，映射到所述特征图上，得到多个候选区域定位框的特征矩阵；基于所述特征矩阵计算所述多个候选区域定位框的交并比，并基于所述交并比判断所述多个候选区域定位框中是否包含眼部图像；根据判断结果确定目标候选区域定位框；其中，包含眼部图像的候选区域定位框为交并比大于预设阈值的候选区域定位框。5.根据权利要求1所述的方法，其特征在于，基于预定义算法计算目标候选区域定位框对应的人眼状态，包括：将目标候选...

【专利技术属性】
技术研发人员：周波，邹小刚，苗瑞，梁书玉，
申请(专利权)人：深圳市海清视讯科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人