一种基于深度学习的行人口罩检测和安全距离预警方法技术

技术编号:38714306 阅读:18 留言:0更新日期:2023-09-08 14:57
本发明专利技术属于智能检测技术领域,具体涉及一种基于深度学习的行人口罩检测和安全距离预警方法,包括:获取的像数据组成数据集;建立目标检测模型,将数据集中的数据输入目标检测模型进行训练;搭建行人口罩检测和安全距离预警系统,将训练完成后的目标检测模型作为系统的检测模块;所述系统包括信息采集模块、检测模块、安全距离预警模块;信息采集模块实时采集待检测数据;检测模块对采集的待检测数据进行实时行人口罩检测,得到检测结果;安全距离预警模块根据检测结果进行行人安全距离预警。本发明专利技术通过将改进的Yolo v3模型融入行人口罩检测和安全距离预警系统,在进行不同类型的口罩佩戴检测任务,增加了识别效率,提升了识别精度。度。度。

【技术实现步骤摘要】
一种基于深度学习的行人口罩检测和安全距离预警方法


[0001]本专利技术属于智能检测
,具体涉及一种基于深度学习的行人口罩检测和安全距离预警方法。

技术介绍

[0002]当前,需要一个自动可以检测行人口罩及安全距离预警的系统来帮助检测是否戴口罩。
[0003]早期的目标检测方法通常是通过提取图像的一些robust的特征(如Haar、SIFT、HOG等),使用DPM(Deformable Parts Model)模型,用滑动窗口(silding window)的方式来预测具有较高score的bounding box。这种方式非常耗时,而且精度又不怎么高。

技术实现思路

[0004]为解决上述技术问题,本专利技术提出一种基于深度学习的行人口罩检测和安全距离预警方法,包括:
[0005]S1:从开源的数据集中选取人脸图像和口罩遮挡的人脸图像,通过在现实场景视频帧中截取行人图像,将获取的图像数据组成数据集;
[0006]S2:建立目标检测模型,将数据集中的数据输入目标检测模型进行训练,
[0007]得到训练完成后的目标检测模型;
[0008]S3:搭建行人口罩检测和安全距离预警系统,将训练完成后的目标检测模型作为系统的检测模块;
[0009]所述系统包括信息采集模块、检测模块、安全距离预警模块;
[0010]S4:信息采集模块实时采集待检测数据,所述待检测数据包括图片、视频数据;
[0011]S5:检测模块对采集的待检测数据进行实时行人口罩检测,得到检测结果;
[0012]S6:安全距离预警模块根据检测结果进行行人安全距离预警。
[0013]优选的,所述目标检测模型,包括:
[0014]将YOLOv3作为基础模型,对目标的大小尺寸进行统计,预先标注好的目标通过数据转换获得每个标注框bounding box的高和宽并对其进行标准化,再利用K

means聚类算法计算1

IOU距离,对生成的bounding box的高和宽的集合进行九分类操作,之后将聚类后得到的最常出现的几种标注框作为人为选定的锚框Anchor Box,接着在YOLOv3基础模型主干特征提取网络DarkNet53的残差结构中嵌入轻量级的通道注意力自学习模块,通过增大卷积核的步长stride来实现目标数据张量尺寸的变化,同时通过通道注意力自学习模块对不同通道特征间关系进行建模、对权重进行重标定来抑制无用通道特征的干扰同时增益关键特征,其次还将YOLOv3基础模型的单向金字塔特征融合模块改为复用空间金字塔模块,把软非极大值抑制替换成可以通过逻辑回归计算出每个检测框内目标的概率的逻辑回归层,最后得到最终的目标检测模型。
[0015]优选的,将数据集中的数据输入目标检测模型进行训练,包括:
[0016]设置输入数据图像的最大尺寸为763,指定batch=64,steps=1800,总共1800次迭代,一次迭代中使用64个图片来更新模型的参数,指定subdivisions为4,允许GPU一次训练64张图片的一部分,降低GPU负载,指定质心间距=50,IOU阈值为0.7,置信度阈值为0.5,参数动量momentum=0.85,参数衰减decay为默认值0.0005,参数学习率learning

rate设置为0.001,载入数据集图片时,将当前图片最长的边缩放到指定的512大小,当前图片较短的边根据最长边的效果同比例缩放,并对输入的目标图片进行数据增强,得到数据增强后图片数据,使用K
‑‑
means聚类算法通过提前设置好的K=12个对象生成初始聚类中心并将对象分类,计算标注框bounding box宽高中值,当聚类的1

IOU距离小于等于设置的阈值时,更新相应的Anchor box的尺寸,并通过残差结构结合全局平均和最大池化提取压缩后的图像特征并在通道上对它们进行加权,然后经过Sigmoid函数激活的轻量级通道注意力自学习模块区分出不同层级的特征,利用改进的复用空间金字塔模块通过3个不同的kernel size将第46层输出的13
×
13特征图,经过上采样于第64层输出的26
×
26特征图和第92层输出的52
×
52特征图进行连接,利用Anchor box生成预测的目标边界框,保留置信度大于阈值0.5的目标边界框,丢弃置信度低于阈值0.5的目标边界框,使用逻辑回归层(Logistic Regression)对多个目标进行检测并预测每个边界框内目标的概率,输出最终的预测边界框和概率,检测到目标之后,提取所有检测目标的质心,计算每个质心之间的欧拉距离,当两个及以上的质心间的间距小于设置值时,更改边界框为红色颜色框,标记为异常状态,否则为蓝色颜色框,标记为正常状态,将图片数据输入模型,持续进行训练迭代,从第500次迭代开始学习率降低为0.0001,之后不断优化更新模型的参数,直到达到设定的迭代次数,最终模型损失值loss稳定在1.55左右,固定模型参数,完成模型的训练。
[0017]进一步的,对输入的目标图片进行数据增强,包括:
[0018]使用Mosaic对输入的目标图片进行数据增强,它对随机四张图片采取随机裁减,随机分布然后对它们进行拼接,最后把训练集中随机的4张图片以不同的比例合并为一张图片,同时运用随机色彩空间(HSV)增强,调整图片饱和度saturation=1.5,曝光量exposure=1.5,利用随机生成的[0,1]区间的随机数对图片进行随机左右翻转,上下翻转,同时映射相应的label,最后生成3通道的512
×
512的图片数据,得到数据增强后图片数据。
[0019]优选的,对行人口罩检测和安全距离预警系统进行检测,包括:
[0020]对于使用摄像头实时监控视频文件或本地视频文件采集的行人影像数据,使用imutils进行图像剪裁、缩放,运用色彩空间转换,逐帧输入上述改进的YOLOv3模型中,进行行人口罩的检测和质心的计算,将检测结果实时显示于监控视频中。对于静态图片的行人图像数据,经过预处理后输入上述改进的YOLOv3模型中,进行行人口罩的检测和质心的计算,将检测结果显示于图片目标上。
[0021]优选的,所述行人口罩检测结果包括两个状态:正常状态和异常状态,其中异常状况包括口罩佩戴不规范和未佩戴口罩。
[0022]优选的,根据检测结果进行行人安全距离预警,包括:
[0023]当检测结果为异常状态时,发出语音指令进行口罩佩戴提示和安全距离提示。
[0024]本专利技术的有益效果:
[0025]本专利技术通过将改进的Yolo v3模型融入行人口罩检测和安全距离预警系统,通过改进的Yolo v3模型进行不同类型的口罩佩戴检测任务,增加了识别效率,提升了识别精
度。
附图说明
[0026]图1为本专利技术的一种基于深度学习的行人口罩检测和安本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于深度学习的行人口罩检测和安全距离预警方法,其特征在于,包括:S1:从开源的数据集中选取人脸图像和口罩遮挡的人脸图像,通过在现实场景视频帧中截取行人图像,将获取的图像数据组成数据集;S2:建立目标检测模型,将数据集中的数据输入目标检测模型进行训练,得到训练完成后的目标检测模型;S3:搭建行人口罩检测和安全距离预警系统,将训练完成后的目标检测模型作为系统的检测模块;所述系统包括信息采集模块、检测模块、安全距离预警模块;S4:信息采集模块实时采集待检测数据,所述待检测数据包括图片、视频数据;S5:检测模块对采集的待检测数据进行实时行人口罩检测,得到检测结果;S6:安全距离预警模块根据检测结果进行行人安全距离预警。2.根据权利要求1所述的一种基于深度学习的行人口罩检测和安全距离预警方法,其特征在于,所述目标检测模型,包括:将YOLOv3作为基础模型,对目标的大小尺寸进行统计,预先标注好的目标通过数据转换获得每个标注框bounding box的高和宽并对其进行标准化,再利用K

means聚类算法计算1

IOU距离,对生成的bounding box的高和宽的集合进行九分类操作,之后将聚类后得到的最常出现的几种标注框作为人为选定的锚框Anchor Box,接着在YOLOv3基础模型主干特征提取网络DarkNet53的残差结构中嵌入轻量级的通道注意力自学习模块,通过增大卷积核的步长stride来实现目标数据张量尺寸的变化,同时通过通道注意力自学习模块对不同通道特征间关系进行建模、对权重进行重标定来抑制无用通道特征的干扰同时增益关键特征,其次还将YOLOv3基础模型的单向金字塔特征融合模块改为复用空间金字塔模块,把软非极大值抑制替换成可以通过逻辑回归计算出每个检测框内目标的概率的逻辑回归层,最后得到最终的目标检测模型。3.根据权利要求1所述的一种基于深度学习的行人口罩检测和安全距离预警方法,其特征在于,将数据集中的数据输入目标检测模型进行训练,包括:设置输入数据图像的最大尺寸为763,指定batch=64,steps=1800,总共1800次迭代,一次迭代中使用64个图片来更新模型的参数,指定subdivisions为4,允许GPU一次训练64张图片的一部分,降低GPU负载,指定质心间距为50,IOU阈值为0.7,置信度阈值为0.5,参数动量momentum=0.85,参数衰减decay为默认值0.0005,参数学习率learning

rate设置为0.001,载入数据集图片时,将当前图片最长的边缩放到指定的512大小,当前图片较短的边根据最长边的效果同比例缩放,并对输入的目标图片进行数据增强,得到数据增强后图片数据,使用K
‑‑
means聚类算法通过提前设置好的K=12个对象生成初始聚类中心并将对象分类,计算标注框bounding box宽高中值,当聚类的1

IOU距离小于等...

【专利技术属性】
技术研发人员:程麒王烨祝宸叶春菱
申请(专利权)人:重庆邮电大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1