System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 基于改进YOLOv5s轻量化模型的密集行人检测方法技术_技高网

基于改进YOLOv5s轻量化模型的密集行人检测方法技术

技术编号:44196217 阅读:1 留言:0更新日期:2025-02-06 18:33
本发明专利技术属于图像行人检测技术领域,具体涉及一种基于改进YOLOv5s轻量化模型的密集行人检测方法;包括:获取行人图像,将行人图像输入到改进YOLOv5模型中,得到初始密集行人检测结果;根据初始密集行人检测结果对改进YOLOv5模型进行结构化剪枝,得到中间改进YOLOv5模型;根据初始密集行人检测结果计算模型总损失,根据模型总损失调整中间改进YOLOv5模型参数,得到训练好的密集行人检测模型;采用Soft‑NMS算法对训练好的密集行人检测模型的检测结果进行筛选,得到最终的密集行人检测结果;本发明专利技术可以提高识别行人的准确率,有效的缓解行人之间出现的遮挡问题,可以在资源受限的设备上运行并且有着不错的效果。

【技术实现步骤摘要】

本专利技术属于图像行人检测,具体涉及一种基于改进yolov5s轻量化模型的密集行人检测方法。


技术介绍

1、行人检测作为目标检测领域内的重要研究内容,其在视觉追踪、行人重识别及行为分析等多个工程
具有广泛应用;近年来,伴随深度学习技术的快速发展,大量相关的目标检测算法也因此而产生。目标检测器也都达到了不错的效果,但这些模型中的大多数都需要过多的计算资源;这就凸显出对轻量化模型设计的强烈需求,主要原因是尽管现有算法在追求高检测精度上取得了显著成就,却往往忽视了模型尺寸及其带来的计算负担,而这恰恰是评判算法实际可行性和能否成功应用于边缘计算资源受限设备的关键因素。

2、目标检测算法在深度学习的框架下,依据其运作机制可大体分类为两大流派:两阶段算法与一阶段算法。前者以基于区域的卷积神经网络为典型,这类算法以高检测精度著称,但伴随而来的是模型规模与计算复杂度的显著增加,这在诸如自动驾驶和智能交通系统的实时应用中可能受到限制。相反,一阶段检测算法简化了检测流程,直接从输入图像中预测物体位置及其边界框属性,将检测任务转化为回归问题。这些算法虽然在精确度上可能略逊于两阶段方法,但胜在模型更为精简,执行速度快,因而在工业界有着广泛的应用实践。特别是yolo模型,以其极高的检测速度脱颖而出,相较于其他多数目标检测技术展现出几个数量级的优势。yolo的核心创新在于其架构设计,该模型对每个预设的锚框同时输出一个物体类别概率和位置偏移量,仅保留那些类别概率超过预设阈值的边界框作为检测结果,以此快速且有效地定位图像中的目标对象,从而区别于依赖复杂区域提议的传统方法。

3、大部分行人检测任务通常在配备高性能图形处理器(gpu)的平台上进行测试和实施。然而,与之相比,嵌入式设备在计算能力上存在显著差异,无法承载大规模的卷积运算负担,这意味着gpu驱动的解决方案在资源有限的嵌入式环境下面临实施挑战。所以要保证模型性能的同时又要保证模型可以在资源受限的设备上使用,这是待解决的一个难题。现有技术中针对yolo模型系列的诸多改进措施已促成检测精度的小幅增长,但模型大小的控制问题依旧突出,未能圆满实现轻量化与高精度的和谐统一。考虑到嵌入式系统与高端服务器在计算性能上的显著差异,现实部署中,许多边缘计算装置及移动设备难以满足前沿深度学习模型的资源需求。特别是在人流量大的场合,目标间的频繁重叠加剧了行人识别的难度,降低了检测精准度。

4、综上所述,继续一种专为资源受限设备设计的轻量化行人检测模型,旨在实现在人群密集情况下也能保持高效实时的行人辨识能力。


技术实现思路

1、针对现有技术存在的不足,本专利技术提出了一种基于改进yolov5s轻量化模型的密集行人检测方法,该方法包括:获取行人图像并将其输入到训练好的密集行人检测模型中进行处理,得到密集行人检测结果;

2、密集行人检测模型的训练过程包括:

3、s1:获取行人图像,将行人图像输入到改进yolov5模型中,得到初始密集行人检测结果;

4、s2:根据初始密集行人检测结果对改进yolov5模型进行结构化剪枝,得到中间改进yolov5模型;

5、s3:根据初始密集行人检测结果计算模型总损失,根据模型总损失调整中间改进yolov5模型参数,得到训练好的密集行人检测模型;

6、s4:采用soft-nms算法对训练好的密集行人检测模型的检测结果进行筛选,得到最终的密集行人检测结果。

7、优选的,改进yolov5模型包括backbone网络、neck网络和head网络;backbone网络由2个一维卷积层、相互交替连接的4个c3_mlca层与3个lwwconv层、sppf层组成;neck网络包括2个一维卷积层、2个上采样层、2个lwwconv层、4个c3层和4个concat层;head网络包括3个detect层。

8、进一步的,lwwconv层的计算表达式为:

9、xavg=conv1×1(avgpool(x))

10、

11、flww_max=wtconv1×1(wtconv1×1(maxpool(x)))

12、flww=softmax(flww_avg+flww_max)·gconvk×k

13、其中,flww表示lwwconv层输出,conv1×1表示卷积核大小为1的卷积,wtconv1×1表示卷积核大小为1的wtconv,x表示输入的特征图,avgpool表示平均池化,maxpool表示最大池化,表示xavg中第i个像素点,n表示xavg中像素点数量,bl是第l个可学习的视觉码字,sl是第l个比例因子,l是视觉中心的总数,表示bn层,gconvk×k表示卷积核大小为k的组卷积;xavg、ek、flww_avg、flww_max分别表示第一、第二、第三和第四中间参数。

14、优选的,模型总损失为分类损失与回归损失的加权和;分类损失为:

15、

16、其中,vfl(p,q)表示分类损失,q表示二值变量,p表示模型预测的概率,γ表示曲线弧度控制参数;a表示比例因子;

17、回归损失为:

18、

19、其中,leiou表示回归损失,iou表示交并比,b表示预测框的中心,bgt表示目标框中心点,ρ2(b,bgt)表示物体的预测框和物体目标框中心点的坐标的欧氏距离的平方,ρ2(w,wgt)表示物体的预测框和物体目标框的宽度差值的平方,w表示预测框的宽,wgt表示目标框的宽,ρ2(h,hgt)表示物体的预测框和物体目标框的高度差值的平方,h表示预测框的高,hgt表示目标框的高,wc表示物体的预测框和物体目标框能够组成的最小外接矩形的宽度,hc表示物体的预测框和物体目标框能够组成的最小外接矩形的高度。

20、优选的,对初始密集行人检测结果进行筛选的过程包括:计算训练好的密集行人检测模型的检测结果中检验框的置信度得分;设置检验框的置信度得分阈值,去除检验框置信度得分低于置信度得分阈值的检验框,得到最终的密集行人检测结果。

21、进一步的,计算检验框置信度得分的公式为:

22、

23、其中,sni表示检验框的置信度得分,si表示经典nms算法输出的第i个检测框的得分,iou(m,bi)表示是两个检验框之间的交并比,m表示得分最高的检测框,bi表示第i个检验框,nt表示衰减阈值,α表示高斯惩罚函数的超参数。

24、优选的,对中间改进yolov5模型进行结构化剪枝的过程包括:对网络参数进行分组,根据分组进行模型剪枝;计算剪枝损失,当剪枝损失收敛时,得到训练好的密集行人检测模型。

25、本专利技术的有益效果为:

26、本专利技术引入了轻量级的卷积lwwconv,该模块通过引入空间注意力机制来自适应地调整不同空间位置的重要性,同时,其利用组卷积结构将输入通道分割成若干组,来达到减少模型的参数和计算量的目的;...

【技术保护点】

1.一种基于改进YOLOv5s轻量化模型的密集行人检测方法,其特征在于,包括:获取行人图像并将其输入到训练好的密集行人检测模型中进行处理,得到密集行人检测结果;

2.根据权利要求1所述的一种基于改进YOLOv5s轻量化模型的密集行人检测方法,其特征在于,所述改进YOLOv5模型包括Backbone网络、Neck网络和Head网络;Backbone网络由2个一维卷积层、相互交替连接的4个C3_MLCA层与3个LWWConv层、SPPF层组成;Neck网络包括2个一维卷积层、2个上采样层、2个LWWConv层、4个C3层和4个Concat层;Head网络包括3个Detect层。

3.根据权利要求2所述的一种基于改进YOLOv5s轻量化模型的密集行人检测方法,其特征在于,LWWConv层的计算表达式为:

4.根据权利要求1所述的一种基于改进YOLOv5s轻量化模型的密集行人检测方法,其特征在于,所述模型总损失为分类损失与回归损失的加权和;分类损失为:

5.根据权利要求1所述的一种基于改进YOLOv5s轻量化模型的密集行人检测方法,其特征在于,对初始密集行人检测结果进行筛选的过程包括:计算训练好的密集行人检测模型的检测结果中检验框的置信度得分;设置检验框的置信度得分阈值,去除检验框置信度得分低于置信度得分阈值的检验框,得到最终的密集行人检测结果。

6.根据权利要求5所述的一种基于改进YOLOv5s轻量化模型的密集行人检测方法,其特征在于,计算检验框置信度得分的公式为:

7.根据权利要求1所述的一种基于改进YOLOv5s轻量化模型的密集行人检测方法,其特征在于,对中间改进YOLOv5模型进行结构化剪枝的过程包括:对网络参数进行分组,根据分组进行模型剪枝;计算剪枝损失,当剪枝损失收敛时,得到训练好的密集行人检测模型。

...

【技术特征摘要】

1.一种基于改进yolov5s轻量化模型的密集行人检测方法,其特征在于,包括:获取行人图像并将其输入到训练好的密集行人检测模型中进行处理,得到密集行人检测结果;

2.根据权利要求1所述的一种基于改进yolov5s轻量化模型的密集行人检测方法,其特征在于,所述改进yolov5模型包括backbone网络、neck网络和head网络;backbone网络由2个一维卷积层、相互交替连接的4个c3_mlca层与3个lwwconv层、sppf层组成;neck网络包括2个一维卷积层、2个上采样层、2个lwwconv层、4个c3层和4个concat层;head网络包括3个detect层。

3.根据权利要求2所述的一种基于改进yolov5s轻量化模型的密集行人检测方法,其特征在于,lwwconv层的计算表达式为:

4.根据权利要求1所述的一种基于改进yolov5s轻量化模...

【专利技术属性】
技术研发人员:吴雪刚刘懋霖
申请(专利权)人:重庆理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1