System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 提高小目标识别率的基于YOLOv8的模型检测方法和系统技术方案_技高网

提高小目标识别率的基于YOLOv8的模型检测方法和系统技术方案

技术编号:44143805 阅读:11 留言:0更新日期:2025-01-29 10:19
本发明专利技术公开提供了一种提高小目标识别率的基于YOLOv8的模型检测方法和系统,该方法包括如下步骤:步骤S1:构建用于检测数据集;步骤S2:基于YOLOv8模型框架,通过增加低层特征信息输出分支LLFO,由backbone特征图2x和4x直接与特征融合后的8x特征图融合后给出特征图,从而构建改进模型YOLOv8‑LLFO架构;步骤S3:通过检测数据集,基于YOLOv8模型,训练YOLOv8原始架构、融合YOLOv9PGI部分的YOLOv8‑PGI架构以及步骤S2构建的YOLOv8‑LLFO架构;步骤S4:对训练结果进行评估。本发明专利技术通过低层特征信息的输出分支(LLFO)能够显著增加小目标的识别率;而且低层特征信息的输出分支(LLFO)能够即插即用,对于基于经典检测COCO数据集的检测模型都能适配。

【技术实现步骤摘要】

本专利技术涉及深度学习,更具体地,涉及一种提高小目标识别率的基于yolov8的模型检测方法和系统。


技术介绍

1、当前深度学习里的目标检测手段往往是基于公开数据集coco来评测的。对于coco数据集,图片分辨率一般在宽800高600左右,识别目标大小具体分为三类:像素面积小于322的小目标,像素面积介于322和962之间的中等目标,以及大于962的大目标。但是在某些特定数据集中,目标的像素面积远小于322,此时依靠coco数据集作为评估手段的检测模型一般效果都有限,所以小目标检测成为了目标检测领域的难点。本专利技术通过给模型适当地增加了部分分支,使得对于小目标检测有很大的改善。

2、如图1所示,为了提高对低层特征信息的利用,yolov8模型通过pafpn架构来融合各特征层的信息。然而该方案仅仅针对coco数据集进行评测;并且没有考虑更低层次特征的利用。

3、如图2所示,为了进一步利用更底层的信息,解决深度神经网络中信息丢失所带来的挑战,yolov9模型通过可扩展的可编程梯度信息(programmable gradientinformation,pgi)模块增加一个辅助训练的分支来提高对输入信息的利用。此架构的右边部分与yolov8类似,左边是新增的辅助训练分支pgi,由输入图像经过backbonenet得到不同倍数的下采样特征图,然后8x特征图与右边部分的8x/16x/32x特征图拼接、卷积融合,16x特征图与右边部分的16x/32x特征图拼接、卷积融合,32x特征图与右边部分的32x特征图拼接、卷积融合。然后再经过headnet输出。然而该方案仅仅针对coco数据集进行评测;该方案只能有限利用低层信息;而且该方案由于增加了辅助训练分支导致训练时长和显存占用的增加。


技术实现思路

1、本专利技术针对由于低层特征信息的缺失导致小目标检测效果不佳的问题,提出了一种提高小目标识别率的基于yolov8的模型检测方法和系统,本专利技术通过低层特征信息的输出分支(llfo)能够显著增加小目标的识别率;而且低层特征信息的输出分支(llfo)能够即插即用,对于基于经典检测coco数据集的检测模型都能适配。

2、为了达到上述目的,本专利技术的技术方案提供了一种提高小目标识别率的模型检测方法,其包括如下步骤:步骤s1:构建检测数据集;步骤s2:基于yolov8模型框架,通过增加低层特征信息输出分支llfo,由backbone特征图2x和4x直接与特征融合后的8x特征图融合后给出特征图,从而构建改进模型yolov8-llfo架构;步骤s3:通过检测数据集,基于yolov8模型,训练yolov8原始架构、融合yolov9 pgi部分的yolov8-pgi架构以及步骤s2构建的yolov8-llfo架构;步骤s4:对训练结果进行评估。

3、进一步地,在步骤s2中,4x特征图经过卷积变化与特征融合后的8x特征图拼接到一起,再经过卷积变化输出到head部分,2x特征图同样经过卷积变化与特征融合后的4x特征图拼接到一起,再经过卷积变化输出到head部分。

4、进一步地,在步骤s2中,yolov8模型框架包括三部分:backbone为cspdarknet结构,neck为pafpn变异体,head为anchor free+decoupled head设计;并且通过增加低层特征信息输出分支llfo,输出五个特征图。

5、进一步地,在步骤s1中,检测数据集的图片分辨率有两种:1920*1080,1080*800;在宽800高600左右,目标大小分布为:50%的目标像素面积小于152,75%的目标像素面积小于252,95%的目标像素面积小于602。

6、进一步地,在步骤s4中,训练评估结果由目标检测评估指标map50给出,并且评估模型推理时的显存占用和延时。

7、本专利技术的技术方案还提供了一种提高小目标识别率的模型检测系统,其包括如下模块:数据集构建模块,构建小目标检测数据集;改进模型构建模块,基于yolov8模型框架,通过增加低层特征信息输出分支llfo,由backbone特征图2x和4x直接与特征融合后的8x特征图融合后给出特征图,从而构建改进模型yolov8-llfo架构;训练模块,通过检测数据集,基于yolov8模型,训练yolov8原始架构、融合yolov9 pgi部分的yolov8-pgi架构以及由改进模型构建模块构建的yolov8-llfo架构;评估模块,对训练结果进行评估。

8、进一步地,在通过改进模型构建模块构建改进模型时,4x特征图经过卷积变化与特征融合后的8x特征图拼接到一起,再经过卷积变化输出到head部分,2x特征图同样经过卷积变化与特征融合后的4x特征图拼接到一起,再经过卷积变化输出到head部分。

9、进一步地,yolov8模型框架包括三部分:backbone为cspdarknet结构,neck为pafpn变异体,head为anchor free+decoupled head设计;并且通过增加低层特征信息输出分支llfo,输出五个特征图。

10、进一步地,在数据集构建模块构建小目标检测数据时,检测数据集的图片分辨率有两种:1920*1080,1080*800;在宽800高600左右,目标大小分布为:50%的目标像素面积小于152,75%的目标像素面积小于252,95%的目标像素面积小于602。

11、进一步地,在评估模块进行评估时,训练评估结果由目标检测评估指标map50给出,并且评估模型推理时的显存占用和延时。

本文档来自技高网...

【技术保护点】

1.一种提高小目标识别率的模型检测方法,其特征在于,包括如下步骤:

2.根据权利要求1所述的方法,其特征在于,在步骤S2中,4x特征图经过卷积变化与特征融合后的8x特征图拼接到一起,再经过卷积变化输出到Head部分,2x特征图同样经过卷积变化与特征融合后的4x特征图拼接到一起,再经过卷积变化输出到Head部分。

3.根据权利要求2所述的方法,其特征在于,在步骤S2中,YOLOv8模型框架包括三部分:Backbone为CSPDarknet结构,Neck为PAFPN变异体,Head为anchor free+decoupled head设计;并且通过增加低层特征信息输出分支LLFO,输出五个特征图。

4.根据权利要求1所述的方法,其特征在于,在步骤S1中,检测数据集的图片分辨率有两种:1920*1080,1080*800;在宽800高600左右,目标大小分布为:50%的目标像素面积小于152,75%的目标像素面积小于252,95%的目标像素面积小于602。

5.根据权利要求1所述的方法,其特征在于,在步骤S4中,训练评估结果由目标检测评估指标mAP50给出,并且评估模型推理时的显存占用和延时。

6.一种提高小目标识别率的模型检测系统,其特征在于,包括如下模块:

7.根据权利要求6所述的系统,其特征在于,在通过改进模型构建模块构建改进模型时,4x特征图经过卷积变化与特征融合后的8x特征图拼接到一起,再经过卷积变化输出到Head部分,2x特征图同样经过卷积变化与特征融合后的4x特征图拼接到一起,再经过卷积变化输出到Head部分。

8.根据权利要求7所述的系统,其特征在于,YOLOv8模型框架包括三部分:Backbone为CSPDarknet结构,Neck为PAFPN变异体,Head为anchor free+decoupled head设计;并且通过增加低层特征信息输出分支LLFO,输出五个特征图。

9.根据权利要求5所述的系统,其特征在于,在数据集构建模块构建检测数据时,检测数据集的图片分辨率有两种:1920*1080,1080*800;在宽800高600左右,目标大小分布为:50%的目标像素面积小于152,75%的目标像素面积小于252,95%的目标像素面积小于602。

10.根据权利要求9所述的系统,其特征在于,在评估模块进行评估时,训练评估结果由目标检测评估指标mAP50给出,并且评估模型推理时的显存占用和延时。

...

【技术特征摘要】

1.一种提高小目标识别率的模型检测方法,其特征在于,包括如下步骤:

2.根据权利要求1所述的方法,其特征在于,在步骤s2中,4x特征图经过卷积变化与特征融合后的8x特征图拼接到一起,再经过卷积变化输出到head部分,2x特征图同样经过卷积变化与特征融合后的4x特征图拼接到一起,再经过卷积变化输出到head部分。

3.根据权利要求2所述的方法,其特征在于,在步骤s2中,yolov8模型框架包括三部分:backbone为cspdarknet结构,neck为pafpn变异体,head为anchor free+decoupled head设计;并且通过增加低层特征信息输出分支llfo,输出五个特征图。

4.根据权利要求1所述的方法,其特征在于,在步骤s1中,检测数据集的图片分辨率有两种:1920*1080,1080*800;在宽800高600左右,目标大小分布为:50%的目标像素面积小于152,75%的目标像素面积小于252,95%的目标像素面积小于602。

5.根据权利要求1所述的方法,其特征在于,在步骤s4中,训练评估结果由目标检测评估指标map50给出,并且评估模型推理时的显存占用和延时。

6.一种提高...

【专利技术属性】
技术研发人员:何弢廖文龙周海进彭湃
申请(专利权)人:酷哇科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1