System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于改进RTDETR的多尺度特征学习小目标检测方法技术_技高网
当前位置: 首页 > 专利查询>淮阴工学院专利>正文

一种基于改进RTDETR的多尺度特征学习小目标检测方法技术

技术编号:44106965 阅读:7 留言:0更新日期:2025-01-24 22:33
本发明专利技术提供了一种基于改进RTDETR的多尺度特征学习小目标检测方法,对RTDETR的主干网络Backbone进行改进,通过Conv层,MaxPool层和PRep‑Block模块进行初步的特征提取;PRep‑Block模块在BasicBlock中添加PConv,并在PConv的最后的卷积层使用了RepConv进行替换,得到PRep‑Block。CCFM模块中,特征融合步骤采用TFE模块改进多尺度特征融合方式,并在每个特征融合后添加VoVGSCSP模块以优化通道特征表示。在最后的特征融合步骤中,使用SSFF模块进行多尺度特征融合。与现有技术相比,本发明专利技术模型通过增强多尺度特征的提取和融合能力,进一步提高了特征图的表达能力和鲁棒性,实现了模型的轻量化,适于低端设备运行,同时提升了化工区域安全装备识别的精度,尤其是小目标的检测精度。

【技术实现步骤摘要】

本专利技术属于机器视觉的目标识别,具体是一种基于改进rtdetr的多尺度特征学习小目标检测方法。


技术介绍

1、小目标检测在计算机视觉领域是一项具有挑战性的任务,特别是在目标检测和识别领域。小目标在图像中所占的像素少,在不同尺度的图像中,小目标特别容易被忽略。目标在图像中的深度变化会导致目标的外观发生显著变化,远处的小目标可能变得模糊或失真。此外,复杂背景下目标与背景的相似性会干扰检测器的判断,显著增加检测难度。在安全监控、自动驾驶、医疗影像和无人机监控等多个领域,目标检测技术的应用日益广泛。然而,现有基于rtdetr的检测方案仍然难以完全解决小目标识别问题,仍需进一步优化和改进以提高检测的准确性和鲁棒性。


技术实现思路

1、专利技术目的:本专利技术的要解决的技术问题是提供一种轻量化的、具有更高检测精度、尤其是对小目标检测精度的rtdetr检测方法。

2、技术方案:本专利技术提出一种基于改进rtdetr的多尺度特征学习小目标检测方法,包括如下步骤:

3、步骤1:获取图像数据,并对其进行可视化处理及标注,构建数据集;

4、步骤2:对rtdetr特征提取网络的backbone进行改进,通过conv层,maxpool层和prep-block模块进行初步的特征提取;所述prep-block模块基于resnet的basicblock进行改进,结合fasternet的pconv技术,并在pconv中引入repconv得到新的卷积层prepconv,替换basicblock中第二个3*3卷积,改进的backbone网络输出四个阶段的特征s2、s3、s4、s5;

5、步骤3:将改进后的backbone网络提取的最后四个阶段的特征s2、s3、s4、s5输入到encoder模块,通过gsconv模块和aifi-lpe模块的对s5进行处理;gsconv模块用于全局信息的整合和特征增强,aifi-lpe模块结合注意力机制和可学习的位置编码,通过encoder模块最终得到特征f5;

6、步骤4:将步骤2和步骤3的特征图s2、s3、s4、s5、f5输入到ccfm模块进行pafpn操作,并输出融合特征f;

7、步骤5:使用rtdetr网络的iou-aware query selection模块对特征f进行预测得到检测框并对其做筛选处理;

8、步骤6:步骤5筛选后的特征f输入到rtdetr的decoder模块,通过多层注意力机制和预测头,将多个特征图融合并输出最终的检测结果。

9、进一步地,所述步骤1的具体方法为:

10、步骤1.1:首先获取化工企业工作区域的图像数据,通过消除无目标的背景图像对数据集进行预处理;

11、步骤1.2:使用labelme标注工具将收集的图像数据进行标注,总共划分了person,work_clothes,helmet三个类别,得到图像数据集c-safe;

12、步骤1.3:将数据集按使用7:2:1的比例划分为训练集,测试集和验证集。

13、进一步地,所述步骤2改进后的backbone网络的具体方法为:

14、步骤2.1:将图像输入到改进后的backbone网络之后,首先使用三个conv层和一个maxpool层依次对其进行特征提取和下采样处理,图像的空间尺寸经过两次减半,特征通道数从初始的3通道增加到64通道,得到特征图s2,然后将s2输入到第一个prep-block模块中;

15、步骤2.2:prep-block模块的输入为x,prep-block模块的输出为f(x),prep-block模块使用pconv对输入特征进行处理,同时对pconv内部使用repconv进行改进,所述prep-block模块的处理过程见下式:

16、x1=conv(x)

17、x2=prepconv(x1)

18、f(x)=relu(x2+conv(x))

19、其中,x1是输入经过卷积层conv得到的输出,x2是对x1经过prepconv的输出;x1为prepconv的输入,首先输入通过partialconv过滤器处理不规则的像素,随后使用repconv进行进一步处理,增强特征提取能力;最后,将特征图输入到多层感知机mlp进行处理,并通过droppath进行正则化,最终得到融合了输入特征的输出结果,prepconv的处理过程见下式:

20、xpartial=partialconv(x1)

21、x′=repconv(xpartial)

22、x2=droppath(mlp(x′))

23、步骤2.3:在整个改进后的backbone网络中,特征图先后经过4个prep-block模块,依次得到s2、s3、s4、s5四个不同尺度特征图。

24、进一步地,所述步骤3中gsconv模块的具体方法为:

25、将输入s5通过gsconv模块调整通道数为256,处理过程见下式:

26、

27、其中,cin表示输入通道数,g表示gsconv中分组卷积对通道的分组数,yk,i是gsconv的第k组第i个输出通道,xk,j是第k组第j个输入通道,wk,ij是第k组的卷积核,bk,i是第k组的偏置。

28、进一步地,所述步骤3中aifi-lpe模块的具体方法为:

29、将gsconv模块的输出作为aifi_lpe模块的输入,记为x,首先通过生成位置编码p并与展平后的特征图xflatten相加,增加位置信息;对加了位置编码的特征图xpos进行transformer编码,得到编码后的特征图xencodedx最后将编码后的特征图进行转置和恢复原来的形状;aifi-lpe模块的处理过程见下式:

30、p=lpe(x)

31、xpos=x+p

32、xflatten=flatten(xpos)

33、xencoder=transformerencoder(xflatten)

34、xoutput=permute(xencodedt)

35、其中,x表示输入特征图,通过lpe模块生成位置编码信息,定义变量p,d,l分别表示最大位置数,嵌入维度和序列长度,位置id生成从0到l-1,表示为positionids=[0,1,2…,l-1],使用嵌入层将位置id映射到嵌入向量,定义一个嵌入矩阵e∈rp×d,其中每一行代表一个位置id的嵌入向量,通过查找操作,从嵌入矩阵e中获取位置嵌入矩阵pemb=e[positionids],其中pemb∈rp×d,此时xpos包含了原始特征图x和位置编码信息pemb;

36、进一步地,所述的步骤4的ccfm模块引入ssff模块和tfe模块对ccfm模块进行改进,具体执行过程如下:

37、步骤4.1:改进的ccfm模块的输入s2、s3、本文档来自技高网...

【技术保护点】

1.一种基于改进RTDETR的多尺度特征学习小目标检测方法,其特征在于,包括如下步骤:

2.根据权利要求1所述的一种基于改进RTDETR的多尺度特征学习小目标检测方法,其特征在于,所述步骤1的具体方法为:

3.根据权利要求1所述的一种基于改进RTDETR的多尺度特征学习小目标检测方法,其特征在于,所述步骤2改进后的Backbone网络的具体方法为:

4.根据权利要求1所述的一种基于改进RTDETR的多尺度特征学习小目标检测方法,其特征在于,所述步骤3中GSConv模块的具体方法为:

5.根据权利要求1或4所述的一种基于改进RTDETR的多尺度特征学习小目标检测方法,其特征在于,所述步骤3中AIFI-LPE模块的具体方法为:

6.根据权利要求1所述的一种基于改进RTDETR的多尺度特征学习小目标检测方法,其特征在于,所述的步骤4的CCFM模块引入SSFF模块和TFE模块对CCFM模块进行改进,具体执行过程如下:

7.根据权利要求6所述的一种基于改进RTDETR的多尺度特征学习小目标检测方法,其特征在于,所述CCFM模块的进一步改进为:在每个TFE模块、Fusion的最后引入GSConv模块和VoVGSCSP模块。

...

【技术特征摘要】

1.一种基于改进rtdetr的多尺度特征学习小目标检测方法,其特征在于,包括如下步骤:

2.根据权利要求1所述的一种基于改进rtdetr的多尺度特征学习小目标检测方法,其特征在于,所述步骤1的具体方法为:

3.根据权利要求1所述的一种基于改进rtdetr的多尺度特征学习小目标检测方法,其特征在于,所述步骤2改进后的backbone网络的具体方法为:

4.根据权利要求1所述的一种基于改进rtdetr的多尺度特征学习小目标检测方法,其特征在于,所述步骤3中gsconv模块的具体方法为:

5.根据权利要...

【专利技术属性】
技术研发人员:马甲林王浩陈伟林俊锋谢乾李俊宇翟中豪尤洪峰
申请(专利权)人:淮阴工学院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1