一种基于改进YOLOv5s和迁移学习的漂浮物检测方法技术

技术编号：44026131 阅读：32 留言：0更新日期：2025-01-15 01:08

本发明专利技术公开了一种基于改进YOLOv5s和迁移学习的漂浮物检测方法，包括以下步骤，收集漂浮物数据，对数据进行预处理，将数据进行增强，增强后数据归一化；然后进行模型改进，EfficientNetv2轻量化网络结构替换，CARAFE轻量级上采样模块更改，替换PANet为BiFPN结构,引入注意力机制，替换CIoU为SIoU损失函数，迁移学习，模型评估与验证，结果分析。本发明专利技术方法相较于传统的目标检测模型在多个方面实现了提升，通过优化改进YOLOv5s模型并结合迁移学习，可以提高漂浮物检测的准确性和精度，使得检测结果更加可靠和准确，较传统方法有更高的检测准确率，YOLOv5s模型在速度和精度方面取得良好平衡，结合迁移学习可以进一步优化性能，提高漂浮物检测的效率和响应速度。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及河道漂浮物检测的，特别涉及一种基于改进yolov5s和迁移学习的漂浮物检测方法。

技术介绍

1、近年来，人工智能不断发展，深度学习和机器学习技术被广泛运用在各个领域。在此背景下，目标检测算法在各个领域得到广泛应用，其中yolo系列算法以其快速、高效的特点备受关注。然而，在水面漂浮物检测领域，传统的目标检测算法往往面临着光照、遮挡、噪声等环境因素干扰的挑战，对漂浮物进行准确检测仍然是一个具有挑战性的问题。

2、现有技术中对小目标的检测中容易出现漏检、误检等情况，已有网络模型存在准确率低、模型泛化能力弱、模型体积大等问题。

技术实现思路

1、针对上述漂浮物检测中存在的问题，本专利技术提供一种基于改进yolov5s和迁移学习的漂浮物检测方法，实现水面漂浮物目标的高精度实时性检测，在测试过程中未出现部分丢帧和检测框偏移等情况。

2、本专利技术解决其技术问题所采用的方案是：一种基于改进yolov5s和迁移学习的漂浮物检测方法，包括以下步骤：

3、s1、收集漂浮物数据；

4、s2、进行数据预处理；

5、对收集的漂浮物数据进行筛选，把水面漂浮物的图像尺寸统一裁剪为640×640大小；

6、s3、数据增强

7、以9:1的比例划分训练集和测试集，使用sagan对图像进行数据增强，在sagan中采用非局部模型,使生成器和判别器有效地构建各个区域之间的关系,直接计算两个像素点之间的关系；

8、s4、数据归一化

9、采用labelimg图像标注工具选择yolo格式标注后，得到对应图片的txt标注文件；

10、s5、efficientnetv2轻量化网络结构；

11、s6、carafe轻量级上采样模块

12、更改yolov5s模型原始上采样模块为carafe轻量级上采样模块，carafe轻量级上采样模块由上采样核预测模块和特征重组模块组成，特征图输入上采样核预测模块；

13、s7、替换panet为bifpn结构；

14、s8、引入注意力机制；

15、s9、替换ciou为siou损失函数；

16、s10、迁移学习

17、采用迁移学习方法，将imagenet数据集作为源域，选取河道岸边漂浮物数据集作为辅助域，通过预训练实现模型权重迁移，作为模型的初始化权重参数，以解决样本数据量较少的问题，提高模型的泛化能力和网络训练速度；

18、s11、模型评估与结果分析。

19、进一步，步骤s5使用efficientnetv2将efficientnet的浅层mbconv结构替换为fused-mbconv结构，即将结构主分支的1×1扩展卷积和3×3dw卷积替换为一个3×3普通卷积，efficientnetv2使用nas搜索mbconv和fused-mbconv的最佳组合，平衡速度和性能后，得到efficientnetv2-b0结构。

20、进一步，步骤s6中输入特征图的特征层通道数c经一个卷积核为1×1的cbs卷积层后降维压缩为cm，如下式所示：

21、cm＝σ2·(kup)2

22、式中σ为上采样倍数，kup为上采样核大小；

23、对于经过通道压缩后的输入特征图，使用一个卷积核大小为ke×ke的卷积层来预测上卷积核，输出通道数为σ2k2up，然后使用pixelshuffle方法将通道维在空间维展开，得到形状为σh·σw·k2up的上采样核，使用softmax激活函数归一化处理。

24、进一步，步骤s7中通过bifpn引入加权特征融合机制，如下式所示：

25、

26、式中ε取值为0.0001，其作用是使分母不为0保证数值稳定，wi为权重范围在[0,1]之间，ii为输入特征图。

27、进一步，步骤s8引入ema注意力机制，所述ema注意力机制主要由一个1×1分支、一个3×3分支和一个跨空间学习模块构成。

28、进一步，步骤s8引入注意力机制的方法包括，

29、s81、对于任意给定的输入特征图设定

30、x∈rc×h×w

31、式中，c、h、w分别为输入特征图的通道数、高度和宽度；

32、ema按跨通道维度方向将x划分成为g个子特征用于学习不同的语义，其中的组风格可以被定义为：

33、x＝[x0,xi,…,xg-1],xi∈rc∥g×h×w

34、式中，g＜＜c；

35、s82、为了捕获所有通道之间的依赖关系并减轻计算开销，ema在1×1分支中分别沿两个空间方向对通道进行编码采用了两个一维全局平均池化操作，在3×3分支中仅堆叠一个3×3内核以捕获多尺度特征表示。在ema中一种不同空间维度方向的跨空间信息聚合方法可以实现更丰富的特征聚合，首先，两个张量其中一个是1×1分支的输出另一个是3×3分支的输出。然后，利用二维全局平均池化对1×1支路的输出进行全局空间信息编码，在通道特征联合激活机制前，将最小支路的输出直接转化为对应的维度形状，即：

36、r11×c∥g×r3c∥g×hw

37、二维全局池化操作公式为：

38、

39、式中，xc表示第c个通道的输入特征；

40、s83、为了提高模型的计算效率，在二维全局平均池化的输出处采用softmax来拟合上述的线性变换，通过将上述并行处理的输出与矩阵点积运算相乘得到了第一个空间注意力图，同样利用二维全局平均池化对3×3分支编码全局空间信息，1×1分支在通道特征联合激活机制前直接转换为相应的维度形状，即：

41、r31×c∥g×r1c∥g×hw

42、在此基础上，导出了保留整个精确空间位置信息的第二空间注意力图，最后，将每组内的输出特征图计算为生成的两个空间注意力权重值的集合，然后使用sigmoid函数捕获像素级的成对关系，并突出显示所有像素的全局上下文。

43、进一步，步骤s9替换ciou为siou损失函数的方法，

44、s91、siou损失函数由角度、距离、形状和交并比(iiou)四个成本函数构成、角度成本函数首先在x轴或y轴预测，然后沿x轴或y轴接近，收敛过程中如果α≤π/4则最小化α，否则最小化β；

45、角度成本函数λ如式：

46、

47、距离成本函数δ如式：

48、

49、式中，(bcx,bcy)为预测框中心点，为真实框中心点，α为σ与cw夹角,cw、ch预测框中心点及真实框中心点的横坐标与纵坐标之差，σ为真实框和预测框中心点距离，w和h为预测框的宽和高；

50、s92、由上式可得，当α接近0时，距离成本贡献降低；当α接近π/4时，距离成本函数δ越大，随着角度增加，γ被赋予时间优先权，

51、形状成本函数本文档来自技高网...

【技术保护点】

1.一种基于改进YOLOv5s和迁移学习的漂浮物检测方法，其特征在于，包括以下步骤：

2.根据权利要求1所述基于改进YOLOv5s和迁移学习的漂浮物检测方法，其特征在于，步骤S5使用EfficientNetv2将EfficientNet的浅层MBConv结构替换为Fused-MBConv结构，即将结构主分支的1×1扩展卷积和3×3DW卷积替换为一个3×3普通卷积，EfficientNetv2使用NAS搜索MBConv和Fused-MBConv的最佳组合，平衡速度和性能后，得到EfficientNetv2-B0结构。

3.根据权利要求1所述基于改进YOLOv5s和迁移学习的漂浮物检测方法，其特征在于，步骤S6中输入特征图的特征层通道数C经一个卷积核为1×1的CBS卷积层后降维压缩为Cm，如下式所示：

4.根据权利要求1所述基于改进YOLOv5s和迁移学习的漂浮物检测方法，其特征在于，步骤S7中通过BiFPN引入加权特征融合机制，如下式所示：

5.根据权利要求1所述基于改进YOLOv5s和迁移学习的漂浮物检测方法，其特征在于，步骤S8引

6.根据权利要求5所述基于改进YOLOv5s和迁移学习的漂浮物检测方法，其特征在于，步骤S8引入注意力机制的方法包括，S81、对于任意给定的输入特征图设定

7.根据权利要求1所述基于改进YOLOv5s和迁移学习的漂浮物检测方法，其特征在于，步骤S9替换CIoU为SIoU损失函数的方法，

8.根据权利要求1所述基于改进YOLOv5s和迁移学习的漂浮物检测方法，其特征在于，步骤S11模型评估与结果分析的方法：基于S5-S9改进的YOLOv5模型，以s10的迁移学习结果作为初始化权重参数，再通过训练集对模型进行训练，测试集检测，评估模型性能；计算改进前后模型的准确率、帧率、F1值和召回率，评估模型的预测性能；然后，比较改进前后模型的准确率、帧率、F1值和召回率并绘制改进前后模型的Loss曲线和准确率曲线对比图，以评估改进YOLOv5s和迁移学习对漂浮物目标检测的效果影响。

...

【技术特征摘要】

1.一种基于改进yolov5s和迁移学习的漂浮物检测方法，其特征在于，包括以下步骤：

2.根据权利要求1所述基于改进yolov5s和迁移学习的漂浮物检测方法，其特征在于，步骤s5使用efficientnetv2将efficientnet的浅层mbconv结构替换为fused-mbconv结构，即将结构主分支的1×1扩展卷积和3×3dw卷积替换为一个3×3普通卷积，efficientnetv2使用nas搜索mbconv和fused-mbconv的最佳组合，平衡速度和性能后，得到efficientnetv2-b0结构。

3.根据权利要求1所述基于改进yolov5s和迁移学习的漂浮物检测方法，其特征在于，步骤s6中输入特征图的特征层通道数c经一个卷积核为1×1的cbs卷积层后降维压缩为cm，如下式所示：

4.根据权利要求1所述基于改进yolov5s和迁移学习的漂浮物检测方法，其特征在于，步骤s7中通过bifpn引入加权特征融合机制，如下式所示：

5.根据权利要求1所述基于改进yolov5s和迁移学习的...

【专利技术属性】
技术研发人员：柴启辉，田青青，张忆庆，马云飞，马乾方，尹鹏博，冉云龙，黄莎莎，孙安冬，贺鹏晟，
申请(专利权)人：华北水利水电大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人