System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于改进YOLOv5的船舶类型检测方法及装置制造方法及图纸_技高网

一种基于改进YOLOv5的船舶类型检测方法及装置制造方法及图纸

技术编号:43677733 阅读:14 留言:0更新日期:2024-12-18 21:00
本发明专利技术提供了一种基于改进YOLOv5的船舶类型检测方法及装置。采用更加轻量化的GhostConv卷积模块作为YOLOv5的主要卷积操作,同时引入CA注意力模块,充分考虑通道信息和方向相关的位置信息,并显著减少模型的参数量和计算量,保证足够灵活和轻量,利用本发明专利技术装置,能够实时准确地检测海上不同类型的作业船舶。

【技术实现步骤摘要】

本专利技术属计算机视觉,具体涉及一种基于改进yolov5的船舶类型检测方法及装置。


技术介绍

1、水上交通的船运相比陆地交通拥挤的情况下,因其运载量大、能耗低而发挥重要的海上交通运输价值。然而,随着水上交通场景环境的日益复杂,面临诸多问题,如船舶目标清晰度低、类型多样化等,使得在进行智能监控分析中识别不同类型、不同尺度的船舶相对困难。因此,利用计算机视觉技术,研究适用于船舶类型检测的深度学习算法和适用于目标检测算法的边端计算智能装置对于服务于各类海事应用具有重要意义。

2、近年来,随着人工智能技术与边缘计算智能装置的结合,目标检测算法在视频监控领域取得了显著的智能检测效果。同时,将服务端训练好的算法模型移植部署在边缘计算智能装置上,能够更好地执行实际应用场景中的目标检测任务。

3、目前,针对海上船舶目标检测的研究方法主要包括yolo系列、ssd系列以及fasterr-cnn系列。鉴于当前国产边缘计算智能装置在算法移植部署方面的高效性,yolo系列算法以其完备且系统性的特征工程,显著缩短了模型在本地端的训练时间及边缘端的迁移和部署时间,进而提升了目标检测的精度和效能。


技术实现思路

1、为了克服现有技术的不足,本专利技术提供一种基于改进yolov5的船舶类型检测方法及装置。采用更加轻量化的ghostconv卷积模块作为yolov5的主要卷积操作,同时引入ca注意力模块,充分考虑通道信息和方向相关的位置信息,并显著减少模型的参数量和计算量,保证足够灵活和轻量,利用本专利技术装置,能够实时准确地检测海上不同类型的作业船舶。

2、一种基于改进yolov5的船舶类型检测方法,其特征在于步骤如下:

3、步骤1,数据采集:采集包含海上不同时间段、不同天气下的船舶视频监控数据作为初始数据集;

4、步骤2,数据标注及图像预处理:将初始数据集中的视频转换为图片格式,并对图片中包含的不同类型的船舶分别进行标注;对标注后的图片进行扩充处理,并将扩充后的图片数据集划分为训练数据集、验证数据集和测试数据集;

5、步骤3,构建改进的yolov5检测模型:首先,采用ghostconv卷积模块替换原yolov5模型主干网络中的卷积操作;然后,在主干网络的sspf模块前一层添加ca注意力模块,得到改进的yolov5检测模型;

6、步骤4,模型训练:以步骤2得到训练数据集为输入,以目标边界框和类别概率为输出,对步骤3构建的改进的yolov5检测模型进行训练,得到训练好的检测模型;

7、步骤5,模型应用:将验证数据集输入到训练好的检测模型,进行模型验证;将测试数据集输入到训练好的检测模型,输出得到目标边界框和类别概率。

8、具体地,所述的图片格式为jpeg格式,将视频数据通过mp4tojpeg.py文件转换为jpeg图片集。

9、具体地,使用labelimg工具对图片中包含的不同类型的船舶进行标注。

10、具体地,所述的船舶类型包括客船、渔船、集装箱船和杂货船四类。

11、具体地,所述的扩充处理包括镜像翻转、图片旋转、缩放和亮度调整操作。

12、具体地,所述的训练数据集、验证数据集和测试数据集包含的图片数量比例为7:2:1。

13、具体地,所述的yolov5模型主要包括主干网络backbone、颈部网络neck和预测模块prediction,其中,主干网络backbone包括标准卷积层、csp模块和sspf模块,采用深度卷积神经网络对输入图像进行特征提取;颈部网络neck整合来自主干网络backbone的多尺度特征,并进行特征融合;预测模块prediction对经过颈部网络neck处理后的特征图进行目标检测,输出目标边界框和类别概率。

14、具体地,所述的ghostconv卷积模块的具体处理过程为:首先,输入特征图通过卷积层进行处理,被分成多个通道组,每个通道组分别使用不同的卷积核进行独立卷积运算,提取得到不同通道组的局部特征,同时,输入特征图通过残差连接直接传递到输出层,将经过卷积处理后的局部特征图与残差连接的特征图相结合,得到最终的输出特征图。

15、具体地,所述的ca注意力模块的具体处理过程为:首先,通过一个残差连接直接将原始输入特征图传递到输出层,输入特征图大小为c×h×w,c表示通道数,h为高度,w为宽度;接着,特征图分别经过x方向平均池化和y方向平均池化操作,得到大小分别为c×1×w和c×h×1的特征图,将池化后的特征图通过concat操作拼接,得到大小为c/r×1×(w+h)的特征图,r表示通道压缩率,再通过卷积层、批量归一化和非线性激活函数处理,将得到的特征图分为两部分,分别经过卷积层和sigmoid激活函数处理,生成用于不同维度的权重矩阵,大小分别为c×1×w和c×h×1;最终,将生成的权重矩阵与原始输入特征图进行逐通道的加权处理,输出经过权重调整的特征图,大小仍为c×h×w。

16、具体地,对改进的yolov5检测模型进行训练时,采用adam优化器,学习率初始设定lr=0.003,训练批次大小设为batch size=20,动量设为momentum=0.9,训练迭代次数设为400次。

17、具体地,步骤3的具体过程为:先将ghostconv模块和ca注意力模块代码写到yolov5模型的common.py配置文件中,然后,新建yolov5_ghost.yaml文件,将yolov5模型主干网络backbone中的相应卷积结构改为ghostconv模式,在yolo.py文件中增加判断条件,在主干网络backbone的sspf模块前一层添加ca注意力模块,得到改进的yolov5检测模型。

18、具体地,步骤4的具体过程为:将改进的yolov5检测模型作为训练器,和步骤2得到的数据集一起传入本地服务端,利用英伟达gpu显卡完成训练过程,生成pt最佳检测模型文件boat_best.pt。

19、具体地,步骤5的具体过程为:将训练后的最佳检测模型pt文件转化为onnx格式的模型,再利用模型转换工具将其转换为bmodel格式文件,产生boat_best.bmodel模型文件,使用bmodel格式的模型文件对验证集进行推理,验证推理结果,以及对测试数据集进行检测,得到目标边界框和类别概率。

20、本专利技术还提供基于上述方法的一种基于改进yolov5的船舶类型检测装置,其特征在于包括:

21、数据采集设备,包括具有摄像和照相功能的摄像机、监控装置,用于录制视频得到视频数据集;

22、服务端,用于数据标注及图像预处理、构建改进的yolov5检测模型、模型训练,并利用模型转换工具将训练好的模型转换为边缘端智能设备所需的模型文件;

23、边缘端智能设备,用于装载模型文件并运行程序,实现船舶目标检测,并对检测结果进行可视化,存储检测结果。

24、具体地,所述的边缘智能设备为包本文档来自技高网...

【技术保护点】

1.一种基于改进YOLOv5的船舶类型检测方法,其特征在于步骤如下:

2.如权利要求1所述的一种基于改进YOLOv5的船舶类型检测方法,其特征在于:所述的图片格式为JPEG格式,将视频数据通过mp4ToJpeg.py文件转换为JPEG图片集。

3.如权利要求1所述的一种基于改进YOLOv5的船舶类型检测方法,其特征在于:使用labelimg工具对图片中包含的不同类型的船舶进行标注。

4.如权利要求1所述的一种基于改进YOLOv5的船舶类型检测方法,其特征在于:所述的船舶类型包括客船、渔船、集装箱船和杂货船四类。

5.如权利要求1所述的一种基于改进YOLOv5的船舶类型检测方法,其特征在于:所述的扩充处理包括镜像翻转、图片旋转、缩放和亮度调整操作。

6.如权利要求1所述的一种基于改进YOLOv5的船舶类型检测方法,其特征在于:所述的训练数据集、验证数据集和测试数据集包含的图片数量比例为7:2:1。

7.如权利要求1所述的一种基于改进YOLOv5的船舶类型检测方法,其特征在于:所述的YOLOv5模型主要包括主干网络Backbone、颈部网络Neck和预测模块Prediction,其中,主干网络backbone包括标准卷积层、CSP模块和SSPF模块,采用深度卷积神经网络对输入图像进行特征提取;颈部网络Neck整合来自主干网络Backbone的多尺度特征,并进行特征融合;预测模块Prediction对经过颈部网络Neck处理后的特征图进行目标检测,输出目标边界框和类别概率。

8.如权利要求1所述的一种基于改进YOLOv5的船舶类型检测方法,其特征在于:所述的GhostConv卷积模块的具体处理过程为:首先,输入特征图通过卷积层进行处理,被分成多个通道组,每个通道组分别使用不同的卷积核进行独立卷积运算,提取得到不同通道组的局部特征,同时,输入特征图通过残差连接直接传递到输出层,将经过卷积处理后的局部特征图与残差连接的特征图相结合,得到最终的输出特征图。

9.如权利要求1所述的一种基于改进YOLOv5的船舶类型检测方法,其特征在于:所述的CA注意力模块的具体处理过程为:首先,通过一个残差连接直接将原始输入特征图传递到输出层,输入特征图大小为C×H×W,C表示通道数,H为高度,W为宽度;接着,特征图分别经过X方向平均池化和Y方向平均池化操作,得到大小分别为C×1×W和C×H×1的特征图,将池化后的特征图通过Concat操作拼接,得到大小为C/r×1×(W+H)的特征图,r表示通道压缩率,再通过卷积层、批量归一化和非线性激活函数处理,将得到的特征图分为两部分,分别经过卷积层和Sigmoid激活函数处理,生成用于不同维度的权重矩阵,大小分别为C×1×W和C×H×1;最终,将生成的权重矩阵与原始输入特征图进行逐通道的加权处理,输出经过权重调整的特征图,大小仍为C×H×W。

10.如权利要求1所述的一种基于改进YOLOv5的船舶类型检测方法,其特征在于:对改进的YOLOv5检测模型进行训练时,采用Adam优化器,学习率初始设定lr=0.003,训练批次大小设为batch size=20,动量设为momentum=0.9,训练迭代次数设为400次。

11.如权利要求1所述的一种基于改进YOLOv5的船舶类型检测方法,其特征在于:步骤3的具体过程为:先将GhostConv模块和CA注意力模块代码写到yolov5模型的common.py配置文件中,然后,新建yolov5_Ghost.yaml文件,将yolov5模型主干网络backbone中的相应卷积结构改为GhostConv模式,在yolo.py文件中增加判断条件,在主干网络backbone的SSPF模块前一层添加CA注意力模块,得到改进的YOLOv5检测模型。

12.如权利要求11所述的一种基于改进YOLOv5的船舶类型检测方法,其特征在于:步骤4的具体过程为:将改进的YOLOv5检测模型作为训练器,和步骤2得到的数据集一起传入本地服务端,利用英伟达GPU显卡完成训练过程,生成pt最佳检测模型文件boat_best.pt。

13.如权利要求12所述的一种基于改进YOLOv5的船舶类型检测方法,其特征在于:步骤5的具体过程为:将训练后的最佳检测模型pt文件转化为onnx格式的模型,再利用模型转换工具将其转换为Bmodel格式文件,产生boat_best.bmodel模型文件,使用bmodel格式的模型文件对验证集进行推理,验证推理结果,以及对测试数据集进行检测,得到目标边界框和类别概率。

14.一种基于改进YOLOv5的船舶类型检测装置,其特...

【技术特征摘要】

1.一种基于改进yolov5的船舶类型检测方法,其特征在于步骤如下:

2.如权利要求1所述的一种基于改进yolov5的船舶类型检测方法,其特征在于:所述的图片格式为jpeg格式,将视频数据通过mp4tojpeg.py文件转换为jpeg图片集。

3.如权利要求1所述的一种基于改进yolov5的船舶类型检测方法,其特征在于:使用labelimg工具对图片中包含的不同类型的船舶进行标注。

4.如权利要求1所述的一种基于改进yolov5的船舶类型检测方法,其特征在于:所述的船舶类型包括客船、渔船、集装箱船和杂货船四类。

5.如权利要求1所述的一种基于改进yolov5的船舶类型检测方法,其特征在于:所述的扩充处理包括镜像翻转、图片旋转、缩放和亮度调整操作。

6.如权利要求1所述的一种基于改进yolov5的船舶类型检测方法,其特征在于:所述的训练数据集、验证数据集和测试数据集包含的图片数量比例为7:2:1。

7.如权利要求1所述的一种基于改进yolov5的船舶类型检测方法,其特征在于:所述的yolov5模型主要包括主干网络backbone、颈部网络neck和预测模块prediction,其中,主干网络backbone包括标准卷积层、csp模块和sspf模块,采用深度卷积神经网络对输入图像进行特征提取;颈部网络neck整合来自主干网络backbone的多尺度特征,并进行特征融合;预测模块prediction对经过颈部网络neck处理后的特征图进行目标检测,输出目标边界框和类别概率。

8.如权利要求1所述的一种基于改进yolov5的船舶类型检测方法,其特征在于:所述的ghostconv卷积模块的具体处理过程为:首先,输入特征图通过卷积层进行处理,被分成多个通道组,每个通道组分别使用不同的卷积核进行独立卷积运算,提取得到不同通道组的局部特征,同时,输入特征图通过残差连接直接传递到输出层,将经过卷积处理后的局部特征图与残差连接的特征图相结合,得到最终的输出特征图。

9.如权利要求1所述的一种基于改进yolov5的船舶类型检测方法,其特征在于:所述的ca注意力模块的具体处理过程为:首先,通过一个残差连接直接将原始输入特征图传递到输出层,输入特征图大小为c×h×w,c表示通道数,h为高度,w为宽度;接着,特征图分别经过x方向平均池化和y方向平均池化操作,得到大小分别为c×1×w...

【专利技术属性】
技术研发人员:李星何文山冯晓辉王博
申请(专利权)人:西安长远电子工程有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1