当前位置: 首页 > 专利查询>淮阴工学院专利>正文

一种用于交通信号灯检测的改进型YOLOv5n模型制造技术

技术编号:38459252 阅读:15 留言:0更新日期:2023-08-11 14:36
一种用于交通信号灯检测的改进型YOLOv5n模型,优化方法的步骤包括:S1、获取待检测图像,进行数据预处理,分为训练集和测试集;S2、在YOLOv5n模型head层中的卷积核为3、步长为2的Convolution卷积换成involution卷积。S3、改进YOLOv5n模型C3模块中的Bottleneck,引入深度可分离卷积网络和FReLU激活函数组成MN_Bottleneck。S4、数据集训练该检测模型,使用训练好的检测模型进行交通信号灯检测,对检测结果进行评价。本发明专利技术使模型轻量化、训练和推理速度更快,提高模型的鲁棒性,使模型对于输入数据中的干扰或噪声能够保持相对稳定的预测结果,使其更加适用于复杂多变的现实场景。使其更加适用于复杂多变的现实场景。使其更加适用于复杂多变的现实场景。

【技术实现步骤摘要】
一种用于交通信号灯检测的改进型YOLOv5n模型


[0001]本专利技术涉及深度学习中目标检测
,具体涉及一种用于交通信号灯检测的改进型YOLOv5n模型。

技术介绍

[0002]目标检测是计算机视觉领域中的一个重要问题,它是指在一张图片或者视频序列中自动地检测出图片中出现的目标物体,并且对其进行定位和分类。在计算机视觉应用中,目标检测是很常见的一项任务,比如智能监控、自动驾驶、无人机和机器人导航、医学图像分析等等。近年来,随着深度学习的兴起和发展,基于深度学习的目标检测方法取得了很大的进步。例如:Faster R

CNN、YOLO、SSD、Mask R

CNN等,这些基于深度学习的目标检测方法在目标检测准确率和速度方面都取得了很大的进步,已经被广泛应用于各种计算机视觉领域的应用中。
[0003]YOLOv5n是一种目标检测模型,是YOLOv5系列中的一员,相较于YOLOv5原版,在保持高精度的情况下,大幅提升了检测速度。YOLOv5n采用了一系列优化策略,如精度损失小的前提下使用轻量化模型、通道注意力机制、密集连接模块等等,从而在目标检测任务中表现出色。具体来说,YOLOv5n使用的是CSPDarknet53作为骨干网络,使用通道注意力机制以增强模型的表达能力和减少计算量。此外,YOLOv5n在输入图像上进行金字塔多尺度特征提取,通过把低层特征和高层特征相结合来提高检测精度。此外,YOLOv5n还采用了密集连接模块,以更好地利用前面层的信息,增加了模型的深度和复杂度,从而进一步提高了精度。
[0004]虽然YOLOv5n相较于其它版本的YOLOv5表现更好,但它仍然存在一些缺点:YOLOv5n依赖于数据集的质量和多样性,如果数据集过于单一或者过小,可能会导致模型的泛化能力不足。对于一些极端情况,如物体遮挡、变形、光照不足等,YOLOv5n的检测效果也会有所下降。YOLOv5n相较于其它版本需要更长时间的训练,因为它有更多的层数和更大的网络容量,所以需要更多的计算资源和时间。

技术实现思路

[0005]针对YOLOv5n模型训练时间长、处理速度略慢、需要较高计算能力的技术问题,本技术方案提供了一种用于交通信号灯检测的改进型YOLOv5n模型,使模型轻量化、训练和推理速度更快,提高模型的鲁棒性,使模型对于输入数据中的干扰或噪声能够保持相对稳定的预测结果,使其更加适用于复杂多变的现实场景;能有效的解决上述问题。本专利技术通过以下技术方案实现:
[0006]一种用于交通信号灯检测的改进型YOLOv5n模型,使模型轻量化、训练和推理速度更快,提高模型的鲁棒性,使模型对于输入数据中的干扰或噪声能够保持相对稳定的预测结果,使其更加适用于复杂多变的现实场景;具体优化方法的步骤包括:
[0007]S1、获取待检测图像数据集,进行数据预处理,分为训练集和测试集;
[0008]S2、在YOLOv5n模型head层中的卷积核为3、步长为2的Convolution卷积换成
involution卷积;
[0009]S3、改进YOLOv5n模型C3模块中的Bottleneck,引入深度可分离卷积网络和FReLU激活函数组成MN_Bottleneck;
[0010]S4、数据集训练该检测模型,使用训练好的检测模型进行交通信号灯检测,对检测结果进行评价。
[0011]进一步的,所述的待检测图像数据集采用交通信号灯数据集S2TLD,以“red”、“yellow”、“green”、“wait_on”4个类别的关键词搜索得到各种各样的道路场景和典型的图片数据,得到图片数据集;对图片数据集进行数据清洗,针对爬取到的数据进行去除已损坏图像、去除重复图像、去除非关键字图像操作。
[0012]进一步的,步骤1所述的分为训练集和测试集是在图像数据清洗之后对数据集打标注工作,将数据集按照8:2划分为训练集和测试集。
[0013]进一步的,步骤2所述的YOLOv5n模型head层用Involution卷积取代输入通道和输出通道一致的convolution模块;具体的操作方式为:
[0014]第一步:修改common文件,向其中放入involution模块;
[0015]第二步:修改YOLO文件,在YOLO的parse_model函数中,加入involution模块;
[0016]Involution卷积将输入张量分解为两个子张量,并对其中一个子张量进行非线性变换,然后再将两个子张量合并;该操作可以由以下公式表示:
[0017][0018]式中:x
j
是输入张量的第j个元素,y
i
是输出张量的第i个元素,w
ij
和b
ij
分别是involution卷积中的权重和偏置,k是块的总数;这种非线性变换的形式类似于ReLU激活函数,在子张量上进行。
[0019]进一步的,步骤3所述的改进YOLOv5n模型C3模块中的Bottleneck是在原YOLOv5n模型C3模块的Bottleneck中引入DW卷积,具体的操作方式为:
[0020]步骤a:修改common文件,在其中添加Conv_FReLU、MN_Bottleneck和MN_C3模块;
[0021]步骤b:修改YOLO文件,在YOLO的parse_model函数,加入MN_C3模块;
[0022]步骤c:在models文件夹下新建yolov5n

MN.yaml文件;
[0023]步骤d:将train.py中原yaml文件改为上一步的yolov5n

MN.yaml文件即可训练。
[0024]进一步的,步骤a所述的MN_Bottleneck由一个1
×
1卷积、一个DW卷积和一个1
×
1卷积组成;所述的DW卷积为深度可分离卷积将每个输入通道与一个独立的卷积核进行卷积操作;该操作由以下公式表示:
[0025][0026]式中,m为卷积核在第m行,n为卷积核在第n列,x
(i*8+m),(j*8+n),k
为输入特征图在第(i*8+m)行、第(j*8+n)列、第k个通道上的像素值,w为权重值。
[0027]进一步的,所述的MN_Bottleneck选择FRelu激活函数,解决SiLu函数空间不敏感问题,使普通的卷积也具备捕获复杂的视觉布局能力,使模型具备像素级建模的能力;SiLu函数的具体数学公式为:
[0028][0029]式中,e为自然指数。
[0030]进一步的,步骤a所述的FReL是一种可调节形状的激活函数,通过添加科学系参数来扩展ReLU函数,使得FReLU可以学习到更多的特征表示,FReLU的数学公式为:
[0031]FReLU(x)=max(0,x)+min(0,α(e
x

β

1))本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用于交通信号灯检测的改进型YOLOv5n模型,其特征在于:使模型轻量化、训练和推理速度更快,提高模型的鲁棒性,使模型对于输入数据中的干扰或噪声能够保持相对稳定的预测结果,使其更加适用于复杂多变的现实场景;具体优化方法的步骤包括:S1、获取待检测图像数据集,进行数据预处理,分为训练集和测试集;S2、在YOLOv5n模型head层中的卷积核为3、步长为2的Convolution卷积换成involution卷积;S3、改进YOLOv5n模型C3模块中的Bottleneck,引入深度可分离卷积网络和FReLU激活函数组成MN_Bottleneck;S4、数据集训练该检测模型,使用训练好的检测模型进行交通信号灯检测,对检测结果进行评价。2.根据权利要求1所述的一种用于交通信号灯检测的改进型YOLOv5n模型,其特征在于:所述的待检测图像数据集采用交通信号灯数据集S2TLD,以“red”、“yellow”、“green”、“wait_on”4个类别的关键词搜索得到各种各样的道路场景和典型的图片数据,得到图片数据集;对图片数据集进行数据清洗,针对爬取到的数据进行去除已损坏图像、去除重复图像、去除非关键字图像操作。3.根据权利要求2所述的一种用于交通信号灯检测的改进型YOLOv5n模型,其特征在于:步骤1所述的分为训练集和测试集是在图像数据清洗之后对数据集打标注工作,将数据集按照8:2划分为训练集和测试集。4.根据权利要求1所述的一种用于交通信号灯检测的改进型YOLOv5n模型,其特征在于:步骤2所述的YOLOv5n模型head层用Involution卷积取代输入通道和输出通道一致的convolution模块;具体的操作方式为:第一步:修改common文件,向其中放入involution模块;第二步:修改YOLO文件,在YOLO的parse_model函数中,加入involution模块;Involution卷积将输入张量分解为两个子张量,并对其中一个子张量进行非线性变换,然后再将两个子张量合并;该操作可以由以下公式表示:式中:x
j
是输入张量的第h个元素,y
i
是输出张量的第i个元素,w
ij
和b
ij
分别是involution卷积中的权重和偏置,k是块的总数;这种非线性变换的形式类似于ReLU激活函数,在子张量上进行。5.根据权利要求1所述的一种用于交通信号灯检测的改进型YOLOv5n模型,其特征在于:步骤3所述的改进YOLOv5n模型C3模块中的Bottleneck是在原YOLOv5n模型C3模块的Bottleneck中引入DW卷积,具体的操作方式...

【专利技术属性】
技术研发人员:邹佳明柯永斌石锐姜程文谢田
申请(专利权)人:淮阴工学院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1