当前位置: 首页 > 专利查询>烟台大学专利>正文

一种基于Yolov4改进的交通标志检测方法技术

技术编号:34569573 阅读:9 留言:0更新日期:2022-08-17 13:00
一种基于Yolov4改进的交通标志检测方法,包括以下步骤;步骤1:将数据集按照8:1:1的比例划分为训练集、验证集和测试集,划分出来的子集相互独立;步骤2:对数据集进行预处理;步骤3:先对网络模型中参数进行初始化,对步骤2中处理后的训练集进行训练,建立模型,再使用验证集检验模型状态,与训练过程不同的是不需要进行反向传播,验证过程目的是防止过拟合,如果出现过拟合可提前终止训练,根据情况调整超参数,接下来重复此步骤,经训练150轮后,损失值达到最低,得到最终模型;步骤4:利用步骤3训练出的最终模型,对测试集进行推理。本发明专利技术具有精度高的特点。具有精度高的特点。具有精度高的特点。

【技术实现步骤摘要】
一种基于Yolov4改进的交通标志检测方法


[0001]本专利技术属于交通标志检测
,特别涉及一种基于Yolov4 改进的交通标志检测方法。

技术介绍

[0002]随着卷积网络神经的快速发展,计算机视觉也随之进步。目标检测作为重要且充满挑战的子任务之一,在智能交通领域充当着至关重要的角色。目前交通标志检测仍存在一些问题,不仅交通标志的种类复杂多样,而且在遭遇恶劣天气如冰雹、大雨时可能会出现精度低或者检测不到目标的情况,所以仍需进一步提高神经网络模型的精度以应对上述情形。

技术实现思路

[0003]为了克服以上技术问题,本专利技术的目的在于提供一种基于Yolov4 改进的交通标志检测方法,具有精度更的特点。
[0004]为了实现上述目的,本专利技术采用的技术方案是:
[0005]一种基于Yolov4改进的交通标志检测方法,包括以下步骤;
[0006]步骤1:使用TT100K(Tsinghua

Tencent 100K)交通数据集中超过300张的类别以及COCO数据集中交通信号灯和停止标志作为数据集,将其按照8:1:1的比例划分为训练集、验证集和测试集,划分出来的子集相互独立;
[0007]步骤2:对数据集进行预处理;将训练集格式转换成RGB后,再将输入图片宽高调整至512
×
512并且进行长宽的扭曲,对图像随机地翻转角度,然后转化成张量进行色域扭曲,最后在对真实框进行调整,验证集需进行图片的格式转换、宽高调整和对真实框调整,由于测试集只对图片进行预测,所以仅对图片进行格式转换和宽高调整;
[0008]步骤3:先对网络模型中参数进行初始化,对步骤2中处理后的训练集进行训练,建立模型,再使用验证集检验模型状态,与训练过程不同的是不需要进行反向传播,验证过程目的是防止过拟合,如果出现过拟合可提前终止训练,根据情况调整超参数,接下来重复此步骤,经训练150轮后,损失值达到最低,得到最终模型;
[0009]步骤4:利用步骤3训练出的最终模型,对测试集进行推理。
[0010]所述步骤3包含以下具体步骤
[0011]步骤3.1:将步骤2中处理后的训练集作为输入,传入网络进行训练;
[0012]步骤3.2:传入神经网络中得到预测结果;
[0013]步骤3.3:计算预测结果和真实值的损失值,损失值见公式(1);
[0014]步骤3.4:进行反向传播来调整网络参数;
[0015][0016]其中IOU为交并比,ρ2(b,ba
t
)为预测框和真实框中心点的欧氏距离,c代表同时包含预测框和真实框的最小闭包区域的对角线距离,αU为惩罚因子。s2代表网格个数,B代表预测框个数,代表网格i中第j个预测框负责检测目标,
[0017]表示代表网格i中第j个预测框检测不到目标,λ
noobj
为权重系数,为真实值,C
i
、p
i
(c)为预测值。公式第1行计算的是CIOU(Complete IOU Loss),第2行为置信度损失,分为含有目标的置信度损失和不含目标的置信度损失,第3行为种类损失。
[0018]所述步骤4具体为:将步骤2中处理后的测试集,投入网络中得到预测结果,并根据预测结果计算各类交通标志的平均精度。
[0019]本专利技术的有益效果:
[0020]本专利技术在yolov4原有基础上增加了注意力模块,捕捉每个通道的重要性,有益于模型学到更多的全局信息,进而提高检测能力。又加强了特征融合模块,不仅优化了特征融合的路线,而且重复融合多次,使得具有的位置及特征信息更为丰富。相比较于其它方法,拥有更高的精度和更好的适应性。
附图说明:
[0021]图1为yolov4网络模型图。
[0022]图2为改进模型图。
[0023]图3为Triplet注意力机制插入位置。
[0024]图4为Triplet结构图。
[0025]图5为检测结果。
[0026]图6为各类的精度及平均精度。
具体实施方式
[0027]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于
本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0028]实施例:
[0029]如图1所示:本实施例所选择的操作系统为Linux,YOLOv4网络模型的深度学习框架为Pytorch,硬件环境为Intel(R)Xeon(R)Gold 6130H CPU@2.10GHz处理器,TeslaV100显卡,配置16GB,具体服务器配置参数如表1所示。
[0030]表1环境配置
[0031][0032]本实施例阐述了将改进后的网络用于交通标志检测,如图2所示为改进模型,针对特征融合模块加以替换,由于交通标志属于小目标,因此在1616,3232,6464三个维度进行预测。由于卷积网络注重于局部感受野而忽视全局信息,故采用通道注意力获得特征层不同通道的重要性,如图3所示;根据图4预测结果可知该目标区域中特定标志能够被检测;交通标志各类精度及平均精度如图5所示。
[0033]Yolov4主干网络使用的是Cspdarknet53,通过下采样提取图片特征。该网络的核心是五个残差体层,每个残差体内部都将输入特征层分为两个部分,一部分作为跨层连接(shortcut),待另一部分完成后与其堆叠。第二部分是一个重复进行的残差块,每一块都先对输入进行操作,再将得到的结果与输入相加,以获得不低于输入的特征,避免了随着网络深度的增加出现的梯度下降/消失的现象。颈部网络由 SPP(Spatial Pyramid Pooling)和PANet(Path aggregation network)组成,其中SPP是对主干网络的最终输出进行不同池化核的最大池化,提取不同感受野下的主要的特征,最后将这些输出堆叠。PANet是特征融合网络,融合了高分辨率特征图的低语义特征,也兼具低分辨率特征图的高语义特征,结合前者的更准确的定位信息以及后者更多的特征信息,使得检测精度大大提高。
[0034]本专利技术通过以下两个步骤来修改模型:(1)在主干网络中添加注意力机制模块。(2)将用于特征融合的颈部网络PANet更换BiFPN (bidirectional feature pyra

mid network),使用快速标准化融合权重;
[0035]此处注意力机制模块使用的是SENet(Sequeeze and Excitation),该模块属于通道注意力机制,着重捕捉全局的信息以弥补卷积专注于局部信息的缺点,主要包括两个部分,第一部分是sequeeze操作,将特征层的长和宽维度压缩至1*1,得到一个1*1*C的张量,该张量中的每一个元素都包含了整本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于Yolov4改进的交通标志检测方法,其特征在于,包括以下步骤;步骤1:使用TT100K(Tsinghua

Tencent 100K)交通数据集中超过300张的类别以及COCO数据集中交通信号灯和停止标志作为数据集,将其按照8:1:1的比例划分为训练集、验证集和测试集,划分出来的子集相互独立;步骤2:对数据集进行预处理;将训练集格式转换成RGB后,再将输入图片宽高调整至512
×
512并且进行长宽的扭曲,对图像随机地翻转角度,然后转化成张量进行色域扭曲,最后在对真实框进行调整,验证集需进行图片的格式转换、宽高调整和对真实框调整,由于测试集只对图片进行预测,所以仅对图片进行格式转换和宽高调整;步骤3:先对网络模型中参数进行初始化,对步骤2中处理后的训练集进行训练,建立模型,再使用验证集检验模型状态,与训练过程不同的是不需要进行反向传播,验证过程目的是防止过拟合,如果出现过拟合可提前终止训练,根据情况调整超参数,接下来重复此步骤,经训练150轮后,损失值达到最低,得到最终模型;步骤4:利用步骤3训练出的最终模型,对测试集进行推理。2.根据权利要求1所述的一种基于Yolov4改进的交通标志...

【专利技术属性】
技术研发人员:王璇宋永超吕骏王莹洁徐金东赵金东阎维青郭健
申请(专利权)人:烟台大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1