一种基于改进YOLOv4的交通目标检测方法及系统技术方案

技术编号:33433729 阅读:21 留言:0更新日期:2022-05-19 00:23
本发明专利技术公开了一种基于改进YOLOv4的交通目标检测方法及系统,所述检测系统包括MobileViT

【技术实现步骤摘要】
一种基于改进YOLOv4的交通目标检测方法及系统


[0001]本专利技术涉及计算机视觉的
,特别涉及基于YOLOv4算法的目标检测的


技术介绍

[0002]随着计算机视觉的飞速发展,目标检测逐渐应用到人们的日常生活中,带来了极大的便利。其中,为了解决复杂交通下的各种交通问题,对交通目标进行检测成了计算机视觉领域的一个研究重点。
[0003]交通背景下的目标具有数量多、遮挡严重、小目标居多的特点,在当前背景下的目标检测往往会出现漏检严重、检测速率慢、难以部署的缺点。因此,对目标检测模型进行优化,使之轻量化以易于部署、加快检测速度、并且使之更适于检测小目标、降低漏检率显得格外重要。
[0004]对交通目标检测包括传统方法和基于深度学习的目标检测方法,其中,传统方法一般分为两个步骤:首先人工提取图像特征,然后输入分类器进行分类识别,代表算法有SIFI、LBP、ORB等,传统目标检测算法基于人工构建特征实现,容易出现遗漏问题,且设计麻烦,检测效果不好具体体现在检测精度低、检测速度慢、鲁棒性差难以满足任务要求。基于深度学习的目标检测方法分为两大类:单阶段(one

stage)目标检测算法和两阶段(two

stage)目标检测算法,其中,两阶段目标检测算法将目标检测任务分为两个子任务,其一是目标候选区域的生成,其二是基于目标候选框信息生成预测框,代表算法有RCNN(Regions with CNN features)、Fast

RCNN(Fast Regions with CNN features)、Faster

RCNN(Faster Regions with CNN features),虽然两阶段目标检测算法具有较高的准确率,但模型较为复杂、运算速度慢。而单阶段目标检测算法将候选框的生成和基于目标候选框生成预测框的两个任务合并为了一个端到端的回归问题,在保持较高准确度的前提下,模型简单且运算速度较快,代表算法有SSD(single shot multibox detector)、YOLO(You Only Look Once)、YOLO9000、YOLOv2、YOLOv3、YOLOv4。
[0005]其中,虽然YOLOv4算法相比较其他各种算法具有最好的目标检测效果,但对于复杂交通背景下的目标检测效果仍然较差,存在小目标漏检严重,模型依然较为复杂且运算缓慢、难以部署到移动嵌入式设备,难以获得最佳锚框(anchor box)配置等缺陷。

技术实现思路

[0006]针对现有技术的缺陷,本专利技术的目的在于提出一种基于改进的YOLOv4的交通目标检测方法及系统,其可以解决现有技术中单阶段目标检测算法中使用YOLOv4会产生的以下问题:(1)小目标漏检严重;(2)模型较为复杂、模型参数量较大、模型难以部署到移动嵌入式设备且运算速度慢;(3)所用K

Means聚类存在随机性,难以得到最佳的锚框配置。
[0007]本专利技术的技术方案如下:
[0008]一种基于改进YOLOv4的交通目标检测系统,其包括MobileViT

S主干网络、SPP特
征金字塔网络、PANet特征加强网络及目标检测头,其中,所述PANet特征加强网络及所述目标检测头中使用的卷积为深度可分离卷积。
[0009]根据本专利技术的一些优选实施方式,所述目标检测系统还包括对所述MobileViT

S主干网络的输出图像进行卷积处理后再输入所述SPP特征金字塔网络的第一卷积块,对所述SPP特征金字塔网络的输出图像进行拼接及卷积处理后再输入所述PANet特征加强网络的第一拼接卷积块,所述第一卷积块包括3个卷积单元,所述第一拼接卷积块包括3个对拼接数据进行卷积处理的卷积单元,所述各卷积单元均包括一个卷积层、一个BN层及ReLU激活函数。
[0010]根据本专利技术的一些优选实施方式,所述MobileViT

S主干网络包括包括输入层、第一卷积层、第一~第二MV2模块、第一~第二MV2残差模块、第三MV2模块、第一MobileViT模块、第四MV2模块、第二MobileViT模块、第五MV2模块,其中,所述MV2模块来自Mobilenetv2网络,由以下部分依次组成:1
×
1卷积层、BN层、SiLU激活函数、3
×
3卷积层、BN层、SiLU激活函数、1
×
1卷积层、BN层;所述MobileViT模块由以下部分依次组成:3
×
3卷积层、BN层、SiLU激活函数、1
×
1卷积层、BN层、SiLU激活函数、Transformer层、1
×
1卷积层、BN层、SiLU激活函数、与输入该模块的图像进行拼接的3
×
3卷积层、BN层、SiLU激活函数;所述Transformer层由以下部分构成:第一LN层、多头注意力层、第一Dropout层、第二LN层、第一线性层、SiLU激活函数、第二Dropout层、第二线性层、第三Dropout层,其中,第一Dropout层后的输出与经第一LN层前的输入进行残差相加后再输入第二LN层,第三Dropout层后的输出与经第二线性层前的输入进行残差相加后再得到最终输出;所述MV2残差模块为在所述MV2模块的1
×
1卷积前引入残差连接,并与最后一个BN层的输出相加得到。
[0011]根据本专利技术的一些优选实施方式,所述PANet特征加强网络包括:与所述第二MV2模块及第一目标检测头相连的第一特征加强层、与所述第三MV2模块及第二目标检测头相连的第二特征加强层、与所述第四MV2模块及第三目标检测头相连的第三特征加强层、与所述SPP特征金字塔网络后的第一拼接卷积块及第四目标检测头相连的第二拼接卷积块;其中,所述第一特征加强层进一步包括与所述第二MV2模块及所述第一目标检测头相连的第一拼接上采样块和与该第一拼接上采样块及所述第二特征加强层中的拼接降采样块相连的第一降采样层,所述第二特征加强层进一步包括与所述第三MV2模块相连的第二拼接上采样块和与该第二拼接上采样块及所述第二目标检测头相连的第一拼接降采样块,所述第三特征加强层进一步包括与所述第四MV2模块相连的第三拼接上采样块和与该第三拼接上采样块及所述第三目标检测头相连的第二拼接降采样块,且所述第三特征加强层的第三拼接上采样块及所述第二拼接卷积块均与所述特征金字塔网络后的所述第一拼接卷积块的输出相连,所述第三拼接上采样块进一步与所述第二拼接上采样块相连,所述第二拼接上采样块进一步与所述第一拼接上采样块相连,所述第一降采样层进一步与所述第一拼接降采样块相连,所述第一拼接降采样块进一步与所述第二拼接卷积块相连;其中,所述第二拼接卷积块包括对拼接数据进行卷积处理的5个卷积块,所述各拼接上采样块均包括对拼接数据进行卷积处理的5个卷积块和一个对拼接数据进行上采样的上采样层,所述各拼接本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于改进YOLOv4的交通目标检测系统,其特征在于,其包括MobileViT

S主干网络、SPP特征金字塔网络、PANet特征加强网络及目标检测头,其中,所述PANet特征加强网络及所述目标检测头中使用的卷积为深度可分离卷积。2.根据权利要求1所述的目标检测系统,其特征在于,其还包括对所述MobileViT

S主干网络的输出图像进行卷积处理后再输入所述SPP特征金字塔网络的第一卷积块,对所述SPP特征金字塔网络的输出图像进行拼接及卷积处理后再输入所述PANet特征加强网络的第一拼接卷积块,所述第一卷积块包括3个卷积单元,所述第一拼接卷积块包括3个对拼接数据进行卷积处理的卷积单元,所述各卷积单元均包括一个卷积层、一个BN层及ReLU激活函数。3.根据权利要求2所述的目标检测系统,其特征在于,所述MobileViT

S主干网络包括输入层、第一卷积层、第一~第二MV2模块、第一~第二MV2残差模块、第三MV2模块、第一MobileViT模块、第四MV2模块、第二MobileViT模块、第五MV2模块,其中,所述MV2模块来自Mobilenetv2网络,由以下部分依次组成:1
×
1卷积层、BN层、SiLU激活函数、3
×
3卷积层、BN层、SiLU激活函数、1
×
1卷积层、BN层;所述MobileViT模块由以下部分依次组成:3
×
3卷积层、BN层、SiLU激活函数、1
×
1卷积层、BN层、SiLU激活函数、Transformer层、1
×
1卷积层、BN层、SiLU激活函数、与输入该模块的图像进行拼接的3
×
3卷积层、BN层、SiLU激活函数;所述Transformer层由以下部分构成:第一LN层、多头注意力层、第一Dropout层、第二LN层、第一线性层、SiLU激活函数、第二Dropout层、第二线性层、第三Dropout层,其中,第一Dropout层后的输出与经第一LN层前的输入进行残差相加后再输入第二LN层,第三Dropout层后的输出与经第二线性层前的输入进行残差相加后再得到最终输出;所述MV2残差模块为在所述MV2模块的1
×
1卷积前引入残差连接,并与最后一个BN层的输出相加得到。4.根据权利要求3所述的目标检测系统,其特征在于,所述PANet特征加强网络包括:与所述第二MV2模块及第一目标检测头相连的第一特征加强层、与所述第三MV2模块及第二目标检测头相连的第二特征加强层、与所述第四MV2模块及第三目标检测头相连的第三特征加强层、与所述SPP特征金字塔网络后的第一拼接卷积块及第四目标检测头相连的第二拼接卷积块;其中,所述第一特征加强层进一步包括与所述第二MV2模块及所述第一目标检测头相连的第一拼接上采样块和与该第一拼接上采样块及所述第二特征加强层中的拼接降采样块相连的第一降采样层,所述第二特征加强层进一步包括与所述第三MV2模块相连的第二拼接上采样块和与该第二拼接上采样块及所述第二目标检测头相连的第一拼接降采样块,所述第三特征加强层进一步包括与所述第四MV2模块相连的第三拼接上采样块和与该第三拼接上采样块及所述第三目标检测头相连的第二拼接降采样块,且所述第三特征加强层的第三拼接上采样块及所述第二拼接卷积块均与所述特征金字塔网络后的所述第一拼接卷积块的输出相连,所述第三拼接上采样块进一步与所述第二拼接上采样块相连,所述第二拼接上采样块进一步与所述第一拼接上采样块相连,所述第一降采样层进一步与所述第一拼接降采样块相连,所述第一拼接降采样块进一步与所述第二拼接卷积块相连;其中,所述第二拼接卷积块包括对拼接数据进行卷积处理的5个卷积块,所述各拼接上采样块均包括对拼接数据进行卷积处理的5个卷积块和一个对拼接数据进行上采样的上采样层,所述各拼接降采样块均包括对拼接数据进行卷积处理的5个卷积块和一个对拼接数据进行降采样的降采样层,所述各卷积块均包括一个卷积层、一个BN层及ReLU激活函数。
5.应用权利要求1

4中任一项所述的目标检测系统进行交通目标检测的检测方法,其特征在于,其包括:S21由所述检测系统主干网络MobileViT

S对待检测图像进行特征提取,得到多尺度的第一提取特征;S22将经与所述MobileViT

S主干网络输出相连的第一卷积块卷积处理后得到的特征图输入所述SPP特征金字塔网络,提取出多个固定尺寸的特征向量,将各特征向量进行拼接后再经过与所述SPP特征金字塔网络输出相连的第一拼接卷积块卷积处理后,得到第二提取特征;S23将所述多尺度的第一提取特征及所述第二提取特征进一步输入所述PANet特征加强网络,以对特征进行多尺度加强及融合,得到多尺度的检测特征;S24通过目标检测头对所述检测特征进行检测。6.根据权利要求5所述的检测方法,其特征在于,其还包括:建立含有交通目标图像的标注数据集;通过所述标注数据集或其进行样本增强处理后的增强数据集对所述检测系统进行训练和/或测试;其中,所述训练和/或测试中使用K

Means++聚类算法进行锚框生成。7.根据权利要求6所述的检测方法,其特征在于,其还包括:所述训练和/或测试中每次设置12个锚框。8.根据权利要求6所述的检测方法,其特征在于,所述训练中,使用以下损失函数:其中,IOU表示预测框和真实框的交并比,α是权重函数,V为度量宽高比一致性的参数,ρ为预测框和真实框中心点坐标的欧氏距离,c代表包住两个框的最小框对角线距离,i,j表示像素坐标,表示目标未命中系数,当(i,...

【专利技术属性】
技术研发人员:袁小平王准赵耀倪梓昂李元博孙乐义
申请(专利权)人:中国矿业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1