一种基于OD-YOLO的自动驾驶目标检测方法技术

技术编号:39000437 阅读:29 留言:0更新日期:2023-10-07 10:32
一种基于OD

【技术实现步骤摘要】
一种基于OD

YOLO的自动驾驶目标检测方法


[0001]本专利技术属于自动驾驶目标检测领域,尤其涉及一种基于OD

YOLO(Omin Dimensional Dynamic Convolution

You Only Look Once,全维动态卷积和YOLO)的自动驾驶目标检测方法。

技术介绍

[0002]随着汽车保有量增加引起的交通问题日益凸显,自动驾驶作为解决传统汽车行业发展问题的重要技术,得到了国家和企业越来越多的重视和研究。环境感知技术是实现自动驾驶的第一个环节,同时也是实现完全自动驾驶技术中的至关重要的环节,而目标检测作为环境感知的重要部分,具有较大的研究意义。目标检测作为自动驾驶领域的核心技术之一,是自动驾驶感知环境的重要途径,影响着车辆的控制决策。
[0003]目前,在自动驾驶应用领域,基于计算机视觉的目标检测算法大体可以分为两类:基于候选区域提议的两步检测方法和基于边框回归的单步检测方法,由于基于候选区域的方法分为两个步骤:候选框提取和目标分类。需要更多的网络参数,导致计算量大速度慢,因此基于回归的方法应运而生。
[0004]尽管当前的目标检测算法提升了检测效率,然而在自动驾驶场景中,需要被探测的目标大小尺度繁多,道路背景变化极大,又有光线强弱和模糊遮挡等因素干扰。所以面向自动驾驶场景的目标检测算法仍然极具挑战性,在精确性以及实时性方面仍有上升空间。因此,设计能够抵抗各种困难干扰的目标检测算法,使其更加准确的进行物体探测与识别,对自动驾驶意义重大。

技术实现思路

[0005]本专利技术的目的在于提供一种基于OD

YOLO的自动驾驶目标检测方法,它能够克服现有技术的不足,是一种简单易行且容易实现的自动驾驶目标检测方法。
[0006]本专利技术的技术方案:一种基于OD

YOLO的自动驾驶目标检测方法,其特征在于它包括以下步骤:
[0007](1)下载公开KITTI自动驾驶数据集,选取其中的2D目标检测数据集,将其分为训练数据集和验证数据集,并对公开KITTI自动驾驶数据集中2D目标检测数据集所有图像进行分辨率调整;
[0008]所述步骤(1)中的训练数据集和验证数据集是对公开KITTI自动驾驶数据集中的2D目标检测数据集按照4:1比例划分,其中,所述训练数据集由KITTI自动驾驶数据集中2D目标检测数据集的80%的数据构成,将用于训练OD

YOLO自动驾驶目标检测网络模型;所述验证数据集是由KITTI自动驾驶数据集中2D目标检测数据集的20%的数据构成,将用于验证OD

YOLO自动驾驶目标检测网络模型,并将验证结果作为模型性能指标。
[0009]所述步骤(1)中图像分辨率调整具体是指将自动驾驶数据集中2D目标检测数据集所有图像调整为640
×
640固定分辨率。
[0010](2)采用全维动态卷积、解耦头结构以及精确边界框回归损失改进YOLOv5算法,构建OD

YOLO自动驾驶目标检测网络;
[0011]所述步骤2中的OD

YOLO自动驾驶目标检测网络由输入模块、CSPDarknet(Cross Stage Partial Darknet)主干网络模块、Neck网络模块和DecoupledHead解耦头部模块四部分构成,其中,所述输入模块的输入端采集自动驾驶场景的图片信号,将其进行随机裁剪、随机缩放、随机翻转这些数据增强操作后输出给CSPDarknet主干网络模块,经过CSPDarknet主干网络模块对其进行特征提取,并将提取到的特征信息传入Neck网络模块中进行特征金字塔池化和特征融合处理,此时特征融合后的特征图传入DecoupledHead解耦头部模块进行目标检测,最后输出检测结果图片信号。
[0012]所述步骤2中OD

YOLO自动驾驶目标检测网络的具体构建方法包括以下阶段:
[0013]第一阶段:利用输入模块采集自动驾驶场景的图片信号,进行随机裁剪、随机缩放、随机翻转后,将经过数据增强操作后的数据输出给CSPDarknet主干网络模块;
[0014]第二阶段:在OD

YOLO自动驾驶目标检测网络的CSPDarknet主干网络模块中执行全维动态卷积操作,该过程是对主干网络中基本卷积特征提取能力进行优化;
[0015]所述第二阶段具体是指:
[0016]假设第二阶段全维动态卷积的输入为x,引入三个新的关注点α
si
、α
ci
、α
fi
,并分别沿着该卷积的卷积核W
i
的核空间维度、输入通道维度和输出通道维度进行乘法计算,如公式(1)所示:
[0017]y=(α
w1 eα
f1 eα
c1 eα
s1 e W1+K+α
wi eα
fi eα
ci eα
si e W
i
)*x
ꢀꢀ
(1)
[0018]式中,α
wi
∈R表示卷积核W
i
的关注标量,α
si
∈R
k
×
k
、α
ci
∈R
cin
和表示三个新引入的关注点,其中,α
si
在k
×
k个空间位置为每个滤波器的卷积参数分配不同的注意标量,α
ci
为每个卷积滤波器的输入通道赋予不同的注意标量,α
fi
为卷积滤波器输出通道分配不同注意标量,e表示沿着卷积核W
i
的核空间的不同维度的乘法运算,*表示乘法运算,y表示全维动态卷积的输出;由公式(1)可以看出,全维动态卷积相当于引入了一种多维注意力机制,α
wi
将注意力标量分配给整个卷积核;
[0019]所述CSPDarknet主干网络模块输出三个不同尺寸的特征图,分别记作:特征图C1、特征图C2和特征图C3。
[0020]所述第二阶段中CSPDarknet主干网络模块输出的特征图C1、特征图C2和特征图C3的通道大小分别为256、512、1024。
[0021]第三阶段:在Neck网络模块对第二阶段提取到的特征图进行处理,并在DecoupledHead解耦头部模块将分类、回归任务进行单独解耦;
[0022]所述第三阶段的具体实现过程为:将第二阶段得到的特征图C1、特征图C2和特征图C3输入到Neck网络模块中,进行特征金字塔池化、特征融合处理,进而得到三个加强过的有效特征图,即有效特征图C1

、有效特征图C2

和有效特征图C3

,这三个加强过的有效特征图分别通过分类分支进行分类信息的预本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于OD

YOLO的自动驾驶目标检测方法,其特征在于它包括以下步骤:(1)下载公开KITTI自动驾驶数据集,选取其中的2D目标检测数据集,将其分为训练数据集和验证数据集,并对公开KITTI自动驾驶数据集中2D目标检测数据集所有图像进行分辨率调整;(2)采用全维动态卷积、解耦头结构以及精确边界框回归损失改进YOLOv5算法,构建OD

YOLO自动驾驶目标检测网络;(3)使用步骤(1)得到的训练数据集中的图像对OD

YOLO自动驾驶目标检测网络模型进行训练;所述步骤(3)中对自动驾驶目标检测网络模型进行训练具体是指:将训练数据集中的图像分辨率全部调整为640
×
640固定分辨率,设初始学习率为0.01,随着迭代次数的增加,学习率变小;为提高训练速度,将训练批量大小设置为64,为防止过拟合现象,训练次数设为300个epoch进行训练,最后得到训练好的OD

YOLO自动驾驶目标检测网络模型;(4)使用步骤(1)得到的验证数据集中的图像对步骤(3)得到的训练好的OD

YOLO自动驾驶目标检测网络模型进行验证;(5)将自动驾驶过程中采集到的自动驾驶场景下的图像作为输入,在步骤(3)得到的训练好的OD

YOLO自动驾驶目标检测网络模型中进行目标检测,以便能够准确的识别出图片中物体的种类,完成目标检测任务。2.根据权利要求1所述一种基于OD

YOLO的自动驾驶目标检测方法,其特征在于所述步骤(1)中的训练数据集和验证数据集是对公开KITTI自动驾驶数据集中的2D目标检测数据集按照4:1比例划分,其中,所述训练数据集由KITTI自动驾驶数据集中2D目标检测数据集的80%的数据构成,将用于训练OD

YOLO自动驾驶目标检测网络模型;所述验证数据集是由KITTI自动驾驶数据集中2D目标检测数据集的20%的数据构成,将用于验证OD

YOLO自动驾驶目标检测网络模型,并将验证结果作为模型性能指标。3.根据权利要求1所述一种基于OD

YOLO的自动驾驶目标检测方法,其特征在于所述步骤(1)中图像分辨率调整具体是指将自动驾驶数据集中2D目标检测数据集所有图像调整为640
×
640固定分辨率。4.根据权利要求1所述一种基于OD

YOLO的自动驾驶目标检测方法,其特征在于所述步骤(2)中的OD

YOLO自动驾驶目标检测网络由输入模块、CSPDarknet主干网络模块、Neck网络模块和DecoupledHead解耦头部模块四部分构成,其中,所述输入模块的输入端采集自动驾驶场景的图片信号,将其进行随机裁剪、随机缩放、随机翻转这些数据增强操作后输出给CSPDarknet主干网络模块,经过CSPDarknet主干网络模块对其进行特征提取,并将提取到的特征信息传入Neck网络模块中进行特征金字塔池化和特征融合处理,此时特征融合后的特征图传入DecoupledHead解耦头部模块进行目标检测,最后输出检测结果图片信号。5.根据权利要求1所述一种基于OD

YOLO的自动驾驶目标检测方法,其特征在于所述步骤(2)中OD

YOLO自动驾驶目标检测网络的具体构建方法由以下阶段构成:第一阶段:利用输入模块采集自动驾驶场景的图片信号,进行随机裁剪、随机缩放、随机翻转后,将经过数据增强操作后的数据输出给CSPDarknet主干网络模块;第二阶段:在OD

YOLO自动驾驶目标检测网络的CSPDarknet主干网络模块中执行全维动态卷积操作,该过程是对主干网络中基本卷积特征提取能力进行优化;
第三阶段:在Neck网络模块对第二阶段提取到的特征图进行处理,并在Decoupled Head解耦头部模块将分类、回归任务进行单独解耦;第四阶段:对第三阶段分类分支预测的分类信息以及回归分支预测的检测框信息和置信度信息进行边界框回归损失计算。6.根据权利要求5所述一种基于OD

YOLO的自动驾驶目标检测方法,其特征在于所述第二阶段具体是指:假设第二阶段全维动态卷积的输入为x,引入三个新的关注点α
si
、α
ci
、α
fi
,并分别沿着该卷积的卷积核W
i
的核空...

【专利技术属性】
技术研发人员:刘娜周惠朱均超张宝峰刘斌李志伟杨雷
申请(专利权)人:天津理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1