一种基于改进YOLOv7算法的红外车辆检测方法技术

技术编号:37607345 阅读:9 留言:0更新日期:2023-05-18 11:59
本发明专利技术公开了一种基于改进YOLOv7算法的红外车辆检测方法,包括以下步骤;步骤1:采集交通道路上的车辆视频进行帧提取和图像预处理,得到红外车辆图像数据集;步骤2:构建一个包含31个卷积块的新主干特征提取网络Conv31;步骤3:将新的主干特征提取网络与原YOLOv7的预测网络连接,构成新的网络模型Conv31

【技术实现步骤摘要】
一种基于改进YOLOv7算法的红外车辆检测方法


[0001]本专利技术属于车辆检测
,具体涉及一种基于改进YOLOv7算法的红外车辆检测方法。

技术介绍

[0002]红外目标检测技术是指从红外图像中自动提取出目标的位置信息。鉴于红外热成像的优势,红外目标检测技术可应用于交通道路上的车辆检测场景中,并可适应黑夜、强光和极端天气的情况,因此,该技术的突破对自动驾驶和智能交通等领域具有重要理论意义和实用价值。
[0003]传统的红外车辆检测方法通常首先采用梯度方向直方图等方法提取目标的特征,然后利用正负样本训练支持向量机等分类器对目标特征进行分类。这种方法检测速度慢,无法满足时性的要求,且存在应用场景受限,鲁棒性差,泛化能力弱的问题。
[0004]近年来,随着人工智能技术的快速发展,基于卷积神经网络的红外车辆检测方法得到了广泛应用。它可通过卷积神经网络自动对图像进行特征抽象和特征提取,具有较高的检测准确率与较强的鲁棒性。
[0005]目前,基于深度学习的目标检测算法主要包括两类,一类是两阶段检测算法,该类算法将检测过程分为两个阶段,第一阶段生成待检测图像的候选区域,第二阶段对生成的候选区域作分类和回归,得到最终的检测结果。该类算法第一阶段比较耗时,总体上检测准确率高,但检测速度慢,一般无法满足实时性的需求,代表算法有R

CNN、Fast R

CNN、Faster R

CNN等。另一类是单阶段检测算法,该类算法将上述的两阶段检测过程统一为一个端到端的回归过程,区域选择和检测判断这两个步骤合二为一,检测准确率较低,但检测速度快,代表算法有YOLO和SSD等。
[0006]基于深度学习的目标检测算法在可见光图像目标检测场景中具有较好的检测效果,但在红外目标检测场景中,由于红外图像为单通道图像、特征不明显,红外车辆目标的特征提取较为困难,致使当前主流目标检测算法检测准确率普遍较低,难以满足实际需求。

技术实现思路

[0007]为了克服上述现有技术存在的不足,本专利技术的目的在于提供一种基于改进YOLOv7算法的红外车辆检测方法,在保证较高检测速度的前提下,显著提高检测准确率。
[0008]为了实现上述目的,本专利技术采用的技术方案是:
[0009]一种基于改进YOLOv7算法的红外车辆检测方法,包括以下步骤;
[0010]步骤1:采集交通道路上的车辆视频进行帧提取和图像预处理,得到红外车辆图像数据集;
[0011]步骤2:对YOLOv7算法主干特征提取网络进行改进,即舍弃YOLOv7算法中的主干特征提取网络,构建一个包含31个卷积块的新主干特征提取网络Conv31,替换YOLOv7算法中的主干特征提取网络;
[0012]步骤3:将新的主干特征提取网络与原YOLOv7的预测网络连接,构成新的网络模型Conv31

YOLOv7;
[0013]步骤4:将步骤1得到的训练数据集送入到步骤3的网络模型Conv31

YOLOv7中,采用小批次随机梯度下降算法进行训练,得到训练好的红外车辆检测模型;
[0014]步骤5:将红外热成像设备实时采集的交通道路上的红外车辆视频按帧送入到所述训练好的红外车辆检测模型,得到车辆的实时位置信息、尺度信息和置信度。
[0015]所述步骤1中进行帧提取和图像预处理的步骤具体为:
[0016](1.1)采集交通道路上的红外车辆视频,读取视频的前10000帧,设置待输出图像的分辨率为640
×
640,将每一帧按顺序以图像格式输出,得到10000张红外车辆图像,并对所得到的红外车辆图像的车辆目标的位置信息进行标注,制作成红外车辆图像数据集,该数据集共有10000张分辨率为640
×
640的红外车辆图像;
[0017](1.2)将红外车辆图像数据集按照9:1的比例划分为训练数据集和测试数据集,即从数据集中随机选取9000张红外图像组成训练集,剩余1000张红外图像组成测试集。
[0018]所述步骤2具体为:
[0019](2.1)舍弃YOLOv7算法中的主干特征提取网络,构建一个新的主干特征提取网络Conv31,用以替换YOLOv7算法中的主干特征提取网络,构建新的主干特征提取网络Conv31,包含31个卷积块,其中每个卷积块结构如下:
[0020]第1个卷积块:包含一个输入通道数为1,输出通道数为32,卷积核大小为3
×
3,步长为1,填充为1的卷积层,一个通道数为32的批量归一化层,一个复斜率为0.1的LeakyReLU激活函数层;
[0021]第2个卷积块:包含一个输入通道数为32,输出通道数为16,卷积核大小为1
×
1,步长为1,填充为0的卷积层,一个通道数为16的批量归一化层,一个复斜率为0.1的LeakyReLU激活函数层;
[0022]第3个卷积块:包含一个输入通道数为16,输出通道数为32,卷积核大小为3
×
3,步长为1,填充为1的卷积层,一个通道数为32的批量归一化层,一个复斜率为0.1的LeakyReLU激活函数层;
[0023]第4个卷积块:包含一个输入通道数为32,输出通道数为32,卷积核大小为1
×
1,步长为2,填充为0的卷积层,一个通道数为32的批量归一化层,一个复斜率为0.1的LeakyReLU激活函数层;
[0024]第5个卷积块和第7个卷积块:包含一个输入通道数为32,输出通道数为64,卷积核大小为3
×
3,步长为1,填充为1的卷积层,一个通道数为64的批量归一化层,一个复斜率为0.1的LeakyReLU激活函数层;
[0025]第6个卷积块:包含一个输入通道数为64,输出通道数为32,卷积核大小为1
×
1,步长为1,填充为0的卷积层,一个通道数为32的批量归一化层,一个复斜率为0.1的LeakyReLU激活函数层;
[0026]第8个卷积块:包含一个输入通道数为64,输出通道数为64,卷积核大小为1
×
1,步长为2,填充为0的卷积层,一个通道数为64的批量归一化层,一个复斜率为0.1的LeakyReLU激活函数层;
[0027]第9个卷积块和第11个卷积块:包含一个输入通道数为64,输出通道数为128,卷积
核大小为3
×
3,步长为1,填充为1的卷积层,一个通道数为128的批量归一化层,一个复斜率为0.1的LeakyReLU激活函数层;
[0028]第10个卷积块:包含一个输入通道数为128,输出通道数为64,卷积核大小为1
×
1,步长为1,填充为0的卷积层,一个通道数为64的批量归一化层,一个复斜率为0.1的LeakyReLU激活函数层;
[0029]第12个卷积块:包含一个输入通道数为128,输出通本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于改进YOLOv7算法的红外车辆检测方法,其特征在于,包括以下步骤;步骤1:采集交通道路上的车辆视频进行帧提取和图像预处理,得到红外车辆图像数据集;步骤2:对YOLOv7算法主干特征提取网络进行改进,即舍弃YOLOv7算法中的主干特征提取网络,构建一个包含31个卷积块的新主干特征提取网络Conv31,替换YOLOv7算法中的主干特征提取网络;步骤3:将新的主干特征提取网络与原YOLOv7的预测网络连接,构成新的网络模型Conv31

YOLOv7;步骤4:将步骤1得到的训练数据集送入到步骤3的网络模型Conv31

YOLOv7中,采用小批次随机梯度下降算法进行训练,得到训练好的红外车辆检测模型;步骤5:将红外热成像设备实时采集的交通道路上的红外车辆视频按帧送入到所述训练好的红外车辆检测模型,得到车辆的实时位置信息、尺度信息和置信度。2.根据权利要求1所述的一种基于改进YOLOv7算法的红外车辆检测方法,其特征在于,所述步骤1中进行帧提取和图像预处理的步骤具体为:(1.1)采集交通道路上的红外车辆视频,读取视频的前10000帧,设置待输出图像的分辨率为640
×
640,将每一帧按顺序以图像格式输出,得到10000张红外车辆图像,并对所得到的红外车辆图像的车辆目标的位置信息进行标注,制作成红外车辆图像数据集,该数据集共有10000张分辨率为640
×
640的红外车辆图像;(1.2)将红外车辆图像数据集按照9:1的比例划分为训练数据集和测试数据集,即从数据集中随机选取9000张红外图像组成训练集,剩余1000张红外图像组成测试集。3.根据权利要求1所述的一种基于改进YOLOv7算法的红外车辆检测方法,其特征在于,所述步骤2具体为:(2.1)舍弃YOLOv7算法中的主干特征提取网络,构建一个新的主干特征提取网络Conv31,用以替换YOLOv7算法中的主干特征提取网络,构建新的主干特征提取网络Conv31,包含31个卷积块,其中每个卷积块结构如下:第1个卷积块:包含一个输入通道数为1,输出通道数为32,卷积核大小为3
×
3,步长为1,填充为1的卷积层,一个通道数为32的批量归一化层,一个复斜率为0.1的LeakyReLU激活函数层;第2个卷积块:包含一个输入通道数为32,输出通道数为16,卷积核大小为1
×
1,步长为1,填充为0的卷积层,一个通道数为16的批量归一化层,一个复斜率为0.1的LeakyReLU激活函数层;第3个卷积块:包含一个输入通道数为16,输出通道数为32,卷积核大小为3
×
3,步长为1,填充为1的卷积层,一个通道数为32的批量归一化层,一个复斜率为0.1的LeakyReLU激活函数层;第4个卷积块:包含一个输入通道数为32,输出通道数为32,卷积核大小为1
×
1,步长为2,填充为0的卷积层,一个通道数为32的批量归一化层,一个复斜率为0.1的LeakyReLU激活函数层;第5个卷积块和第7个卷积块:包含一个输入通道数为32,输出通道数为64,卷积核大小为3
×
3,步长为1,填充为1的卷积层,一个通道数为64的批量归一化层,一个复斜率为0.1的
LeakyReLU激活函数层;第6个卷积块:包含一个输入通道数为64,输出通道数为32,卷积核大小为1
×
1,步长为1,填充为0的卷积层,一个通道数为32的批量归一化层,一个复斜率为0.1的LeakyReLU激活函数层;第8个卷积块:包含一个输入通道数为64,输出通道数为64,卷积核大小为1
×
1,步长为2,填充为0的卷积层,一个通道数为64的批量归一化层,一个复斜率为0.1的LeakyReLU激活函数层;第9个卷积块和第11个卷积块:包含一个输入通道数为64,输出通道数为128,卷积核大小为3
×
3,步长为1,填充为1的卷积层,一个通道数为128的批量归一化层,一个复斜率为0.1的LeakyReLU激活函数层;第10个卷积块:包含一个输入通道数为128,输出通道数为64,卷积核大小为1
×
1,步长为1,填充为0的卷积层,一个通道数为64的批量归一化层,一个复斜率为0.1的LeakyReLU激活函数层;第12个卷积块:包含一个输入通道数为128,输出通道数为128,卷积核大小为1
×
1,步长为2,填充为0的卷积层,一个通道数为128的批量归一化层,一个复斜率为0.1的LeakyReLU激活函数层;第13个卷积块和第15个卷积块:包含一个输入通道数为128,输出通道数为256,卷积核大小为3
×
3,步长为1,填充为1的卷积层,一个通道数为256的批量归一化层,一个复斜率为0.1的LeakyReLU激活函数层;第14个卷积块:包含一个输入通道数为256,输出通道数为128,卷积核大小为1
×
1,步长为1,填充为0的卷积层,一个通道数为128的批量归一化层,一个复斜率为0.1的LeakyReLU激活函数层;第16个卷积块、第19个卷积块、第21个卷积块、第23个卷积块:包含一个输入通道数为256,输出通道数为512,卷积核大小为3
×
3,步长为1,填充为1的卷积层,一个通道数为512的批量归一化层,一个复斜率为0.1的LeakyReLU激活函数层;第17个卷积块、第20个卷积块、第22个卷积块:包含一个输入通道数为512,输出通道数为256,卷积核大小为1
×
1,步长为1,填充为0的卷积层,一个通道数为256的批量归一化层,一个复斜率为0.1的LeakyReLU激活函数层;第18个卷积块:包含一个输入通道数为256,输出通道数为256,卷积核大小为1
×
1,步长为2,填充为0的卷积层,一个通道数为256的批量归一化层,一个复斜率为0.1的LeakyReLU激活函数层;第24个卷积块、第27个卷积块、第29个卷积块、第31个卷积块:包含一个输入通道数为512,输出通道数为1024,卷积核大小为3
×
3,步长为1,填充为1的卷积层,一个通道数为1024的批量归一化层,一个复斜率为0.1的LeakyReLU激活函数层;第25个卷积块、第28个卷积块、第30个卷积块:均包含一个输入通道数为1024,输出通道数为512,卷积核大小为1
×
1,步长为1,填充为0的卷积层,一个通道数为512的批量归一化层,一个复斜率为0.1的LeakyReLU激活函数层;第26个卷积块:包含一个输入通道数为512,输出通道数为512,卷积核大小为1
×
1,步长为2,填充为0的卷积层,一个通道数为512的批量归一化层,一个复斜率为0.1的
LeakyReLU激活函数层;(2.2)将上述31个卷积块按照顺序依...

【专利技术属性】
技术研发人员:徐一铭姬红兵张文博李林臧博龙璐岚
申请(专利权)人:西安电子科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1