一种无人机航拍照片的目标检测方法技术

技术编号:39659432 阅读:18 留言:0更新日期:2023-12-09 11:28
本发明专利技术涉及无人系统目标检测技术领域,具体为一种无人机航拍照片的目标检测方法,包括:

【技术实现步骤摘要】
一种无人机航拍照片的目标检测方法


[0001]本专利技术涉及无人系统目标检测
,特别涉及一种无人机航拍照片的目标检测方法


技术介绍

[0002]无人机图像中的微小目标检测广泛应用于海上救援

大尺度监测

农业

环境保护

本文的主要目的是增强无人机捕获图像的目标检测性能,此外,为上述各种应用提供有价值的见解

[0003]由于无人机捕获的图像目标在不同的飞行高度,它们的尺度可能会有很大的差异,这给目标检测模型的准确检测带来了挑战

此外,图像中的微小物体包含的信息很少,很难从背景中区分出来

针对图像中微小目标的检测,人们提出了许多传统的检测方法,其中包括基于滑动窗口的检测方法,直方图的方向梯度,和变形零件模型

然而,这些传统的目标检测算法计算量大,处理速度慢,精度低,难以在实际场景中应用

近年来,人们提出了许多基于卷积神经网络
(CNN)
的目标检测算法,并成功应用于无人机图像中的目标检测

具体来说,目标检测方法主要分为两种:两阶段方法和一阶段方法

两阶段方法首先生成包含可能检测目标的候选块,然后对这些候选块进行分类和校正,如
R

CNN

Fast R

CNN

Faster R

CNN。
然而,该方法检测精度高,但效率较低

单阶段方法通过回归操作实现端到端的目标检测方法,如
SSD

YOLO
系列,检测速度更快,能够满足实时性要求


技术实现思路

[0004]本专利技术提供了一种无人机航拍照片的目标检测方法,以解决现有无人机图像目标检测方法的检测效率低的技术问题

[0005]为达到上述目的,本专利技术的技术方案是这样实现的:
[0006]本专利技术提供了一种无人机航拍照片的目标检测方法,包括如下步骤:
[0007]S1、
获取多张无人机航拍图像,将多张无人机航拍图像划分成训练集

测试集和验证集,对训练集中的图像进行预处理,得到预处理后的训练集;
[0008]S2、
构建目标检测模型,包括依次连接的骨干网络

中间层和检测头;中间层中包括变换器和
CVAN
模块,其中变换器与骨干网络的底层连接,
CVAN
模块与检测头连接;
[0009]S3、
从预处理后的训练集中选择一张图像输入到骨干网络中,得到四类不同尺度的骨干网络特征图,分别是第一类骨干网络特征图至第四类骨干网络特征图,将第一类骨干网络特征图输入到变换器中,得到变换器输出特征图;
[0010]S4、
将变换器输出特征图以及第二类骨干网络特征图至第四类骨干网络特征图输入到目标检测模型的中间层进行特征融合,得到第一类融合特征图

第二类融合特征图

第三类融合特征图和第四类融合特征图;
[0011]S5、
将第四类融合特征图输入到
CVAN
模块中,最终得到第四类输出特征图
F
″′

[0012]S6、
将第一类融合特征图

第二类融合特征图

第三类融合特征以及第四类输出特
征图
F
″′
输入到各自的目标检测头中,计算得到目标的分类信息

置信度信息以及边框位置信息;重复
S3

S5
,使用验证集对当前目标检测模型进行验证,计算置信度损失

分类损失和边框预测回归损失,直至迭代至设定次数,然后选取并保存在训练集中最好的一组权重结果,得到训练后的目标检测模型

[0013]进一步地,所述
S1
中的预处理包括标注文件生成

数据集读取

调整图像大小

图像增强

图像归一化

图像填充

图像转换和图像扩展维度;
[0014]其中图像增强包括随机裁剪

随机翻转

随机旋转

随机缩放

以及亮度和对比度调整

[0015]进一步地,所述
S2
中的骨干网络为
YOLOv7
的骨干网络,具体包括四个卷积归一化激活层

三个最大池化层和四个第一层聚合网络;
[0016]三个最大池化层分别与其中三个第一层聚合网络两两一组依次连接;4个卷积归一化激活层依次连接,然后与另一个第一层聚合网络连接,并与第一组的最大池化层

第一层聚合网络连接

[0017]进一步地,所述
S3
中的将第一类骨干网络特征图输入到变换器中,得到变换器输出特征图具体包含如下步骤:
[0018]S31、
将第一类骨干网络特征图
z
l
‑1通过可训练的查询权重矩阵
W
ql

关键词权重矩阵
W
kl
进行线性变换,得到查询矩阵
Q
l
和键矩阵
K
l

[0019]S32、
通过查询矩阵
Q
l
和键矩阵
K
l
之间的点积操作,计算得到注意力权重
A
l

[0020]S33、
利用注意力权重
A
l
对第一类骨干网络特征图
z
l
‑1的值矩阵
V
l
进行加权计算,得到多个自注意力的值
SA
l

[0021]S34、
将多个自注意力的值
SA
l
拼接到一起得到多头自注意力
MSA
,然后传入一个线性层得到输出
MSA
l
(z
l
)

[0022]S35、
将得到的多头自注意力
MSA
和第一类骨干网络特征图
z
l
‑1进行残差
A
连接并且层归一化,得到中间结果
z
l


[0023]S36、

S34

S35
的输出结果传入到多本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种无人机航拍照片的目标检测方法,其特征在于:包括如下步骤:
S1、
获取多张无人机航拍图像,将多张无人机航拍图像划分成训练集

测试集和验证集,对训练集中的图像进行预处理,得到预处理后的训练集;
S2、
构建目标检测模型,包括依次连接的骨干网络

中间层和检测头;中间层中包括变换器和
CVAN
模块,其中变换器与骨干网络的底层连接,
CVAN
模块与检测头连接;
S3、
从预处理后的训练集中选择一张图像输入到骨干网络中,得到四类不同尺度的骨干网络特征图,分别是第一类骨干网络特征图至第四类骨干网络特征图,将第一类骨干网络特征图输入到变换器中,得到变换器输出特征图;
S4、
将变换器输出特征图以及第二类骨干网络特征图至第四类骨干网络特征图输入到目标检测模型的中间层进行特征融合,得到第一类融合特征图

第二类融合特征图

第三类融合特征图和第四类融合特征图;
S5、
将第四类融合特征图输入到
CVAN
模块中,最终得到第四类输出特征图
F
″′

S6、
将第一类融合特征图

第二类融合特征图

第三类融合特征以及第四类输出特征图
F
″′
输入到各自的目标检测头中,计算得到目标的分类信息

置信度信息以及边框位置信息;重复
S3

S5
,使用验证集对当前目标检测模型进行验证,计算置信度损失

分类损失和边框预测回归损失,直至迭代至设定次数,然后选取并保存在训练集中最好的一组权重结果,得到训练后的目标检测模型
。2.
根据权利要求1所述的目标检测方法,其特征在于,所述
S1
中的预处理包括标注文件生成

数据集读取

调整图像大小

图像增强

图像归一化

图像填充

图像转换和图像扩展维度;其中图像增强包括随机裁剪

随机翻转

随机旋转

随机缩放

以及亮度和对比度调整
。3.
根据权利要求1所述的目标检测方法,其特征在于,所述
S2
中的骨干网络为
YOLOv7
的骨干网络,具体包括四个卷积归一化激活层

三个最大池化层和四个第一层聚合网络;三个最大池化层分别与其中三个第一层聚合网络两两一组依次连接;4个卷积归一化激活层依次连接,然后与另一个第一层聚合网络连接,并与第一组的最大池化层

第一层聚合网络连接
。4.
根据权利要求1所述的目标检测方法,其特征在于,所述
S3
中的将第一类骨干网络特征图输入到变换器中,得到变换器输出特征图具体包含如下步骤:
S31、
将第一类骨干网络特征图
z
l
‑1通过可训练的查询权重矩阵
W
ql

关键词权重矩阵
W
kl
进行线性变换,得到查询矩阵
Q
l
和键矩阵
K
l

S32、
通过查询矩阵
Q
l
和键矩阵
K
l
之间的点积操作,计算得到注意力权重
A
l

S33、
利用注意力权重
A
l
对第一类骨干网络特征图
z
l
‑1的值矩阵
V
l
进行加权计算,得到多个自注意力的值
SA
l

S34、
将多个自注意力的值
SA
l
拼接到一起得到多头自注意力
MSA
,然后传入一个线性层得到输出
MSA
l
(z
l
)

S35、
将得到的多头自注意力
MSA
和第一类骨干网络特征图
z
l
‑1进行残差
A
连接并且层归一化,得到中间结果
z
l


S36、<...

【专利技术属性】
技术研发人员:朱青罗越凡吴成中周振王耀南黄嘉男袁宇豪蒋天健
申请(专利权)人:江西省通讯终端产业技术研究院有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1