一种基于改进多头自注意力的无人机小目标检测方法技术

技术编号:34457973 阅读:24 留言:0更新日期:2022-08-06 17:08
本发明专利技术提供一种基于改进多头自注意力的无人机小目标检测方法,包括:步骤1:从已经部署的居民摄像头监控中采集图像,获得一个含有低空无人机的图片数据集;步骤2:使用含低空无人机的图片数据集对原始的YOLOv5s模型进行预训练,获得YOLOv5s的预训练权重;步骤3:根据无人机小目标的特性对多头自注意力模块进行改进,并将其加入到YOLOv5s模型中;步骤4:使用含低空无人机的图片数据集和预训练权重对YOLOv5s模型进行重新训练,获得YOLOv5s的新训练权重;步骤5:将新训练权重加载到YOLOv5s模型中,对居民摄像头监控数据进行检测。在YOLOv5s目标检测模型基础上添加改进多头自注意力模块,既适用于实时的无人机小目标检测任务,又增强目标检测模型提取小目标特征的能力。力。力。

【技术实现步骤摘要】
一种基于改进多头自注意力的无人机小目标检测方法


[0001]本专利技术涉及计算机视觉中的目标检测
,特别涉及一种基于改进多头自注意力的无人机小目标检测方法。

技术介绍

[0002]在计算机视觉领域,目标检测作为一个重要的技术,被广泛的应用到实际场景中,如:人脸检测、行人检测、车辆检测、无人机检测等。目标检测主要存在传统的目标检测方法和基于深度学习的目标检测方法。在小目标检测方向,目标的有效占比小导致传统的目标检测算法表现效果差,而基于深度学习的目标检测方法能够保持较高的检测精度。因此,基于深度学习的目标检测方法逐步成为小目标检测的主流技术。
[0003]基于深度学习的目标检测方法主要分为两大类:一阶段(One

stage)目标检测方法和二阶段(Two

stage)目标检测方法。One

stage目标检测方法主要将目标检测问题看成回归问题,在检测目标位置的同时预测目标类别,其代表的算法主要有YOLO、YOLO9000、YOLOv3、SSD等;Two

stage目标检测方法则类似于传统的方法,需要先产生大量的候选区域,然后对区域进行分类,其代表的算法有R

CNN、Fast R

CNN、Faster R

CNN、Cascade R

CNN等。近年来,随着目标检测领域的不断发展,One

stage目标检测方法在保留其速度的同时,检测精度得到了大幅的提升。因此,为了满足无人机小目标检测实时性要求,可采用基于深度学习的One

stage目标检测方法。
[0004]针对市区的低空无人机小目标,利用城市中已经部署的监控摄像头进行检测,无疑是最经济的一种方法。但是,在背景复杂、声音嘈杂的市区环境下,基于深度学习的One

stage目标检测方法也不能很好的检测出无人机小目标。为此,本专利技术选用更为有效的One

stage目标检测模型—YOLOv5s,并改进一种通用的注意力机制,以增强检测模型对无人机小目标的检测精度。

技术实现思路

[0005]为了解决
技术介绍
提出的技术问题,本专利技术提供一种基于改进多头自注意力的无人机小目标检测方法,在YOLOv5s目标检测模型基础上添加改进多头自注意力模块,既适用于实时的无人机小目标检测任务,又增强目标检测模型提取小目标特征的能力。
[0006]为了达到上述目的,本专利技术采用以下技术方案实现:
[0007]一种基于改进多头自注意力的无人机小目标检测方法,包括如下步骤:
[0008]步骤1:从已经部署的居民摄像头监控中采集图像,手工标注采集到的图像,获得一个含有低空无人机的图片数据集;
[0009]步骤2:使用含低空无人机的图片数据集对原始的YOLOv5s模型进行预训练,获得YOLOv5s的预训练权重;
[0010]步骤3:根据无人机小目标的特性对多头自注意力模块进行改进,并将改进多头自注意力模块加入到YOLOv5s模型中;
[0011]步骤4:使用含低空无人机的图片数据集和预训练权重对YOLOv5s模型进行重新训练,获得YOLOv5s的新训练权重;
[0012]步骤5:将新训练权重加载到YOLOv5s模型中,对居民摄像头监控数据进行检测。
[0013]进一步地,所述的步骤3中,改进多头自注意力模块,包括:
[0014]多头自注意力模块具有三个输入端口和一个输出端口,输入端口输入的是原始特征,输出端口输出的是经过多头注意力模块处理后的新特征;
[0015]第一个输入端口连接改进残差通道注意力子模块,用于提高输入特征中小目标有效特征的显著性;
[0016]第二个输入端口连接改进残差空间特征注意力子模块,用于提高输入特征中小目标有效特征的显著性;
[0017]第三个输入端口和两个改进注意力子模块连接卷积层子模块,卷积层替换原全连接层以提高多头自注意力的即插即用性;
[0018]多头缩放点积注意力子模块与卷积层子模块连接,并通过拼接和卷积处理,输出新特征。
[0019]进一步地,所述的改进残差通道注意力子模块,使用残差机制将原始输入特征与调整之后的特征相加,以使得输出特征可以保留部分浅层特征,继而保留更多的小目标特征。
[0020]进一步地,所述的改进残差空间特征注意力子模块,包括:
[0021]使用最大值池化,以降低输入特征通道数;
[0022]使用三层卷积组成空间金字塔,以增大特征搜索的空间,提高小目标尺度有效特征的捕获率;
[0023]拼接最大值池化的特征、三层卷积空间金字塔的三个特征;
[0024]计算拼接后的均值特征;
[0025]输入特征与均值特征点积,获得加权特征;
[0026]使用残差机制将输入特征与加权特征相加,以使得输出特征可以保留部分浅层特征,继而保留更多的小目标特征。
[0027]进一步地,所述的步骤3中,将改进多头自注意力模块加入到YOLOv5s模型,是将改进多头自注意力模块放在YOLOv5s的拼接层模块之后,用于调整拼接后小目标有效特征的显著性,降低检测层捕获小目标有效特征的难度。
[0028]进一步地,所述的步骤5中,对居民摄像头监控数据进行检测,过程如下:
[0029]从已经部署的居民摄像头监控中提取出单帧图像;
[0030]调用加载有新训练权重的YOLOv5s模型,对单帧图像进行检测;
[0031]若检测到小目标无人机,使用矩形框将小目标无人机区域自动框选出来。
[0032]与现有技术相比,本专利技术的有益效果是:
[0033]1)本专利技术的一种基于改进多头自注意力的无人机小目标检测方法,提供了改进多头自注意力模块,使用卷积层替换原始的全连接层,使用改进残差通道注意力和改进残差空间特征注意力调整输入特征,提高了多头自注意力的即插即用性和小目标有效特征的显著性,继而提升了无人机小目标的检测精度;
[0034]2)本专利技术的一种基于改进多头自注意力的无人机小目标检测方法,提供了改进残
差空间特征注意力子模块,在空间注意力中添加空间金字塔特征和残差机制,使得子模块可以从多个空间搜索小目标特征,并且保留了浅层的小目标特征,极大地提高了小目标有效特征的占比;
[0035]3)本专利技术的一种基于改进多头自注意力的无人机小目标检测方法,提供了改进残差通道注意力子模块,引入了残差机制,使得输出特征可以保留部分浅层特征,提高了小目标特征的占比。
附图说明
[0036]图1为本专利技术实施例提供的一种基于改进多头自注意力的无人机小目标检测方法的流程图;
[0037]图2为本专利技术实施例提供的改进残差空间特征注意力子模块的结构图;
[0038]图3为本专利技术实施例提供的改进多头自注意力模块的结构图。
本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于改进多头自注意力的无人机小目标检测方法,其特征在于,包括如下步骤:步骤1:从已经部署的居民摄像头监控中采集图像,手工标注采集到的图像,获得一个含有低空无人机的图片数据集;步骤2:使用含低空无人机的图片数据集对原始的YOLOv5s模型进行预训练,获得YOLOv5s的预训练权重;步骤3:根据无人机小目标的特性对多头自注意力模块进行改进,并将改进多头自注意力模块加入到YOLOv5s模型中;步骤4:使用含低空无人机的图片数据集和预训练权重对YOLOv5s模型进行重新训练,获得YOLOv5s的新训练权重;步骤5:将新训练权重加载到YOLOv5s模型中,对居民摄像头监控数据进行检测。2.根据权利要求1所述的一种基于改进多头自注意力的无人机小目标检测方法,其特征在于,所述的步骤3中,改进多头自注意力模块,包括:多头自注意力模块具有三个输入端口和一个输出端口,输入端口输入的是原始特征,输出端口输出的是经过多头注意力模块处理后的新特征;第一个输入端口连接改进残差通道注意力子模块,用于提高输入特征中小目标有效特征的显著性;第二个输入端口连接改进残差空间特征注意力子模块,用于提高输入特征中小目标有效特征的显著性;第三个输入端口和两个改进注意力子模块连接卷积层子模块,卷积层替换原全连接层以提高多头自注意力的即插即用性;多头缩放点积注意力子模块与卷积层子模块连接,并通过拼接和卷积处理,输出新特征。3.根据权利要求2所述的一种基于改进多头自注意力的...

【专利技术属性】
技术研发人员:巩荣芬束伟储茂祥王伟刘光虎
申请(专利权)人:辽宁科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1