基于自适应感受野增强的航拍小目标检测方法技术

技术编号:36706247 阅读:12 留言:0更新日期:2023-03-01 09:28
本发明专利技术涉及一种基于自适应感受野增强的航拍小目标检测方法,首次提出自适应感受野增强网络模块,该模块不仅能够改进空洞卷积存在的上下文缺失问题,而且在卷积层分支数量一样的情况下,能够比感受野块获得更多数量的感受野尺度。此外,本发明专利技术对输出的特征图进一步处理,可实现每层神经元自适应调整感受野大小。将本发明专利技术加入通用目标检测算法,实验表明,本发明专利技术能够提高航拍小目标检测率。发明专利技术能够提高航拍小目标检测率。发明专利技术能够提高航拍小目标检测率。

【技术实现步骤摘要】
基于自适应感受野增强的航拍小目标检测方法


[0001]本专利技术属于图像处理
,涉及一种自适应感受野增强网络模块,从感受野出发解决航拍图像目标较小导致的信息不足的问题,提高航拍图像小目标检测性能。

技术介绍

[0002]目标检测是经典的视觉问题之一,目前基于深度学习的方法已经成为通用对象检测的热门方向,然而现在前沿的深度学习目标检测算法都是针对通用数据集提出,航拍图像与之相比检测更具有挑战性,因为(1)目标相对于高分辨率航拍图像尺度较小(2)目标稀疏、不均匀且集中在某些区域(3)与自然图像数据集相比,小目标占比较大。
[0003]目前利用通用目标检测算法进行航拍图像目标检测,尤其在提高小目标检测上已做出很多努力。为解决航拍图像目标较小导致的信息不足问题,分别从增加输入分辨率和特征增强出发,提出多种改进算法,其中感受野增强是实现特征增强的常用方式。感受野是卷积神经网络的重要属性,卷积神经网络中某一层特征图的一个点对应的输入图像的区域大小就是该层的感受野大小,卷积层感受野的大小关系着目标提取特征的完整性与鲁棒性,尤其对小目标的影响更大。
[0004]鉴于感受野对航拍小目标检测的重要性,并且目前基于感受野增强改进的通用目标检测算法仍然存在不足,例如有的学者使用空洞卷积实现感受野增强,但空洞卷积稀疏采样的特性无法捕获上下文信息;有的学者使用感受野块(Receptive Field Block,RFB)为网络加入感受野增强模块,但是如果需要增加感受野尺度数量,必须增加卷积层分支数量,造成计算量大大增加。<br/>
技术实现思路

[0005]要解决的技术问题
[0006]针对航拍图像中由于目标较小、信息不足导致检测出现误检、漏检问题,本专利技术提供一种基于自适应感受野增强的航拍小目标检测方法。首次提出自适应感受野增强网络模块,该模块不仅能够改进空洞卷积存在的上下文缺失问题,而且在卷积层分支数量一样的情况下,能够比感受野块获得更多数量的感受野尺度。此外,本专利技术对输出的特征图进一步处理,可实现每层神经元自适应调整感受野大小。将本专利技术加入通用目标检测算法,实验表明,本专利技术能够提高航拍小目标检测率。
[0007]技术方案
[0008]一种基于自适应感受野增强的航拍小目标检测方法,其特征在于步骤如下:
[0009]步骤1:输入待检测图片,提取图片特征图;
[0010]步骤2:将特征图输入到自适应感受野增强网络增强特征图的感受野;所述的自适应感受野增强网络:将输入特征图先通过1
×
1卷积模块;然后将处理后的特征图输入感受野块,通过感受野块串联分支的K

conv卷积层实现感受野增强;将经过感受野块处理后的多个分支的输出特征图输入选择性卷积模块,通过选择性卷积模块计算感受野块不同支路
特征图的权重值,并将特征图与权重值加权求和得到输出特征图;将输出特征图再次经过1
×
1卷积,使通道数恢复到输入时的大小;最后经过eSE模块,并且使用短路连接,进一步增强特征图,得到最终输出特征图;
[0011]步骤3:将增强感受野的特征图输入到通用目标检测方法进行目标检测。
[0012]本专利技术进一步的技术方案:所述的通用目标检测方法为YOLOx、Faster R

CNN或YOLOv5算法。
[0013]本专利技术进一步的技术方案:所述的K

conv卷积层的卷积核K'表示为:
[0014][0015][0016]其中,F为变换矩阵,I为单位矩阵和O为零矩阵,r1是中间膨胀因子,r2为内部共享因子,c2∈[1,C
B
],c1∈[1,C
A
],C
A
、C
B
分别表示特征图A、B的通道数。
[0017]本专利技术进一步的技术方案:所述的选择性卷积模块具体如下:
[0018]首先,将通过求和融合多个分支的特征图R:
[0019][0020]然后通过全局平均池化嵌入全局信息,即将特征图所有像素相加求平均,得到一个数值用来表示对应特征图s∈R
C
,因此经过全局平均池化后第c个通道的特征图s
c

[0021][0022]接着使用全连接层预测不同特征图的概率向量V∈R
C'

[0023]V=F
fc
(s)=δ(B(W
s
))
[0024]其中,δ是损失函数,B表示正则化,W∈R
C'

[0025]在求得概率向量后,采用自注意力机制自适应地选择不同空间尺度的信息;使用softmax函数求得第c个通道权重值:
[0026][0027]其中,表示第c个通道第i条支路输出特征图的权重值,表示第c个通道第i条支路输出特征图的概率向量;
[0028]最后,将卷积层不同支路得到的特征图R
i
与求得的权重值加权求和,生成最终的输出特征图Foutput,F
output
=[F1,F2,...,F
C
],第c个通道的输出特征图
[0029][0030][0031]本专利技术进一步的技术方案:当通用目标检测方法为YOLOx,在检测小、中、大目标特征图输出层加入不同扩张率感受野模块。
[0032]有益效果
[0033]本专利技术从感受野增强角度出发,提出自适应感受野增强网络,提高通用目标检测算法对航拍小目标的检测率。
[0034]首先,通过双向连接实现特征复用,使得在支路数相同且每个支路卷积参数设置相同的情况下,不仅能够获得更大的感受野,更好地提取目标特征,而且感受野的尺度种类也更丰富;其次,在分支中引入K

conv卷积层实现感受野增强,解决使用空洞卷积带来的上下文信息缺失问题;最后,在网络中加入选择性卷积模块,使得每层神经元能够自适应地调整感受野大小,避免了每层神经元感受野大小固定情况。为体现本专利技术的优越性,以yolox为基础算法,分别加入多种其他感受野模块进行性能对比测试,本专利技术在检测精度和检测速度上均优于其余几种模块。
[0035]为进一步验证本专利技术有效性和泛化性,将本专利技术分别加入到YOLOx、Faster R

CNN和YOLOv5算法中,实验结果表明本专利技术对提高航拍小目标检测是有效的。
附图说明
[0036]附图仅用于示出具体实施例的目的,而并不认为是对本专利技术的限制,在整个附图中,相同的参考符号表示相同的部件。
[0037]图1:RFB结构图;
[0038]图2:OSA模块图;
[0039]图3:空洞率为4的空洞卷积示意图;
[0040]图4:r1=4,r2=3的K

conv示意图;
[0041]图5:选择性卷积模块图;
[0042]图6:自适应感受野增强网络整体框架图;
[0本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于自适应感受野增强的航拍小目标检测方法,其特征在于步骤如下:步骤1:输入待检测图片,提取图片特征图;步骤2:将特征图输入到自适应感受野增强网络增强特征图的感受野;所述的自适应感受野增强网络:将输入特征图先通过1
×
1卷积模块;然后将处理后的特征图输入感受野块,通过感受野块串联分支的K

conv卷积层实现感受野增强;将经过感受野块处理后的多个分支的输出特征图输入选择性卷积模块,通过选择性卷积模块计算感受野块不同支路特征图的权重值,并将特征图与权重值加权求和得到输出特征图;将输出特征图再次经过1
×
1卷积,使通道数恢复到输入时的大小;最后经过eSE模块,并且使用短路连接,进一步增强特征图,得到最终输出特征图;步骤3:将增强感受野的特征图输入到通用目标检测方法进行目标检测。2.根据权利要求1所述的一种基于自适应感受野增强的航拍小目标检测方法,其特征在于所述的通用目标检测方法为YOLOx、Faster R

CNN或YOLOv5算法。3.根据权利要求1所述的一种基于自适应感受野增强的航拍小目标检测方法,其特征在于所述的K

conv卷积层的卷积核K'表示为:conv卷积层的卷积核K'表示为:其中,F为变换矩阵,I为单位矩阵和O为零矩阵,r1是中间膨胀因子,r2为内部共享因子,c2∈[1,C
B
],c1∈[1,C
A
],C
A
、C
...

【专利技术属性】
技术研发人员:王健周立辉陈家福李欣琦郭霖佯刘洁何自豪
申请(专利权)人:西北工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1