基于混合域注意力的有限像素红外无人机目标检测方法技术

技术编号:27835323 阅读:21 留言:0更新日期:2021-03-30 11:58
本发明专利技术公开了一种基于混合域注意力的有限像素红外无人机目标检测方法,通过基于注意力机制的单步级联神经网络对红外图像进行特征提取,获得特征图;对所述特征图进行上采样获得多尺度特征图,并对所述多尺度特征图分别进行特征融合与预测,获得目标检测最终结果。采用注意力机制与多尺度特征融合预测方法,提高对有限像素目标的特征提取能力与检测准确性。性。

【技术实现步骤摘要】
基于混合域注意力的有限像素红外无人机目标检测方法


[0001]本专利技术属于红外小目标检测领域,具体涉及一种基于混合域注意力的有限像素红外无人机目标检测方法。

技术介绍

[0002]随着无人平台技术的不断发展,各国对无人机的研制和应用也较为活跃,凭借它高效率、低成本、大产出、强机动性等优点被广泛应用于军事和民用领域。同时也给空域安全保障带来了严峻的挑战,甚至会造成重大的社会危害。利用红外成像探测技术能实现对无人机的检测与跟踪,对无人机进行有效监测。但在实际场景中,由于成像距离远、长距离大气程辐射干扰造成的影响,导致目标信噪比低、像素点少、无形状纹理,并且会受到复杂背景杂波及随机噪声的干扰,使得常规目标检测识别算法无法同时兼顾检测精度与检测效率。
[0003]为解决有限像素目标检测问题,目前主要有两类方法:单帧检测和多帧检测。由于多帧检测算法通常比单帧检测算法耗费更多的时间,且多帧检测算法一般假设背景是静态的,这使得多帧检测算法不适合无人机应用。本报告主要研究单帧检测算法。
[0004]基于单帧的检测方法主要分为基于滤波的方法、基于人类视觉系统(HVS)的方法、基于图像数据结构的方法和基于神经网络的方法。基于滤波的方法主要通过抑制背景进而达到检测红外有限像素目标的目的,易受到背景中的杂波和噪声的影响,影响检测的鲁棒性;基于HVS的方法通过目标与背景的局部差异构建可以突出目标的显著图,进而实现对目标的检测,但对背景的平稳性要求较高;基于图像数据结构的方法则利用目标矩阵与背景矩阵之间的特征差异从单帧图像中分离出目标,该方法主要聚焦于目标模型的建立而缺乏对复杂背景的描述。
[0005]由于深度神经网络在自然图像处理方面的巨大成功,将卷积神经网络引入了红外有限像素目标检测领域。Fan等人使用MNIST数据集训练多尺度CNN,提取卷积核增强小目标图像。Wang等人将一个在ILSVRC 2013上预先训练好的CNN转移到小目标数据集中,学习小目标特征,但现实世界中的对象通常包含大量的形状、颜色和结构信息,对有限像素目标的迁移效果有限。Lin等人通过融合高层的语义信息和低层的位置信息,预测在不同的特征图上进行,该方法对小目标检测的提升是比较明显的。Cai等人使用一系列IoU逐渐增大的检测器,每个检测器都由不同IoU阈值界定的正负样本训练得到,下一个检测器的输入来自上一个检测器的输出,从而训练出高质量的检测器。Li等人使用感知生成式对抗网络提高小目标的特征表示,提高目标检测率。

技术实现思路

[0006]鉴于此,本专利技术的主要目的在于提供一种基于混合域注意力的有限像素红外无人机目标检测方法。
[0007]为达到上述目的,本专利技术实施例的技术方案是这样实现的:
[0008]本专利技术实施例提供一种基于多尺度特征融合的有限像素红外无人机目标检测方法,该方法为:
[0009]通过基于注意力机制单步级联神经网络对红外图像进行特征提取,获得特征图;
[0010]对所述特征图进行上采样获得多尺度特征图,并对所述多尺度特征图分别进行特征融合与预测,获得目标检测最终结果。
[0011]上述方案中,所述通过基于注意力机制单步级联神经网络对红外图像进行特征提取,获得特征图,具体为:以单步级联神经网络作为特征提取模型,获取多层不同深度的特征图,并加入基于混合域机制的注意力模块,提高对目标区域的关注度评分。
[0012]上述方案中,在特征提取过程中输入残差模块的特征图大小为208
×
208
×
32,其中208
×
208表示特征图的空间大小,32表示通道数,在特征提取模块中引入通道注意力模块与空间注意力模块,分别用于提取多个通道中以及单通道空间特征中的有效特征。
[0013]上述方案中,首先,在通道维度上对红外图像分别进行全局平均池化和全局最大池化操作,再经过含有一个隐藏层的网络得到权重,相加作为最终的注意力权重向量,如式(1)所示:
[0014][0015]其中,表示输入特征图;σ表示sigmoid激活函数,用于学习特征间的非线性关系;H表示仅含一个隐藏层的网络,用于学习参数线性关系;H表示仅含一个隐藏层的网络,用于学习参数r表示减少率;AvgPool和MaxPool分别表示平均池化和最大池化,平均池化是把每个通道所有特征值相加再平均,最大池化是选取各个通道中特征值的最大值;加法表示逐元素相乘,并按通道维度拼接得到特征图F';
[0016]其次,对特征图F进行基于通道维度的平均池化和最大池化操作,并进行拼接得到一个通道数为2的特征图,再经过一个7
×
7的卷积层,激活函数为Sigmoid,得到权重系数M
S
,如式(2)所示:
[0017][0018]其中,Conv7×7表示对其进行卷积操作,卷积核大小为7
×
7;
[0019]最后,使用权重系数M
S
和特征层F'相乘即可得到缩放后的新特征图。
[0020]上述方案中,所述对所述特征图进行上采样获得多尺度特征图,并对所述多尺度特征图分别进行特征融合与预测,获得结果图,具体为:根据无人机目标所占像素值大小,选取四个不同大小级别的特征图,分别为13
×
13、26
×
26、52
×
52和104
×
104,对其进行多级特征融合与预测。
[0021]上述方案中,对单步级联神经网络的第82层大小为13
×
13的特征图进行检测,获得大小为13
×
13的第一结果图;其次,对第79层大小为13
×
13的特征图进行2倍的上采样,获得大小为26
×
26的特征图,并将上采样后的特征图与第61层得到的特征图以拼接的方式进行特征融合,在拼接时将进行深度的叠加,26
×
26
×
255的特征图与26
×
26
×
255的特征
图拼接得到26
×
26
×
768的特征图,然后在第二个检测层的第94层进行检测,获得大小为26
×
26的第二结果图;再其次,对第91层得到的特征图做相同处理,与第36层特征层拼接,在第106层进行检测,获得大小为52
×
52
×
255的第三结果图;最后,对第103层做相同操作并与第11层特征层拼接,获得大小为104
×
104的第四结果图。
[0022]与现有技术相比,本专利技术的有益效果:
[0023](1)本专利技术利用注意力机制提高对目标区域的关注度评分;
[0024](2)本专利技术采用多尺度特征融合与预测方法,提高对有限像素目标的特征提取能力与检测准确性。
附图说明
[0025]图1为本专利技术的流程图。
具体实施方式
[0026本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于混合域注意力的有限像素红外无人机目标检测方法,其特征在于,该方法为:通过基于注意力机制的单步级联神经网络对红外图像进行特征提取,获得特征图;对所述特征图进行上采样获得多尺度特征图,并对所述多尺度特征图分别进行特征融合与预测,获得目标检测最终结果。2.根据权利要求1所述的基于混合域注意力的有限像素红外无人机目标检测方法,其特征在于,所述通过基于注意力机制单步级联神经网络对红外图像进行特征提取,获得特征图,具体为:以单步级联神经网络作为特征提取模型,获取多层不同深度的特征图,并加入基于混合域机制的注意力模块,提高对目标区域的关注度评分。3.根据权利要求2所述的基于混合域注意力的有限像素红外无人机目标检测方法,其特征在于,在特征提取过程中输入残差模块的特征图大小为208
×
208
×
32,其中208
×
208表示特征图的空间大小,32表示通道数,在特征提取模块中引入通道注意力模块与空间注意力模块,分别用于提取多个通道中以及单通道空间特征中的有效特征。4.根据权利要求3所述的基于混合域注意力的有限像素红外无人机目标检测方法,其特征在于,首先,在通道维度上对红外图像分别进行全局平均池化和全局最大池化操作,再经过含有一个隐藏层的网络得到权重,相加作为最终的注意力权重向量,如式(1)所示:其中,表示输入特征图;σ表示sigmoid激活函数,用于学习特征间的非线性关系;H表示仅含一个隐藏层的网络,用于学习参数系;H表示仅含一个隐藏层的网络,用于学习参数r表示减少率;AvgPool和MaxPool分别表示平均池化和最大池化,平均池化是把每个通道所有特征值相加再平均,最大池化是选取各个通道中特征值的最大值;加法表示逐元素相乘,并按通道维度拼接得到特征图F';其次,对特征图F进行基于通道维度的平均池化和最大池化操作,并进行拼接得到一个通道数为2的特征图,再经过一个7
×
7的卷积层,激活函数为Sigmoid,得到权重系数M
S
,如式(2)所示:其中,Conv7×7表示对其进...

【专利技术属性】
技术研发人员:秦翰林蔡彬彬梁毅马琳延翔欧洪璇岳恒张昱庚
申请(专利权)人:西安电子科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1