基于频域注意力的SAR图像舰船尾迹检测方法技术

技术编号:38904552 阅读:21 留言:0更新日期:2023-09-22 14:22
本发明专利技术提出基于频域注意力的SAR图像舰船尾迹检测方法。所述方法用于舰船尾迹检测,该方法通过图像的频域信息来提取尾流特征。然后通过特征金字塔产生多尺度的特征表示,增强了相邻特征图间的信息融合。实现了高效准确的检测SAR图像舰船尾迹。测SAR图像舰船尾迹。测SAR图像舰船尾迹。

【技术实现步骤摘要】
基于频域注意力的SAR图像舰船尾迹检测方法


[0001]本专利技术涉及合成孔径雷达(SAR)目标检测
,特别是涉及一种基于频域注意力的SAR图像舰船尾迹检测方法。

技术介绍

[0002]合成孔径雷达(SAR)不受光照、天气等条件的影响,具有全天时、全天候的强大监视能力,已经被广泛应用于海洋港口和海战场指挥等场景。SAR通过检测舰船尾迹来实现准确、高效的舰船定位。舰船尾迹不仅可以帮助检测舰船,还可以通过尾流特征来反演舰船状态,包括航速、航向等信息。因此开展SAR图像舰船尾迹检测的研究,在维护海洋安全、监管海上交通等方面具有广阔的应用前景。
[0003]近年来,深度学习方法已成功应用于SAR图像中的目标检测。然而,传统的检测方法在SAR图像舰船尾迹检测仍然存在很大的问题。相比于海洋背景下的舰船定位,舰船尾迹的条纹常常与海岸线、溢油和海洋内波等线性结构特征相混淆。单纯的舰船检测方法只能识别舰船目标,获取舰船信息有限,并不能有效利用尾迹信息。因此如何高效准确的检测SAR图像舰船尾迹是一项亟需解决的重要问题。

技术实现思路

[0004]本专利技术目的是为了解决现有技术中的问题,提出了一种基于频域注意力的SAR图像舰船尾迹检测方法。
[0005]本专利技术是通过以下技术方案实现的,本专利技术提出基于频域注意力的SAR图像舰船尾迹检测方法,所述方法包括:
[0006]步骤1:对数据集进行预处理增强,将增强后的数据集按照比例划分为训练集、验证集以及测试集;
[0007]步骤2:对输入图像进行特征提取,选取FcaNet为骨干网络,通过离散余弦变换从输入图像中提取频域信息;
[0008]步骤3:改进金字塔特征提取模块FPN,在金字塔的三层至七层上进行特征融合,在三层至五层上应用MSAM,通过卷积层转换到相邻特征图,从而融合信息;
[0009]步骤4:使用包含多个卷积核的分类头和OBB回归头对特征进行多任务回归,并赋予权重系数以适应舰船尾迹的场景,最终得到检测结果并进行可视化。
[0010]进一步地,在步骤1中,所述数据集为高分三号舰船尾迹数据集,对使用的数据集进行旋转、平移和翻转预处理操作来增强数据。
[0011]进一步地,在步骤2中,通过FcaNet在卷积过程中执行离散余弦变换以选择性的提取图像特征,FcaNet骨干网络将通道划分成n等分,先分别计算出通道注意力中每个频率分量的结果,再根据所得结果筛选出k个性能最佳的频率分量。
[0012]进一步地,在步骤3中,利用特征金字塔提取目标的多尺度特征,改进特征金字塔网络中的特征融合步骤,在特征图的每个元素中进行具有相邻尺度间空间相关性的上下文
信息加权编码,MSAM对高层特征图和浅层特征图进行卷积,生成具有相同通道数的特征图,然后重塑为长向量并通过全连接层。
[0013]进一步地,2D离散余弦变换DCT有:
[0014][0015]其中x(i,j)是输入,H是输入图像的高,W是输入图像的宽;相应的2D离散余弦逆变换IDCT可以写成:
[0016][0017]通道注意力机制通过标量来表示并评估每个通道的重要程度,输入特征X∈R
H
×
W
×
C
沿通道维度分为m组,X∈R
H
×
W
×
C
[X0,X1,X2…
X
m
‑1],每组中的通道数为使用2D

DCT计算出对应每个部分的频率分量:
[0018][0019]其中Freq
n
∈R
C
是计算得到的频率分量,通过级联来获得整个通道的注意力权重为:
[0020]W=sigmoid(fc(compress([X0,X1,X2…
X
m
‑1]))
[0021]=sigmoid(fc(conactenation([Freq0,Freq1,Freq2…
Freq
m
‑1]))
[0022]其中sigmoid是sigmoid函数,fc表示映射函数。
[0023]进一步地,在FPN的C3‑
C7进行特征融合,并在C3‑
C5应用MSAM,通过卷积层转换相邻特征图,并将它们融合到一起,对高层信息和浅层信息进行变换;首先分别对高层特征图C
h
和浅层特征图C
l
进行1
×
1卷积,生成具有相同通道数的特征图M
h
和M
l
,然后将M
h
和M
l
重塑为长向量并通过全连接层得到B
h
和(B
l
)
T
,接下来通过softmax函数计算相邻特征图之间的注意力权重分布H:
[0024][0025]其中分别为对应特征图的x位置,A=H
×
W代表特征图所有点的总数;最后对H进行重塑和矩阵乘法以及softmax层来获得空间注意力映射,并与低级特征图M
l
进行相加得到输出P
l

[0026]P
l
=rs(H
T
A
h
)+M
l
[0027]通过上式将FPN的高层信息和浅层信息进行聚合,通过学习权重矩阵将全局特征与原始特征图结合来获得具有上下文关系的特征。
[0028]进一步地,分类头的损失函数为:
[0029][0030]其中,a表示检测结果,a

表示真实值标签,N表示锚框的总数,L
focal
为聚焦损失:
[0031]L
focal
(a
i
,a

i
)=

(1

a

i
)
η
log(a

i
)
[0032][0033]其中η为超参数。
[0034]进一步地,OBB回归的参数包括预定义锚框参数(x0,y0,w0,h0,θ0)和预测框参数(x,y,w,h,θ),预测框与预定义锚框输出结果的偏移量offset=(x
s
,y
s
,w
s
,h
s

s
)为:
[0035][0036][0037]θ
s
=tan(θ

θ0)
[0038]其中x,x0分别为预测框和预定义锚框的中心点横坐标,y,y0分别为预测框和预定义锚框的中心点纵坐标,w,w0分别为预测框和预定义锚框的宽度,h,h0分别为预测框和预定义锚框的高度,θ,θ0分别为预测框和预定义锚框的旋转角度;
[0039]真实值框参数(x

,y...

【技术保护点】

【技术特征摘要】
1.基于频域注意力的SAR图像舰船尾迹检测方法,其特征在于:所述方法包括:步骤1:对数据集进行预处理增强,将增强后的数据集按照比例划分为训练集、验证集以及测试集;步骤2:对输入图像进行特征提取,选取FcaNet为骨干网络,通过离散余弦变换从输入图像中提取频域信息;步骤3:改进金字塔特征提取模块FPN,在金字塔的三层至七层上进行特征融合,在三层至五层上应用MSAM,通过卷积层转换到相邻特征图,从而融合信息;步骤4:使用包含多个卷积核的分类头和OBB回归头对特征进行多任务回归,并赋予权重系数以适应舰船尾迹的场景,最终得到检测结果并进行可视化。2.根据权利要求1所述的方法,其特征在于:在步骤1中,所述数据集为高分三号舰船尾迹数据集,对使用的数据集进行旋转、平移和翻转预处理操作来增强数据。3.根据权利要求2所述的方法,其特征在于:在步骤2中,通过FcaNet在卷积过程中执行离散余弦变换以选择性的提取图像特征,FcaNet骨干网络将通道划分成n等分,先分别计算出通道注意力中每个频率分量的结果,再根据所得结果筛选出k个性能最佳的频率分量。4.根据权利要求3所述的方法,其特征在于:在步骤3中,利用特征金字塔提取目标的多尺度特征,改进特征金字塔网络中的特征融合步骤,在特征图的每个元素中进行具有相邻尺度间空间相关性的上下文信息加权编码,MSAM对高层特征图和浅层特征图进行卷积,生成具有相同通道数的特征图,然后重塑为长向量并通过全连接层。5.根据权利要求3所述的方法,其特征在于:2D离散余弦变换DCT有:其中x(i,j)是输入,H是输入图像的高,W是输入图像的宽;相应的2D离散余弦逆变换IDCT可以写成:通道注意力机制通过标量来表示并评估每个通道的重要程度,输入特征X∈R
H
×
W
×
C
沿通道维度分为m组,X∈R
H
×
W
×
C
[X0,X1,X2…
X
m
‑1],每组中的通道数为使用2D

DCT计算出对应每个部分的频率分量:其中Freq
n
∈R
C
是计算得到的频率分量,通过级联来获得整个通道的注意力权重为:W=sigmoid(fc(compress([X0,X1,X2…
X
m
‑1]))=sigmoid(fc(conactenation([Freq0,Freq1,Freq2…
Freq
m
‑1]))其中sigmoid是sigmoid函数,fc表示映射函数。6.根据权利要求4所述的方法,其特征在于:在FPN的C3‑
C7进行特征融合,并在C3‑
C5应用MSAM,通过卷积层转换相邻特征图,并将它们融合到一起,对高层信息和浅层信息进行变换;首先分别对高层特征图C
h
和浅层特征图C
l
进行1
×
1卷积,生成具有相同通道数的特征图
M
h
和M
l
,然后将M
h
和M
l
重塑为长向量并通过全连接层得到B
h
和(B
l
)
T
,接下来通过softmax函数计算相邻特征图之间的注意力权重分布H:其中分别为对应特征图的x位置,A=H
×
W代表特征图所有点的总数;最后对H进行重塑和矩阵乘法以及softmax层来获得空间注意力映射,并与低级特征图M
l
进行相加得到输出P
l
:P
l
=rs(H
T
A
h
)+M
l
通过上式将FPN的高层信息和浅层信息进行聚合,通过学习权重矩阵将全局特征与原始特征图结合来获得具有上下文关系的特征。7.根据权利要求1所述的方法,其特征在于:分类头的损失函数为:其中,a表示检测结果,a

表示真实值标签,N表示锚框的总数,L
focal
为聚焦...

【专利技术属性】
技术研发人员:王路刘浩东亓宇航李开誉赵春晖
申请(专利权)人:哈尔滨工程大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1