基于自注意力网络的合成孔径雷达飞机目标识别方法技术

技术编号:32827591 阅读:8 留言:0更新日期:2022-03-26 20:32
本发明专利技术属于雷达遥感应用技术领域,具体涉及一种基于自注意力网络的合成孔径雷达飞机目标识别方法。实现过程包括:获取数据集;构建基于swin transformer的网络模型;将训练集输入网络模型,利用网络模型提取特征;将提取到的特征在反向传播的过程中计算损失函数,根据损失函数调整网络模型参数,得获得最终目标识别模型;将需要检测的SAR图像输入到最终目标识别模型中,获得检测结果。本发明专利技术的方法利用来自分类和回归分支信息明确分解联合表示目标定位质量,在不增加计算量的同时,可以提升识别精度。同时,本文采用Swin Transformer网络进行SAR图像飞机目标识别,具有更强大的特征提取能力,检测效果更好。检测效果更好。检测效果更好。

【技术实现步骤摘要】
基于自注意力网络的合成孔径雷达飞机目标识别方法


[0001]本专利技术属于雷达遥感应用
,具体涉及一种基于自注意力网络的合成孔径雷达飞机目标识别方法。

技术介绍

[0002]合成孔径雷达(SyntheticAperture Radar,以下简称SAR)具有全天时、全天候的特点,是一种重要的对地观测手段。SAR图像目标识别利用SAR图像信息来实现目标位置和类别的判定,已广泛应用到军事作战等领域,是提升SAR传感器信息感知能力、实现SAR技术应用的关键技术之一。
[0003]SAR图像目标识别性能与特征提取的能力及数据集有密切关系。随着SAR成像技术的发展,SAR图像的分辨率越来越高。与此同时,SAR飞机数据也越来越多。然而,在SAR飞机识别领域,目前存在的方法识别效果并不理想,SAR飞机数据存在严重的样本不平衡问题且漏检问题严重。因此,需要研究更好的特征提取方法,减少特征损失,减轻类别不平衡的影响,以在SAR图像飞机目标识别中获得更好的性能。
[0004]传统的SAR图像目标识别方法主要特征提取和分类器。近年来,随着深度学习的快速发展,基于卷积神经网络(Convolutional Neural Network,简称CNN)的目标识别方法取得了较好的效果。现有的基于深度卷积神经网络的目标识别算法主要分为两阶段和单阶段的网络两大类。CNN通过不断地通过卷积层来完成对图像从局部信息到全局信息的提取。近期,有学者将NLP领域的transformer引入目标检测识别领域,将目标识别看做集合预测问题。相比于CNN,transformer训练更加简洁优雅,且无需任何后处理。
[0005]近年来,针对卷积神经网络中的样本不平衡问题引起广泛的研究。Focal loss损失函数降低了大量简单负样本在训练中所占的权重,从而减轻了正负样本不平衡的问题。由于损失函数的设计影响着最终目标边界框定位和回归的精度,本专利技术引用边界框的不确定性的统计量来指导定位质量估计,从而提高目标识别的精度。

技术实现思路

[0006]本专利技术所要解决的技术问题是通过损失函数的改进,提高边界框定位的质量,从而提高SAR图像飞机识别的精确率。针对SAR图像飞机识别干扰较多,且漏检较多的问题,提供了一种基于transformer的识别方法,并对损失函数进行改进,进一步提升识别精度,在SAR图像飞机识别中取得了很好的效果。
[0007]本专利技术采用的技术方案为:
[0008]一种基于自注意力网络的合成孔径雷达飞机目标识别方法,包括以下过程:
[0009]步骤1、获取数据集,分割为训练集,测试集和验证集数据;
[0010]步骤2、构建基于swintransformer的网络模型,基于swintransformer模型的结构包括块划分、线性嵌入、第一SwinTransformer模块、块合并和第二SwinTransformer模块;块划分用于将输入图像划分为不重合的图像块,线性嵌入用于改变图像块的特征维度,块
合并用于按照2
×
2相邻图像块进行合并,第一和第二SwinTransformer模块分别用于提取图像深度特征;
[0011]步骤3、将训练集输入网络模型,利用网络模型提取特征;
[0012]步骤4、将提取到的特征在反向传播的过程中计算损失函数,根据损失函数调整网络模型参数,返回步骤3,直至损失函数收敛,得到训练好的网络模型,并在验证集上进行优化调参,得获得最终目标识别模型;
[0013]步骤5、将需要检测的SAR图像输入到最终目标识别模型中,获得检测结果。
[0014]进一步的,第一和第二SwinTransformer模块中采用局部窗口自注意的方式,在局部窗口划分时,采用移位窗口划分方法,具体为:
[0015]在第一SwinTransformer模块的神经网络中,首先将线性嵌入后得到的图像采用自左上角像素开始的窗口划分策略,将8
×
8的特征图平均划分为2
×
2个4
×
4的窗口,然后下一层在上一层的窗口配置基础上,采用移动窗口划分,将平均划分的窗口进行尺度的变换,然后在重新划分的窗口上进行特征提取;
[0016]在第二SwinTransformer模块的神经网络中,将块合并后的图像采用自左上角像素开始的窗口划分策略,将特征图首先进行平均划分,然后在下一层采用移动窗口划分,将平均划分的窗口进行尺度变换,得到不同尺度的窗口,然后在重新划分的窗口上进行特征提取。
[0017]进一步的,步骤4中损失函数采用融合损失函数,计算过程如下:
[0018]融合损失函数将分类和回归分支进行融合,将特征提取之后的特征分布输入到回归分支得到预测交并比的标量I,然后和分类分支得到的损失C相乘得到J,计算公式如下:
[0019]J=C
×
I
[0020]其中,C=[C1,C2,...C
m
],C
i
∈[0,1],表示总共m个类别的分类表示,I∈[0,1]是一个标量,代表预测交并比的大小;
[0021]预测交并比的标量I计算公式如下:
[0022]I=σ(W2δ(W1F))
[0023]其中,δ为线性整流函数,σ为S型生长曲线函数,k表示目标分布的Top

k参数,p表示第二Swin Transformer模块中隐藏层的通道维度。
[0024]本专利技术的有益效果为:
[0025]本专利技术相比于CNN的目标识别网络,改变了损失函数,使其更好的定位目标,提高了目标定位的质量,提高了识别精度。同时Swintransformer与其它transformer方法相比,具有更强的通用性。在损失函数上,为了提高目标定位的质量,将分类和回归分支进行分解然后再联合,可以显著提高目标识别任务性能。
附图说明
[0026]图1为本专利技术实施例基于swintransformer的网络模型结构图。
[0027]图2为本专利技术实施例移位窗口划分方法示意图。
[0028]图3为本专利技术实施例损失函数示意图。
[0029]图4为本专利技术实施例含有飞机目标的SAR图像。
具体实施方式
[0030]本专利技术是为了提高SAR图像识别的能力。因此,将本专利技术的损失函数应用于Swin transformer检测识别框架中。为了评价本专利技术损失函数的好坏,将该损失函数应用于SAR图像飞机目标识别框架中。直接替换Swintransformer中目标定位的损失函数。实验首先将数据集按8:1:1的比例分为训练,验证和测试三个部分,采用COCO格式的数据集输入。通过将附图3的损失函数加入到Swin transformer中进行SAR图像飞机目标识别的训练。多尺度训练,根据数据集中图像尺寸的不同,调整输入的大小。使用AdamW优化器,初始学习率设置为10

4,权重衰减为0.05,批大小为16。本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于自注意力网络的合成孔径雷达飞机目标识别方法,其特征在于,包括以下过程:步骤1、获取数据集,分割为训练集,测试集和验证集数据;步骤2、构建基于swin transformer的网络模型,基于swin transformer模型的结构包括块划分、线性嵌入、第一Swin Transformer模块、块合并和第二Swin Transformer模块;块划分用于将输入图像划分为不重合的图像块,线性嵌入用于改变图像块的特征维度,块合并用于按照2
×
2相邻图像块进行合并,第一和第二Swin Transformer模块分别用于提取图像深度特征;步骤3、将训练集输入网络模型,利用网络模型提取特征;步骤4、将提取到的特征在反向传播的过程中计算损失函数,根据损失函数调整网络模型参数,返回步骤3,直至损失函数收敛,得到训练好的网络模型,并在验证集上进行优化调参,得获得最终目标识别模型;步骤5、将需要检测的SAR图像输入到最终目标识别模型中,获得检测结果。2.根据权利要求1所述的基于自注意力网络的合成孔径雷达飞机目标识别方法,其特征在于,第一和第二Swin Transformer模块中采用局部窗口自注意的方式,在局部窗口划分时,采用移位窗口划分方法,具体为:在第一Swin Transformer模块的神经网络中,首先将线性嵌入后得到的图像采用自左上角像素开始的窗口划分策略,将8
×

【专利技术属性】
技术研发人员:王晓雅柴英特朱光熙王港
申请(专利权)人:中国电子科技集团公司第五十四研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1