基于VIT模型和原型网络的可解释SAR目标识别方法及系统技术方案

技术编号:36825179 阅读:48 留言:0更新日期:2023-03-12 01:20
本发明专利技术公开一种基于VIT模型和原型网络的可解释SAR目标识别方法及系统,首先把数据集分为训练集与测试集,使用训练集来训练VIT模型;从训练集种选择部分数据作为支持集,并设置支持集的类别,使用训练好的VIT模型对支持集数据进行编码,得到支持数据编码向量;使用训练好的VIT模型对测试集进行编码,得到测试数据编码向量;计算测试数据编码向量各部位与支持数据编码向量各部位之间的L1距离,根据测试集数据与支持集数据的L1距离得到相似性向量;将相似性向量重新划分训练集与测试集,展平以后经过全连接网络进行训练与测试,最后得到分类结果。该方法使得神经网络在MSATR数据集上具有一定的可解释性;分类精度相对于原始VIT模型下降很低。VIT模型下降很低。VIT模型下降很低。

【技术实现步骤摘要】
基于VIT模型和原型网络的可解释SAR目标识别方法及系统


[0001]本专利技术涉及神经网络算法
,特别是一种基于VIT模型和原型网络的可解释SAR目标识别方法及系统。

技术介绍

[0002]目标识别是SAR成像以后的关键应用。如何从SAR图像中识别目标的类别是研究的热点问题。传统SAR目标识别技术主要通过利用回波能量来完成。在实际场景中,雷达回波不仅包含目标信息,还包含诸如地杂波、海杂波、干扰等杂波及背景信息。近年来,随着计算能力的显著提升、数据规模的大幅扩大以及机器学习算法的不断改进,从数据中自动进行特征学习日益成为模式识别的主要范式。其中,由于卷积神经网络(CNN)对图像有着很强的特征提取能力而受到广泛应用,产生了各种基于CNN的模型。
[0003]目前的基于深度学习的模型大部分具有“黑盒”性质,其工作机理、决策过程和决策逻辑对用户的不透明,会存在安全隐患,特别是在医疗诊断、金融投资、国防军事等高风险领域,深度神经网络的可解释性对于理解和信任模型的决策至关重要。随着深度学习技术的进步和在诸多领域的大量应用,其可解释性问题日益受到政府、学术界和工业界的广泛重视。从目的上来说,可解释性旨在帮助人们理解机器学习模型是如何学习的,它从数据中学到了什么;针对每一个输入样本,它为什么会做出如此决策以及它所做的决策是否可靠等。

技术实现思路

[0004]有鉴于此,本专利技术的目的在于提供一种基于VIT模型和原型网络的可解释SAR目标识别方法及系统,该方法利用测试数据与支持集进行比较得出的相似性,神经网络根据相似性进行分类。
[0005]为达到上述目的,本专利技术提供如下技术方案:
[0006]本专利技术提供的基于VIT模型和原型网络的可解释SAR目标识别方法,包括以下步骤:
[0007]步骤一:首先把MSTAR数据集分为训练集与测试集,使用训练集来训练VIT模型;
[0008]步骤二:从训练集种选择部分数据作为支持集,使用训练好的VIT模型对支持集数据进行编码,得到支持数据编码向量;使用训练好的VIT模型对测试集进行编码,得到测试数据编码向量;
[0009]步骤三:计算测试数据编码向量各部位与支持数据编码向量各部位之间的L1距离,根据测试集数据与支持集数据的L1距离得到最相似部位的相似性向量;
[0010]步骤四:根据相似性向量重新划分训练集与测试集,展平以后经过全连接网络进行训练与测试,最后得到分类结果。
[0011]进一步,所述L1距离按照以下公式计算:
[0012]L1=|x
i

y
jk
|
[0013]其中,i表示测试数据编码向量中第i个部位,x
i
表示测试数据编码向量中第i个部位;j表示支持集数据编码中第j个数据,k表示支持集数据编码中第k个部位;y
jk
表示支持集第j个数据编码向量中第k个部位。
[0014]进一步,所述步骤三中的相似性向量按照以下方式得到:
[0015]计算测试数据单个部位与支持集数据单个部位的L1距离,得到测试数据相对于支持集数据各部位的相似性向量;遍历支持集所有数据所有部位进行计算得到测试集数据各部位与支持集数据所有部位的相似性向量;
[0016]取出相对于每个支持集数据最相似的部位,对支持集中每个类别求均值,得到测试数据单个部位与支持集每个类别的最相似部位的相似性向量;
[0017]遍历测试数据所有部位,对测试数据的所有部位进行计算L1距离,取出最相似部位并按类别求均值,得到测试数据各部位与支持集每个类别的最相似部位的相似性向量。
[0018]进一步,所述遍历支持集所有数据所有部位进行计算得到测试集数据单个部位与支持集数据所有部位的相似性向量,按照以下公式进行:
[0019][0020]其中,M表示支持集数据编码中数据的数量;N表示支持集数据编码中部位的数量。
[0021]进一步,所述遍历测试数据所有部位,对测试数据的所有部位进行计算L1距离,按照以下公式进行:
[0022][0023]其中,Q表示测试数据部位的数量,M表示支持集数据编码中数据的数量;N表示支持集数据编码中部位的数量。
[0024]进一步,所述VIT模型包括编码器与全连接网络。
[0025]进一步,所述支持数据编码向量或测试数据编码向量是通过训练后的VIT模型中的编码器进行编码输出的。
[0026]本专利技术提供的基于VIT模型和原型网络的可解释SAR目标识别系统,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述的方法。
[0027]本专利技术的有益效果在于:
[0028]本专利技术提供的基于VIT模型和原型网络的可解释SAR目标识别方法及系统,首先把MSTAR数据集分为训练集与测试集,使用训练集来训练VIT模型;从训练集种选择部分数据作为支持集,并设置支持集的类别,使用训练好的VIT模型对支持集数据进行编码,得到支持数据编码向量;使用训练好的VIT模型对测试集进行编码,得到测试数据编码向量;计算测试数据编码向量各部位与支持数据编码向量各部位之间的L1距离,根据测试集数据与支持集数据的L1距离得到相似性向量;将相似性向量重新划分训练集与测试集,展平以后经过全连接网络进行训练与测试,最后得到分类结果。该方法使得神经网络在MSATR数据集上具有一定的可解释性;分类精度相对于原始VIT模型下降很低。
[0029]本专利技术的其他优点、目标和特征在某种程度上将在随后的说明书中进行阐述,并且在某种程度上,基于对下文的考察研究对本领域技术人员而言将是显而易见的,或者可以从本专利技术的实践中得到教导。本专利技术的目标和其他优点可以通过下面的说明书来实现和获得。
附图说明
[0030]为了使本专利技术的目的、技术方案和有益效果更加清楚,本专利技术提供如下附图进行说明:
[0031]图1为基于Vision Transformer的SAR目标识别流程。
[0032]图2为原型网络目标识别流程。
[0033]图3为基于Vision Transformer的可解释SAR目标识别流程。
[0034]图4为全连接网络示意图。
[0035]图5为可解释VIT的分类解释。
具体实施方式
[0036]下面结合附图和具体实施例对本专利技术作进一步说明,以使本领域的技术人员可以更好的理解本专利技术并能予以实施,但所举实施例不作为对本专利技术的限定。
[0037]如图1所示,图1为基于Vision Transformer的SAR目标识别流程,描述了VIT模型的特点,利用VIT模型对MSTAR数据集进行分类,具体步骤如下:
[0038]VIT模型在分类时先把图像分为多个小块,然后使用线性投射层对小块进行编码,而后采用位置编码加入位置信息,与位置编码后的结果相加,之后采用Transformer编码器对融合后的信息进一步编码提取特征本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于VIT模型和原型网络的可解释SAR目标识别方法,其特征在于:包括以下步骤:步骤一:首先把MSTAR数据集分为训练集与测试集,使用训练集来训练VIT模型;步骤二:从训练集种选择部分数据作为支持集,使用训练好的VIT模型对支持集数据进行编码,得到支持数据编码向量;使用训练好的VIT模型对测试集进行编码,得到测试数据编码向量;步骤三:计算测试数据编码向量各部位与支持数据编码向量各部位之间的L1距离,根据测试集数据与支持集数据的L1距离得到最相似部位的相似性向量;步骤四:根据相似性向量重新划分训练集与测试集,展平以后经过全连接网络进行训练与测试,最后得到分类结果。2.如权利要求2所述的基于VIT模型和原型网络的可解释SAR目标识别方法,其特征在于:所述L1距离按照以下公式计算:L1=|x
i

y
jk
|其中,i表示测试数据编码向量中第i个部位,x
i
表示测试数据编码向量中第i个部位;j表示支持集数据编码中第j个数据,k表示支持集数据编码中第k个部位;y
jk
表示支持集第j个数据编码向量中第k个部位。3.如权利要求1所述的基于VIT模型和原型网络的可解释SAR目标识别方法,其特征在于:所述步骤三中的相似性向量按照以下方式得到:计算测试数据单个部位与支持集数据单个部位的L1距离,得到测试数据相对于支持集数据各部位的相似性向量;遍历支持集所有数据所有部位进行计算得到测试集数据各部位与支持集数据所有部位的相似性向...

【专利技术属性】
技术研发人员:钱江叶鑫吕海涛蒋俊正
申请(专利权)人:电子科技大学长三角研究院湖州
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1