一种基于监督最小化深度学习模型的SAR目标识别方法技术

技术编号:30275334 阅读:20 留言:0更新日期:2021-10-09 21:35
本发明专利技术公开了一种监督最小化深度学习模型的SAR目标识别方法。该方法的主要流程:首先从训练样本集中随机抽取样本并做类别标注,利用数据增强技术对标签样本进行数据扩增,得到初始训练样本集;然后构建贝叶斯卷积神经网络分类模型,即在浅层卷积神经网络的每一个卷积层和全连接层后部署dropout层;接着,采用双重损失函数,利用初始训练样本集训练贝叶斯卷积神经网络分类模型;最后,使用一种新的样本选择策略从无标签样本集中筛选并标注新样本,将新标注的样本与原有的标记样本一同用于训练贝叶斯卷积神经网络分类模型,达到一定的迭代次数后终止训练。通过在MSTAR数据集上进行仿真实验,证明了本发明专利技术中的方法可以用较少的标记样本逐步学习一个稳健的深度分类模型。记样本逐步学习一个稳健的深度分类模型。

【技术实现步骤摘要】
一种基于监督最小化深度学习模型的SAR目标识别方法


[0001]本专利技术应用于合成孔径雷达(synthetic aperture radar,SAR)自动目标识别领域,特别涉及一种SAR自动目标识别的方法。

技术介绍

[0002]近年来,深度学习在SAR自动目标识别上得到广泛应用。相比于传统的两阶段自动目标识别技术,基于深度学习的自动目标识别模型能够在短时间内准确检测出成像场景中潜在目标区域、并以端到端的方式完成目标特征提取和目标型号鉴别。由于基于深度学习的自动目标识别模型具有强大的特征表征能力,其在公开的MSTAR基准数据集上的识别性能远优于传统自动目标识别算法。然而,标注大量训练样本是训练深度分类模型的首要任务。众所周知,采集大量SAR图像是非常困难甚至在多数情况下是不可能实现的。另外,不同于光学与红外图像,SAR图像特征的非直观性给图像解译带来重大挑战。因此,SAR图像标注成为一项耗时耗力的工程。主动学习能够在较低的样本标注代价下获得高精度的分类模型,但通过深度学习与主动学习来实现稳健的SAR目标识别存在两方面不足。一方面,在标注标本数较少的初始阶段,深度学习模型不能稳健地学习且容易出现过拟合现象;另一方面,仅通过主动学习来标注样本仍是代价昂贵的。结合以上情况,本文提出了一种基于监督最小化深度学习模型的SAR目标识别方法,它能够在较少的标记样本情况下迭代学习一个鲁棒的分类模型。

技术实现思路

[0003]本专利技术针对上述深度学习在SAR目标识别中的不足以及综合考虑样本识别代价,提出一种基于监督最小化深度学习方法用于实现SAR自动目标识别。
[0004]本专利技术为解决上述技术问题所采用的技术方案为:在模型训练初期,手工标注少量SAR图像,并使用常见的数据扩增技术(翻转、平移、反转)进行数据扩增;考虑到扩增后的有标签SAR图像数量仍然较少,卷积神经网络模型无法稳健地学习且容易过拟合;为此,将贝叶斯推理引入到卷积神经网络的参数优化过程,并首先利用扩增后有标签的SAR图像训练一个初始的分类模型。考虑到这个初始分类模型的泛化能力有限且剩余未标注的大量SAR图像中含有更多鉴别信息;因此,提出一种低成本的样本选择策略来标注未标记的SAR图像。具体来说,通过主动学习策略从未标记样本池中选择当前模型无法判别的低置信度样本并做人工标注,通过自步长学习策略从未标记样本池中选择当前模型判别代价较小的高置信度样本并完成自动标注。然后,将这些新标注的SAR图像与原始有标签的SAR图像混合形成新的训练集并做数据扩增;最后利用扩增后的数据集来迭代训练当前的分类模型,当模型达到一定的识别精度或者达到样本的采样次数上限,终止模型训练。在训练过程中,为了提取更鉴别的特征,采用一个双重损失函数来训练模型参数。因而本专利技术技术方案为一种基于监督最小化深度学习模型的SAR目标识别方法,该方法步骤如下:
[0005]步骤1:从采集的SAR图像数据集中随机采样少量样本并标注;
[0006]步骤2:考虑到较少的标注样本无法实现稳健的深度模型训练,采用平移,旋转和反转的方法对有标签样本进行数据扩增,将扩增后的样本作为初始训练样本集;
[0007]步骤3:设计浅层的卷积神经网络分类模型,将贝叶斯推理引入到网络参数优化过程来缓解因训练样本不足而导致模型产生过拟合的现象;
[0008]步骤4:利用步骤2中得到的初始训练样本集,对步骤3中得到的分类模型进行训练;
[0009]步骤4.1:采用一种双重损失函数来训练模型,损失函数定义如下:
[0010]L=L
S
+γL
c
[0011]其中,L
s
表示softmax损失函数,γ表示为平衡softmax损失与中心损失函数的权重超参数,L
c
是中心损失函数;
[0012]步骤4.2:采用带动量的随机梯度下降算法来优化分类模型;
[0013]步骤4.3:利用初始标记的训练样本集训练初始分类模型;
[0014]步骤5:从未标记的SAR图像中进行采样并作样本标注,将新标注的样本与初始标注样本混合后用于模型训练;
[0015]步骤5.1:通过主动学习从大量未标记SAR图像数据集中选择当前分类模型无法判别的低置信度样本,并人工完成标注;
[0016]步骤5.2:通过自步长学习从未标记的样本集中选择当前模型判别代价最小的高置信度样本,并依据当前分类模型做伪标注;
[0017]步骤5.3:将人工标记样本,伪标记样本以及初始标记样本混合后进行数据扩增,扩增后的数据作为新的训练集再次训练和更新分类模型参数;循环步骤5,判断迭代次数是否等于设定次数,若是,结束训练,否则,继续迭代;
[0018]步骤6:捕获SAR目标图像,利用上述步骤学习到的分类模型进行目标身份鉴别。
[0019]进一步的,所述步骤3中神经网络的中心损失函数被考虑作为模型优化的损失函数,定义为:
[0020][0021]其中,m是批量大小,代表从x样本中提取的特征,y
i
是x样本对应的类标识,表示类标识y
i
对应的类中心。
[0022]进一步的,所述步骤5.1中选择BvSB方法作为主动学习策略,其样本选取的数学模型为:
[0023][0024]其中,p
f
(x
i
)表示样本x
i
的最高分类概率,p
s
(x
i
)表示样本x
i
的第二高的分类概率;在BvSB中,最高分类概率与第二高分类概率差值最小的样本被选择进行标注。
[0025]本专利技术步骤5.2中的伪标记与步骤5.1中的主动标记协同完成样本的标注。通过这种协同标记过程,从大量的无标签样本集中挖掘出有利于优化当前深度分类模型的更多训练样本。另外,步骤5.2中的伪标记过程可以协同步骤5.1中主动标记来标记更多样本,可缓解步骤5.1中主动标记的标记成本。本专利技术由于将贝叶斯推理思想引入到卷积神经网络的
参数优化过程中,可以实现在标注样本较少的情况下迭代学习一个鲁棒的分类模型。另外,本专利技术设计了一种低成本的样本采样策略,这在很大程度上降低了样本标注成本。同时,为了学习更鉴别的分类特征,设计了一种双重损失函数。
附图说明
[0026]图1是本专利技术的实现流程图;
[0027]图2是在每一轮学习过程中高置信度样本伪标签的平均错误率。
具体实施方式
[0028]以下将针对本文的
技术实现思路
结合附图和具体实施例进行详细阐述,以便于更好地体现出本专利技术的技术要点。本专利技术是一种基于监督最小化深度学习模型的SAR目标识别方法,实施步骤流程如图1所示,各步骤具体按照以下方式实施:
[0029]步骤1:采集SAR目标训练集,从训练集中随机抽取样本并做类别标注;
[0030]步骤1.1:本实施例使用MSTAR基准数据集中俯仰角为15度及17度的十类地面车辆目标。在实验中本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于监督最小化深度学习模型的SAR目标识别方法,该方法步骤如下:步骤1:从采集的SAR图像数据集中随机采样少量样本并标注;步骤2:考虑到较少的标注样本无法实现稳健的深度模型训练,采用平移,旋转和反转的方法对有标签样本进行数据扩增,将扩增后的样本作为初始训练样本集;步骤3:设计浅层的卷积神经网络分类模型,将贝叶斯推理引入到网络参数优化过程来缓解因训练样本不足而导致模型产生过拟合的现象;步骤4:利用步骤2中得到的初始训练样本集,对步骤3中得到的分类模型进行训练;步骤4.1:采用一种双重损失函数来训练模型,损失函数定义如下:L=L
S
+γL
c
其中,L
s
表示softmax损失函数,γ表示为平衡softmax损失与中心损失函数的权重超参数,L
c
是中心损失函数;步骤4.2:采用带动量的随机梯度下降算法来优化分类模型;步骤4.3:利用初始标记的训练样本集训练初始分类模型;步骤5:从未标记的SAR图像中进行采样并作样本标注,将新标注的样本与初始标注样本混合后用于模型训练;步骤5.1:通过主动学习从大量未标记SAR图像数据集中选择当前分类模型无法判别的低置信度样本,并人工完成标注;步骤5.2:通过自步长学习从未标记的样本集中选择当前模型判别代价最小的高置信度样本,并依据当前分类模型做伪标注;步骤5.3:将人工标记样本,伪标记样本以及初始标记样本混合后进行数据扩增,扩增后的数据作为新的训练集再次训练和更新分类模型参数;循环步骤5,判断迭代次数是否等于设定次数,若是,结束训...

【专利技术属性】
技术研发人员:于雪莲任浩浩陈智伶李相东周云
申请(专利权)人:电子科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1