一种遥感图像长尾分布目标半监督检测方法技术

技术编号:39275959 阅读:17 留言:0更新日期:2023-11-07 10:52
本发明专利技术公开了一种遥感图像长尾分布目标半监督检测方法,包括:将教师

【技术实现步骤摘要】
一种遥感图像长尾分布目标半监督检测方法


[0001]本专利技术涉及数字图像处理
,特别涉及一种基于主动学习的半监督遥感图像长尾目标检测方法。

技术介绍

[0002]半监督目标检测是计算机视觉领域的一项研究课题,旨在通过结合有标注和无标注数据来提高目标检测的性能。在传统的目标检测算法中,有监督方法需要大量的有标注数据进行训练,但是获取有标注数据的成本很高,而且标注数据往往存在不准确、不完整等问题,这限制了算法的性能和应用范围。
[0003]半监督学习的方法结合有标注数据和无标注数据来训练模型。具体而言,通过利用少量的有标注数据进行监督学习,结合大量的无标注数据进行自监督学习,从而提高目标检测的性能。无标注数据可以是从互联网上下载的图片或视频,也可以是从其他应用场景中获取的数据。通过半监督学习的方法,可以有效地利用有限的有标注数据和大量的无标注数据,从而提高目标检测的性能和可靠性。
[0004]但是,在遥感图像目标检测任务中,经常会出现一些类别的样本数目较少,而另一些类别的样本数目较多的情况,这就形成了长尾分布。由于模型在训练过程中更容易学习到出现频率较高的类别,而忽略掉出现频率较低的类别,因此长尾分布会对模型的性能造成较大的影响。
[0005]传统算法如SVM等,基于图像特征对目标进行检测,需要手动筛选特征,工作量大,而且难以解决类别不平衡的长尾分布问题。基于深度学习的遥感图像目标检测技术大多是先通过深度卷积网络(CNN)对图像特征进行提取,然后对生成的特征图进行前景区域与背景区域的分离,对得到的前景区域进行分类与目标检测框的回归,最后得到目标检测结果。但这种方法对于样本中一些类别数目较少,而另一些类别数目较多的长尾分布问题的处理效果很差。因为,模型在训练过程中更容易学习到出现频率较高的类别,而忽略掉出现频率较低的类别。这使得模型学习到了很多偏置信息,从而影响了网络的检测精度。此外,遥感图像中有些图像背景复杂,目标种类多,数目多,分布密集,而另一些数目少,分布稀疏,也就是样本的难易程度存在较大差异。这对半监督目标检测的监督样本的筛选也提出了很高的要求,而传统的半监督目标检测也忽略了这一特点,检测结果往往不尽如人意。并且传统的随机筛选可能漏掉大量有价值的样本导致模型学习到的知识不够。
[0006]因此,如何提供一种针对遥感图像长尾分布目标,能够提高遥感图像目标检测的性能的半监督检测方法是本领域技术人员亟待解决的技术问题。

技术实现思路

[0007]本专利技术针对上述研究现状和存在的问题,提供了一种遥感图像长尾分布目标半监督检测方法,通过将师生学习网络框架扩展为一个基于主动学习的迭代框架,提高伪标签生成的质量;通过使用平衡类别数据集调整分类器,缓解遥感数据集中类别不平衡的问题。
[0008]本专利技术提供的一种遥感图像长尾分布目标半监督检测方法,包括如下步骤:
[0009]S1:教师

学生学习模型的构建:从遥感图像公共数据集中筛选有标注数据,使用有标注数据训练基准目标检测器,采用两阶段训练策略优化基准目标检测器训练过程:
[0010]使用长尾数据集中头部类别有标注数据训练基准目标检测器的特征提取部分,并固定特征提取部分的网络参数,得到一阶段基准目标检测器;
[0011]针对长尾数据集中所有类别平均提取给定数量个有标注数据样本,得到平衡类别数据集,使用平衡类别数据集训练一阶段基准目标检测器的分类回归部分,得到优化后的基准目标检测器,教师模型和学生模型均采用优化后的基准目标检测器网络结构;
[0012]S2:教师模型的主动采样:从公共数据集中筛选无标注数据,教师模型根据设定的度量指标对所述无标注数据进行主动采样,对符合所述度量指标要求的无标注数据进行人工标注,得到新标注数据,将新标注数据与S1筛选的有标注数据合并,对于遥感图像公共数据集中其余的无标注数据进行预测,产生伪标签,预测结果为伪标签数据;
[0013]S3:学生模型的半监督学习:使用遥感图像公共数据集中的有标注数据和伪标签数据共同训练学生模型;
[0014]S4:伪标签筛选:学生模型的当前训练轮次结束后,根据学生模型对无标注数据进行预测产生的检测的标注类别和伪标签的标签类别的相似度,对所述伪标签进行筛选,筛选的所述伪标签数据参与下一轮次的训练;
[0015]S5:迭代训练:重复S2

S4,直到达到预设的训练轮次或者教师

学生学习模型训练性能满足预设值要求为止。
[0016]优选的,所述两阶段训练策略具体包括:
[0017]使用长尾数据集中样本数量满足要求的头部类别的有标注数据训练基准目标检测器的特征提取部分,并固定特征提取部分的网络参数,得到一阶段基准目标检测器;
[0018]以长尾数据集中样本数量最少的尾部类别的有标注数据的数量N为准,针对长尾数据集中所有类别的有标注数据均提取N个,N≥1,得到平衡类别数据集,使用平衡类别数据集训练一阶段基准目标检测器的分类回归部分,得到优化后的基准目标检测器。
[0019]优选的,所述S2中设定的度量指标包括:困难度指标、信息量指标和多样性指标,并以L1范式对三个指标进行联合,得到所述度量指标。
[0020]优选的,所述S2还包括:设置一个阈值,教师模型对符合所述度量指标要求的无标注数据进行预测,得到预测框,所述预测框的置信度高于所述阈值时,确定为正样本,并产生伪标签。
[0021]优选的,所述S2还包括:对筛选的无标注数据人工标注后,将筛选的无标注数据从所述长尾数据集中移除并加入到遥感图像公共数据集中的有标记数据中的步骤。
[0022]优选的,所述S4包括:
[0023]学生模型的当前训练轮次结束后,对无标注数据进行预测产生检测框一,学生模型对有标注数据进行预测产生检测框二;
[0024]将与所述检测框一满足相似度要求的伪标签进行保留,相应的伪标签数据参与学生模型下一轮次的训练;
[0025]无监督损失函数为学生模型与伪标签数据产生的损失函数,有监督损失函数为学生模型与有标注数据产生的损失函数;通过反向传播算法,将损失值从输出层向输入层传
播,计算学生模型每个参数对损失的贡献度,并更新学生模型参数值。
[0026]优选的,所述S5包括:
[0027]重复S2

S4,直到达到预设的训练轮次或者学生模型的性能指标满足预设值要求为止。
[0028]优选的,所述S4还包括:
[0029]判断学生模型对无标注数据进行预测产生的检测框一与相应的所述伪标签的相似度是否满足要求;
[0030]若是,则所述伪标签数据参与下一轮次的训练;
[0031]若否,则确定所述伪标签为噪声标签,并将所述噪声标签对应的数据从训练数据中移除。
[0032]优选的,所述S1中筛选的有标注数据和所述S2中筛选的无标注数据为将所述遥感图像随机切分为设定比例的小图像,并设置所述本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种遥感图像长尾分布目标半监督检测方法,其特征在于:包括如下步骤:S1:教师

学生学习模型的构建:从遥感图像公共数据集中筛选有标注数据,使用有标注数据训练基准目标检测器,采用两阶段训练策略优化基准目标检测器训练过程:使用长尾数据集中头部类别有标注数据训练基准目标检测器的特征提取部分,并固定特征提取部分的网络参数,得到一阶段基准目标检测器;针对长尾数据集中所有类别平均提取给定数量个有标注数据样本,得到平衡类别数据集,使用平衡类别数据集训练一阶段基准目标检测器的分类回归部分,得到优化后的基准目标检测器,教师模型和学生模型均采用优化后的基准目标检测器网络结构;S2:教师模型的主动采样:从遥感图像公共数据集中筛选无标注数据,教师模型根据设定的度量指标对所述无标注数据进行主动采样,对符合所述度量指标要求的无标注数据进行人工标注,得到新标注数据,将新标注数据与S1筛选的有标注数据合并,对遥感图像公共数据集中其余的无标注数据进行预测,产生伪标签,预测结果为伪标签数据;S3:学生模型的半监督学习:使用遥感图像公共数据集中的有标注数据和伪标签数据共同训练学生模型;S4:伪标签筛选:学生模型的当前训练轮次结束后,根据学生模型对无标注数据进行预测产生的检测框一检测的标注类别和伪标签的标签类别的相似度,对所述伪标签进行筛选,筛选的所述伪标签数据参与下一轮次的训练;S5:迭代训练:重复S2

S4,直到达到预设的训练轮次或者教师

学生学习模型训练性能满足预设值要求为止。2.根据权利要求1所述的一种遥感图像长尾分布目标半监督检测方法,其特征在于,所述两阶段训练策略具体包括:使用长尾数据集中样本数量满足要求的头部类别的有标注数据训练基准目标检测器的特征提取部分,并固定特征提取部分的网络参数,得到一阶段基准目标检测器;以长尾数据集中样本数量最少的尾部类别的有标注数据的数量N为准,针对长尾数据集中所有类别的有标注数据均提取N个,N≥1,得到平衡类别数据集,使用平衡类别数据集训练一阶段基准目标检测器的分类回归部分,得到优化后的基准目标检测器。3.根据权利要求1所述的一种遥感图像长尾分布目标半监督检测方法,其特征在于,所述S2中设定的度量指标包括:困难度指标、信息量指标和多样性指...

【专利技术属性】
技术研发人员:张浩鹏姚黎帆王毓浩张信耶宋佳芸张芳芳
申请(专利权)人:北京航空航天大学青岛研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1