【技术实现步骤摘要】
一种遥感图像长尾分布目标半监督检测方法
[0001]本专利技术涉及数字图像处理
,特别涉及一种基于主动学习的半监督遥感图像长尾目标检测方法。
技术介绍
[0002]半监督目标检测是计算机视觉领域的一项研究课题,旨在通过结合有标注和无标注数据来提高目标检测的性能。在传统的目标检测算法中,有监督方法需要大量的有标注数据进行训练,但是获取有标注数据的成本很高,而且标注数据往往存在不准确、不完整等问题,这限制了算法的性能和应用范围。
[0003]半监督学习的方法结合有标注数据和无标注数据来训练模型。具体而言,通过利用少量的有标注数据进行监督学习,结合大量的无标注数据进行自监督学习,从而提高目标检测的性能。无标注数据可以是从互联网上下载的图片或视频,也可以是从其他应用场景中获取的数据。通过半监督学习的方法,可以有效地利用有限的有标注数据和大量的无标注数据,从而提高目标检测的性能和可靠性。
[0004]但是,在遥感图像目标检测任务中,经常会出现一些类别的样本数目较少,而另一些类别的样本数目较多的情况,这就形成了长尾分布。由于模型在训练过程中更容易学习到出现频率较高的类别,而忽略掉出现频率较低的类别,因此长尾分布会对模型的性能造成较大的影响。
[0005]传统算法如SVM等,基于图像特征对目标进行检测,需要手动筛选特征,工作量大,而且难以解决类别不平衡的长尾分布问题。基于深度学习的遥感图像目标检测技术大多是先通过深度卷积网络(CNN)对图像特征进行提取,然后对生成的特征图进行前景区域与背景区域的分离, ...
【技术保护点】
【技术特征摘要】
1.一种遥感图像长尾分布目标半监督检测方法,其特征在于:包括如下步骤:S1:教师
‑
学生学习模型的构建:从遥感图像公共数据集中筛选有标注数据,使用有标注数据训练基准目标检测器,采用两阶段训练策略优化基准目标检测器训练过程:使用长尾数据集中头部类别有标注数据训练基准目标检测器的特征提取部分,并固定特征提取部分的网络参数,得到一阶段基准目标检测器;针对长尾数据集中所有类别平均提取给定数量个有标注数据样本,得到平衡类别数据集,使用平衡类别数据集训练一阶段基准目标检测器的分类回归部分,得到优化后的基准目标检测器,教师模型和学生模型均采用优化后的基准目标检测器网络结构;S2:教师模型的主动采样:从遥感图像公共数据集中筛选无标注数据,教师模型根据设定的度量指标对所述无标注数据进行主动采样,对符合所述度量指标要求的无标注数据进行人工标注,得到新标注数据,将新标注数据与S1筛选的有标注数据合并,对遥感图像公共数据集中其余的无标注数据进行预测,产生伪标签,预测结果为伪标签数据;S3:学生模型的半监督学习:使用遥感图像公共数据集中的有标注数据和伪标签数据共同训练学生模型;S4:伪标签筛选:学生模型的当前训练轮次结束后,根据学生模型对无标注数据进行预测产生的检测框一检测的标注类别和伪标签的标签类别的相似度,对所述伪标签进行筛选,筛选的所述伪标签数据参与下一轮次的训练;S5:迭代训练:重复S2
‑
S4,直到达到预设的训练轮次或者教师
‑
学生学习模型训练性能满足预设值要求为止。2.根据权利要求1所述的一种遥感图像长尾分布目标半监督检测方法,其特征在于,所述两阶段训练策略具体包括:使用长尾数据集中样本数量满足要求的头部类别的有标注数据训练基准目标检测器的特征提取部分,并固定特征提取部分的网络参数,得到一阶段基准目标检测器;以长尾数据集中样本数量最少的尾部类别的有标注数据的数量N为准,针对长尾数据集中所有类别的有标注数据均提取N个,N≥1,得到平衡类别数据集,使用平衡类别数据集训练一阶段基准目标检测器的分类回归部分,得到优化后的基准目标检测器。3.根据权利要求1所述的一种遥感图像长尾分布目标半监督检测方法,其特征在于,所述S2中设定的度量指标包括:困难度指标、信息量指标和多样性指...
【专利技术属性】
技术研发人员:张浩鹏,姚黎帆,王毓浩,张信耶,宋佳芸,张芳芳,
申请(专利权)人:北京航空航天大学青岛研究院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。