一种基于主动学习的遥感图像场景分类方法技术

技术编号:34961020 阅读:18 留言:0更新日期:2022-09-17 12:40
本发明专利技术公开了一种基于主动学习的遥感图像场景分类方法,由以下步骤组成:从样本集人工随机地挑选出一批样本进行人工标记,标记后的样本为初始标记样本集D1,未标记的样本为未标记样本集U1,输入卷积神经网络进行特征提取得到标记样本特征图和未标记样本特征图,输入分支网络进行训练,利用查询策略从未标记样本集U1中选择一批样本进行人工标记,将标记后的样本添加到初始标记样本集D1中形成新标记样本集D2,重复直到未标记样本集U1全部被标记或者标记样本的数量达到初始标记样本集D1与未标记样本集U1和的20%;本发明专利技术使用经主动学习筛选出来的信息量丰富的样本进行场景分类,利用少的标记样本同样可以得到高的分类精度。用少的标记样本同样可以得到高的分类精度。用少的标记样本同样可以得到高的分类精度。

【技术实现步骤摘要】
一种基于主动学习的遥感图像场景分类方法


[0001]本专利技术属于遥感图像场景分类领域,尤其涉及一种基于主动学习的遥感图像场景分类方法。

技术介绍

[0002]遥感图像场景分类(remote sensing image scene classification)是指从一系列遥感图像中选择具有相似场景特征的图像,并为每幅选定的图像分配特定的场景类别标签来完成场景分类。目前,遥感图像场景分类在城市规划、环境监测、地面目标识别与检测、自然灾害损失评估土地资源管理等诸多应用中发挥着重要作用。
[0003]目前国际上常用的方法是基于深度特征学习的方法,使用深度体系结构的神经网络直接从原始图像中生成特征,然后再进行分类。事实上,基于深度特征学习的方法严重依赖于大规模样本,而构建大量标记样本的高成本在一定程度上限制了该类方法的发展。在常规的图像分类中,通常采用主动学习来减少对标记样本数目的需求,可显著降低成本。
[0004]目前,遥感图像场景分类方法主要是基于深度特征学习的方法,基于深度特征学习的方法严重依赖于大规模样本,而构建大量标记样本的高成本在一定程度上限制了该方法的发展。

技术实现思路

[0005]本专利技术的目的是提供一种基于主动学习的遥感图像场景分类方法,不依赖于大规模标记样本,且标记成本较低。
[0006]本专利技术采用以下技术方案:一种基于主动学习的遥感图像场景分类方法,由以下步骤组成:
[0007]步骤S1:从样本集人工随机地挑选出一批样本进行人工标记,标记后的样本为初始标记样本集D1,未标记的样本为未标记样本集U1,
[0008]步骤S2:将初始标记样本集D1和未标记样本集U1输入卷积神经网络进行特征提取,得到标记样本特征图和未标记样本特征图,
[0009]步骤S3:将标记样本特征图和未标记样本特征图输入分支网络进行训练,所述分支网络包括鉴别器和分类器,
[0010]将标记样本特征图输入分类器进行训练,将标记样本特征图和未标记样本特征图输入鉴别器进行训练,
[0011]所述分支网络的损失函数为:
[0012][0013]其中,L
Poly
‑1=

log(P
t
)+ε1(1

P
t
)
[0014]其中,Y为的标签,权重系数λ1和λ2的取值范围为[0,1],L
BCE
为鉴别器的损失函数,L
Poly
‑1为分类器的损失函数,P
t
是模型对目标真实类别的预测概率;
[0015]步骤S4:利用查询策略从未标记样本集U1中选择一批样本进行人工标记,将标记后的样本添加到初始标记样本集D1中形成新标记样本集D2,
[0016]步骤S5:重复步骤S2

步骤S4直到未标记样本集U1全部被标记或者标记样本的数量达到初始标记样本集D1与未标记样本集U1和的20%。
[0017]进一步地,其中,步骤S2中的卷积神经网络包括依次连接的第一卷积模块、第二残差网络、第三残差网络、第四残差网络、第五残差网络、全连接层,所述第一个卷积模块包括依次连接的卷积层和池化层,所述第二残差网络、第三残差网络、第四残差网络、第五残差网络均由依次连接的两个残差模块组成,每个残差模块包括两个卷积层。
[0018]进一步地,步骤S4中在选择样本形成新标记样本集D2时,选择方法为:
[0019]利用训练好的鉴别器从未标记样本集U1中挑选鉴别器鉴别是未标记样本概率最高的5k个样本,k为主动学习每轮挑选的样本数,然后利用KMeans聚类方法将这5k个样本聚成k类,选择离聚类中心点最近的k个样本进行标记,将标记后的样本添加到初始标记样本集D1中形成新的标记样本集D2。
[0020]本专利技术的有益效果是:本专利技术使用经主动学习筛选出来的信息量丰富的样本进行场景分类,利用少的标记样本同样可以得到高的分类精度,与现有方法相比,不需要大规模样本,从而显著降低样本数据集的标记成本。
附图说明
[0021]图1是本专利技术的流程图;
[0022]图2是本专利技术的原理示意图;
[0023]图3是SE

ResNet的结构图。
具体实施方式
[0024]下面结合附图和具体实施方式对本专利技术进行详细说明。
[0025]本专利技术公开了一种基于主动学习的遥感图像场景分类方法,假设遥感图像的尺寸为H


×
W

列,通道数为C

,本专利技术的流程图如图1所示,由以下步骤组成:
[0026]步骤S1:从样本集人工随机地挑选出一批样本进行人工标记,标记后的样本为初始标记样本集D1,未标记的样本为未标记样本集U1,
[0027]步骤S2:将初始标记样本集D1和未标记样本集U1输入卷积神经网络进行特征提取,得到标记样本特征图和未标记样本特征图,即将初始标记样本集D1输入卷积神经网络进行特征提取得到标记样本特征图,将未标记样本集U1输入卷积神经网络进行特征提取得到未标记样本特征图。
[0028]特征提取的过程可以表示为下式:
[0029][0030]其中,X为输入图像,X∈R
H
′×
W
′×
C

,F为卷积神经网络,为提取的特征图,H、W、C分别表示特征图的行、列和通道数。
[0031]步骤S2中的卷积神经网络包括依次连接的第一卷积模块、第二残差网络、第三残差网络、第四残差网络、第五残差网络、全连接层,所述第一个卷积模块包括依次连接的卷
积层和池化层,所述第二残差模块、第二残差网络、第三残差网络、第四残差网络、第五残差网络均由依次连接的两个残差模块组成,每个残差模块包括两个卷积层。
[0032]步骤S3:将标记样本特征图和未标记样本特征图输入分支网络进行训练,所述分支网络包括鉴别器和分类器,将标记样本特征图输入分类器进行训练,将标记样本特征图和未标记样本特征图输入鉴别器进行训练,分支网络的鉴别器和分类器是通过损失函数L
BCE
和L
Poly
‑1联合训练的。
[0033]所述分支网络的损失函数为:
[0034][0035]L
Poly
‑1=

log(P
t
)+ε1(1

P
t
)
ꢀꢀ
(3)
[0036]其中,Y为的标签,权重系数λ1和λ2的取值范围为[0,1],L
BCE
为鉴别器的损失函数,L
Poly
‑1为分类器的损失函数,P
t
是模型对目标真实类别的预测概率。
[0037]步骤S4:利用查询策略从未标记样本集U1中选择一批样本进行人工标记,将标记后的样本添加到初始本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于主动学习的遥感图像场景分类方法,其特征在于,由以下步骤组成:步骤S1:从样本集人工随机地挑选出一批样本进行人工标记,标记后的样本为初始标记样本集D1,未标记的样本为未标记样本集U1,步骤S2:将初始标记样本集D1和未标记样本集U1输入卷积神经网络进行特征提取,得到标记样本特征图和未标记样本特征图,步骤S3:将标记样本特征图和未标记样本特征图输入分支网络进行训练,所述分支网络包括鉴别器和分类器,将标记样本特征图输入分类器进行训练,将标记样本特征图和未标记样本特征图输入鉴别器进行训练,所述分支网络的损失函数为:其中,L
Poly
‑1=

log(P
t
)+∈1(1

P
t
)其中,Y为的标签,权重系数λ1和λ2的取值范围为[0,1],L
BCE
为鉴别器的损失函数,L
Poly
‑1为分类器的损失函数,P
t
是模型对目标真实类别的预测概率;步骤S4:利用查询策略从未标记样本集U1中选择一批样本进行...

【专利技术属性】
技术研发人员:李旭王飞月张一凡李立欣卫保国
申请(专利权)人:西北工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1