一种改进主动深度学习的高光谱图像半监督分类方法及装置制造方法及图纸

技术编号:31085591 阅读:12 留言:0更新日期:2021-12-01 12:37
一种改进主动深度学习的高光谱图像半监督分类方法及装置,涉及遥感图像处理技术领域,用以解决现有高光谱图像分类方法中存在的小样本情况下人工标记花费时间过长且分类效果不佳的问题。本发明专利技术的技术要点包括:利用有标签样本训练卷积神经网络,并利用卷积神经网络对无标签样本进行类别概率预测;根据预测的类别概率,利用主动学习策略计算获得其中信息量最大的无标签样本;引入随机多图算法对无标签样本进行标记,在伪标签候选池中寻找信息量大的样本作为新样本,将新样本加入训练集,对卷积神经网络的分类模型不断进行微调。本发明专利技术在降低标记成本的同时可以提高模型在小样本数据集上的分类性能,可应用于标签样本稀缺的高光谱遥感图像分类之中。高光谱遥感图像分类之中。高光谱遥感图像分类之中。

【技术实现步骤摘要】
一种改进主动深度学习的高光谱图像半监督分类方法及装置


[0001]本专利技术涉及遥感图像处理
,具体涉及一种改进主动深度学习的高光谱图像半监督分类方法及装置。

技术介绍

[0002]在过去几十年,卫星遥感技术以宏观、全面、快速、动态和准确的优势,为研究地球资源、监测局部和区域环境变化和研究全球环境变化等提供了先进检测和研究手段。遥感数据中的高光谱图像可以捕获数百个连续窄带中观察到的每个像素光谱行为,为后续的信息提取提供了巨大的潜力。高光谱图像逐渐被应用在土地覆盖,森林资源和城市地区等许多方面。所有这些应用都需要每个高光谱像素向量的地物类别标签,因此,高光谱图像分类作为高光谱遥感中的基础和挑战性任务,逐渐成为遥感领域的热门研究方向。
[0003]利用深度学习模型进行分类需要大量的有标签样本训练分类模型,而这些标记样本不仅需要专家的先验知识进行标记,还耗费时间和成本,在实践中很难获取。为缓解这一问题,具有高标记效率的主动学习方法被提出并且成功应用于高光谱图像分类中。主动学习的主要思想是通过人机交互方式,人为地对少数未知样本进行标注,不仅达到扩展训练集的目的,还减少了标记样本的数量。虽然加入主动学习方法可以提高计算效率和分类精度,但主动学习是人机交互的循环过程,仍然存在少量人类专家标记样本的代价,存在时间和金钱上的消耗。

技术实现思路

[0004]针对上述现有分类方法存在的不足,本专利技术提出一种改进主动深度学习的高光谱图像半监督分类方法及装置,用以解决现有高光谱图像分类方法中存在的小样本情况下人工标记花费时间过长且分类效果不佳的问题。
[0005]根据本专利技术一方面,提出一种改进主动深度学习的高光谱图像半监督分类方法,该方法包括以下步骤:
[0006]步骤一、获取高光谱图像数据集,将所述高光谱图像数据集划分为训练样本集和测试样本集;其中,训练样本集包含有标签样本,测试样本集包含无标签样本;
[0007]步骤二、将训练样本集输入到卷积神经网络中,初始化卷积神经网络模型;
[0008]步骤三、将测试样本集输入到初始化后的卷积神经网络模型中,获得无标签样本的输出类别概率;
[0009]步骤四、根据所述输出类别概率,利用主动学习策略计算测试样本集中每一个无标签样本的信息量,并将信息量按照从大到小的顺序排序;
[0010]步骤五、根据训练样本集,利用随机多图算法对测试样本集中的无标签样本进行伪标注,获取带有伪标注的伪标签样本;
[0011]步骤六、根据步骤四计算得到的无标签样本的信息量,在带有伪标注的伪标签样本中查询,将超过预设信息量阈值的信息量所对应的伪标签样本标记为新样本;
[0012]步骤七、将所述新样本加入训练样本集,迭代循环执行步骤二至步骤六,直至达到预设最大迭代次数则停止迭代,保存最终训练好的卷积神经网络模型;
[0013]步骤八、将待分类高光谱图像数据输入到最终训练好的卷积神经网络模型中,获得分类结果。
[0014]进一步地,步骤四中所述主动学习策略包括基于概率启发式方法中的信息熵度量、最佳与第二最佳度量方法。
[0015]进一步地,利用信息熵度量方法计算测试样本集中每一个无标签样本的信息量的公式为:
[0016][0017]其中,z
i
表示样本;C表示样本类别总数。
[0018]进一步地,利用最佳与第二最佳度量方法计算测试样本集中每一个无标签样本的信息量的公式为:
[0019]BVSB(z
i
)=P
B
(z
i
)

P
SB
(z
i
)
[0020]其中,P
B
表示样本的最佳类别隶属概率;P
SB
表示样本的第二最佳类别隶属概率。
[0021]进一步地,步骤五中利用随机多图算法对测试样本集的无标签样本进行伪标注的具体过程包括:
[0022]步骤五一、对训练样本集和测试样本集进行PCA降维;
[0023]步骤五二、利用局部二值模式改进后的等值模式提取训练样本集和测试样本集的光谱波段空间信息,获得训练样本集和测试样本集的空间特征向量;
[0024]步骤五三、分别将训练样本集和测试样本集的原始高光谱图像数据和其对应的空间特征向量进行结合,获得所有样本点;利用所有样本点构建随机多图,并对其进行学习,根据学习获得的标签预测函数得到无标签样本的伪标签;所述随机多图为加权图,所述加权图的顶点由样本点组成,边表示权重矩阵,权重大则表示相邻两个顶点具有相同的标签。
[0025]进一步地,步骤五二中所述局部二值模式改进后的等值模式是指当局部二值模式所对应的循环二进制数从0到1或从1到0、最多有两次跳变时,该局部二值模式所对应的二进制就成为一个等价模式;步骤五二的具体过程包括:
[0026]首先,将降维后的每个有标签或无标签样本进行区域划分,计算每个局部区域的LBP码;其中,每个局部区域的中心像素点表示为t
c
,其所属局部区域内的p个相邻像素由以中心像素点t
c
为圆心,半径为r的圆生成,则中心像素点t
c
的LBP码表示为:
[0027][0028]其中,U是符号函数,以该中心像素点自身为阈值,若其相邻像素值大于或等于阈值,将该相邻像素点的位置标为“1”,即U(t
i

t
c
)=1;若小于阈值,将其位置标为“0”,即U(t
i

t
c
)=0;
[0029]最后,计算每个局部区域的直方图,并将统计直方图连接成一个特征向量,即获得空间特征向量。
[0030]进一步地,步骤五三中利用锚图算法构建加权图并对其进行学习,锚图算法使标签预测函数成为锚点样本子集上标签的加权平均,具体过程包括:
[0031]首先,对所有样本点进行聚类,获得多个聚类中心,选择m个聚类中心作为锚点,每个锚点用a
j
表示;
[0032]然后,标签预测函数表达式为:
[0033][0034]其中,f=[f(x1),f(x2),...,f(x
N
)]T
表示无标签样本的标签预测值;F
A
=[F(a1),F(a2),...,F(a
m
)]T
表示每个锚点的标签值;P
ij
∈R
N
×
m
表示待学习的数据

锚点映射矩阵;N表示样本的像素总数;
[0035]对上述标签预测函数表达式中每个锚点的标签值F
A
和待学习的数据

锚点映射矩阵P
ij
分别求解,利用高斯定义求解待学习的数据

锚点映射矩阵:
[0036][0037]其中,K
σ<本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种改进主动深度学习的高光谱图像半监督分类方法,其特征在于,包括以下步骤:步骤一、获取高光谱图像数据集,将所述高光谱图像数据集划分为训练样本集和测试样本集;其中,训练样本集包含有标签样本,测试样本集包含无标签样本;步骤二、将训练样本集输入到卷积神经网络中,初始化卷积神经网络模型;步骤三、将测试样本集输入到初始化后的卷积神经网络模型中,获得无标签样本的输出类别概率;步骤四、根据所述输出类别概率,利用主动学习策略计算测试样本集中每一个无标签样本的信息量,并将信息量按照从大到小的顺序排序;步骤五、根据训练样本集,利用随机多图算法对测试样本集中的无标签样本进行伪标注,获取带有伪标注的伪标签样本;步骤六、根据步骤四计算得到的无标签样本的信息量,在带有伪标注的伪标签样本中查询,将超过预设信息量阈值的信息量所对应的伪标签样本标记为新样本;步骤七、将所述新样本加入训练样本集,迭代循环执行步骤二至步骤六,直至达到预设最大迭代次数则停止迭代,保存最终训练好的卷积神经网络模型;步骤八、将待分类高光谱图像数据输入到最终训练好的卷积神经网络模型中,获得分类结果。2.根据权利要求1所述的一种改进主动深度学习的高光谱图像半监督分类方法,其特征在于,步骤四中所述主动学习策略包括基于概率启发式方法中的信息熵度量、最佳与第二最佳度量方法。3.根据权利要求2所述的一种改进主动深度学习的高光谱图像半监督分类方法,其特征在于,利用信息熵度量方法计算测试样本集中每一个无标签样本的信息量的公式为:其中,z
i
表示样本;C表示样本类别总数。4.根据权利要求3所述的一种改进主动深度学习的高光谱图像半监督分类方法,其特征在于,利用最佳与第二最佳度量方法计算测试样本集中每一个无标签样本的信息量的公式为:BVSB(z
i
)=P
B
(z
i
)

P
SB
(z
i
)其中,P
B
表示样本的最佳类别隶属概率;P
SB
表示样本的第二最佳类别隶属概率。5.根据权利要求4所述的一种改进主动深度学习的高光谱图像半监督分类方法,其特征在于,步骤五中利用随机多图算法对测试样本集的无标签样本进行伪标注的具体过程包括:步骤五一、对训练样本集和测试样本集进行PCA降维;步骤五二、利用局部二值模式改进后的等值模式提取训练样本集和测试样本集的光谱波段空间信息,获得训练样本集和测试样本集的空间特征向量;步骤五三、分别将训练样本集和测试样本集的原始高光谱图像数据和其对应的空间特征向量进行结合,获得所有样本点;利用所有样本点构建随机多图,并对其进行学习,根据学习获得的标签预测函数得到无标签样本的伪标签;所述随机多图为加权图,所述加权图的顶点由样本点组成,边表示权重矩阵,权重大则表示相邻两个顶点具有相同的标签。
6.根据权利要求5所述的一种改进主动深度学习的高光谱图像半监督分类方法,其特征在于,步骤五二中所述局部二值模式改进后的等值模式是指当局部二值模式所对应的循环二进制数从0到1或从1到0、最多有两次跳变时,该局部二值模式所对应的二进制就成为一个等价模式;步骤五二的具体过程包括:首先,将降维后的每个有标签或无标签样本进行区域划分,计算每个局部区域的LBP码;其中,每个局部区域的中心像素点表示为t
c
,其所属局部区域内的p个相邻像素由以中心像素点t
c
为圆心,半径为r的圆生成,则中心像素点t
c
的LBP码表示为:其中,U是符号函数,以该中心像素点自身为阈值,若其相邻像素值大于或等于阈值,将该相邻像素点的位置标为“1”,即U(t
i

t
c
)=1;若小于阈值,将其位置标为“0”,即U(t
i

t
c
)=0;最后,计算每个局部区域的直方图,并将统计直方图连接成一个特征向量,即获得空间特征向量。7.根据权利要求6所述的一种改进主动深度学习的高光谱图像半监督分类方法,其特征在于,步骤五三中利用锚图算法构建加权图并对其进行学习,锚图算法使标签预测函数成为锚点样本子集上标签的加权平均,具体过程包括:首先,对所有样本点进行聚类,获得多个聚类中心,选择m个聚类中心作为锚点,每个锚点用a
j
表示;然后,标签预测函数表达式为:其中,f=[f(x1),f(x2),...,f(x
N
)]
T
表示无标签样本的标签预测值;F
A
=[F(a1),F(a2),...,F(a
m
)]
T
表示每个锚点的标签值;P
ij
∈R
N
×
m
表示待学习的数据

锚点映射矩阵;N表示样本的像素总数;对上述标签预测函数表达式中每个锚点的标签值F
A
和待学习的数据

锚点映射矩阵P
ij
分别求解;其中,利用高斯定义求解待学习的数据

锚点映射矩阵:其中,K
σ
(.)表示带宽为σ的高斯核函数;A<i>表示样本点x
i
的近邻锚点;u
j'
表示锚点a
j
的近邻点;根据待学习的数据

锚点映射矩阵P
ij
求解获得权重矩阵W:W=PΛ
‑1P
T
其中,对角矩阵并根据权重矩阵W计算获得每个锚点的标签值F
A
;将求解获得的每个锚点的标签值F
A
和待学习的数据

锚点映射矩阵P
ij
代入标签预测函数表达式中即...

【专利技术属性】
技术研发人员:王庆岩陈萌梁欣涛王玉静康守强
申请(专利权)人:哈尔滨理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1