一种基于主动学习和聚类分析的高光谱图像分类方法技术

技术编号:20273442 阅读:31 留言:0更新日期:2019-02-02 03:59
本发明专利技术公开了一种基于主动学习和聚类分析的高光谱图像分类方法。使用了一种高效的特征提取方法结合改进的多项逻辑回归算法,对高光谱遥感数据的分类精度有了一定的提高。而在此基础上加入的主动学习和聚类分析,主动选择信息量较高的样本作为标记样本,显著减少了训练器所需要的样本,提高了训练器的分类精度,大幅提高了分类器的分类效率,提高了算法的高效性;适用于高光谱图像的分类,与其他主动学习的分类算法相比,更加高效,分类精度有显著的提高,同时也显著减少了所需的样本数。

【技术实现步骤摘要】
一种基于主动学习和聚类分析的高光谱图像分类方法
本专利技术是一种涉及主动学习和聚类分析的高光谱图像分类方法。
技术介绍
最近研究表明,为了提高高光谱遥感数据的分类精度,结合高光谱遥感数据的光谱特征和空间特征的提取方法可以取得较好的效果。然而由于高光谱遥感数据的维度高,冗余信息多,有效提取特征存在一定的难度。属性剖面是一种用于提取空间特征的方法,基于属性形态学,使用一系列属性滤波器对数据的特征进行级联,从而获得遥感数据的结构信息。主动学习方法是从未标记样本集中选择信息量最多的样本的一种迭代过程。同时,均值漂移法是一种无监督的聚类方法,旨在寻找到密度最聚集的中心点。将两种方法相结合,并通过一定的筛选策略选择少部分样本加入训练器,可以得到不确定性和代表性兼具的信息量较多的样本。这种策略与随机选择样本相比,可以使用更少的样本达到更高的训练精度,与传统的半监督方法相比,更加高效。由于高光谱遥感数据的标记样本成本代价较大,因此研究主动学习方法和聚类方法来应对小样本分类问题有着重要的指导意义。因此,研究一种基于主动学习和聚类分析的高光谱图像分类方法,尤其是适用于小样本分类问题的方法尤为重要。
技术实现思路
本专利技术的目的在于提供一种基于主动学习和空间-光谱特征提取的高光谱图像分类方法,以克服现有技术中心的上述技术问题本专利技术的技术方案是这样实现的:使用混合像元分解和主成分分析方法对高光谱数据进行预处理去躁和降维,使用扩展多属性剖面方法提取高光谱图像的空间信息和光谱信息;选取少量样本标记作为训练样本,使用与子空间投影方法相结合的多项式逻辑回归分类器对样本进行训练,获得各个像素的类别概率;使用不连续松弛策略对训练结果进行后处理,得到分类结果;使用基于后验概率的主动学习方法对未标记的样本进行不确定性估计,选取部分不确定性较高的样本,再使用均值漂移法对样本进行再筛选,去除掉冗余的样本,保证选取样本的多样性,最终选择不确定性和代表性均较高的样本加入到训练集;使用更新后的训练集重新训练分类器并测试得到结果,如果精度达到要求则停止训练,如果精度没达到要求则回到上一步继续标记样本。此外,一种基于主动学习和聚类分析的高光谱图像分类方法,还包括:在特征提取阶段,将一系列属性过滤器应用于图像来获取像素的连通分支,并通过连接操作符来处理不同灰度级的邻接区域,再通过施加一系列属性减弱或者属性增强操作来得到属性剖面。另外,一种基于主动学习和聚类分析的高光谱图像分类方法,还包括:使用的分类器将基于马尔科夫随机场的多层次逻辑先验知识与基于子空间的多项逻辑回归算法相结合,并使用不连续松弛策略在逻辑上平滑结果,同时保持从数据中提取的不连续性。另外,一种基于主动学习和空间-光谱特征提取的高光谱图像分类方法,还包括:选取每个样本的后验概率最大的两项的差值作为衡量样本不确定性的标准,使用均值漂移法衡量样本的代表性,去除掉聚集过于紧密的冗余点,多次筛选后选择不确定性和代表性均较高的样本加入训练集。本专利技术的有益效果:基于主动学习和聚类分析的高光谱图像分类方法,使用了一种高效的特征提取方法结合改进的多项逻辑回归算法,对高光谱遥感数据的分类精度有了一定的提高。而在此基础上加入的主动学习和聚类分析,主动选择信息量较高的样本作为标记样本,显著减少了训练器所需要的样本,提高了训练器的分类精度,大幅提高了分类器的分类效率,提高了算法的高效性。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是根据本专利技术实施例的一种基于主动学习和聚类分析的高光谱图像分类方法的流程示意图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员所获得的所有其他实施例,都属于本专利技术保护的范围。根据本专利技术的实施例,提供了一种基于主动学习和聚类分析的高光谱图像分类方法。如图1所示,根据本专利技术实施例的基于主动学习和聚类分析的高光谱图像分类方法包括以下步骤:步骤S101、使用混合像元分解方法和主成分分析方法对高光谱数据进行预处理去躁和降维,使用扩展多属性剖面方法提取高光谱图像的空间信息和光谱信息;步骤S103、选取少量样本标记作为训练样本,使用与子空间投影方法相结合的多项式逻辑回归分类器对样本进行训练,获得各个像素的类别概率;步骤S105、使用不连续松弛策略对训练结果进行后处理,得到分类结果;步骤S107、使用均值漂移法和基于后验概率的主动学习方法对未标记的样本进行代表性和不确定性估计,选择前几个样本进行标记并加入测试集;步骤S109、使用更新后的训练集重新训练分类器并测试得到结果,如果精度达到要求则停止训练,如果精度没达到要求则回到上一步继续标记样本。此外,一种基于主动学习和聚类分析的高光谱图像分类方法,还包括:在特征提取阶段,将一系列属性过滤器应用于图像来获取像素的连通分支,并通过连接操作符来处理不同灰度级的邻接区域,再通过施加一系列属性减弱或者属性增强操作来得到属性剖面。另外,一种基于主动学习和聚类分析的高光谱图像分类方法,还包括:使用的分类器将基于马尔科夫随机场的多层次逻辑先验知识与基于子空间的多项逻辑回归算法相结合,并使用不连续松弛策略在逻辑上平滑结果,同时保持从数据中提取的不连续性。另外,一种基于主动学习和空间-光谱特征提取的高光谱图像分类方法,还包括:选取每个样本的后验概率最大的两项的差值作为衡量样本不确定性的标准,使用均值漂移法衡量样本的代表性,去除掉聚集过于紧密的冗余点,多次筛选后选择不确定性和代表性均较高的样本加入训练集。为了方便理解本专利技术的上述技术方案,以下通过具体原理对本专利技术的上述技术方案进行详细说明。具体使用时:1)特征提取:扩展多属性剖面数学形态学是遥感影像空间信息分析的一个强大的框架,尤其是应用属性剖面生成遥感数据分类图。其基本思想是使用不同的属性滤波器对数据进行滤波来提取数据的结构信息,并对不同的属性滤波结果进行叠加合并等处理,得到数据的空间几何特征。扩展多属性剖面执行滤波时是对于一个给定的属性A如何计算图像f中每个连通分支的相关值λ的评估。对于图像中的一个区域Ci,如果属性满足条件(比如A(Ci)>λ),则区域保持不变。否则,设置为具有更接近值的相邻区域的灰度值,从而合并Ci到一个周围的连通分支。当该区域合并到一个更低(或更高)的灰度级的邻接区域时,执行操作是减弱(或增强)。给定有序的阈值{λ1,λ2,…,,λn},通过施加一系列属性减弱或者属性增强操作可以得到一个属性剖面:AP(f):={φn(f),...,φ1(f),f,γ1(f),...γn(f)}在这里φi和γi分别表示增强和减弱的转换。该公式针对的是数据的单个特征(或光谱波段)。对于高光谱数据而已,需要对整个原始数据进行属性滤波。然而高光谱数据维度很高,在原始谱带上构建扩展属性剖面的计算复杂度将会很高,因此首先使用主成分分析方法将原始数据降维,选取前几个主成分(或者本文档来自技高网...

【技术保护点】
1.一种基于主动学习和聚类分析的高光谱图像分类方法,其特征在于,包括以下步骤:使用混合像元分解和主成分分析方法对高光谱数据进行预处理去躁和降维,使用扩展多属性剖面方法提取高光谱图像的空间信息和光谱信息;选取少量样本标记作为训练样本,使用与子空间投影方法相结合的多项式逻辑回归分类器对样本进行训练,获得各个像素的类别概率;使用不连续松弛策略对训练结果进行后处理,得到分类结果;使用基于后验概率的主动学习方法对未标记的样本进行不确定性估计,选取部分不确定性较高的样本,再使用均值漂移法对样本进行再筛选,去除掉冗余的样本,保证选取样本的多样性,最终选择不确定性和代表性均较高的样本加入到训练集;使用更新后的训练集重新训练分类器并测试得到结果,如果精度达到要求则停止训练,如果精度没达到要求则回到上一步继续标记样本。

【技术特征摘要】
1.一种基于主动学习和聚类分析的高光谱图像分类方法,其特征在于,包括以下步骤:使用混合像元分解和主成分分析方法对高光谱数据进行预处理去躁和降维,使用扩展多属性剖面方法提取高光谱图像的空间信息和光谱信息;选取少量样本标记作为训练样本,使用与子空间投影方法相结合的多项式逻辑回归分类器对样本进行训练,获得各个像素的类别概率;使用不连续松弛策略对训练结果进行后处理,得到分类结果;使用基于后验概率的主动学习方法对未标记的样本进行不确定性估计,选取部分不确定性较高的样本,再使用均值漂移法对样本进行再筛选,去除掉冗余的样本,保证选取样本的多样性,最终选择不确定性和代表性均较高的样本加入到训练集;使用更新后的训练集重新训练分类器并测试得到结果,如果精度达到要求则停止训练,如果精度没达到要求则回到上一步继续标记样本。2.根据权利要求1所述的一种基于主动学习和聚类分析的...

【专利技术属性】
技术研发人员:刘鹏王力哲舒雯
申请(专利权)人:中国科学院遥感与数字地球研究所
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1