遥感影像训练样本的自动选择方法技术

技术编号:36286001 阅读:55 留言:0更新日期:2023-01-13 09:57
本发明专利技术提供一种遥感影像训练样本的自动选择方法,该方法涉及遥感技术领域,所述方法包括:首先获取初始训练样本和目标域训练样本,然后构建样本选择框架,包括筛选策略、迁移学习算法、模型评估和筛选准则,通过样本选择框架对初始训练样本进行迭代迁移和筛选,得到多组最优迁移训练样本。本方法能够在少量标注当前训练样本的情况下,得到大量的训练样本数据,充分利用了前期影像的先验信息和知识,减少了人力物力的投入,并能较好的完成当前的遥感影像的分类任务。感影像的分类任务。感影像的分类任务。

【技术实现步骤摘要】
遥感影像训练样本的自动选择方法


[0001]本专利技术涉及遥感影像样本集选择领域,具体涉及一种遥感影像训练样本的自动选择方法。

技术介绍

[0002]在土地覆盖、土地分类和土地利用的应用中,遥感影像是非常重要的信息获取源,通常对遥感影像的解译的过程中,需要先利用充分的训练样本库训练一个预测模型,然后用预测模型对待检测遥感影像进行解译。因此训练样本的采集是非常重要的步骤。但针对新的遥感影像任务,往往之前得到的训练样本都是过期的,不能满足传统机器学习理论要求的同分布假设,这样进行预测学习的结果会不够准确。
[0003]而受到如大气吸收与散射、传感器标定、太阳高度角、方位角、物候时相、数据处理过程等多种因素的影像,卫星传感器获得的地物光谱数据常常会随着时间的变化而变化,这使得前期影像上采集的训练样本和当前新影像数据的光谱值并不能服从相同的概率统计分布,传统的分类算法将无法开展运用,此时需要重新标注大量新的样本以满足当前影像分类任务的训练需求,但重新标注将会耗费大量的时间、人力、物力和财力,影响土地覆盖分类专题的快速生产,降低分类专题的时效性。
[0004]在前期影像中,存在大量的与当前新影像的物候期或地域等地学认知相似的影像,且这些影像富含大量先验信息与知识,完全丢弃这些影像是非常可惜的。
[0005]因此,有必要挖掘历史知识来辅助完成当前的影像任务,需要一种新的训练样本选择方法以解决上述问题。

技术实现思路

[0006]针对现在的当前遥感影像的训练样本勾画费时费力,而前期影像包括大量先验信息与知识却被浪费的技术问题,本专利技术通过构建一个样本选择框架进行自动选择前期训练样本,能够在少量标注当前训练样本的情况下,得到大量的训练样本数据,充分利用了前期影像的先验信息和知识,减少了人力物力的投入,并对当前遥感影像的分类任务有较好的分类效果。
[0007]本专利技术提供一种遥感影像训练样本的自动选择方法,该方法包括:
[0008]S1获取初始训练样本和目标域训练样本;
[0009]S2构建样本选择框架,所述样本选择框架包括筛选策略、迁移学习算法、模型评估和筛选准则;
[0010]S3将所述初始训练样本输入所述样本选择框架,根据所述筛选策略进行筛选,得到候选训练样本;
[0011]S4根据所述候选训练样本和所述目标域训练样本之间的相关度,利用所述迁移学习算法对所述候选训练样本进行迁移,得到迁移训练样本;
[0012]S5通过所述模型评估对所述迁移训练样本进行评价,得到最优迁移训练样本;
[0013]S6根据所述筛选准则,重复S3

S5进行迭代筛选,得到多组最优迁移训练样本。
[0014]于本专利技术一具体实施例中,所述初始训练样本为样本库中选取的带有标签数据和先验知识的前期影像,所述目标域训练样本为待分类影像中的勾画样本。
[0015]于本专利技术一具体实施例中,所述筛选策略包括完全式筛选、启发式筛选和随机式筛选中至少一项。
[0016]于本专利技术一具体实施例中,所述迁移学习算法包括Tradaboost算法。
[0017]于本专利技术一具体实施例中,步骤S4具体为:
[0018]根据所述候选训练样本和所述目标域训练样本之间相似的数据分布,利用迁移学习算法对所述候选训练样本的权重进行更新迭代,得到迁移训练样本;
[0019]步骤S5具体为:
[0020]通过所述模型评估对所述迁移训练样本的权重按从大到小进行排序,将排在前预设数量的迁移训练样本选为最优迁移训练样本。
[0021]于本专利技术一具体实施例中,在迁移过程中,将所述候选训练样本作为源域数据集,将所述目标域训练样本作为目标域数据集;
[0022]确定源域的特征边缘分布和任务的条件概率分布以及目标域的特征边缘分布和任务的条件概率分布;
[0023]在所述源域的特征边缘分布不等于所述目标域的特征边缘分布,且所述源域任务的条件概率分布等于所述目标域任务的条件概率分布时,根据非归纳式迁移学习算法对所述候选训练样本的权重进行更新迭代;
[0024]在所述源域任务的条件概率分布不等于所述目标域任务的条件概率分布时,根据归纳式迁移学习算法对所述候选训练样本的权重进行更新迭代。
[0025]于本专利技术一具体实施例中,所述权重的估计算法跳过密度估计,采用直接估计,所述估计算法包括判别区分所述候选训练样本和所述目标域训练样本、核平均匹配以及函数估计中至少一项。
[0026]于本专利技术一具体实施例中,所述模型评估的方式包括采用F1

Score指标进行评估,F1

Score为精确率和召回率的调和平均数。
[0027]于本专利技术一具体实施例中,所述精确率为根据所述迁移训练样本与对应的权重均预测正确的数目以及错将其它迁移训练样本预测为所述权重的数目计算得到;
[0028]所述召回率为根据所述迁移训练样本与对应的权重均预测正确的数目以及所述权重的大小预测错误的数目计算得到。
[0029]于本专利技术一具体实施例中,所述筛选准则包括根据所述F1

Score指标、所述多组最优迁移训练样本数目以及迭代次数进行筛选。
[0030]本专利技术的有益效果为:本专利技术提供一种遥感影像训练样本的自动选择方法,首先获取初始训练样本和目标域训练样本,然后构建样本选择框架,包括筛选策略、迁移学习算法、模型评估和筛选准则,通过样本选择框架对初始训练样本进行迭代迁移和筛选,得到多组最优迁移训练样本,最后将多组最优迁移训练样本加入目标域训练样本中构成训练样本集,进行训练得到分类模型。本专利技术提供的方法利用迁移学习算法对初始训练样本进行迁移,初始训练样本为前期影像,该方法充分利用了前期影像的先验信息和知识,只需要标注少量的目标域训练样本,最后就能够得到训练样本数量足够多的训练样本集,大大减少了
人力物力的付出,训练样本集训练出的分类模型能较好的完成当前的遥感影像分类任务。
附图说明
[0031]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0032]图1为本专利技术的遥感影像训练样本自动选择方法的步骤流程图;
[0033]图2为本专利技术的样本选择框架的流程示意图。
具体实施方式
[0034]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。需要说明的是,只要不构成冲突,本专利技术中的各个实施例以及各实施例的各个特征可以相互结合,所形成的技术方案均在本专利技术的保护范围之内。
[0035]需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本专利技术的示本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种遥感影像训练样本的自动选择方法,其特征在于,该方法包括:S1获取初始训练样本和目标域训练样本;S2构建样本选择框架,所述样本选择框架包括筛选策略、迁移学习算法、模型评估和筛选准则;S3将所述初始训练样本输入所述样本选择框架,根据所述筛选策略进行筛选,得到候选训练样本;S4根据所述候选训练样本和所述目标域训练样本之间的相关度,利用所述迁移学习算法对所述候选训练样本进行迁移,得到迁移训练样本;S5通过所述模型评估对所述迁移训练样本进行评价,得到最优迁移训练样本;S6根据所述筛选准则,重复S3

S5进行迭代筛选,得到多组最优迁移训练样本。2.根据权利要求1所述的方法,其特征在于,所述初始训练样本为样本库中选取的带有标签数据和先验知识的前期影像,所述目标域训练样本为待分类影像中的勾画样本。3.根据权利要求1所述的方法,其特征在于,所述筛选策略包括完全式筛选、启发式筛选和随机式筛选中至少一项。4.根据权利要求1所述的方法,其特征在于,所述迁移学习算法包括Tradaboost算法。5.根据权利要求1所述的方法,其特征在于,步骤S4具体为:根据所述候选训练样本和所述目标域训练样本之间相似的数据分布,利用迁移学习算法对所述候选训练样本的权重进行更新迭代,得到迁移训练样本;步骤S5具体为:通过所述模型评估对所述迁移训练样本的权重按从大到小进行排序,将排在前预设数量的迁移训练样本选为最优迁移训练样本。6.根据权利要求5所述的方法,其特征在于,...

【专利技术属性】
技术研发人员:鲁锦涛李洁邹圣兵
申请(专利权)人:北京数慧时空信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1