基于遗传规划算法的高光谱数据构建方法技术

技术编号:35491164 阅读:22 留言:0更新日期:2022-11-05 16:47
本实施例提出一种基于遗传规划算法的高光谱数据构建方法,通过实地调查马尾松松材线虫病病情,并获取健康和早期侵染马尾松的高光谱数据,但考虑在原始光谱数据中可能存在冗余特征对识别产生影响。因此本实施例中利用一个遗传规划算法的变体—M3GP算法,在原始特征的基础上自动构建指数特征(超特征)再对数据进行分类,不仅降低特征维度也提高了分类准确率,实现对马尾松松材线虫病发病早期监测的可行性,为松材线虫病发病早期监测提供借鉴和参考。考。考。

【技术实现步骤摘要】
基于遗传规划算法的高光谱数据构建方法


[0001]本实施例涉及森林保护
,尤其涉及一种基于遗传规划算法的高光谱数据构建方法。

技术介绍

[0002]马尾松不仅是木材原料,还被广泛应用在医学药材,化学原料上,经济价值高,但它很容易出现松材线虫病。在植物受到病虫侵害的时候,树叶中的叶绿素、细胞活性和水含量等都会发生变化,进而影响植物的光合作用,从而引起植物的相关生理变化。有研究表明将受侵染的马尾松植株针叶的光谱与健康马尾松植株针叶的光谱相比,一些特征波段会发生变化,因此分类识别出受早期侵染的马尾松和健康马尾松可以从对光谱特征方面进行分析。高光谱遥感图像波段间隔较窄,具有更加丰富的光谱信息,也为外观看上去相似的健康与早期侵染马尾松提供更精细的光谱特征,因此利用高光谱遥感数据对马尾松进行分类识别时能够更好的分辨出早期侵染马尾松和健康马尾松。
[0003]目前,已有现有技术利用光谱特征对受害植物进行研究分析。张素兰等针对不同虫害程度的马尾松,构建了六个光谱特征参数。研究结果表明随虫害程度的加深,绿峰位置会“红移”,而红谷位置和红边位置会“蓝移”,枯死样本的“绿峰”和“红谷”特征会消失。伍南等对炭疽病胁迫下杉木的光谱特征构建高光谱微分指数,分析了其与病情指数之间的关系并建立线性模型,通过检验证明该模型预测精度较高。张素兰等对松材线虫病胁迫下马尾松不同侵染程度状况的高光谱特征参数进行岭迹分析,筛选出非共线性特征参数,构建岭回归估计模型,最终得到平均估计精度达87.15%。彭隆赞等对植被指数与受松毛虫不同侵害程度的马尾松之间的关系进行分析,研究发现增强型植被指数(EVI)、绿波段叶绿素指数(Red/Green)和归一化指标指数(NDVI)适合对马尾松受虫害进行中期和晚期监测,红边波段叶绿素指数(CIrededge)、比值植被指数(RVI550、RVI700)、绿波段归一化植被指数(gNDVI)、差值植被指数(DVI)和结构不敏感色素指数(SPID)适合对虫害发生的早期进行监测。
[0004]虽然已有现有技术利用高光谱监测受害植物,但对松材线虫病发病早期进行监测的较少,且在研究中利用到的特征都是通过现有指数计算成的特征,而一个指数可能并不适用于所有问题,且在选择指数时费时费力,需要有丰富的邻域知识。

技术实现思路

[0005]为了克服现有技术中存在的不足,本实施例提出一种基于遗传规划算法的高光谱数据构建方法,通过实地调查马尾松松材线虫病病情,并获取健康和早期侵染马尾松的高光谱数据,但考虑在原始光谱数据中可能存在冗余特征对识别产生影响。因此本实施例中利用一个遗传规划算法的变体—M3GP算法,在原始特征的基础上自动构建指数特征(超特征)再对数据进行分类,不仅降低特征维度也提高了分类准确率,实现对马尾松松材线虫病发病早期监测的可行性,为松材线虫病发病早期监测提供借鉴和参考。
[0006]本实施例具体采用以下技术方案:
[0007]一种基于遗传规划算法的高光谱数据构建方法,其特征在于:对马尾松的高光谱数据集利用M3GP算法进行特征构造,形成指数特征的超特征集后,再训练并使用分类器对数据进行分类。
[0008]进一步地,所述利用M3GP算法进行特征构造为通过M3GP算法得到的每个树表示一个指数特征,其具体过程为:
[0009](1)初始化:初始化后计算每个个体的适应度值,为之后繁殖后代时选择父代提供信息;
[0010](2)选择:M3GP算法中利用锦标赛的方式选择下一代的父母;先随机选择五个个体,然后从这五个个体中选择最好的那个个体作为父代;
[0011](3)生育:繁殖后代的方式有两种:变异和交叉;在变异时,以相同概率执行以下3种行为之一:
[0012]一个标准的子树突变,利用一个随机创建的新树替换父树中一个随机选择的分支但不包括根节点;
[0013]将随机创建的新树添加父树中,以有效地向个体添加一个维;
[0014]随机删除父树中的一颗树,以有效地从个体中删除一个维;
[0015]在交叉时,父代模型相互之间交换分支;经过变异操作后得到的是一个后代,经过交叉操作后得到的是两个后代;
[0016]剪枝:利用剪枝的方式将冗余的分支去除;剪枝过程只应用在每代的最优解上。
[0017]进一步地,所述分类器采用马氏距离分类器或决策树分类器;
[0018]利用分类准确率作为算法的适应度值,并计算F

分数;准确率与F

分数计算公式分别如下:
[0019][0020][0021]其中T代表预测正确、F代表预测错误、P代表正类、N代表负类;将TP、FP、FN、TN理解为:TP代表预测为正类,实际为正类;FP代表预测为正类,实际为负类;FN代表预测为负类,实际为正类;TN代表预测为负类,实际为负类;TP+TN即为预测正确的数量,FP+FN即为预测错误的数量;precision是查准率,recall是查全率,由以下公式计算:
[0022][0023][0024]相较于现有技术,本实施例及其优选方案具有以下有益效果:
[0025]1)考虑使用原数据高光谱信息直接对马尾松进行识别时,分类效果不理想的问题。引入植被指数后,可以提高识别准确率但可能会存在光谱信息利用不完全的情况。因此需要一个针对具体问题光谱数据自动构建指数的方法。
[0026]2)利用M3GP算法对光谱数据进行自动构建指数特征之后,分类效果相比于直接使用原数据或使用植被指数有了显著提高。说明了M3GP算法在降维的同时还能够有效提高分类性能,在解决健康和早期侵染马尾松分类识别问题上具有重要作用。
[0027]3)使用高光谱遥感影像作为数据源,充分挖掘光谱数据中的有效信息并构建新的指数特征,扩展了无人机高光谱数据在感病马尾松识别中的应用范围。
附图说明
[0028]下面结合附图和具体实施方式对本实施例进一步详细的说明:
[0029]图1是本实施例实施例方案整体流程示意图;
[0030]图2是GP算法个体表示方式示意图;
[0031]图3是GP算法交叉示意图;
[0032]图4是GP算法变异示意图;
[0033]图5是本实施例实施例M3GP算法变异示意图;
[0034]图6是本实施例实施例M3GP算法剪枝示意图。
具体实施方式
[0035]为让本专利的特征和优点能更明显易懂,下文特举实施例,并配合附图,作详细说明如下:
[0036]本实施例通过利用特征构建方法在原始光谱特征的基础上自动构造出一些指数特征,将原始数据转换到一个新的特征空间,然后再对数据集进行分类以提高分类速度及分类准确率。本实施例利用M3GP算法进行特征构造,本实施例技术路线如图1所示。
[0037]在算法过程中,通常会将数据集分为两个部分,一个是训练集和一个是测试集。训练集用来训练分类器,测试集用来测试分类器在未知数据上的分类效果。基于训练集,特征构建算法自动构建本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于遗传规划算法的高光谱数据构建方法,其特征在于:对马尾松的高光谱数据集利用M3GP算法进行特征构造,形成指数特征的超特征集后,再训练并使用分类器对数据进行分类。2.根据权利要求1所述的基于遗传规划算法的高光谱数据构建方法,其特征在于:所述利用M3GP算法进行特征构造为通过M3GP算法得到的每个树表示一个指数特征,其具体过程为:(1)初始化:初始化后计算每个个体的适应度值,为之后繁殖后代时选择父代提供信息;(2)选择:M3GP算法中利用锦标赛的方式选择下一代的父母;先随机选择五个个体,然后从这五个个体中选择最好的那个个体作为父代;(3)生育:繁殖后代的方式有两种:变异和交叉;在变异时,以相同概率执行以下3种行为之一:一个标准的子树突变,利用一个随机创建的新树替换父树中一个随机选择的分支但不包括根节点;将随机创建的新树添加父树中,以有效地向个体添加一个维;随机删除父树中的一颗树,以有效地从个体中删除一个维;在交叉时,...

【专利技术属性】
技术研发人员:黄世国张元孜张飞萍吴松青李小林
申请(专利权)人:福建农林大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1