System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 顾及空间自相关的CatBoost-GPP遥感估算模型的构建方法技术_技高网
当前位置: 首页 > 专利查询>武汉大学专利>正文

顾及空间自相关的CatBoost-GPP遥感估算模型的构建方法技术

技术编号:40148525 阅读:12 留言:0更新日期:2024-01-24 00:52
本发明专利技术提供一种顾及空间自相关的CatBoost‑GPP遥感估算模型的构建方法集系统,包括:获取研究区范围内影响植被总初级生产力GPP的变量数据,并对各变量数据进行预处理;根据研究区范围内的监测站点坐标构建空间邻接矩阵并根据空间邻接矩阵筛选特征向量;以预处理后的变量数据作为自变量、步骤2中筛选出的特征向量作为协变量,构建用于估算植被总初级生产力的CatBoost‑GPP遥感估算模型;将研究区范围内的监测站点的GPP观测值及对应的自变量数据整理成数据集,并将该数据集划分为训练集和验证集;采用训练集训练CatBoost‑GPP遥感估算模型并采用验证集进行验证得到优化后的CatBoost‑GPP遥感估算模型。本发明专利技术考虑了空间自相关性和异质性对GPP估算的影响,提高了模型的估算精度。

【技术实现步骤摘要】

本专利技术属于空间统计分析的,具体涉及一种顾及空间自相关的catboost-gpp遥感估算模型的构建方法。


技术介绍

1、植被总初级生产力(gross primary productivity,gpp)在陆地碳循环中发挥着至关重要的作用,与碳排放和全球变暖密切相关。然而,在区域和全球范围内,gpp估算仍然存在很大的不确定性,gpp估算准确性和模型适用性的提高仍然是人们所关注的问题,这将更好地监测和管理陆地生态系统中的碳通量。

2、遥感估算模型由于具有长时间序列和大空间尺度的监测能力,已成为区域和全球范围gpp估算的主要工具之一。具体可分为四大类:回归模型、参数模型、过程模型和机器学习模型。回归模型是由与gpp高度相关的变量(如光照、温度、降水等)构建的,包括线性回归、多项式回归和岭回归等;参数模型通常基于光合作用过程的机理,并使用一些环境因子作为输入,需要对生态系统过程有深入的理解,例如光合作用机理、气象因子和植物特征等;过程模型是基于生物地球化学过程的机理模型,通过描述和模拟光合作用过程中的生态学、生理学和物理学机制来估算gpp,通常涉及对光合作用速率、碳交换和植物生理过程等细节的建模,需要较为复杂的参数和数据输入;机器学习模型是近年来在gpp估算中得到广泛应用的一类模型方法,它利用大量的输入数据和机器学习算法,从中学习出gpp与环境因子之间的复杂模式和非线性关系。常见的机器学习模型包括随机森林、支持向量机、神经网络和梯度提升树等,适用于大规模的遥感数据分析和模型建立。

3、但传统的遥感估算方法有三个重要的不确定性来源。首先,所有模型都使用植物功能类型(plant functional traits,pfts)进行参数设置,以考虑不同植被类型之间光合作用的不同特征。然而,现实世界中的植被是一个连续体,包括无数不同的植被类型,pfts只是这个连续体的一个代表,来自遥感观测的具有粗略分辨率的像素实际上是包含多种植被类型的混合物。因此,将真实世界的植被划分为几个典型的pfts就限制了传统模型的gpp估算精度,特别是在植被组成复杂的地区;其次,大部分估算模型都依赖于多源数据,如气象数据和土地覆盖数据。尽管气象数据提供了遥感观测之外的一些补充信息,但其粗略的分辨率和不确定性同时也限制了gpp估算的准确性。第三,传统模型中所需要的关键指标的有限精度也是误差来源,如光利用效率(lue)、叶面积指数(lai)和植被有效光合辐射吸收比(fpar)等。因此,现有的gpp遥感估算模型对pfts参数设置和气象数据的依赖,限制了其在非典型地区的空间泛化能力和估计精度。

4、joiner和yoshida的研究发现,当modis反射率仅与潜在的下行短波辐射配对时,能够在每天到每周的尺度上捕捉到gpp变化的很大一部分(通常为77%),额外的气象数据(如温度、土壤含水量和蒸散量)对捕捉gpp变化的贡献微乎其微。因此,完全基于遥感数据准确估算植被gpp是可行的。

5、此外,在基于站点的观测数据建模时,通常假设站点之间是相互独立的,未考虑建模过程中由站点空间分布引起的空间效应,从而导致有偏的参数估计和结果不稳定,因此在建模过程中需要采用简单有效的方式将变量的空间效应考虑进来,从而得到更加准确和稳定的结果。空间滤值(empirical spatial filter,esf)方法的基本思想是利用站点的邻域信息来构建权重矩阵,以反映不同站点之间的空间相关性。这些权重可以根据站点之间的距离、方向和相似性等因素进行计算,一旦权重矩阵建立完成,它可以用来调整回归模型的参数估计,从而在预测过程中考虑到空间效应。研究表明,将esf空间滤值方法应用于回归问题中可以获得更准确的预测结果,并提高模型的可解释性。这种方法能够考虑到站点之间的空间自相关性和异质性,从而改善模型的拟合能力和泛化能力。此外,esf方法还可以提供有关空间相关性的信息,帮助我们更好地理解空间数据的特征和变化规律。patuelli利用空间滤值方法研究德国失业现象,发现空间滤值的加入使得回归模型对于失业现象的预测准确率提高,从实证研究的角度验证了空间滤值方法的有效性。murakami和griffith针对随机效应特征函数空间滤值方法在考虑空间混淆后不能有效的处理空间自相关这一问题进行了分析,文章详细的阐述了随机效应esf的两点主要不足,并提出将残差的最大似然估计加入到扩展模型中以解决问题,进一步扩大了空间滤值方法的应用范围。


技术实现思路

1、本专利技术的目的在于针对现有技术的不足之处,提供一种一种顾及空间自相关的catboost-gpp遥感估算模型的构建方法,该方法构建的catboost-gpp遥感估算模型考虑了空间自相关性和异质性对gpp估算的影响,提高了模型的估算精度,能够完全基于遥感数据准确估算植被gpp。

2、为解决上述技术问题,本专利技术采用如下技术方案:

3、一种顾及空间自相关的catboost-gpp遥感估算模型的构建方法,其特征在于,包括如下步骤:

4、步骤1、获取研究区范围内影响植被总初级生产力gpp的变量数据,并对各变量数据进行预处理;

5、步骤2、根据研究区范围内的监测站点坐标构建空间邻接矩阵并根据空间邻接矩阵筛选特征向量;

6、步骤3、以预处理后的变量数据作为自变量、步骤2中筛选出的特征向量作为协变量,构建catboost-gpp遥感估算模型;

7、步骤4、将研究区范围内的监测站点的gpp观测值及对应的自变量数据整理成数据集,并将该数据集划分为训练集和验证集;采用训练集训练catboost-gpp遥感估算模型并采用验证集进行验证得到优化后的catboost-gpp遥感估算模型,优化后的catboost-gpp遥感估算模型用于估算植被总初级生产力。

8、进一步地,步骤1中的变量数据包括glass下行短波辐射数据、波段反射率数据、植被指数数据、通量数据。

9、进一步地,步骤1中对数据的预处理包括:对获得的矢量文件、glass下行短波辐射数据、波段反射率数据进行重采样以统一空间分辨率,根据矢量文件划定的研究区范围,对glass下行短波辐射数据、波段反射率数据进行截取,获取研究区的相关数据。

10、进一步地,步骤1中对数据的预处理还包括以通量数据中的gpp监测站点坐标为感兴趣区域,从变量数据中提取该地区modis五个波段反射率、下行短波辐射和植被指数时间序列。

11、进一步地,对提取植被指数时间序列进行savitzky-golay滤波的平滑上包络,且通过粗粒化方法提取统计特征,将统计的特征作为catboost-gpp遥感估算模型的自变量。

12、进一步地,步骤2中,构建空间邻接矩阵后对空间邻接矩阵中心化并对中心化后的空间邻接矩阵进行特征分解,得到对应的特征值和特征向量,再对特征向量进行显著性检验以筛选出显著相关的特征向量。

13、进一步地,构建邻接矩阵的方法为:

14、基于反距离法对监测站点坐本文档来自技高网...

【技术保护点】

1.一种顾及空间自相关的CatBoost-GPP遥感估算模型的构建方法,其特征在于,包括如下步骤:

2.根据权利要求1所述的顾及空间自相关的CatBoost-GPP遥感估算模型的构建方法,其特征在于,步骤1中的变量数据包括GLASS下行短波辐射数据、波段反射率数据、植被指数数据、通量数据。

3.根据权利要求2所述的顾及空间自相关的CatBoost-GPP遥感估算模型的构建方法,其特征在于,步骤1中对数据的预处理包括:对获得的矢量文件、GLASS下行短波辐射数据、波段反射率数据进行重采样以统一空间分辨率,根据矢量文件划定的研究区范围,对GLASS下行短波辐射数据、波段反射率数据进行截取,获取研究区的相关数据。

4.根据权利要求2所述的顾及空间自相关的CatBoost-GPP遥感估算模型的构建方法,其特征在于,步骤1中对数据的预处理还包括以通量数据中的GPP监测站点坐标为感兴趣区域,从变量数据中提取该地区MODIS五个波段反射率、下行短波辐射和植被指数时间序列。

5.根据权利要求4所述的顾及空间自相关的CatBoost-GPP遥感估算模型的构建方法,其特征在于,对提取植被指数时间序列进行Savitzky-Golay滤波的平滑上包络,且通过粗粒化方法提取统计特征,将统计的特征作为CatBoost-GPP遥感估算模型的自变量。

6.根据权利要求1所述的顾及空间自相关的CatBoost-GPP遥感估算模型的构建方法,其特征在于,步骤2中,构建空间邻接矩阵后对空间邻接矩阵中心化并对中心化后的空间邻接矩阵进行特征分解,得到对应的特征值和特征向量,再对特征向量进行显著性检验以筛选出显著相关的特征向量。

7.根据权利要求6所述的顾及空间自相关的CatBoost-GPP遥感估算模型的构建方法,其特征在于,构建邻接矩阵的方法为:

8.根据权利要求1所述的顾及空间自相关的CatBoost-GPP遥感估算模型的构建方法,其特征在于,中心化空间邻接矩阵W0得到矩阵W1,计算矩阵W1的特征值和特征向量,矩阵中心化的公式如下:

9.根据权利要求1所述的顾及空间自相关的CatBoost-GPP遥感估算模型的构建方法,其特征在于,步骤3中在进行特征向量的选择时,选择特征值>0的特征向量;

10.一种实现权利要求1-9任意一项所述的顾及空间自相关的CatBoost-GPP遥感估算模型的构建方法的系统,其特征在于,包括:

...

【技术特征摘要】

1.一种顾及空间自相关的catboost-gpp遥感估算模型的构建方法,其特征在于,包括如下步骤:

2.根据权利要求1所述的顾及空间自相关的catboost-gpp遥感估算模型的构建方法,其特征在于,步骤1中的变量数据包括glass下行短波辐射数据、波段反射率数据、植被指数数据、通量数据。

3.根据权利要求2所述的顾及空间自相关的catboost-gpp遥感估算模型的构建方法,其特征在于,步骤1中对数据的预处理包括:对获得的矢量文件、glass下行短波辐射数据、波段反射率数据进行重采样以统一空间分辨率,根据矢量文件划定的研究区范围,对glass下行短波辐射数据、波段反射率数据进行截取,获取研究区的相关数据。

4.根据权利要求2所述的顾及空间自相关的catboost-gpp遥感估算模型的构建方法,其特征在于,步骤1中对数据的预处理还包括以通量数据中的gpp监测站点坐标为感兴趣区域,从变量数据中提取该地区modis五个波段反射率、下行短波辐射和植被指数时间序列。

5.根据权利要求4所述的顾及空间自相关的catboost-gpp遥感估算模型的构建方法,其特征在于,对提取植被指数时间序列进行savitzky-g...

【专利技术属性】
技术研发人员:陈玉敏徐睿闵万坤陈玥君安钱莹罗嘉欣
申请(专利权)人:武汉大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1