System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于MDI-XGBOOST模型的三维成矿预测方法与系统技术方案_技高网

一种基于MDI-XGBOOST模型的三维成矿预测方法与系统技术方案

技术编号:41362020 阅读:13 留言:0更新日期:2024-05-20 10:11
本发明专利技术提供了一种基于MD I‑XGBOOST模型的三维成矿预测方法与系统,本发明专利技术采用MD I‑XGBOOST模型,通过构建随机森林,将已建立的三维地质体体元模型耦合地质岩性、地球物理、地球化学、遥感等属性数据,构建三维数据集作为训练集,训练随机森林模型得到多棵决策树,依次计算得到某棵决策树某个节点分裂时平均下降的基尼不纯度、某棵决策树的平均下降基尼不纯度、整个随机随林的平均下降基尼不纯度,从而计算得到所有数据集特征的重要性估值。通过计算所有样本属性点的重要性评分,来选择所需要的负样本,构建新的数据集供XGBoost模型训练,从而提升模型的精度。

【技术实现步骤摘要】

本专利技术涉及三维成矿预测,特别是一种基于mdi-xgboost模型的三维成矿预测方法与系统。


技术介绍

1、在国内外三维成矿预测领域,a.g.,&huijbregts,c.j.(1978)奠定了地质统计学在矿产勘察领域的作用,提出了克里格法原理等理论方法,对三维成矿预测起到了重要的推动作用。bonham-carter,g.f.(1994)展示了gis在成矿预测中的潜力。carranza,e.j.(2008)在gis中应用机器学习技术进行地球化学异常和矿产远景预测的方法,使用了支持向量机和随机森林等多种算法,这极大推动了机器学习技术在成矿预测领域的应用。j.carranza(2017)和r.zhang(2016)进行三维成矿预测研究中并未采用任何方法去应对正、负样本不平衡的问题,liu,b.,wu,x.,&yu,b.(2010)通过随机欠采样的方法来生成负样本,平衡正负样本比例。m.wang(2021)通过正负样本加权,即给少数类样本赋予更高的权重,让分类器跟关注它们。

2、尽管机器学习在三维成矿预测领域发展突飞猛进,但是实际工程中负样本数据则少之又少,导致了正、负样本比例极不平衡的问题。


技术实现思路

1、本专利技术的目的是提供一种基于mdi-xgboost模型的三维成矿预测方法与系统,旨在解决现有技术中成矿预测负样本缺失及样本不平衡的问题,实现提高三维成矿预测准确度。

2、为达到上述技术目的,本专利技术提供了一种基于mdi-xgboost模型的三维成矿预测方法,所述方法包括以下操作:

3、构建随机森林,将已建立的三维地质体体元模型耦合属性数据,构建三维数据集作为训练集,训练随机森林模型得到多颗决策树;

4、依次计算得到每颗决策树下每个节点分裂时平均下降的基尼不纯度、每颗决策树的平均下降基尼不纯度以及整个随机森林的平均下降基尼不纯度,进而计算所有数据集特征的重要性评分;

5、根据重要性评分选择所需负样本,构建新数据集供xgboost模型训练,进行成矿预测。

6、优选地,所述属性数据包括地质岩性、地球物理、地球化学以及遥感数据。

7、优选地,所述每颗决策树下每个节点分裂时平均下降的基尼不纯度的计算如下:

8、

9、为特征xj在随机森林第i棵决策树节点q的gini指数,为特征xj在随机森林第i棵决策树节点l的gini指数,为特征xj在随机森林第i棵决策树节点r的gini指数;其中,gini指数的计算如下:

10、

11、优选地,所述每颗决策树的平均下降基尼不纯度的计算如下:

12、

13、优选地,所述整个随机森林的平均下降基尼不纯度的计算如下:

14、

15、优选地,所述重要性评分的计算如下:

16、

17、为重要性评分的归一化,具体为:

18、

19、优选地,所述根据重要性评分选择所需负样本具体为:

20、若只有正样本,则选择低重要性评分属性点作为负样本;若有已知负样本,则选择重要性评分相近的属性点作为负样本。

21、本专利技术还提供了一种基于mdi-xgboost模型的三维成矿预测系统,所述系统包括:

22、随机森林训练模块,用于构建随机森林,将已建立的三维地质体体元模型耦合属性数据,构建三维数据集作为训练集,训练随机森林模型得到多颗决策树;

23、重要性评分计算模块,用于依次计算得到每颗决策树下每个节点分裂时平均下降的基尼不纯度、每颗决策树的平均下降基尼不纯度以及整个随机森林的平均下降基尼不纯度,进而计算所有数据集特征的重要性评分;

24、负样本选择模块,用于根据重要性评分选择所需负样本,构建新数据集供xgboost模型训练,进行成矿预测。

25、本专利技术还提供了一种基于mdi-xgboost模型的三维成矿预测装置,所述装置包括:

26、存储器,用于存储计算机程序;

27、处理器,用于执行所述计算机程序,以实现所述的基于mdi-xgboost模型的三维成矿预测方法。

28、本专利技术还提供了一种可读存储介质,用于保存计算机程序,其中,所述计算机程序被处理器执行时实现所述的基于mdi-xgboost模型的三维成矿预测方法。

29、
技术实现思路
中提供的效果仅仅是实施例的效果,而不是专利技术所有的全部效果,上述技术方案中的一个技术方案具有如下优点或有益效果:

30、与现有技术相比,本专利技术采用mdi-xgboost模型,通过构建随机森林,将已建立的三维地质体体元模型耦合地质岩性、地球物理、地球化学、遥感等属性数据,构建三维数据集作为训练集,训练随机森林模型得到多棵决策树,依次计算得到某棵决策树某个节点分裂时平均下降的基尼不纯度、某棵决策树的平均下降基尼不纯度、整个随机随林的平均下降基尼不纯度,从而计算得到所有数据集特征的重要性估值。通过计算所有样本属性点的重要性评分,来选择所需要的负样本,构建新的数据集供xgboost模型训练,从而提升模型的精度。本方法不同于其他样本不均衡及样本缺失值较多的三维成矿预测方法,后者只采用原始正、负样本来进行模型训练或随机从待预测样本中抽取作为负样本构建数据进行模型训练,克服了模型预测结果的不确定性,提高了训练效率和模型精度。

本文档来自技高网...

【技术保护点】

1.一种基于MDI-XGBOOST模型的三维成矿预测方法,其特征在于,所述方法包括以下操作:

2.根据权利要求1所述的一种基于MDI-XGBOOST模型的三维成矿预测方法,其特征在于,所述属性数据包括地质岩性、地球物理、地球化学以及遥感数据。

3.根据权利要求1所述的一种基于MDI-XGBOOST模型的三维成矿预测方法,其特征在于,所述每颗决策树下每个节点分裂时平均下降的基尼不纯度的计算如下:

4.根据权利要求1所述的一种基于MDI-XGBOOST模型的三维成矿预测方法,其特征在于,所述每颗决策树的平均下降基尼不纯度的计算如下:

5.根据权利要求1所述的一种基于MDI-XGBOOST模型的三维成矿预测方法,其特征在于,所述整个随机森林的平均下降基尼不纯度的计算如下:

6.根据权利要求1所述的一种基于MDI-XGBOOST模型的三维成矿预测方法,其特征在于,所述重要性评分的计算如下:

7.根据权利要求1所述的一种基于MDI-XGBOOST模型的三维成矿预测方法,其特征在于,所述根据重要性评分选择所需负样本具体为

8.一种基于MDI-XGBOOST模型的三维成矿预测系统,其特征在于,所述系统包括:

9.一种基于MDI-XGBOOST模型的三维成矿预测装置,其特征在于,所述装置包括:

10.一种可读存储介质,其特征在于,用于保存计算机程序,其中,所述计算机程序被处理器执行时实现根据权利要求1至7任一项所述的基于MD I-XGBOOST模型的三维成矿预测方法。

...

【技术特征摘要】

1.一种基于mdi-xgboost模型的三维成矿预测方法,其特征在于,所述方法包括以下操作:

2.根据权利要求1所述的一种基于mdi-xgboost模型的三维成矿预测方法,其特征在于,所述属性数据包括地质岩性、地球物理、地球化学以及遥感数据。

3.根据权利要求1所述的一种基于mdi-xgboost模型的三维成矿预测方法,其特征在于,所述每颗决策树下每个节点分裂时平均下降的基尼不纯度的计算如下:

4.根据权利要求1所述的一种基于mdi-xgboost模型的三维成矿预测方法,其特征在于,所述每颗决策树的平均下降基尼不纯度的计算如下:

5.根据权利要求1所述的一种基于mdi-xgboost模型的三维成矿预测方法,其特征在于,所述整个随机森林的...

【专利技术属性】
技术研发人员:田宜平王佳恒徐凯孔春芳
申请(专利权)人:中国地质大学武汉
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1