System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 基于集成学习的地下水封油库涌水量预测方法和装置制造方法及图纸_技高网
当前位置: 首页 > 专利查询>河南大学专利>正文

基于集成学习的地下水封油库涌水量预测方法和装置制造方法及图纸

技术编号:42707298 阅读:2 留言:0更新日期:2024-09-13 12:00
本发明专利技术的实施例涉及地下水封油库领域,提供了基于集成学习的地下水封油库涌水量预测方法和装置。所述方法包括获取目标数据集,提取目标数据集中的初始特征;对初始特征进行筛选,得到最优特征子集;构建基学习器,利用贝叶斯参数优化模型对基学习器的超参数进行优化,对优化后的基学习器进行训练,得到优化训练后的基学习器;构建Stacking集成学习模型,对所述Stacking集成学习模型进行训练,通过训练后的Stacking集成学习模型对地下水封油库涌水量进行预测。以此方式,能够对地下水封油库涌水量进行预测,并且从有限的学习数据中获取尽可能多的有效信息,有效地避免陷入局部最小值,可以在一定程度上避免过拟合问题。

【技术实现步骤摘要】

本专利技术一般涉及地下水封油库领域,并且更具体地,涉及基于集成学习的地下水封油库涌水量预测方法和装置


技术介绍

1、地下水封洞库具有安全、环保、环境友好、造价低等优点,是我国目前大力推广的石油储备方式。洞室涌水量是评价地下水封洞库技术经济综合性价比和工程质量安全的一个重要指标,因此洞室涌水量预测长期以来始终使困扰洞库建设与运营的一大难题。

2、目前规范推荐和工程上采用的分析地下洞库涌水量预测方法以等效连续性介质为基础进行求解,如经验公式解析法、数值模拟分析法和水文地质比拟法等,其预测值均与工后实际值存在较大的偏差,因而不能满足工程需要。地下水条件对洞库涌水量对洞库的涌水量有较大的影响,库区的水文监测数据可真实的反映地下水位的状态变化,进而影响涌水量的变化。本专利通过收集现场真实数据,通过对数据集的预处理得到最优数据集,进而基于集成学习的方法实现对地下水封油库涌水量的精准预测。


技术实现思路

1、根据本专利技术的实施例,提供了一种基于集成学习的地下水封油库涌水量预测方案。本方案能够从有限的学习数据中获取尽可能多的有效信息,有效地避免陷入局部最小值,可以在一定程度上避免过拟合问题。

2、在本专利技术的第一方面,提供了一种基于集成学习的地下水封油库涌水量预测方法。该方法包括:

3、获取目标数据集,提取所述目标数据集中的初始特征;所述初始特征包括自变量特征和因变量特征;

4、利用相关性分析对所述初始特征进行筛选,得到最优特征子集;将所述最优特征子集划分为训练集和测试集;

5、构建基学习器,利用贝叶斯参数优化模型对所述基学习器的超参数进行优化,并通过k-fold方法对优化后的基学习器进行训练,得到优化训练后的基学习器;所述基学习器包括随机森林模型、极端梯度提升树和轻量梯度提升机;

6、构建stacking集成学习模型,利用所述训练集对所述stacking集成学习模型进行训练,得到训练后的stacking集成学习模型,通过所述训练后的stacking集成学习模型对地下水封油库涌水量进行预测。

7、进一步地,所述利用相关性分析对所述初始特征进行筛选,得到最优特征子集,包括:

8、计算所述初始特征中每个自变量特征的皮尔逊相关系数矩阵,得到若干个自变量相关系数;

9、筛选出自变量相关系数大于预设重要性阈值的自变量特征,生成最优特征子集。

10、进一步地,所述计算所述初始特征中每个自变量特征的皮尔逊相关系数矩阵,包括:

11、

12、其中,r为自变量相关系数;xi为第i个自变量特征,yi为第i个自变量特征对应的地下水封油库涌水量,n为自变量特征的维度。

13、进一步地,还包括对所述最优特征子集进行数据预处理,以预处理后的最优特征子集作为训练集和测试集。

14、进一步地,所述对所述最优特征子集进行预处理,包括:

15、采用随机森林回归算法填充所述最优特征子集中的缺失数据,得到第一子集;

16、绘制箱型图检测并剔除所述第一子集的噪音,得到第二子集;

17、对所述第二子集进行归一化处理,得到预处理后的最优特征子集。

18、进一步地,所述stacking集成学习模型,包括一级学习器和二级学习器;所述一级学习器为优化训练后的基学习器;所述二级学习器为元学习器;所述一级学习器的输入作为所述stacking集成学习模型的输入,所述一级学习器的输出作为所述二级学习器的输入,所述二级学习器的输出作为所述stacking集成学习模型的输出。

19、进一步地,还包括:对所述训练后的stacking集成学习模型的泛化能力进行评估,以满足评估要求的stacking集成学习模型对地下水封油库涌水量进行预测。

20、进一步地,所述评估要求,包括:

21、stacking集成学习模型的决定系数大于决定系数阈值;且

22、stacking集成学习模型的平均绝对百分比误差小于平均绝对百分比误差阈值;且

23、stacking集成学习模型的均方根误差小于均方根误差阈值。

24、在本专利技术的第二方面,提供了一种基于集成学习的地下水封油库涌水量预测装置。该装置包括:

25、获取模块,用于获取目标数据集,提取所述目标数据集中的初始特征;所述初始特征包括自变量特征和因变量特征;

26、筛选模块,用于利用相关性分析对所述初始特征进行筛选,得到最优特征子集;将所述最优特征子集划分为训练集和测试集;

27、第一构建模块,用于构建基学习器,利用贝叶斯参数优化模型对所述基学习器的超参数进行优化,并通过k-fold方法对优化后的基学习器进行训练,得到优化训练后的基学习器;所述基学习器包括随机森林模型、极端梯度提升树和轻量梯度提升机;

28、第二构建模块,用于构建stacking集成学习模型,利用所述训练集对所述stacking集成学习模型进行训练,得到训练后的stacking集成学习模型,通过所述训练后的stacking集成学习模型对地下水封油库涌水量进行预测。

29、在本专利技术的第三方面,提供了一种电子设备。该电子设备至少一个处理器;以及与所述至少一个处理器通信连接的存储器;所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本专利技术第一方面的方法。

30、在本专利技术的第四方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行本专利技术第一方面的方法。

31、应当理解,
技术实现思路
部分中所描述的内容并非旨在限定本专利技术的实施例的关键或重要特征,亦非用于限制本专利技术的范围。本专利技术的其它特征将通过以下的描述变得容易理解。

本文档来自技高网...

【技术保护点】

1.一种基于集成学习的地下水封油库涌水量预测方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述利用相关性分析对所述初始特征进行筛选,得到最优特征子集,包括:

3.根据权利要求2所述的方法,其特征在于,所述计算所述初始特征中每个自变量特征的皮尔逊相关系数矩阵,包括:

4.根据权利要求1或2所述的方法,其特征在于,还包括对所述最优特征子集进行数据预处理,以预处理后的最优特征子集作为训练集和测试集。

5.根据权利要求4所述的方法,其特征在于,所述对所述最优特征子集进行预处理,包括:

6.根据权利要求1所述的方法,其特征在于,所述Stacking集成学习模型,包括一级学习器和二级学习器;所述一级学习器为优化训练后的基学习器;所述二级学习器为元学习器;所述一级学习器的输入作为所述Stacking集成学习模型的输入,所述一级学习器的输出作为所述二级学习器的输入,所述二级学习器的输出作为所述Stacking集成学习模型的输出。

7.根据权利要求1所述的方法,其特征在于,还包括:对所述训练后的Stacking集成学习模型的泛化能力进行评估,以满足评估要求的Stacking集成学习模型对地下水封油库涌水量进行预测。

8.根据权利要求7所述的方法,其特征在于,所述评估要求,包括:

9.一种基于集成学习的地下水封油库涌水量预测装置,其特征在于,包括:

10.一种电子设备,包括至少一个处理器;以及

11.一种存储有计算机指令的非瞬时计算机可读存储介质,其特征在于,所述计算机指令用于使所述计算机执行根据权利要求1-8中任一项所述的方法。

...

【技术特征摘要】

1.一种基于集成学习的地下水封油库涌水量预测方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述利用相关性分析对所述初始特征进行筛选,得到最优特征子集,包括:

3.根据权利要求2所述的方法,其特征在于,所述计算所述初始特征中每个自变量特征的皮尔逊相关系数矩阵,包括:

4.根据权利要求1或2所述的方法,其特征在于,还包括对所述最优特征子集进行数据预处理,以预处理后的最优特征子集作为训练集和测试集。

5.根据权利要求4所述的方法,其特征在于,所述对所述最优特征子集进行预处理,包括:

6.根据权利要求1所述的方法,其特征在于,所述stacking集成学习模型,包括一级学习器和二级学习器;所述一级学习器为优化训练后的基学习器;所述二级学习器为元学习器;所述一...

【专利技术属性】
技术研发人员:石磊田广杨阳张建伟边汉亮
申请(专利权)人:河南大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1