System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及电力工程预测控制,具体涉及基于xgboost算法的电网投资预测方法及相关设备。
技术介绍
1、目前,电网投资的计算主要还是依靠公司专业技术人员从经验出发选取指标,并对指标进行分析得到投资预测值。这存在从经验出发选取的指标存在多重共线性所造成的信息冗余,引起投资预测模型出线过拟合的现象;同时,投资预测模型建立不当也会存在过拟合的现象。
技术实现思路
1、基于上述
技术介绍
所提出的问题,本专利技术的目的在于提供基于xgboost算法的电网投资预测方法及相关设备,通过采用相关性分析去除关联性高的指标,得到输电线路投资预测指标体系,然后基于影响指标体系和xgboost算法在实际工程数据训练集上构建投资预测模型,并在测试集数据上对模型效果进行了检验,解决了现有技术在筛选线路工程投资指标以及构建投资预测模型的过程中存在过拟合现象,从而导致的预测不准确的问题。
2、本专利技术通过下述技术方案实现:
3、本专利技术第一方面提供了基于xgboost算法的电网投资预测方法,包括如下步骤:
4、步骤s1、获取输电线路工程投资预测指标,对所述输电线路工程投资预测指标进行相关性分析,根据相关性分析结果构建预测指标体系;
5、步骤s2、在所述预测指标体系的基础上获取历史投资数据,对所述历史投资数据进行清洗,并将清洗后的历史投资数据划分为训练集和测试集;
6、步骤s3、基于xgboost算法构建预测训练模型,采用所述训练集对所述预测训练模型
7、步骤s4、采用测试集对训练后的预测训练模型进行测试,得到电网投资预测模型。
8、在上述技术方案中,由于输电线路工程投资预测指标之间存在多重共线性等因素会影响建立模型,产生过拟合,因此,需要对预测指标体系进行相关性分析,将关联度高的指标剔除,去关联度以防止过拟合现象的发生,根据相关性分析结果构建预测指标体系,根据该预测指标体系获取该体系中影响的历史投资数据,并将其划分为用于训练模型的训练集和用于测试模型的测试集。基于xgboost算法构建预测训练模型,采用训练集对预测训练模型进行训练,优化参数,直到满足可靠性要求。然后采用测试集对训练好的预测训练模型进行测试,计算用于评价预测训练模型的指标。将测试通过的模型作为用于预测的电网投资预测模型。
9、在一种可选的实施例中,基于xgboost算法构建预测训练模型包括:
10、基于xgboost算法构建决策树,将所述决策树中对应叶子节点的分数相加,得到电网线路工程投资预测值;
11、对所述决策树进行拟合残差,得到决策树模型;
12、构建所述决策树模型的目标函数,对所述目标函数进行t次迭代,得到迭代目标函数;
13、对所述迭代目标函数进行求解,得到决策树结构最优解,将所述决策树结构最优解对应的决策树模型作为预测训练模型。
14、在一种可选的实施例中,基于xgboost算法构建决策树包括:采用贪心算法对所述决策树中的叶子节点进行分割,其中,分割时的增益为:
15、
16、上式中,lsplit为分割增益,:il为分裂后左节点的实例集,ir为分裂后右节点的实例集,gi为一阶导数,hi为二阶导数,γ为叶子节点个数的惩罚系数,λ为l2正则项的惩罚系数。
17、在一种可选的实施例中,将所述决策树中对应叶子节点的分数相加,得到电网线路工程投资预测值包括:
18、
19、ft(xi)=wq(x)
20、上式中,为电网线路工程投资预测值,ft(xi)为第t棵树输入为xi时的结果,xi为电网线路工程投资的第i个输入特征,f为决策树所在空间,下角标q(x)为样本x对应的叶子节点索引号,q为每个ft对应独立的决策树结构,w为每个ft对应独立的决策树叶子节点权重,t为决策树的数量。
21、在一种可选的实施例中,对所述决策树进行拟合残差的过程表示如下:
22、
23、上式中,为决策树第t次累加结果。
24、在一种可选的实施例中,所述目标函数表达如下:
25、
26、
27、上式中,为损失函数,为预测值,yi为实际值,为电网线路工程投资预测值与实际值的偏差,ω(ft)为正则化函数,tn为叶子节点总数。
28、在一种可选的实施例中,所述迭代目标函数表示如下:
29、
30、上式中,l(t)为迭代目标函数值,n为迭代总次数。
31、在一种可选的实施例中,对所述迭代目标函数进行求解,得到决策树结构最优解包括:
32、将所述迭代目标函数进行二阶泰勒展开,得到二阶泰勒展开式;
33、计算所述二阶泰勒展开式中的叶子节点权重的偏导数,将所述偏导数作为所述迭代目标函数的最优解;
34、将所述迭代目标函数的最优解带入所述二阶泰勒展开式,得到目标函数值的最优解,将所述目标函数值的最优解作为决策树结构最优解。
35、本专利技术第二方面提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现基于xgboost算法的电网投资预测方法。
36、本专利技术第三方面提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现基于xgboost算法的电网投资预测方法。
37、本专利技术与现有技术相比,具有如下的优点和有益效果:
38、通过采用相关性分析去除关联性高的指标,得到输电线路投资预测指标体系,然后基于影响指标体系和xgboost算法在实际工程数据训练集上构建投资预测模型,并在测试集数据上对模型效果进行了检验,解决了现有技术在筛选线路工程投资指标以及构建投资预测模型的过程中存在过拟合现象,从而导致的预测不准确的问题。
本文档来自技高网...【技术保护点】
1.基于XGBOOST算法的电网投资预测方法,其特征在于,包括如下步骤:
2.根据权利要求1所述的基于XGBOOST算法的电网投资预测方法,其特征在于,基于XGBoost算法构建预测训练模型包括:
3.根据权利要求2所述的基于XGBOOST算法的电网投资预测方法,其特征在于,基于XGBoost算法构建决策树包括:采用贪心算法对所述决策树中的叶子节点进行分割,其中,分割时的增益为:
4.根据权利要求3所述的基于XGBOOST算法的电网投资预测方法,其特征在于,将所述决策树中对应叶子节点的分数相加,得到电网线路工程投资预测值包括:
5.根据权利要求4所述的基于XGBOOST算法的电网投资预测方法,其特征在于,对所述决策树进行拟合残差的过程表示如下:
6.根据权利要求5所述的基于XGBOOST算法的电网投资预测方法,其特征在于,所述目标函数表达如下:
7.根据权利要求6所述的基于XGBOOST算法的电网投资预测方法,其特征在于,所述迭代目标函数表示如下:
8.根据权利要求2所述的基于XGBOOST算法的
9.一种电子设备,其特征在于,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如权利要求1至8任一所述的基于XGBoost算法的电网投资预测方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1至8任一所述的基于XGBoost算法的电网投资预测方法。
...【技术特征摘要】
1.基于xgboost算法的电网投资预测方法,其特征在于,包括如下步骤:
2.根据权利要求1所述的基于xgboost算法的电网投资预测方法,其特征在于,基于xgboost算法构建预测训练模型包括:
3.根据权利要求2所述的基于xgboost算法的电网投资预测方法,其特征在于,基于xgboost算法构建决策树包括:采用贪心算法对所述决策树中的叶子节点进行分割,其中,分割时的增益为:
4.根据权利要求3所述的基于xgboost算法的电网投资预测方法,其特征在于,将所述决策树中对应叶子节点的分数相加,得到电网线路工程投资预测值包括:
5.根据权利要求4所述的基于xgboost算法的电网投资预测方法,其特征在于,对所述决策树进行拟合残差的过程表示如下:
6.根据权利要...
【专利技术属性】
技术研发人员:周英,张玉鸿,周萍,隆竹寒,张文文,蹇亚玲,任文诗,王倩,
申请(专利权)人:国网四川省电力公司经济技术研究院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。