基于两段式特征选择和随机森林改进模型的短期风电功率预测方法技术

技术编号:34335294 阅读:33 留言:0更新日期:2022-07-31 02:51
本发明专利技术涉及新能源发电技术领域,是一种基于两段式特征选择和随机森林改进模型的短期风电功率预测方法,其特点是,包括:基于两段式特征选择的训练样本筛选、基于随机森林改进模型的风电功率预测,以最大相关

【技术实现步骤摘要】
基于两段式特征选择和随机森林改进模型的短期风电功率预测方法


[0001]本专利技术属于新能源发电
,特别是涉及一种基于两段式特征选择和随机森林改进 模型的短期风电功率预测方法。

技术介绍

[0002]开展短期风电功率预测,对优化电力调度方式、提高电网接纳风电水平具有重要意义。 受风能资源自身特征影响,风电功率随机性强、规律性弱,现有短期风电功率预测准确度、 自适应能力有待提高。
[0003]风电功率预测方法一般是基于神经网络模型及其改进模型,往往存在训练过程过拟合、 泛化能力不足等问题。目前,改进方法主要有:一是优化训练目标,控制模型参数复杂性, 即,在目标函数或损失函数(Cost Function)中,增加正则化(Regularization)因子、松弛变 量(Slack Variable)或置信风险,使训练目标更为松弛,或提前终止训练,常见的算法有贝叶 斯神经网络(Bayesian Network)、支持向量机,以及深度学习中的卷积神经网络(CNN)、网 络节点裁剪技术(Dropout)。二是改进训练方式,提高数据特征多样性,即:1)利用实测数 据定期更新训练样本,对模型参数进行滚动修正;2)训练过程中采用交叉验证法(CrossValidation,CV),对输入样本进行特征重组,如:k折交叉验证、留一法、Holdout验证法。 近年来出现了数据增强(Data Augmentation)技术,根据先验知识对有限样本集进行重复抽 样,增加样本特征的多样性和随机性,如Bagging方法、集成学习、随机森林。三是采用组 合预测方法,增强模型自适应能力:利用预测对象不同的特征分量,或者在预测过程的各个 环节,开展不同算法的适应性分析,确保模型组合后能够适用于多个预测场景,预测结果更 加接近实际情况。
[0004]统筹考虑上述改进措施,本专利技术提出了一种基于两段式特征选择和随机森林改进模型的 短期风电功率预测方法,1)利用Bagging方法对亲密样本进行随机重采样,提高了训练样本 的特征多样性,属于第二类改进方法;2)随机森林是多个决策树的组合模型,对决策树性能 排序、约简、重组,进一步提高随机森林模型泛化能力,也顾了第一、三类改进方法。

技术实现思路

[0005]本专利技术所要解决的技术问题是:提供一种预测准确度高、计算效率高、抗干扰能力强, 能够解决现有风电预测模型训练过拟合、泛化能力不足技术问题的基于两段式特征选择和随 机森林改进模型的短期风电功率预测方法。
[0006]解决其技术问题采用的方案是,一种基于两段式特征选择和随机森林模改进型的短期风 电功率预测方法,其特征是:它包括以下步骤:
[0007]步骤1:基于两段式特征选择的训练样本筛选
[0008]1.1关键特征选择
[0009]风电场历史数据由气温、气压、湿度、风向、10m风速、30m风速、50m轮毂风速、70m 风速、100m风速、风电历史功率10个特征变量组成,采用如下两种方法,对这10个特征变 量的重要性进行评估,
[0010]方法1:利用随机森林模型,对每个特征变量进行重要性评估,发现所述10个特征变量 的重要性指标参差不齐,其中,50m轮毂风速、风电历史功率的重要性大,能够归类为关键 特征变量,其他特征变量则作为冗余特征剔除;
[0011]方法2:分别以单个特征变量为输入,进行随机森林模型的训练,得到所述10个特征变 量所对应的10条预测误差曲线,根据误差曲线分群情况,发现50m轮毂风速、风电历史功 率训练出来的模型预测误差整体小,能够归类为关键特征变量,其他特征变量则作为冗余特 征剔除;
[0012]1.2亲密样本筛选
[0013]除了剔除冗余特征变量外,还需要从关键特征变量的海量历史数据中筛选出与预测目标 强相关的亲密样本集,其计算过程分为两步:
[0014]a)日样本构建:将风电场历史数据,包括风电功率P、风速V转换为每日数据样本 {P1,P2,...,P
N
}和{V1,V2,...,V
N
},若历史数据的长度为1年,则N=365,以满足日前风电功率预 测的要求;
[0015]b)亲密样本筛选:将每日风电数据样本进行归一化处理后,分别计算每日风电数据样本 与预测日参考样本的关联度指标,并按关联度大小进行降序排列,筛选出强相关的前2M个 样本,设M=20作为亲密样本集{P
M1
,P
M2
,...,P
MM
}和{V
M1
,V
M2
,...,V
MM
},得到随机森林模型的 输入样本集为{P
M1
,P
M2
,...,P
MM
,V
M1
,V
M2
,...,V
MM
},考虑到输入特征与预测目标之间的广义相关 性,采用互信息关联度指标;
[0016]步骤2:基于随机森林改进模型的风电功率预测
[0017]2.1随机森林的基本流程
[0018]随机森林(Random Forest,RF)是一种并联组合方式的集成学习方法,包括Bagging方 法、随机子空间理论,随机森林的计算过程为:
[0019]1)对原始样本集使用Bagging方法进行有放回地随机重采样,得到多个训练样本子集, 分别用于每棵决策树的训练,利用袋外样本集(Out of Bag,OOB),对随机森林模型的泛化 误差进行无偏估计,
[0020]设原始训练样本集的样本总数为N,则每个样本未被抽中的概率为:
[0021][0022]其中,x为训练样本,P为袋外样本集的概率分布,S
i
为第i个训练样本子集;
[0023]公式表明,原始样本集中,有36.8%的样本不会出现在训练样本中,将未被抽中的样本 组成袋外样本集OOB,用于估算随机森林模型的泛化误差,等同于k折交叉验证的过程;
[0024]2)基于随机子空间理论,从训练样本的特征变量中随机选取一部分特征变量参与决策树 的训练,使其自上而下地分枝生长,直至达到设定的叶节点尺寸为止;
[0025]3)将步骤1)和2)重复M次,能够训练得到M棵决策树,将M棵决策树组合起来, 便构成随机森林模型。集成学习理论证明,每棵决策树误差应小于50%,随着决策树棵数的 增
多,随机森林的整体误差减小,最终趋于一个相对稳定的下限值;
[0026]4)将训练好的随机森林用于测试样本集,多棵决策树的预测结果按一定集成规则进行优 化组合后,即得到随机森林的预测值,对于分类问题,集成规则主要采用投票法;对于回归 及预测问题,集成规则主要采用平均法;
[0027]2.2随机森林改进模型的提出
[0028]随机森林模型集成了大量的决策树,涉及到的特征变量数量庞大,模型可解释性降低, 尤其是双重随机性的引入,使得随机森林像“黑箱”模型,其内本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于两段式特征选择和随机森林模改进型的短期风电功率预测方法,其特征是:它包括以下步骤:步骤1:基于两段式特征选择的训练样本筛选1.1关键特征选择风电场历史数据由气温、气压、湿度、风向、10m风速、30m风速、50m轮毂风速、70m风速、100m风速、风电历史功率10个特征变量组成,采用如下两种方法,对这10个特征变量的重要性进行评估,方法1:利用随机森林模型,对每个特征变量进行重要性评估,发现所述10个特征变量的重要性指标参差不齐,其中,50m轮毂风速、风电历史功率的重要性大,能够归类为关键特征变量,其他特征变量则作为冗余特征剔除;方法2:分别以单个特征变量为输入,进行随机森林模型的训练,得到所述10个特征变量所对应的10条预测误差曲线,根据误差曲线分群情况,发现50m轮毂风速、风电历史功率训练出来的模型预测误差整体小,能够归类为关键特征变量,其他特征变量则作为冗余特征剔除;1.2亲密样本筛选除了剔除冗余特征变量外,还需要从关键特征变量的海量历史数据中筛选出与预测目标强相关的亲密样本集,其计算过程分为两步:a)日样本构建:将风电场历史数据,包括风电功率P、风速V转换为每日数据样本{P1,P2,...,P
N
}和{V1,V2,...,V
N
},若历史数据的长度为1年,则N=365,以满足日前风电功率预测的要求;b)亲密样本筛选:将每日风电数据样本进行归一化处理后,分别计算每日风电数据样本与预测日参考样本的关联度指标,并按关联度大小进行降序排列,筛选出强相关的前2M个样本,设M=20作为亲密样本集{P
M1
,P
M2
,...,P
MM
}和{V
M1
,V
M2
,...,V
MM
},得到随机森林模型的输入样本集为{P
M1
,P
M2
,...,P
MM
,V
M1
,V
M2
,...,V
MM
},考虑到输入特征与预测目标之间的广义相关性,采用互信息关联度指标;步骤2:基于随机森林改进模型的风电功率预测2.1随机森林的基本流程随机森林(Random Forest,RF)是一种并联组合方式的集成学习方法,包括Bagging方法、随机子空间理论,随机森林的计算过程为:1)对原始样本集使用Bagging方法进行有放回地随机重采样,得到多个训练样本子集,分别用于每棵决策树的训练,利用袋外样本集(Out of Bag,OOB),对随机森林模型的泛化误差进行无偏估计,设原始训练样本集S的样本总数为N,则每个样本未被抽中的概率为:其中,x为训练样本,P为袋外样本集的概率分布,S

【专利技术属性】
技术研发人员:史坤鹏李婷安军周毅博刘座铭姜旭郭雷曲绍杰蒋宪军赵亮
申请(专利权)人:东北电力大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1