【技术实现步骤摘要】
基于两段式特征选择和随机森林改进模型的短期风电功率预测方法
[0001]本专利技术属于新能源发电
,特别是涉及一种基于两段式特征选择和随机森林改进 模型的短期风电功率预测方法。
技术介绍
[0002]开展短期风电功率预测,对优化电力调度方式、提高电网接纳风电水平具有重要意义。 受风能资源自身特征影响,风电功率随机性强、规律性弱,现有短期风电功率预测准确度、 自适应能力有待提高。
[0003]风电功率预测方法一般是基于神经网络模型及其改进模型,往往存在训练过程过拟合、 泛化能力不足等问题。目前,改进方法主要有:一是优化训练目标,控制模型参数复杂性, 即,在目标函数或损失函数(Cost Function)中,增加正则化(Regularization)因子、松弛变 量(Slack Variable)或置信风险,使训练目标更为松弛,或提前终止训练,常见的算法有贝叶 斯神经网络(Bayesian Network)、支持向量机,以及深度学习中的卷积神经网络(CNN)、网 络节点裁剪技术(Dropout)。二是改进训练方式,提高数据特征多样性,即:1)利用实测数 据定期更新训练样本,对模型参数进行滚动修正;2)训练过程中采用交叉验证法(CrossValidation,CV),对输入样本进行特征重组,如:k折交叉验证、留一法、Holdout验证法。 近年来出现了数据增强(Data Augmentation)技术,根据先验知识对有限样本集进行重复抽 样,增加样本特征的多样性和随机性,如Bagging方法、集成学习、随机森 ...
【技术保护点】
【技术特征摘要】 【专利技术属性】
1.一种基于两段式特征选择和随机森林模改进型的短期风电功率预测方法,其特征是:它包括以下步骤:步骤1:基于两段式特征选择的训练样本筛选1.1关键特征选择风电场历史数据由气温、气压、湿度、风向、10m风速、30m风速、50m轮毂风速、70m风速、100m风速、风电历史功率10个特征变量组成,采用如下两种方法,对这10个特征变量的重要性进行评估,方法1:利用随机森林模型,对每个特征变量进行重要性评估,发现所述10个特征变量的重要性指标参差不齐,其中,50m轮毂风速、风电历史功率的重要性大,能够归类为关键特征变量,其他特征变量则作为冗余特征剔除;方法2:分别以单个特征变量为输入,进行随机森林模型的训练,得到所述10个特征变量所对应的10条预测误差曲线,根据误差曲线分群情况,发现50m轮毂风速、风电历史功率训练出来的模型预测误差整体小,能够归类为关键特征变量,其他特征变量则作为冗余特征剔除;1.2亲密样本筛选除了剔除冗余特征变量外,还需要从关键特征变量的海量历史数据中筛选出与预测目标强相关的亲密样本集,其计算过程分为两步:a)日样本构建:将风电场历史数据,包括风电功率P、风速V转换为每日数据样本{P1,P2,...,P
N
}和{V1,V2,...,V
N
},若历史数据的长度为1年,则N=365,以满足日前风电功率预测的要求;b)亲密样本筛选:将每日风电数据样本进行归一化处理后,分别计算每日风电数据样本与预测日参考样本的关联度指标,并按关联度大小进行降序排列,筛选出强相关的前2M个样本,设M=20作为亲密样本集{P
M1
,P
M2
,...,P
MM
}和{V
M1
,V
M2
,...,V
MM
},得到随机森林模型的输入样本集为{P
M1
,P
M2
,...,P
MM
,V
M1
,V
M2
,...,V
MM
},考虑到输入特征与预测目标之间的广义相关性,采用互信息关联度指标;步骤2:基于随机森林改进模型的风电功率预测2.1随机森林的基本流程随机森林(Random Forest,RF)是一种并联组合方式的集成学习方法,包括Bagging方法、随机子空间理论,随机森林的计算过程为:1)对原始样本集使用Bagging方法进行有放回地随机重采样,得到多个训练样本子集,分别用于每棵决策树的训练,利用袋外样本集(Out of Bag,OOB),对随机森林模型的泛化误差进行无偏估计,设原始训练样本集S的样本总数为N,则每个样本未被抽中的概率为:其中,x为训练样本,P为袋外样本集的概率分布,S
技术研发人员:史坤鹏,李婷,安军,周毅博,刘座铭,姜旭,郭雷,曲绍杰,蒋宪军,赵亮,
申请(专利权)人:东北电力大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。