一种基于孤立森林与WGAN网络的风电输出功率预测方法技术

技术编号:29792107 阅读:20 留言:0更新日期:2021-08-24 18:11
本发明专利技术一种基于孤立森林与WGAN网络的风电输出功率预测方法,包括基于孤立森林的风电原始数据异常值检测方法,用于自适应检测并剔除海量风电数据中的异常值;以及基于对抗生成网络的缺失值填补方法,用于探索风电数据的变化规律,从而填补风电数据的缺失值和上一步骤中剔除的异常值;以及面向海量风电数据的归一化方法,用于统一风电数据中不同特征的量纲;以及基于门控循环单元网络的风电功率预测方法,用于高精度超短期风电输出功率预测。本发明专利技术可高精度还原风电原始数据的缺失值和剔除的异常值,分析风电数据在时间序列上的变化情况,更好地对异常检测后的风电数据进行插值,得到完整的数据集,准确预测超短期风电输出功率。

【技术实现步骤摘要】
一种基于孤立森林与WGAN网络的风电输出功率预测方法
本专利技术属于电网
,亦属于大数据分析与应用
,涉及风电场发电的并网,特别涉及一种基于孤立森林与WGAN网络的风电输出功率预测方法。
技术介绍
风电场通过开展风电功率预测来进行电力市场竞价和风电场运行维护,通过风电功率预测系统的预测结果,电网调度部门进行合理的发电计划安排,减少系统的旋转备用容量,提高电网运行的经济性,同时通过提前预测风电功率的波动,合理的安排运行方式和应对措施,提高电网的安全性和可靠性。但是数据在采集过程中由于传感器等硬件设备所带来的采集误差,对后期风电功率预测带来一定的误差。
技术实现思路
为了克服上述现有技术的缺点,本专利技术的目的在于提供一种基于孤立森林与WGAN网络的风电输出功率预测方法,通过异常数据剔除和插补,尽可能规避了由于多方面原因所带来的异常值现象,提高预测准确性。为了实现上述目的,本专利技术采用的技术方案是:一种基于孤立森林与WGAN网络的风电输出功率预测方法,包括如下步骤:步骤1,将风电场传感器所接收的原始数据构成原始数据集,先在原始数据集中提取特征数据得到特征数据集,然后基于孤立森林的风电原始数据异常值检测方法,自适应检测并剔除特征数据集中的异常数据,得到含有缺失值的特征数据集;步骤2,对步骤1中获取的含有缺失值的特征数据集进行插值操作,填补风电数据的缺失值和步骤1中剔除的异常值;步骤3,将步骤2所生成的数据集归一化之后作为预测模型的输入数据,预测模型经过训练测试后输出预测结果。与现有技术相比,本专利技术针对风电数据采集过程中出现的异常值现象,以及相应类似于风电原始数据一样的时序数据存在的异常值现象,采用异常数据剔除和插补的方法,将采集到原始数据中的异常值进行剔除和插补,最终获得输入的特征数据进行预测模型的训练和测试,达到风电场所需的预测模型。采用本专利技术,可极大程度上解决风电原始数据采集的误差现象,提高预测模型预测的准确性,为电网调度部门和风电场提高更精准的预测数据。附图说明图1是本专利技术整体流程示意图。图2是本专利技术实施例中真实值与插补值的可视化对比示意图。具体实施方式下面结合附图和实施例详细说明本专利技术的实施方式。如图1所示,本专利技术为一种基于孤立森林与WGAN网络的风电输出功率预测方法,包括如下步骤:步骤1,将风电场传感器所接收的原始数据(主要包括气象部门监测的温度、压强数据以及风电场监测的风速、风向数据)构成原始数据集,先在原始数据集中提取特征数据得到特征数据集,然后基于孤立森林的风电原始数据异常值检测方法,自适应检测并剔除特征数据集中的异常数据,得到含有缺失值的特征数据集。其中,风电原始数据异常值检测方法如下:步骤1.1,构建随机二叉树,在风电原始数据中选取一个特征,随机选择该特征下的一个值Value作为根节点,以此对该特征下其余值进行分类,当选取值小于根节点时,将该值放在Value值的左叶子上,大于根节点时,则放在右叶子上,以此递归剩下的数据集,直到传入的数据只有一条数据或二叉树的高度达到限定高度时结束执行,此时完成了一棵孤立树的构建。限定高度一般应设在log(n)~log(n-1)之间,n为数据个数。在孤立树中,叶子结点的路径长度可判断一条数据是否为异常值(孤立森林会将异常值被划分到叶子结点处),进而可计算整个孤立森林的路径长度期望。步骤1.2,当一棵孤立树构建完成后,在特征数据集中采取同样方式重新构建新的孤立树,直到构建t棵树结束,对于数据x,令其遍历每一棵孤立树,并计算数据x在每一棵孤立树上的路径长度h(x),即叶子结点到根节点的距离。本专利技术通过计算数据x在所有孤立树上的平均路径长度c(n),然后使用平均路径长度c(n)来标准化数据长度h(x),从而形成最后完整的孤立森林。c(n)是h(x)在n个数据的情况下的平均值,本专利技术用其来规范化h(x),c(n)的计算公式如下:其中H(n-1)为调节函数,H(n-1)=ln(n-1)+ζ,ζ为欧拉常数,ζ=0.5772156649,n为数据个数。步骤1.3,根据路径长度h(x)判断数据x是否为异常数据,若是,则将其剔除。具体地,先计算整个孤立森林的路径长度平均值E(h(x)),E(h(x))为h(x)的期望,并计算异常分数s(x,n),s(x,n)取值为[0,1],当s(x,n)为1时数据x为异常值;当s(x,n)小于0.5时数据x为正常值;当s(x,n)为0.5±0.01时当前特征数据集中无明显的异常值,此时即得到含有缺失值的特征数据集。步骤2,对步骤1中获取的含有缺失值的特征数据集进行插值操作,填补风电数据的缺失值和步骤1中剔除的异常值。由于不完整时间序列数据相邻之间的时间差存在一定的潜在关系,同时原始数据采集的不完整性,GAN网络可以训练生成接近于真实数据的数据元素,而基于RNN的GRU神经单元所提出的一种新的GRUI神经单元,该神经单元可以注意到相邻时间序列的不同时间间隔,淡化由不同时间间隔所带来的影响。由于GAN网络训练的不确定性,故此采用Wasserstein距离作为衡量标准的WGAN网络进行缺失值的生成填补工作。因此本步骤采用依次采用GRUI神经单元构成的WGAN网络进行数据元素的插补,并进行主成分提取,获取得到对应的特征数据集,将获得的最终的预测模型输入数据集。具体地,本专利技术利用基于生成对抗网络的缺失值填补方法进行插值操作,所述生成对抗网络由一个生成器G和一个辨别器D构成,生成器G和辨别器D均由三个GRUI层、一个Dense层和一个dropout层构成,其中生成器用于寻找输入数据的真实分布,辨别器用来训练获取填补缺失值。具体的插值操作的步骤如下:步骤2.1,将随机噪声向量z输入到生成器G中,得到生成的时间序列G(z),G(z)是由WGAN网络生成器所生成的伪时间序列,创建一个掩蔽重建损失函数Lr(z),用来判断G(z)与不完整的原始时间序列X是否足够接近,原始时间序列X即异常值检测剔除后的剩余数据序列,Lr(z)仅计算原始时间序列X与生成的时间序列G(z)未缺失值的欧几里得范数,如下所示:Lr(z)=||X·Q-G(z)·Q||2其中Q为掩模矩阵,表示原始时间序列X中缺失值的位置,数据存在时该位置为1,反之为0;步骤2.2,创建鉴别损失函数Ld(z),用来表示G(z)的真实程度,Ld(z)通过计算G(z)的方差D,以此判别损失:Ld(z)=-D(G(z))根据掩蔽重建损失函数Lr(z)和鉴别损失函数Ld(z)构建插值损失函数Limputation(z),Limputation(z)=Lr(z)+λLd(z),λ为超参数;利用Limputation(z)对G(z)进行训练,得出收敛后的生成时间序列G(z)′,根据下式进行插值:ximputed=X·Q+(1-Q)·G(z)'qi,j为Q中第i行本文档来自技高网...

【技术保护点】
1.一种基于孤立森林与WGAN网络的风电输出功率预测方法,其特征在于,包括如下步骤:/n步骤1,将风电场传感器所接收的原始数据构成原始数据集,先在原始数据集中提取特征数据得到特征数据集,然后基于孤立森林的风电原始数据异常值检测方法,自适应检测并剔除特征数据集中的异常数据,得到含有缺失值的特征数据集;/n步骤2,对步骤1中获取的含有缺失值的特征数据集进行插值操作,填补风电数据的缺失值和步骤1中剔除的异常值;/n步骤3,将步骤2所生成的数据集归一化之后作为预测模型的输入数据,预测模型经过训练测试后输出预测结果。/n

【技术特征摘要】
1.一种基于孤立森林与WGAN网络的风电输出功率预测方法,其特征在于,包括如下步骤:
步骤1,将风电场传感器所接收的原始数据构成原始数据集,先在原始数据集中提取特征数据得到特征数据集,然后基于孤立森林的风电原始数据异常值检测方法,自适应检测并剔除特征数据集中的异常数据,得到含有缺失值的特征数据集;
步骤2,对步骤1中获取的含有缺失值的特征数据集进行插值操作,填补风电数据的缺失值和步骤1中剔除的异常值;
步骤3,将步骤2所生成的数据集归一化之后作为预测模型的输入数据,预测模型经过训练测试后输出预测结果。


2.根据权利要求1所述基于孤立森林与WGAN网络的风电输出功率预测方法,其特征在于,所述步骤1中,原始数据包括气象部门监测的温度、压强数据以及风电场监测的风速、风向数据。


3.根据权利要求1所述基于孤立森林与WGAN网络的风电输出功率预测方法,其特征在于,所述基于孤立森林的风电原始数据异常值检测方法如下:
步骤1.1,构建随机二叉树,在风电原始数据中选取一个特征,随机选择该特征下的一个值Value作为根节点,以此对该特征下其余值进行分类,当选取值小于根节点时,将该值放在Value值的左叶子上,大于根节点时,则放在右叶子上,以此递归剩下的数据集,直到传入的数据只有一条数据或二叉树的高度达到限定高度时结束执行,此时完成了一棵孤立树的构建;
步骤1.2,当一棵孤立树构建完成后,在特征数据集中采取同样方式重新构建新的孤立树,直到构建t棵树结束,对于数据x,令其遍历每一棵孤立树,并计算数据x在每一棵孤立树上的路径长度h(x),即叶子结点到根节点的距离;
步骤1.3,根据路径长度h(x)判断数据x是否为异常数据,若是,则将其剔除。


4.根据权利要求3所述基于孤立森林与WGAN网络的风电输出功率预测方法,其特征在于,所述限定高度在log(n)~log(n-1)之间,n为数据个数。


5.根据权利要求3所述基于孤立森林与WGAN网络的风电输出功率预测方法,其特征在于,计算数据x在所有孤立树上的平均路径长度c(n),使用平均路径长度c(n)来标准化数据长度h(x),从而形成最后完整的孤立森林;
所述平均路径长度c(n)的计算公式如下:



其中,H(n-1)为调节函数,H(n-1)=ln(n-1)+ζ,ζ为欧拉常数,ζ=0.5772156649,n为数据个数;c(n)是h(x)在n个数据的情况下的平均值,使用其来规范化h(x);
计算整个孤立森林的路径长度平均值E(h(x)),并通过下式计算异常分数s(x,n):



其中,E(h(x))为h(x)的期望;s(x,n)取值为[0,1],当s(x,n)为1时数据x为异常值;当s(x,n)小于0.5时数据x为正常值;当s(x,n)为0.5±0.01时当前特征数据集中无明显的...

【专利技术属性】
技术研发人员:王永生武煜昊徐昊许志伟苏晓明刘广文
申请(专利权)人:内蒙古工业大学
类型:发明
国别省市:内蒙古;15

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1