一种风电装置功率预测方法、系统及存储介质制造方法及图纸

技术编号:37192357 阅读:15 留言:0更新日期:2023-04-20 22:52
本发明专利技术涉及新能源发电技术领域,公开了一种风电装置功率预测方法、系统及存储介质,包括:S1:得到特征数据;S2:对各项数据对应的特征数据进行皮尔逊相关系数计算,得到各项数据对应的皮尔逊相关系数;S3:通过改进K均值聚类法对各项数据对应的皮尔逊相关系数进行异常值识别与剔除,得到数据集;S4:将数据集划分为训练集和校验集;S5:基于训练集和校验集构建风电功率预测模型;S6:通过计算特征数据的交叉相进行数据维度增广,通过方差距、拟合度以及均方根误差选出S5中所得预测模型在该数据集上预测结果最优的数据维度;本发明专利技术解决了现有的风电装置功率预测方法存在精度较低的问题。题。题。

【技术实现步骤摘要】
一种风电装置功率预测方法、系统及存储介质


[0001]本专利技术涉及新能源发电
,尤其涉及一种风电装置功率预测方法、系统及存储介质。

技术介绍

[0002]随着新能源技术的快速发展,风力发电装置的使用越来越广泛,由于受地形以及大气环流影响,风电装置输入具有较强的波动性、随机性以及间歇性,因此,需要通过对风电装置进行功率预测以保障风电装置接入电网后的电网的安全、稳定运行。目前,在进行风电装置功率预测时,大多采用神经网络模型预测的方式,在采用神经网络模型预测时,主要通过使用不同的网络模型或多种网络模型组合进行网络拟合的方式,容易受到数据包含的样本数量和维度的限制从而影响功率预测的准确性。可见,现有的功率预测方法存在预测精度较低的问题。

技术实现思路

[0003]本专利技术提供了一种风电装置功率预测方法、系统及存储介质,以解决现有的风电装置功率预测方法存在精度较低的问题。
[0004]为了实现上述目的,本专利技术通过如下的技术方案来实现:
[0005]第一方面,本专利技术提供一种风电装置功率预测方法,包括:
[0006]S1:采集待预测风电装置的原始数据,并对所述原始数据中各项数据进行数据纬度划分得到特征数据;
[0007]S2:对各项数据对应的所述特征数据进行皮尔逊相关系数计算(Pearson correlation coefficient,PCC),得到各项数据对应的皮尔逊相关系数;
[0008]S3:通过改进K均值聚类法对各项数据对应的皮尔逊相关系数进行异常值识别与剔除,得到数据集;
[0009]S4:将所述数据集划分为训练集和校验集;
[0010]S5:基于所述训练集和所述校验集构建风电功率预测模型;
[0011]S6:通过计算所述特征数据的交叉相进行数据维度增广,通过方差距(Square Gap,SG)、拟合度(R

squared,R2)以及均方根误差(Root Mean Squared Error,RMSE)选出S5中所得预测模型在该数据集上预测结果最优的数据维度,并将该数据纬度作为待预测风电装置的预测结果。
[0012]第二方面,本申请实施例提供一种风电装置功率预测系统,包括处理器、存储器;
[0013]存储器,用于存放计算机程序;
[0014]处理器,用于执行存储器上所存放的程序时,实现第一方面中任一所述的方法步骤。
[0015]第三方面,本申请实施例提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如第一方面所述的方法步骤。
[0016]有益效果:
[0017]本专利技术提供的风电装置功率预测方法,突破了小批量风功率数据对于深度学习的限制,提高了小批量风功率数据的利用率,提出的数据增强思想及方法对于其他预测领域具有一定拓展能力,构建的CNN

LSTM模型兼具CNN与LSTM的优势,相较于经典预测模型有着明显的精度提升。
附图说明
[0018]图1为本专利技术优选实施例的风电装置功率预测方法的流程图;
[0019]图2为本专利技术优选实施例的数据集空间分区图;
[0020]图3为本专利技术优选实施例的拟合度与均方根误差随维度变化曲线图。
具体实施方式
[0021]下面对本专利技术的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0022]除非另作定义,本专利技术中使用的技术术语或者科学术语应当为本专利技术所属领域内具有一般技能的人士所理解的通常意义。本专利技术中使用的“第一”、“第二”以及类似的词语并不表示任何顺序、数量或者重要性,而只是用来区分不同的组成部分。同样,“一个”或者“一”等类似词语也不表示数量限制,而是表示存在至少一个。“连接”或者“相连”等类似的词语并非限定于物理的或者机械的连接,而是可以包括电性的连接,不管是直接的还是间接的。“上”、“下”、“左”、“右”等仅用于表示相对位置关系,当被描述对象的绝对位置改变后,则该相对位置关系也相应地改变。
[0023]请参见图1,本申请实施例提供一种风电装置功率预测方法,包括:
[0024]S1:采集待预测风电装置的原始数据,并对所述原始数据中各项数据进行数据纬度划分得到特征数据;
[0025]S2:对各项数据对应的所述特征数据进行皮尔逊相关系数计算(Pearson correlation coefficient,PCC),得到各项数据对应的皮尔逊相关系数;
[0026]S3:通过改进K均值聚类法对各项数据对应的皮尔逊相关系数进行异常值识别与剔除,得到数据集;
[0027]S4:将所述数据集划分为训练集和校验集;
[0028]S5:基于所述训练集和所述校验集构建风电功率预测模型;
[0029]S6:通过计算所述特征数据的交叉相进行数据维度增广,通过方差距(Square Gap,SG)、拟合度(R

squared,R2)以及均方根误差(Root Mean Squared Error,RMSE)选出S5中所得预测模型在该数据集上预测结果最优的数据维度,并将该数据纬度作为待预测风电装置的预测结果。
[0030]在上述实施例中,各步骤具体实施如下:
[0031]1、采集风电功率原始数据,如时间信息、气象数据、风机数据等,并划分各项数据维度,即数据特征,指单一样本所包含的特征信息,且各维度间应具有较高的非线性,确保数据不出现维度坍缩,其具体数据类型如下表1:
[0032]表1:原始数据变量汇总
[0033][0034]2、计算原始数据集中各维度间的皮尔逊相关系数,计算公式如公式(1)。本专利技术使用的数据集为西班牙某风电场的实测功率数据及该区域数值天气数据,其原始数据各维度间的PCC结果见如下表2:
[0035]表2:各维度间的相关性
[0036][0037][0038]其中,cov(X,Y)为估算变量间的协方差,σ
X
,σ
Y
为变量X、Y的标准差。计算获得的PCC绝对值越大,两维度的线性相关度越高,即越接近:X=kY;反之,则两维度的线性关系越弱,或不存在线性关系。
[0039]3、采用改进K均值聚类进行数据的异常值识别与剔除。
[0040](1)首先选取聚类对象,根据表2中各维度数据的PCC,选取PCC≤0.4的维度,针对各维度依次进行聚类,在识别到某数据样本的某一维度存在异常值时,将该样本直接剔除。
[0041](2)再选定单次进行聚类的数据子集,针对某一维度,每次抽取3000个样本进行训练,并产出该批次下的异常值,即该维度的聚类包含一系列小批量K

means。
[0042](3)选取初始聚类中心,对单次小批量数据进行分本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种风电装置功率预测方法,其特征在于,包括:S1:采集待预测风电装置的原始数据,并对所述原始数据中各项数据进行数据纬度划分得到特征数据;S2:对各项数据对应的所述特征数据进行皮尔逊相关系数计算(Pearson correlation coefficient,PCC),得到各项数据对应的皮尔逊相关系数;S3:通过改进K均值聚类法对各项数据对应的皮尔逊相关系数进行异常值识别与剔除,得到数据集;S4:将所述数据集划分为训练集和校验集;S5:基于所述训练集和所述校验集构建风电功率预测模型;S6:通过计算所述特征数据的交叉相进行数据维度增广,通过方差距(Square Gap,SG)、拟合度(R

squared,R2)以及均方根误差(Root Mean Squared Error,RMSE)选出S5中所得预测模型在该数据集上预测结果最优的数据维度,并将该数据纬度作为待预测风电装置的预测结果。2.根据权利要求1所述的风电装置功率预测方法,其特征在于,所述皮尔逊相关系数计算的计算公式如下式所示:其中,cov(X,Y)为估算变量间的协方差,σ
X
,σ
Y
为变量X、Y的标准差。3.根据权利要求1所述的风电装置功率预测方法,其特征在于,所述通过改进K均值聚类法对各项数据对应的皮尔逊相关系数进行异常值识别与剔除,得到数据集,包括:S301:根据S2计算获得的所述皮尔逊相关系数选取所述皮尔逊相关系数小于等于0.4对应的所述特征数据,并将所述特征数据进行聚类,在识别到所述特征数据存在异常值时,将该样本直接剔除;S302:对所述特征数据进行样本抽取训练,并产出所述特征数据的异常值;S303:对所述特征数据进行分区,记录各分区内样本点数量为数据密度ρ
D
,并定义:其中,batch为单个批次包含的样本数,设置为3000;N为分区数。并认为:非异常值簇的中心只在非异常区,异常值簇的中心只在非异常区。若存在n个异常区,其所有相邻(仅指两分区拥有公共边)分区均为异常区,此类异常区称为紧密异常区,此时聚类簇数k+n,且k初始值为1;S304:计算分区中其余样本点到该中心的欧氏距离,假设样本点包含m个维度,则对于第i聚类中心c
i
,第n个样本点的计算公式为:其中,x
nj
、c
ij
为x
n
、c
i
的第j个维度。计算数据集整体的距离平方和:
将SSE作为评价聚类结果的指标。之后计算每一簇中的样本均值,作为新的聚类中心,重复上述过程,直至完成迭代。4.根据权利要求1所述的风电装置功率预测方法,其特征在于,所述基于所述训练集和所述校验集...

【专利技术属性】
技术研发人员:万代赵邈周恒逸彭思敏莫文慧朱吉然张志丹段绪金李金亮羿敏杨淼唐海国张帝周可慧梁冠萱王邹俊邓威陈伟由凯周芊帆范凯伦
申请(专利权)人:国网湖南省电力有限公司电力科学研究院国家电网有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1