【技术实现步骤摘要】
数据降维方法、装置、计算机设备和存储介质
[0001]本申请涉及电力系统
,特别是涉及一种数据降维方法、装置、计算机设备、存储介质和计算机程序产品。
技术介绍
[0002]随着人们对于电力能源的低碳化提出了更高的要求,以风力和光伏为主的可再生能源逐渐替代化石能源,在发电领域中占据了越来越大的比例。风力发电作为应用最广泛的新能源,具有典型的随机性和不可预测性,加大了制定合理的电力规划方案的难度。如何在这种不可预测的自然条件下,必要尽可能准确地计算新能源的发电能力是亟待解决的问题。
[0003]当前电网中存在海量的数据可以用来分析和挖掘风力发电的特性,由于测风塔采集到的不同种类的影响因素之间往往存在着线性或非线性的关系,因此存在冗余的影响因素,这些冗余数据不仅增加了建模的复杂度,甚至会导致相关模型的不准确。为了更好地挖掘数值天气预报的数据价值,需要对数据冗余问题进行研究,采用有效的方法对于数据进行筛选与降维,降低数据冗余性,提升数据的应用价值。
[0004]传统技术中的降维方法可以分为线性降维方法和非线性降维方法,其中线性降维的代表算法有主成分分析(PCA)和线性判别分析(LDA)等,线性方法将原始数据集嵌入线性结构中,模型计算简单,对于线性和高斯分布的数据效果良好。然而,当实际数据出现明显非线性结构的时候,降维效果明显欠佳。常用的非线性降维方法中,核主成分分析法(KPCA)中最关键的核选取困难,目前只能依托经验判断,而t
‑
分布邻域嵌入(t
‑
SNE)算法计算复 ...
【技术保护点】
【技术特征摘要】
1.一种数据降维方法,其特征在于,所述方法包括:获取风电功率的多种影响因素以及影响因素数据,所述影响因素数据包括多种影响因素在目标季节内多个时刻的参数值;根据所述目标季节的影响因素数据,对所述多种影响因素进行多重共线性诊断,得到每一个影响因素的多重共线性诊断参数;如果根据各所述影响因素的多重共线性诊断参数,确定所述多种影响因素之间存在多重共线性,则根据所述目标季节的影响因素数据、预设影响因素观测数据以及岭参数,计算各所述影响因素的岭回归系数;根据所述岭回归系数与所述岭参数之间的对应关系对各个影响因素进行筛选,剔除所述岭回归系数不满足预设岭回归系数变化条件的影响因素,得到多个目标影响因素。2.根据权利要求1所述的方法,其特征在于,在所述根据所述目标季节的影响因素数据,对所述多种影响因素进行多重共线性诊断,得到每一个影响因素的多重共线性诊断参数的步骤之后,所述方法还包括:根据每一个影响因素的多重共线性诊断参数,判断所述多种影响因素之间是否存在多重共线性。3.根据权利要求2所述的方法,其特征在于,所述影响因素的多重共线性诊断参数包括容忍度;所述根据所述目标季节的影响因素数据,对所述多种影响因素进行多重共线性诊断,得到每一个影响因素的多重共线性诊断参数,包括:针对每一影响因素,对所述影响因素对应的目标季节的影响因素数据进行最小二乘法计算,确定所述影响因素的复相关系数;根据预设目标值与所述复相关系数的平方,计算所述容忍度;所述根据每一个影响因素的多重共线性诊断参数,判断所述多种影响因素之间是否存在多重共线性,包括:如果所述每一个影响因素的容忍度均小于第一预设阈值,则确定所述多种影响因素之间存在多重共线性。4.根据权利要求2所述的方法,其特征在于,所述影响因素的多重共线性诊断参数包括容忍度、方差膨胀因子;所述根据所述目标季节的影响因素数据,对所述多种影响因素进行多重共线性诊断,得到每一个影响因素的多重共线性诊断参数,包括:针对每一影响因素,对所述影响因素对应的目标季节的影响因素数据进行最小二乘法计算,确定所述影响因素的复相关系数;根据预设目标值与所述复相关系数的平方,计算所述容忍度;将所述容忍度的倒数作为所述影响因素的方差膨胀因子;所述根据每一个影响因素的多重共线性诊断参数,判断所述多种影响因素之间是否存在多重共线性,包括:如果所述每一个影响因素的方差膨胀因子均大于第二预设阈值,则确定所述多种影响因素之间存在多重共线性。5.根据权利要求2所述的方法,其特征在于,所述影响因素的多重共线性诊断参数包括
条件指数;所述根据所述目标季节的影响因素数据,对所述多种影响因素进行多重共线性诊断,得到每一个影响因素的多重共线性诊断参数,包括:根据所述目标季节的影响因素数据,确定第一数据矩阵;根据所述第一数据矩阵以及所述第一数据矩阵的转置矩阵,确定第一观测矩阵;计算所述第一观测矩阵的至少一个特征根;将最大的特征根与最小的特征根的比值作为最大的...
【专利技术属性】
技术研发人员:乔颖,鲁宗相,孙书鑫,王楠,袁帅,程艳,
申请(专利权)人:国网山东省电力公司电力科学研究院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。