数据降维方法、装置、计算机设备和存储介质制造方法及图纸

技术编号:34389137 阅读:60 留言:0更新日期:2022-08-03 21:15
本申请涉及一种数据降维方法、装置、计算机设备、存储介质和计算机程序产品。所述方法包括:获取风电功率的多种影响因素以及影响因素数据;根据所述目标季节的影响因素数据,对所述多种影响因素进行多重共线性诊断,在多种影响因素之间存在多重共线性,则根据所述目标季节的影响因素数据、预设影响因素观测数据以及岭参数,计算各所述影响因素的岭回归系数;根据所述岭回归系数与所述岭参数之间的对应关系对各个影响因素进行筛选,剔除所述岭回归系数不满足预设岭回归系数变化条件的影响因素,得到多个目标影响因素。通过采用本方法,可以通过各个影响因素的岭回归系数对多个影响因素进行筛选,在保证数据应用价值的条件下,降低数据冗余性。降低数据冗余性。降低数据冗余性。

【技术实现步骤摘要】
数据降维方法、装置、计算机设备和存储介质


[0001]本申请涉及电力系统
,特别是涉及一种数据降维方法、装置、计算机设备、存储介质和计算机程序产品。

技术介绍

[0002]随着人们对于电力能源的低碳化提出了更高的要求,以风力和光伏为主的可再生能源逐渐替代化石能源,在发电领域中占据了越来越大的比例。风力发电作为应用最广泛的新能源,具有典型的随机性和不可预测性,加大了制定合理的电力规划方案的难度。如何在这种不可预测的自然条件下,必要尽可能准确地计算新能源的发电能力是亟待解决的问题。
[0003]当前电网中存在海量的数据可以用来分析和挖掘风力发电的特性,由于测风塔采集到的不同种类的影响因素之间往往存在着线性或非线性的关系,因此存在冗余的影响因素,这些冗余数据不仅增加了建模的复杂度,甚至会导致相关模型的不准确。为了更好地挖掘数值天气预报的数据价值,需要对数据冗余问题进行研究,采用有效的方法对于数据进行筛选与降维,降低数据冗余性,提升数据的应用价值。
[0004]传统技术中的降维方法可以分为线性降维方法和非线性降维方法,其中线性降维的代表算法有主成分分析(PCA)和线性判别分析(LDA)等,线性方法将原始数据集嵌入线性结构中,模型计算简单,对于线性和高斯分布的数据效果良好。然而,当实际数据出现明显非线性结构的时候,降维效果明显欠佳。常用的非线性降维方法中,核主成分分析法(KPCA)中最关键的核选取困难,目前只能依托经验判断,而t

分布邻域嵌入(t

SNE)算法计算复杂度高,且只能降维至2维或者3维,对于风电预测可能使得数据点揉杂在一起无法区分,降维效果不好。

技术实现思路

[0005]基于此,有必要针对上述技术问题,提供一种能够提高数据应用价值的数据降维方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。
[0006]第一方面,本申请提供了一种数据降维方法。所述方法包括:
[0007]获取风电功率的多种影响因素以及影响因素数据,所述影响因素数据包括多种影响因素在目标季节内多个时刻的参数值;
[0008]根据所述目标季节的影响因素数据,对所述多种影响因素进行多重共线性诊断,得到每一个影响因素的多重共线性诊断参数;
[0009]如果根据各所述影响因素的多重共线性诊断参数,确定所述多种影响因素之间存在多重共线性,则根据所述目标季节的影响因素数据、预设影响因素观测数据以及岭参数,计算各所述影响因素的岭回归系数;
[0010]根据所述岭回归系数与所述岭参数之间的对应关系对各个影响因素进行筛选,剔除所述岭回归系数不满足预设岭回归系数变化条件的影响因素,得到多个目标影响因素。
[0011]在其中一个实施例中,在所述根据所述目标季节的影响因素数据,对所述多种影响因素进行多重共线性诊断,得到每一个影响因素的多重共线性诊断参数的步骤之后,所述方法还包括:
[0012]根据每一个影响因素的多重共线性诊断参数,判断所述多种影响因素之间是否存在多重共线性。
[0013]在其中一个实施例中,所述影响因素的多重共线性诊断参数包括容忍度;
[0014]所述根据所述目标季节的影响因素数据,对所述多种影响因素进行多重共线性诊断,得到每一个影响因素的多重共线性诊断参数,包括:
[0015]针对每一影响因素,对所述影响因素对应的目标季节的影响因素数据进行最小二乘法计算,确定所述影响因素的复相关系数;
[0016]根据预设目标值与所述复相关系数的平方,计算所述容忍度;
[0017]所述根据每一个影响因素的多重共线性诊断参数,判断所述多种影响因素之间是否存在多重共线性,包括:
[0018]如果所述每一个影响因素的容忍度均小于第一预设阈值,则确定所述多种影响因素之间存在多重共线性。
[0019]在其中一个实施例中,所述影响因素的多重共线性诊断参数包括容忍度、方差膨胀因子;
[0020]所述根据所述目标季节的影响因素数据,对所述多种影响因素进行多重共线性诊断,得到每一个影响因素的多重共线性诊断参数,包括:
[0021]针对每一影响因素,对所述影响因素对应的目标季节的影响因素数据进行最小二乘法计算,确定所述影响因素的复相关系数;
[0022]根据预设目标值与所述复相关系数的平方,计算所述容忍度;
[0023]将所述容忍度的倒数作为所述影响因素的方差膨胀因子;
[0024]所述根据每一个影响因素的多重共线性诊断参数,判断所述多种影响因素之间是否存在多重共线性,包括:
[0025]根据每一个影响因素的方差膨胀因子,判断所述多种影响因素之间是否存在多重共线性;
[0026]如果所述每一个影响因素的方差膨胀因子均大于第二预设阈值,则确定所述多种影响因素之间存在多重共线性。
[0027]在其中一个实施例中,所述影响因素的多重共线性诊断参数包括条件指数;
[0028]所述根据所述目标季节的影响因素数据,对所述多种影响因素进行多重共线性诊断,得到每一个影响因素的多重共线性诊断参数,包括:
[0029]根据所述目标季节的影响因素数据,确定第一数据矩阵;
[0030]根据所述第一数据矩阵以及所述第一数据矩阵的转置矩阵,确定第一观测矩阵;
[0031]计算所述第一观测矩阵的至少一个特征根;
[0032]将最大的特征根与最小的特征根的比值作为最大的条件指数;
[0033]所述根据每一个影响因素的多重共线性诊断参数,判断所述多种影响因素之间是否存在多重共线性,包括:
[0034]根据所述最大的条件指数,判断所述多种影响因素之间是否存在多重共线性;
[0035]如果所述最大的条件指数大于或等于第三预设阈值,则确定所述多种影响因素之间存在多重共线性。
[0036]在其中一个实施例中,所述根据所述目标季节的影响因素数据、预设影响因素观测数据以及岭参数,计算各所述影响因素的岭回归系数,包括:
[0037]根据所述目标季节的影响因素数据,确定第一数据矩阵;
[0038]根据所述第一数据矩阵以及所述第一数据矩阵的转置矩阵,确定第一观测矩阵;
[0039]根据所述第一观测矩阵、所述岭参数以及预设标准值,确定目标矩阵;
[0040]根据所述第一数据矩阵的转置矩阵以及所述预设影响因素观测数据,确定第二观测矩阵;
[0041]根据所述目标矩阵与所述第二观测矩阵,得到各所述影响因素的岭回归系数。
[0042]在其中一个实施例中,所述根据所述岭回归系数与所述岭参数之间的对应关系对各个影响因素进行筛选,剔除所述岭回归系数不满足预设岭回归系数变化条件的影响因素,得到多个目标影响因素,包括:
[0043]在所述岭参数在预设范围内的情况下,将所述岭回归系数符合预设稳定条件且绝对值小于预设稳定阈值的影响因素确定为第一影响因素;
[0044]在所述岭参数在预设范围内的情况下,本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据降维方法,其特征在于,所述方法包括:获取风电功率的多种影响因素以及影响因素数据,所述影响因素数据包括多种影响因素在目标季节内多个时刻的参数值;根据所述目标季节的影响因素数据,对所述多种影响因素进行多重共线性诊断,得到每一个影响因素的多重共线性诊断参数;如果根据各所述影响因素的多重共线性诊断参数,确定所述多种影响因素之间存在多重共线性,则根据所述目标季节的影响因素数据、预设影响因素观测数据以及岭参数,计算各所述影响因素的岭回归系数;根据所述岭回归系数与所述岭参数之间的对应关系对各个影响因素进行筛选,剔除所述岭回归系数不满足预设岭回归系数变化条件的影响因素,得到多个目标影响因素。2.根据权利要求1所述的方法,其特征在于,在所述根据所述目标季节的影响因素数据,对所述多种影响因素进行多重共线性诊断,得到每一个影响因素的多重共线性诊断参数的步骤之后,所述方法还包括:根据每一个影响因素的多重共线性诊断参数,判断所述多种影响因素之间是否存在多重共线性。3.根据权利要求2所述的方法,其特征在于,所述影响因素的多重共线性诊断参数包括容忍度;所述根据所述目标季节的影响因素数据,对所述多种影响因素进行多重共线性诊断,得到每一个影响因素的多重共线性诊断参数,包括:针对每一影响因素,对所述影响因素对应的目标季节的影响因素数据进行最小二乘法计算,确定所述影响因素的复相关系数;根据预设目标值与所述复相关系数的平方,计算所述容忍度;所述根据每一个影响因素的多重共线性诊断参数,判断所述多种影响因素之间是否存在多重共线性,包括:如果所述每一个影响因素的容忍度均小于第一预设阈值,则确定所述多种影响因素之间存在多重共线性。4.根据权利要求2所述的方法,其特征在于,所述影响因素的多重共线性诊断参数包括容忍度、方差膨胀因子;所述根据所述目标季节的影响因素数据,对所述多种影响因素进行多重共线性诊断,得到每一个影响因素的多重共线性诊断参数,包括:针对每一影响因素,对所述影响因素对应的目标季节的影响因素数据进行最小二乘法计算,确定所述影响因素的复相关系数;根据预设目标值与所述复相关系数的平方,计算所述容忍度;将所述容忍度的倒数作为所述影响因素的方差膨胀因子;所述根据每一个影响因素的多重共线性诊断参数,判断所述多种影响因素之间是否存在多重共线性,包括:如果所述每一个影响因素的方差膨胀因子均大于第二预设阈值,则确定所述多种影响因素之间存在多重共线性。5.根据权利要求2所述的方法,其特征在于,所述影响因素的多重共线性诊断参数包括
条件指数;所述根据所述目标季节的影响因素数据,对所述多种影响因素进行多重共线性诊断,得到每一个影响因素的多重共线性诊断参数,包括:根据所述目标季节的影响因素数据,确定第一数据矩阵;根据所述第一数据矩阵以及所述第一数据矩阵的转置矩阵,确定第一观测矩阵;计算所述第一观测矩阵的至少一个特征根;将最大的特征根与最小的特征根的比值作为最大的...

【专利技术属性】
技术研发人员:乔颖鲁宗相孙书鑫王楠袁帅程艳
申请(专利权)人:国网山东省电力公司电力科学研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1