一种基于主元降维和间隙统计的负荷聚类装置及方法制造方法及图纸

技术编号:27287923 阅读:12 留言:0更新日期:2021-02-06 11:56
本发明专利技术公开了一种基于主元降维和间隙统计的负荷聚类方法,涉及电力负荷数据处理技术领域,其技术要点包括:S1:获取海量用户原始电力负荷数据B;S2:对数据B做主成分分析,得到数据C;S3:对数据C做间隙统计计算,得到离散度和间隙值数据D;S4:根据数据D计算聚类个数,对所述聚类个数做判断,若聚类个数≥2时,则带入聚类算法进行聚类,获得聚类结果,否则结束步骤,通过对智能电表获得的海量负荷数据进行降维,能够减少运算的复杂度;同时方法能够获得降维数据后的最优聚类数,并通过离散度对数与聚类个数n的曲线关系,实现聚类数效果的可视化,本方法能够避免聚类算法的随机性,提高聚类速度和准确性。和准确性。和准确性。

【技术实现步骤摘要】
一种基于主元降维和间隙统计的负荷聚类装置及方法


[0001]本专利技术涉及电力负荷数据处理
,具体涉及一种基于主元降维和间隙统计的负荷聚类装置及方法。

技术介绍

[0002]随着智能电表大规模应用,电力企业可获得海量的负荷数据。而分析海量负荷数据的关键工作之一是进行负荷聚类,也是当前工业界和学术界关注的重点。
[0003]国内外负荷聚类方法可分为直接聚类法和间接聚类法。直接聚类法,是指直接以负荷数据作为输入量的聚类方法。间接聚类法,是先对负荷数据做分析、处理和降维,再进行聚类的方法。直接法由于输入数据维数过大,容易出现维数灾和聚类时间过长;而间接法存在聚类中心和类别数确定困难。
[0004]因此解决上述问题是我们亟需的。

技术实现思路

[0005]有鉴于此,本专利技术目的在于提供一种基于主元降维和间隙统计的负荷聚类装置及方法,以解决负荷聚类过程中的海量数据优化降维和聚类类别数确定的问题。
[0006]一种基于主元降维和间隙统计的负荷聚类装置,包括:
[0007]电力数据预处理装置,其用于调取某个时间段汇入电网的原始电力负荷数据样本A,并于所述时间段按等间隔提取原始电力负荷数据样本A,并生成电力负荷数据B;
[0008]电力数据采集装置,其用于接收所述电力数据预处理装置生成的电力负荷数据B;
[0009]电力数据筛选装置,其用于对所述电力负荷数据B做主成分筛选,得到K维特征数据C;
[0010]电力数据聚类处理装置,其用于对K维特征数据C做聚类处理,得到n个子集、聚类中心点Ck和子集与聚类中心的距离平方和S
k
,令聚类数n=1和n=2,得到聚类后的离散度ω(n);对得到的离散度取自然对数,选取一个参考数据集r,得到间隙值G(n),并记离散度ω(n)和间隙值G(n)为数据D;
[0011]电力数据聚类判定装置,其通过数据集r、间隙值G(n)和离散度ω(n)得到参考数据集的离散度估计值E{ln[W
r
(n)]},并计算数据集产生的分布误差δ,通过表达式 G(n)≥G(n+1)-δ
n+1
,得到最佳聚类个数,对聚类个数做判定,若聚类个数≥2时,则进行聚类处理,获取聚类结果,得到最佳聚类个数,并带入聚类算法中,获取聚类结果。
[0012]数据显示装置,其用于显示聚类结果图像。
[0013]此外基于本装置,本专利技术还提供一种基于主元降维和间隙统计的负荷聚类方法来实现具体处理效果。
[0014]一种基于主元降维和间隙统计的负荷聚类方法,包括步骤:S1:获取用户原始电力负荷数据B;S2:对数据B做主成分分析,得到K维特征数据C;S3:对K维特征数据C做聚类处理,得到n个子集、聚类中心点Ck和子集与聚类中心的距离平方和S
k
,令聚类数n=1 和n=
2,得到聚类后的离散度ω(n);对得到的离散度取自然对数,选取一个参考数据集r,得到间隙值G(n),将离散度ω(n)和间隙值G(n)记为数据D;S4:根据数据D计算聚类个数,对所述聚类个数做判断,若聚类个数≥2时,则带入聚类算法进行聚类,获得聚类结果,否则结束步骤。
[0015]在上述方案中,通过对获取的海量用户原始电力负荷数据A做主成分分析来实现数据A的主元降维,能有效减少数据量,降低了数据处理运算的复杂度,通过对上述数据B做间隙统计计算得到离散度和间隙值,通过对离散度和间隙值处理计算得到最优聚类个数,通过聚类个数与离散度对数建立曲线关系来实现聚类效果的可视化,相比于现有的聚类处理,本方案避免聚类算法的随机性,提高聚类速度和准确性。
[0016]进一步地,步骤S2中还包括:
[0017]步骤S21:对数据A进行负荷数据归一化处理,将数据投影到[0,1]区间,得到样本数据 A1,其表达式为;
[0018][0019]S22:对样本数据A1中每个特征序列做特征中心化处理,得到样本特征A2数据,其表达式为;
[0020][0021]S23:求样本特征A2数据之间的协方差矩阵C;
[0022][0023]S24:求样本特征A2数据协方差阵列的特征值λ和特征向量μ;
[0024]Cu=λu
ꢀꢀ
(4)
[0025]S25:选取前K个最大的特征值,其中λ取值大于0.85,记为降维后的K维特征数据。
[0026]在本方案中,因不同用户的不同用电行为的差异,往往不在一个数量级上,直接带入算法会有较大误差,且无法在图像上进行对比,通过对负荷数据归一化处理,并投影至[0,1]区间来减少数据运算复杂性,通过对数据的特征中心化结合协方差矩阵计算出特征向量,最终得到降维的K维特征数据,实现原始电力负荷数据的主元降维,减少运算量,减低了运算误差。
[0027]进一步地,步骤S3中还包括:
[0028]步骤S31:对K维特征数据进行聚类处理,令聚类数n=1和n=2,分别计算聚类后的离散度;
[0029][0030][0031]其中,K维特征数据Q={x
i
}聚类后得到n个子集,Q1、Q2...Q
n
为K维特征数据聚类后
的子集,Q
k
为任一子集,S
k
为子集内每个样本到聚类中心的距离平方和,Ck作为Qk的聚类中心点,ω(n)为对n类聚类结果的评价函数即离散度;
[0032]可以理解的是,对K维特征数据进行聚类处理,可采用现有技术中的各种聚类处理技术实现。
[0033]S32:将上述不同n值下得到的离散度取其自然对数,然后选取一个参考数据与之进行对比来判定最佳聚类个数,其表达式为:
[0034]G(n)=E{ln[W
r
(n)]}-ln[W(n)]ꢀꢀ
(7)
[0035][0036]其中,r表示参考数据集,E{ln[W
r
(n)]}为参考数据集的离散度估计值,G(n)为间隙值。
[0037]在本方案中,将离散度做为对n类聚类结果的评价函数,再对不同n值下得到的离散度取其自然对数,选取参考数据来求得最佳聚类个数便于后续建立图像曲线关系。
[0038]步骤S32中,对生成参考数据集产生的分布误差做计算,其表达式为:
[0039][0040]在本方案中,上述处理实现对不同类别间隙值的差异误差拐点计算。
[0041]进一步地,在步骤S4中,还包括步骤:
[0042]S41:判断最佳聚类个数n,其表达式为:
[0043]G(n)≥G(n+1)-δ
n+1
ꢀꢀ
(10)
[0044]S42:当n=1,结束步骤,若n≥2,则进入以下步骤;
[0045]S43:根据离散度对数与聚类个数n的曲线关系,取拐点数为最佳聚类个数,每条折线之间的夹角为α
n
,其表达式为:
[0046][0047]其中,
[00本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于主元降维和间隙统计的负荷聚类装置,其特征在于,包括:电力数据预处理装置,其用于调取某个时间段汇入电网的原始电力负荷数据样本A,并于所述时间段按等间隔提取原始电力负荷数据样本A,并生成电力负荷数据B;电力数据采集装置,其用于接收所述电力数据预处理装置生成的电力负荷数据B;电力数据筛选装置,其用于对所述电力负荷数据B做主成分筛选,得到K维特征数据C;电力数据聚类处理装置,其用于对K维特征数据C做聚类处理,得到n个子集、聚类中心点Ck和子集与聚类中心的距离平方和S
k
,令聚类数n=1和n=2,得到聚类后的离散度ω(n);对得到的离散度取自然对数,选取一个参考数据集r,得到间隙值G(n),并记离散度ω(n)和间隙值G(n)为数据D;电力数据聚类判定装置,其通过数据集r、间隙值G(n)和离散度ω(n)得到参考数据集的离散度估计值,并计算数据集产生的分布误差δ,通过表达式G(n)≥G(n+1)-δ
n+1
,得到最佳聚类个数,对聚类个数做判定,若聚类个数≥2时,则进行聚类处理,获取聚类结果;数据显示装置,其用于显示聚类结果图像。2.使用权利要求1所述的一种基于主元降维和间隙统计的负荷聚类装置的方法,其特征在于,包括以下步骤:S1:获取用户原始电力负荷数据B;S2:对数据B做主成分分析,得到K维特征数据C;S3:对K维特征数据C做聚类处理,得到n个子集、聚类中心点Ck和子集与聚类中心的距离平方和S
k
,令聚类数n=1和n=2,得到聚类后的离散度ω(n);对得到的离散度取自然对数,选取一个参考数据集r,得到间隙值G(n),将离散度ω(n)和间隙值G(n)记为数据D;S4:根据数据D计算聚类个数,对所述聚类个数做判断,若聚类个数≥2时,则带入聚类算法进行聚类,获得聚类结果,否则结束步骤。3.根据权利要求2所述的一种基于主元降维和间隙统计的负荷聚类方法,其特征在于,步骤S2中包括:S21:对数据A进行负荷数据归一化处理,将数据投影到[0,1]区间,得到样本数据A1,其表达式为;S22:对样本数据A1中每个特征序列做特征中心化处理,得到样本特征A2数据,其表达式为;S23:求样本特征A2数据之间的协方差矩阵C;S24:求样本特征A2数据协方差阵列的特征值λ和特征向量μ;Cu=λu
ꢀꢀꢀ...

【专利技术属性】
技术研发人员:王晞胥威汀张全明陈博张玉鸿魏俊刘莹吕学海
申请(专利权)人:国网四川省电力公司经济技术研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1