基于曲线均值聚类算法的边缘侧用电数据聚类方法及装置制造方法及图纸

技术编号:32133880 阅读:13 留言:0更新日期:2022-01-29 19:38
本发明专利技术提供了一种基于曲线均值聚类算法的边缘侧用电数据聚类方法及装置,涉及用电数据聚类的技术领域,所述方法包括:获取第一用电日负荷数据,并对用电日负荷数据进行预处理以获取第二用电日负荷数据;对第二用电日负荷数据进行低秩性分析和奇异值计算,并采用肘方法确定最优簇数;基于最优簇数对第二用电日负荷数据采用K均值聚类算法进行聚类。通过本发明专利技术可以在边缘侧对用电数据进行聚类,为基于边

【技术实现步骤摘要】
基于曲线均值聚类算法的边缘侧用电数据聚类方法及装置


[0001]本专利技术涉及用电数据聚类的
,尤其是涉及一种基于曲线均值聚类算法的边缘侧用电数据聚类方法及装置。

技术介绍

[0002]随着电网智能化、数字化建设的推进,基于边

云协同的电力高级应用不断增加。边缘计算技术将计算力下放至近电力终端物理设备和数据源侧,基于边缘计算节点自主快速对数据进行处理分析,满足电力信息系统对海量数据快速处理的需求,支撑智能电网高级应用。其中,边缘侧营销大数据蕴含着丰富的用电信息,而海量多源多维度数据难以发现其内在规律,为此,通过对海量多源用电数据进行聚类分析,将用电行为习惯相似的电力用户进行归类,提升电网精益化运营,为人工智能高级应用提供基础。

技术实现思路

[0003]有鉴于此,本专利技术的目的在于提供一种基于曲线均值聚类算法的边缘侧用电数据聚类方法及装置,以在边缘侧对用电数据进行聚类,为基于边

云协同的电力高级应用提供强有力的支撑。
[0004]本专利技术提供了一种基于曲线均值聚类算法的边缘侧用电数据聚类方法,具体按照如下步骤进行:
[0005]获取第一用电日负荷数据,并对所述用电日负荷数据进行预处理以获取第二用电日负荷数据;
[0006]对所述第二用电日负荷数据进行低秩性分析和奇异值计算,并采用肘方法确定最优簇数;
[0007]基于所述最优簇数对所述第二用电日负荷数据采用K均值聚类算法进行聚类。
[0008]优选的,所述方法还包括:
[0009]获取聚类的簇内平均距离、簇间平均距离以及DI指数以对聚类结果进行评价。
[0010]优选的,所述对所述第二用电日负荷数据进行低秩性分析和奇异值计算的步骤包括:
[0011]采用如下公式进行低秩性分析和奇异值计算:
[0012]L=UΣV
T
[0013]U—m
×
m阶酉矩阵;
[0014]∑—m
×
n阶非负实数对角矩阵;
[0015]V—n
×
n阶酉矩阵。
[0016]优选的,所述对所述用电日负荷数据进行预处理以获取第二用电日负荷数据的步骤包括:
[0017]删除所述第一用电日负荷数据含缺失值的数据,并对所述第一用电日负荷数据进行归一化处理。
[0018]优选的,所述对所述第二用电日负荷数据进行低秩性分析和奇异值计算,并采用肘方法确定最优簇数的步骤包括:
[0019]采用如下公式获取两对象之间的距离:
[0020]d=1

|ρ|
[0021]ρ—相关系数;
[0022]相关系数采用如下公式计算:
[0023][0024]基于相关系数获取r
SSE
与簇数C关系曲线以获取最优簇数基于相关系数获取r
SSE
与簇数C关系曲线以获取最优簇数;
[0025][0026]k—总簇数;
[0027]n
i
—第i个分簇的对象数量;
[0028]d
ij
—第i个分簇中,第j个对象与该簇质心的距离。
[0029]优选的,所述基于所述最优簇数对所述第二用电日负荷数据采用K均值聚类算法进行聚类的步骤包括:
[0030]获取所述第二用电日负荷数据、设置最大迭代次数、迭代误差,并基于所述最优簇数获取第一聚类中心,并初始化迭代次数i=1;
[0031]判定所述迭代次数i是否小于最大迭代次数,若是,则执行如下步骤:
[0032]基于所述第二用电日负荷数据以及所述第一聚类中心获取第一属隶度函数;
[0033]基于所述第一属隶度函数获取第二聚类中心,并所述基于第二聚类中心以及所述第二用电日负荷数据获取第二隶属度函数;
[0034]基于所述第二隶属度函数与所述第一隶属度函数之间判定是否小于迭代误差:
[0035]若所述第二隶属度函数与所述第一隶属度函数之间小于迭代误差,则输出第二隶属度函数;
[0036]若所述第二隶属度函数与所述第一隶属度函数之间大于迭代误差,令迭代次数i=迭代次数i+1,令所述第二隶属度函数为第一隶属度函数,令所述第二聚类中心为第一聚类中心,并重新执行所述判定所述迭代次数i是否小于最大迭代次数的步骤。
[0037]优选的,所述基于所述最优簇数对所述第二用电日负荷数据采用K均值聚类算法进行聚类的步骤还包括:
[0038]获取所述第二用电日负荷数据、设置最大迭代次数、迭代误差,并基于所述最优簇数获取第一聚类中心,并初始化迭代次数i=1;
[0039]判定所述迭代次数i是否小于最大迭代次数,若否,则结束此次聚类。
[0040]优选的,采用如下公式获取簇内平均距离
[0041][0042]|C|—簇C的样本个数;
[0043]x
i
=簇C中的对象;
[0044]dist(x
i
,x
j
)—距离度量函数;
[0045]采用如下公式计算簇间最小距离d
min
(C
i
,C
j
):
[0046][0047]采用如下公式DI指数:
[0048][0049]k—总簇数;
[0050]d
min
(C
i
,C
j
)—两个簇间最小距离;
[0051]diam(C
l
)—簇C
l
内样本间的最远距离。
[0052]另一方面,本专利技术提供了一种基于曲线均值聚类算法的边缘侧用电数据聚类装置,包括:
[0053]负荷数据获取模块:用于获取第一用电日负荷数据,并对所述用电日负荷数据进行预处理以获取第二用电日负荷数据;
[0054]最优簇数获取模块:用于对所述第二用电日负荷数据进行低秩性分析和奇异值计算,并采用肘方法确定最优簇数;
[0055]聚类模块:用于基于所述最优簇数对所述第二用电日负荷数据采用K均值聚类算法进行聚类。
[0056]本专利技术实施例带来了以下有益效果:本专利技术提供了一种基于曲线均值聚类算法的边缘侧用电数据聚类方法及装置,所述方法包括:获取第一用电日负荷数据,并对用电日负荷数据进行预处理以获取第二用电日负荷数据;对第二用电日负荷数据进行低秩性分析和奇异值计算,并采用肘方法确定最优簇数;基于最优簇数对第二用电日负荷数据采用K均值聚类算法进行聚类。通过本专利技术可以在边缘侧对用电数据进行聚类,为基于边

云协同的电力高级应用提供强有力的支撑。
[0057]本专利技术的其他特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本专利技术而了解。本专利技术的目的和其他优点在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。
[0058]为使本专利技术的上本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于曲线均值聚类算法的边缘侧用电数据聚类方法,其特征在于,具体按照如下步骤进行:获取第一用电日负荷数据,并对所述用电日负荷数据进行预处理以获取第二用电日负荷数据;对所述第二用电日负荷数据进行低秩性分析和奇异值计算,并采用肘方法确定最优簇数;基于所述最优簇数对所述第二用电日负荷数据采用K均值聚类算法进行聚类。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:获取聚类的簇内平均距离、簇间平均距离以及DI指数以对聚类结果进行评价。3.根据权利要求1所述的方法,其特征在于,所述对所述第二用电日负荷数据进行低秩性分析和奇异值计算的步骤包括:采用如下公式进行低秩性分析和奇异值计算:L=UΣV
T
U—m
×
m阶酉矩阵;∑—m
×
n阶非负实数对角矩阵;V—n
×
n阶酉矩阵。4.根据权利要求1所述的方法,其特征在于,所述对所述用电日负荷数据进行预处理以获取第二用电日负荷数据的步骤包括:删除所述第一用电日负荷数据含缺失值的数据,并对所述第一用电日负荷数据进行归一化处理。5.根据权利要求1所述的方法,其特征在于,所述对所述第二用电日负荷数据进行低秩性分析和奇异值计算,并采用肘方法确定最优簇数的步骤包括:采用如下公式获取两对象之间的距离:d=1

|ρ|ρ—相关系数;相关系数采用如下公式计算:基于相关系数获取r
SSE
与簇数C关系曲线以获取最优簇数;k—总簇数;n
i
—第i个分簇的对象数量;d
ij
—第i个分簇中,第j个对象与该簇质心的距离。6.根据权利要求1所述的方法,其特征在于,所述基于所述最优簇数对所述第二用电日负荷数据采用K均值聚类算法进行聚类的步骤包括:获取所述第二用电日负荷数据、设置最大迭代次数、迭代误差,并基于所述最优簇数获取第一聚类中心,并初始化迭代次数i=1;
判定所述迭代次数i是否小于最大迭代次数,若是,则执行如下步骤:基于所述第二用电日负荷数据以及所述第一聚类中心获取第一属隶度函数;基于所述第一属隶度函数获取第二聚类中心,并所述基于第二聚类中心以及所述第二用电日负荷数据获取第二隶属度函数;基于所述第二隶属度函数与所述第一隶属度函数之间判定是否小于迭代误差:若所述第二隶属度函数与所述第一隶属度函数之间小于迭代...

【专利技术属性】
技术研发人员:李聪利张志东杨滨闫龙王斌张恩杰李达陈雪振乐坤黄红军宫博仁李亚前吴凯
申请(专利权)人:国家电网有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1