【技术实现步骤摘要】
基于曲线均值聚类算法的边缘侧用电数据聚类方法及装置
[0001]本专利技术涉及用电数据聚类的
,尤其是涉及一种基于曲线均值聚类算法的边缘侧用电数据聚类方法及装置。
技术介绍
[0002]随着电网智能化、数字化建设的推进,基于边
‑
云协同的电力高级应用不断增加。边缘计算技术将计算力下放至近电力终端物理设备和数据源侧,基于边缘计算节点自主快速对数据进行处理分析,满足电力信息系统对海量数据快速处理的需求,支撑智能电网高级应用。其中,边缘侧营销大数据蕴含着丰富的用电信息,而海量多源多维度数据难以发现其内在规律,为此,通过对海量多源用电数据进行聚类分析,将用电行为习惯相似的电力用户进行归类,提升电网精益化运营,为人工智能高级应用提供基础。
技术实现思路
[0003]有鉴于此,本专利技术的目的在于提供一种基于曲线均值聚类算法的边缘侧用电数据聚类方法及装置,以在边缘侧对用电数据进行聚类,为基于边
‑
云协同的电力高级应用提供强有力的支撑。
[0004]本专利技术提供了一种基于曲线均值聚类算法的边缘侧用电数据聚类方法,具体按照如下步骤进行:
[0005]获取第一用电日负荷数据,并对所述用电日负荷数据进行预处理以获取第二用电日负荷数据;
[0006]对所述第二用电日负荷数据进行低秩性分析和奇异值计算,并采用肘方法确定最优簇数;
[0007]基于所述最优簇数对所述第二用电日负荷数据采用K均值聚类算法进行聚类。
[0008]优选的,所述方法还包 ...
【技术保护点】
【技术特征摘要】
1.一种基于曲线均值聚类算法的边缘侧用电数据聚类方法,其特征在于,具体按照如下步骤进行:获取第一用电日负荷数据,并对所述用电日负荷数据进行预处理以获取第二用电日负荷数据;对所述第二用电日负荷数据进行低秩性分析和奇异值计算,并采用肘方法确定最优簇数;基于所述最优簇数对所述第二用电日负荷数据采用K均值聚类算法进行聚类。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:获取聚类的簇内平均距离、簇间平均距离以及DI指数以对聚类结果进行评价。3.根据权利要求1所述的方法,其特征在于,所述对所述第二用电日负荷数据进行低秩性分析和奇异值计算的步骤包括:采用如下公式进行低秩性分析和奇异值计算:L=UΣV
T
U—m
×
m阶酉矩阵;∑—m
×
n阶非负实数对角矩阵;V—n
×
n阶酉矩阵。4.根据权利要求1所述的方法,其特征在于,所述对所述用电日负荷数据进行预处理以获取第二用电日负荷数据的步骤包括:删除所述第一用电日负荷数据含缺失值的数据,并对所述第一用电日负荷数据进行归一化处理。5.根据权利要求1所述的方法,其特征在于,所述对所述第二用电日负荷数据进行低秩性分析和奇异值计算,并采用肘方法确定最优簇数的步骤包括:采用如下公式获取两对象之间的距离:d=1
‑
|ρ|ρ—相关系数;相关系数采用如下公式计算:基于相关系数获取r
SSE
与簇数C关系曲线以获取最优簇数;k—总簇数;n
i
—第i个分簇的对象数量;d
ij
—第i个分簇中,第j个对象与该簇质心的距离。6.根据权利要求1所述的方法,其特征在于,所述基于所述最优簇数对所述第二用电日负荷数据采用K均值聚类算法进行聚类的步骤包括:获取所述第二用电日负荷数据、设置最大迭代次数、迭代误差,并基于所述最优簇数获取第一聚类中心,并初始化迭代次数i=1;
判定所述迭代次数i是否小于最大迭代次数,若是,则执行如下步骤:基于所述第二用电日负荷数据以及所述第一聚类中心获取第一属隶度函数;基于所述第一属隶度函数获取第二聚类中心,并所述基于第二聚类中心以及所述第二用电日负荷数据获取第二隶属度函数;基于所述第二隶属度函数与所述第一隶属度函数之间判定是否小于迭代误差:若所述第二隶属度函数与所述第一隶属度函数之间小于迭代...
【专利技术属性】
技术研发人员:李聪利,张志东,杨滨,闫龙,王斌,张恩杰,李达,陈雪振,乐坤,黄红军,宫博仁,李亚前,吴凯,
申请(专利权)人:国家电网有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。