当前位置: 首页 > 专利查询>三峡大学专利>正文

基于复合聚类算法的电力居民用户日负荷曲线聚类方法技术

技术编号:23315228 阅读:43 留言:0更新日期:2020-02-11 17:50
基于复合聚类算法的电力居民用户日负荷曲线聚类方法,获取电力居民用户日负荷数据,该数据包含有P个样本,每个样本有Q个时间点属性的数据集矩阵;对电力居民用户日负荷数据进行预处理,获得初始群集;对初始群集进行降维处理,获得降维群集;采用聚类算法1对降维群集进行初步聚类,得到初始聚类中心;采用聚类算法2对聚类算法1得到的初始聚类中心进行聚类,并使用聚类有效性指标,对聚类结果进行评估,最终得到M个聚类中心;采用得到的M个聚类中心,作为聚类算法2的初始聚类中心,对数据进行聚类,获得行为相似的用户群。本发明专利技术把庞大零散的日负荷数据聚类成行为相似的用户群。电力企业管理人对聚类成的用户群进行分析,可以更好地预测用电量高峰和低谷,为电力业务的管理提供更可靠地方法。

Clustering method of daily load curve of electric power users based on composite clustering algorithm

【技术实现步骤摘要】
基于复合聚类算法的电力居民用户日负荷曲线聚类方法
本专利技术涉及电力居民用户用电
,尤其是一种基于复合聚类算法的电力居民用户日负荷曲线聚类方法。
技术介绍
随着电力行业的快速发展,以及智能电表的普及,获取电力居民用户的用电情况变得更加方便,同时,电力公司会获得更加庞大以及详细的用户用电数据。面对庞大的用电数据,利用现有的数据挖掘和分析技术,对电力用户日负荷数据进行规律分析以及特征提取,从而便于电力公司根据电价政策为用户提供更加高质量的供电服务。其中,居民用户用电细分是电力公司提供优质服务的重要方面,面对日益增长的居民用户用电负荷那比例的增加,使用合理,高效的数据聚类算法对用户进行分析可以帮助电力公司根据用户的特征提供更加合理,个性化的供电方案,让用户获得更好的体验。但是,单一的原始的聚类算法聚类效率低,聚类效果差,例如,K-means算法由于对于初始聚类中心的选择是随机的,这使得对于样本数据量大的数据集,容易使聚类结果陷入局部最优。无法确定最佳聚类数目,需要研究人员逐个测试,导致聚类效率低下。从而不能很好地反映用户用电数据中的潜在规律以及用电特征,从而无法为电力公司在居民用户聚类方面提供良好的支持。
技术实现思路
本专利技术提供一种基于复合聚类算法的电力居民用户日负荷曲线聚类方法,该方法根据实时采集用电负荷的智能电表中的数据,对负荷曲线进行聚类,进而将有相同用电行为的用户聚到一起。本专利技术采取的技术方案为:基于复合聚类算法的电力居民用户日负荷曲线聚类方法,包括以下步骤:步骤1:获取电力居民用户日负荷数据,该数据包含有P个样本,每个样本有Q个时间点属性的数据集矩阵;步骤2:对电力居民用户日负荷数据进行预处理,获得初始群集;步骤3:对初始群集进行降维处理,获得降维群集;步骤4:采用聚类算法1对降维群集进行初步聚类,得到初始聚类中心;步骤5:采用聚类算法2对聚类算法1得到的初始聚类中心进行聚类,并使用聚类有效性指标,对聚类结果进行评估,最终得到M个聚类中心;步骤6:采用步骤5得到的M个聚类中心,作为聚类算法2的初始聚类中心,对数据进行聚类,获得行为相似的用户群,并对获得的行为相似的用户群进行行为特征分析。所述步骤1中,对于P个样本,每个样本有Q个时间点属性的电力居民用户日负荷数据集,具体包括:P个样本为居民用户样本,居民生活主要受季节变化、气温变化、收人水平、空调、电炊拥有率等因素影响,不用的因素会导致不同的日负荷曲线;Q为每日各个时间点由智能电表采集的该时间点的用电功率,Q的值根据智能电表采集数据的时间间隔而定。所述步骤2中,预处理包括缺失值处理、数据标准化、数据正则化处理;缺失值处理,对含有较多缺失值的数据进行删除,对含有较少缺失值的数据进行补全;数据标准化,将原始数据线性化的方法转换到[0,1]的范围;数据正则化处理,将每个属性减去该属性对应的均值,然后,再除以该属性对应方差。所述步骤3中,降维处理采用PCA(PrincipalComponentAnalysis),即主成分分析方法;获取的降维集群为p个样本、每个样本有q个属性的数据集矩阵。所述步骤4中,采用聚类算法1对降维群集做初步聚类,获得行为相似的用户群,具体包括,采用Mean-shift算法,将数据集中的p个样本聚成N类,其中,N为正整数。所述步骤5中,采用聚类算法2对聚类算法1得到的聚类中心进行聚类,采用聚类有效性指标评估聚类结果,具体包括:采用K-means算法对Mean-shift算法得到的N个聚类中心进行聚类,在聚类数目N范围内,对[2,N]分别聚类,其中,N为正整数,并使用Calinski-Harabasz(CH)指标对聚类结果进行评估,选取CH值最大的结果,最终得到M个聚类中心,其中,M为[2,N]中的正整数。所述步骤6中,采用得到的M个聚类中心作为K-means算法的初始聚类中心,对数据集中的每个样本,即每个用户或每条记录进行聚类,最后得到M个类的用户。本专利技术一种基于复合聚类算法的电力居民用户日负荷曲线聚类方法,以电力居民用户日负荷数据为分析对象,通过数据预处理,数据降维,以及特征聚类等多个算法过程,其中,特征聚类算法优选Mean-shift算法与K-means算法相结合。把庞大零散的日负荷数据聚类成行为相似的用户群。电力企业管理人对聚类成的用户群进行分析,可以更好地预测用电量高峰和低谷,为电力业务的管理提供更可靠地方法,为电力客户提供更优质的服务。附图说明图1为本专利技术方法实施例1的流程图。图2为本专利技术方法实施例2的流程图。具体实施方式实施例1:基于复合聚类算法的电力居民用户日负荷曲线聚类方法,包括以下步骤:步骤1:获取电力居民用户日负荷数据,该数据包含有P个样本,每个样本有Q个时间点属性的数据集矩阵;步骤2:对电力居民用户日负荷数据进行预处理,获得初始群集;步骤3:对初始群集进行降维处理,获得降维群集;步骤4:采用聚类算法1对降维群集进行初步聚类,得到N个初始聚类中心;步骤5:采用聚类算法2对聚类算法1得到的初始聚类中心进行聚类,并使用聚类有效性指标,对聚类结果进行评估,最终得到M个聚类中心;步骤6:采用步骤5得到的M个聚类中心,作为聚类算法2的初始聚类中心,对数据进行聚类,获得行为相似的用户群,并对获得的行为相似的用户群进行行为特征分析。实施例2:基于复合聚类算法的电力居民用户日负荷曲线聚类方法,包括以下步骤:首先,获取电力居民用户日负荷数据,该数据包含有P个样本、每个样本有Q个时间点属性的数据集矩阵。一般情况下,电网公司营销系统经过的数据集包括数万或更多的样本,每个样本为一个电力居民用户,随着智能电表的普及,统计每个用户的居民用户日负荷数据变得非常容易。然后,对获取的电力居民用户日负荷数据进行预处理,获得初始群集,其中,本实施例中,预处理过程包括对电力居民用户日负荷用电数据进行缺失值处理,数据标准化,数据正则化以及数据降维,经过以上处理后,获得的初始群集为p个样本、每个样本有q个属性的数据集矩阵。其中,缺失值处理具体为,对有效值少的样本进行删除,对有效值多的样本的缺失值进行补全。当然,在删除有效值少的属性时,可一并将冗余属性进行删除。删除样本的过程中,若删除n个样本,则剩余p个样本,其中,p=P-n。另外,对缺失值进行补充的方式有多种,本申请中,对已有有效性取其平均作为缺失值的填充值。本领域技术人员可根据选择其他补充方法,其不均不影响之后的分析过程。数据标准化具体为,将原始数据线性化的方法转换到[0,1]的范围,最大-最小归一化的计算公式为该方法实现对原始数据的等比例缩放,其中,Xnorm为归一化后的数据,X为原始数据,Xmax、Xmin分别为原始数据集的最大值和最小值。数据正则本文档来自技高网...

【技术保护点】
1.基于复合聚类算法的电力居民用户日负荷曲线聚类方法,其特征在于包括以下步骤:/n步骤1:获取电力居民用户日负荷数据,该数据包含有P个样本,每个样本有Q个时间点属性的数据集矩阵;/n步骤2:对电力居民用户日负荷数据进行预处理,获得初始群集;/n步骤3:对初始群集进行降维处理,获得降维群集;/n步骤4:采用聚类算法1对降维群集进行初步聚类,得到初始聚类中心;/n步骤5:采用聚类算法2对聚类算法1得到的初始聚类中心进行聚类,并使用聚类有效性指标,对聚类结果进行评估,最终得到M个聚类中心;/n步骤6:采用步骤5得到的M个聚类中心,作为聚类算法2的初始聚类中心,对数据进行聚类,获得行为相似的用户群。/n

【技术特征摘要】
1.基于复合聚类算法的电力居民用户日负荷曲线聚类方法,其特征在于包括以下步骤:
步骤1:获取电力居民用户日负荷数据,该数据包含有P个样本,每个样本有Q个时间点属性的数据集矩阵;
步骤2:对电力居民用户日负荷数据进行预处理,获得初始群集;
步骤3:对初始群集进行降维处理,获得降维群集;
步骤4:采用聚类算法1对降维群集进行初步聚类,得到初始聚类中心;
步骤5:采用聚类算法2对聚类算法1得到的初始聚类中心进行聚类,并使用聚类有效性指标,对聚类结果进行评估,最终得到M个聚类中心;
步骤6:采用步骤5得到的M个聚类中心,作为聚类算法2的初始聚类中心,对数据进行聚类,获得行为相似的用户群。


2.根据权利要求1所述基于复合聚类算法的电力居民用户日负荷曲线聚类方法,其特征在于:所述步骤1中,对于P个样本,每个样本有Q个时间点属性的电力居民用户日负荷数据集,包括:P个样本为居民用户样本,居民生活主要受季节变化、气温变化、收人水平、空调、电炊拥有率等因素影响,不用的因素会导致不同的日负荷曲线;Q为每日各个时间点由智能电表采集的该时间点的用电功率,Q的值根据智能电表采集数据的时间间隔而定。


3.根据权利要求1所述基于复合聚类算法的电力居民用户日负荷曲线聚类方法,其特征在于:所述步骤2中,预处理包括缺失值处理、数据标准化、数据正则化处理;
缺失值处理,对含有较多缺失值的数据进行删除,对含有较少缺失值的数据进行补全;
数据标准化,将原始数据线性化的方法转换到[0,1]的范围;
...

【专利技术属性】
技术研发人员:游文霞金之榆
申请(专利权)人:三峡大学
类型:发明
国别省市:湖北;42

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1