一种基于Kmeans-AHC混合聚类算法的配电网线损异常检测方法技术

技术编号:26506385 阅读:44 留言:0更新日期:2020-11-27 15:34
一种基于Kmeans‑AHC混合聚类算法的配电网线损异常检测方法,包括:基于影响配电网线损的影响因素,采集多个特征数据用于混合聚类算法,构建配电网线损特征指标体系;基于有监督指标与无监督指标相结合的综合指标数据来确定最优聚类中心数;基于K‑Means聚类算法与凝聚型层次聚类相结合的混合聚类算法,优化初始聚类中心的选取;通过决策判断模型对配电网线损异常样本进行诊断识别。本发明专利技术利用混合聚类算法无监督学习的特点,解决了初始聚类中心以及最优聚类中心数的选取问题,适用于处理电网建设初期海量无标签运行数据,提高了配电网线损异常检测的准确度。

【技术实现步骤摘要】
一种基于Kmeans-AHC混合聚类算法的配电网线损异常检测方法
本专利技术属于电力系统自动化
,具体涉及一种基于Kmeans-AHC混合聚类算法的配电网线损异常检测方法。
技术介绍
随着经济社会发展,我国配电网的规模也日趋庞大,运行的电力设备数量也飞速增长。配电网运行中的电能损失可以分为技术线损和管理线损两大类,技术线损是由电网中的电气设备带来的铁损和铜损以及配电线路所产生的损耗组成;管理线损是指配电侧电力用户的窃电、欺诈等一系列欺骗性用电行为所导致的损失。配电网线损率是电力企业的重要考核指标,反映了我国电网的规划设计与运营管理水平,因此开展线损异常检测是电力企业进行降损治理的关键环节。近年来,我国电力工业进入飞速发展阶段,但是由于当前技术经济条件的限制和能源分布不均等问题,在有些领域中可能表现为与总体发展方向相悖、甚至阻碍电力发展的问题。在市场营销环节,各级供电公司都投入了大量资金进行大规模的建设和改造,由于用户庞大的群体数量,且变换多端,因此线损管理中往往存在着用电异常、窃电、计量故障等主动失电造成的线损异常,同时也存在着迂回供电、线路老化、设备老化等被动失电造成的线损异常。各地区供电企业线损管理方面存在着一定的差别,其用电结构、用电水平、管理水平以及信息化程度的不同和新技术的应用以及无功优化、改造投入的资金和力度不同等因素的差异,造成各地区线损效益和线损率水平存在很大差距,发达地区与不发达地区、东西部地域也差距很大。近年来,降低电能损耗是国内外研究的热点之一,全面而准确的线损诊断。其一可以为电力部门分析线损构成、制定降损措施、提供理论和现实依据,促进供电企业深挖发展潜力,提高经济效益;其二可以优化电网规划设计方案,促进配电网的建设与改造;其三可以促进加强运行管理,使配电网处于经济运行状态;其四制定配电网线损指标,节约能源,提高供电能力,缓解供电能力不足局面。本专利技术基于Kmeans-AHC混合聚类算法,解决了传统聚类算法中初始聚类中心以及最优聚类中心数的选取问题,适用于处理电网建设初期海量无标签运行数据,提高了配电网线损异常检测的准确度。
技术实现思路
本专利技术技术解决的问题是:克服现有技术方法的不足,提供一种基于Kmeans-AHC混合聚类算法的配电网线损异常检测方法。其能够确定最优聚类中心数,优化初始聚类中心的选取。对样本聚类结果进行快速、准确的决策判断。这种基于Kmeans-AHC混合聚类算法的配电网线损异常检测方法的技术解决方案,包括以下步骤:1.基于影响配电网线损的影响因素,采集多个特征数据用于混合聚类算法,综合考虑在电网实际运行中指标获取的难易程度和影响配电网线损的技术因素、管理因素,构建配电网线损特征指标体系;2.使用有监督指标与无监督指标相结合的综合指标数据来确定最优聚类中心数;3.使用K-Means聚类算法与凝聚型层次聚类相结合的混合聚类算法,优化初始聚类中心的选取;4.对采集的电网运行数据进行数据预处理后,基于确定的聚类中心数和初始聚类中心,进行混合聚类分析;5.结合样本的混合聚类结果,通过决策判断模型对配电网线损异常样本进行诊断识别,输出线损异常样本。与最接近的现有技术相比,本专利技术具有的有益效果如下:1、本专利技术构建了配电网线损特征指标体系,综合考虑了影响配电网线损的技术因素和管理因素。所选取指标在电网实际运行中易于数据采集,且适用于本专利技术所提出的混合聚类算法,降低了输入变量的维数,改善了算法的性能。2、本专利技术提出了由有监督指标与无监督指标相结合的综合指标,相较于传统指标,对聚类效果的评价更为准确,有助于选取最优聚类中心数;本专利技术提出的混合聚类算法将K-Means聚类算法与凝聚型层次聚类相结合,通过对聚类树进行截取,优化了初始聚类中心的选取,提高了算法精度。3、本专利技术提出的配电网线损异常决策判断模型,实现了配电网线损异常的检测,提高了线损异常检测的准确性,有助于电力企业降低运营成本,提高了对配电网海量运行数据的利用能力。附图说明上述仅是本专利技术技术方案的概述,为了能够更清楚地了解本专利技术的技术方法,以下结合附图与具体实施方式对本专利技术作进一步得详细说明。图1是本专利技术的一种基于Kmeans-AHC混合聚类算法的配电网线损异常检测方法流程图。图2是本专利技术的配电网线损特征指标体系图。图3是本专利技术的混合聚类算法流程图。图4是本专利技术的基于混合聚类的线损异常决策判断流程图。具体实施方式下面结合附图对本专利技术实施例作进一步说明。实施例:本专利技术的目的在于提供一种基于Kmeans-AHC混合聚类算法的配电网线损异常检测方法,旨在解决线损异常检测中,考虑多种影响因素时对线损异常检测精度的影响,结合图1的方法结构图进行介绍,具体包括:步骤1:基于影响配电网线损的影响因素,采集多个特征数据用于混合聚类算法,综合考虑在电网实际运行中指标获取的难易程度和影响配电网线损的技术因素、管理因素,构建配电网线损特征指标体系;步骤2:使用有监督指标与无监督指标相结合的综合指标数据来确定最优聚类中心数;步骤3:使用K-Means聚类算法与凝聚型层次聚类相结合的混合聚类算法,优化初始聚类中心的选取;步骤4:对采集的电网运行数据进行数据预处理后,基于确定的聚类中心数和初始聚类中心,进行混合聚类分析;步骤5:结合样本的混合聚类结果,通过决策判断模型对配电网线损异常样本进行诊断识别,输出线损异常样本。其中,步骤1:配电网线损特征指标体系构建,具体包括:结合图2的配电网线损特征指标体系图进行介绍,选取的线损特征指标包括:抄表同期性、设备老化程度、智能电表装表率、母线电量不平衡率、变电站用电率、馈线温度、计量表计损耗、线损率极差、线损率平均值和线损率变异系数等。所确定的线损特征指标体系综合考虑了指标在电网实际运行中获取的难易程度和影响配电网线损的技术因素、管理因素。步骤2:确定最优聚类中心数,具体包括:提出有监督指标与无监督指标相结合的综合指标数据来选取最优聚类中心数。有监督指标通过计算聚类结果与基准数据的符合程度来评价聚类效果,在算法训练过程中,对于数据集X={X1,X2,…,Xm},假定通过聚类得到的簇划分为C={C1,C2,…,Cn},数据集已知划分为P={P1,P2,…,Pn},将样本点进行两两比较,得到有监督指标计算公式如下:式中:a表示两个样本在C中属于同簇,且在P中同组;b表示两个样本在C中属于同簇,但在P中不同组;c表示两个样本在C中不同簇,但在P中同组。无监督指标通过计算轮廓系数来评价聚类效果,对于数据集中任一样本点i,计算公式如下:式中:p(i)是样本点i到所有它所属簇中其他点的距离平均值,q(i)是样本点i到它非所属簇内的其他点的距离平均值,m是样本总数。结合上述两种指标得到综合指标S,计算公式本文档来自技高网
...

【技术保护点】
1.一种基于Kmeans-AHC混合聚类算法的配电网线损异常检测方法,其特征在于,包括:/n基于影响配电网线损的影响因素,构建配电网线损特征指标体系;/n通过有监督指标与无监督指标相结合的综合指标数据来确定最优聚类中心数;/n使用K-Means聚类算法与凝聚型层次聚类相结合的混合聚类算法,优化初始聚类中心的选取;/n基于所确定的最优聚类中心数和初始聚类中心,对所述特征数据采用混合聚类进行聚类;/n通过决策判断模型对配电网线损异常样本进行诊断识别。/n

【技术特征摘要】
1.一种基于Kmeans-AHC混合聚类算法的配电网线损异常检测方法,其特征在于,包括:
基于影响配电网线损的影响因素,构建配电网线损特征指标体系;
通过有监督指标与无监督指标相结合的综合指标数据来确定最优聚类中心数;
使用K-Means聚类算法与凝聚型层次聚类相结合的混合聚类算法,优化初始聚类中心的选取;
基于所确定的最优聚类中心数和初始聚类中心,对所述特征数据采用混合聚类进行聚类;
通过决策判断模型对配电网线损异常样本进行诊断识别。


2.如权利要求1所述的通过综合指标数据来确定最优聚类中心数,其特征在于,综合指标S的计算公式如下:
S=Ssp+Susp









式中,Ssp是有监督指标,对于数据集X={X1,X2,…,Xm},通过聚类得到的簇划分为C={C1,C2,…,Cn},数据集已知划分为P={P1,P2,…,Pn},a表示两个样本在C中属于同簇,且在P中同组;b表示两个样本在C中属于同簇,但在P中不同组;c表示两个样本在C中不同簇,但在P中同组。Sus...

【专利技术属性】
技术研发人员:康忠健罗霖李伟秀
申请(专利权)人:中国石油大学华东
类型:发明
国别省市:山东;37

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1