基于聚类分析的企业综合用能异常识别方法及电子设备技术

技术编号:37704702 阅读:14 留言:0更新日期:2023-06-01 23:52
本公开提供一种基于聚类分析的企业综合用能异常识别方法及电子设备,所述方法包括,基于企业用户第一历史年份每月的用能量以及第二历史年份月均用能量,得到第一月用能量比率;根据第一月用能量比率,得到企业用户所属行业的聚类数据集,根据聚类数据集得到企业用户所属行业的用能异常阈值;根据企业用户目标年份每月的用能量以及第一历史年份月均用能量,得到第二月用能量比率;当第二月用能量比率大于等于用能异常阈值时,企业用户为用能异常状态,否则企业用户为非用能异常状态。本方法通过结合不同行业的水电气月用能量比率对用能异常的企业用户进行识别,大幅度提升了识别准确性。别准确性。别准确性。

【技术实现步骤摘要】
基于聚类分析的企业综合用能异常识别方法及电子设备


[0001]本专利技术涉及数据检测
,特别涉及一种基于聚类分析的企业综合用能异常识别方法及电子设备。

技术介绍

[0002]近几年多地开始建设多表合一项目,将水、电、气、热表计进行融合,集中管理、用能数据自动集采集抄,实现用能信息交互与主动控制。而目前对于用能异常的识别,也主要集中于对单一用能方向,如用电、用水的用能异常情况进行识别,识别方式上主要采用比对、临近性检测等方式,但识别的准确率不高,易受突发情况的影响;异常识别对象主要集中为居民用户,对企业用户的用能异常识别相对较少,采用统一处理方式,并未区分不同行业的用能特性,分时间段对企业用户用能异常进行识别。

技术实现思路

[0003]本专利技术提供一种基于聚类分析的企业综合用能异常识别方法及相关设备,用以针对不同行业的企业用户的用能特性,对不同时间段的用能异常情况进行识别,采用K均值聚类算法(K

means clustering algorithm)计算得到不同行业的异常用能阈值,基于异常用能阈值对企业用户不同时间段的用能异常情况进行识别。
[0004]本专利技术提供一种基于聚类分析的企业综合用能异常识别方法,包括:
[0005]基于企业用户第一历史年份每月的用能量以及第二历史年份月均用能量,得到第一月用能量比率;
[0006]根据所述第一月用能量比率,得到所述企业用户所属行业的聚类数据集;
[0007]对所述聚类数据集进行聚类,得到多个类别;从所述多个类别中获取包含所述第一月用能量比率最小值的第一类别;根据第一类别中的信息确定所述企业用户所述行业的用能异常阈值;
[0008]根据所述企业用户目标年份每月的用能量以及第一历史年份月均用能量,得到第二月用能量比率;
[0009]响应于确定所述第二月用能量比率大于等于所述用能异常阈值,所述企业用户为用能异常状态,否则所述企业用户为非用能异常状态。
[0010]优选地,
[0011]所述用能量包括用水量、用电量和用气量;
[0012]所述异常阈值为所述第一类别中的所述第一月用能量比率的最大值;
[0013]所述第一月用能量比率根据公式(1)进行计算:
[0014][0015]其中,r
k,d
表示第一月用能量比率,E
k,d
表示企业用户k的第一历史年份d月的用能量,表示企业用户k第二历史年份月均用能量。
[0016]优选地,所述根据所述第一月用能量比率,得到所述企业用户所属行业的聚类数据集,包括:
[0017]根据公式(2)确定所述企业用户所属行业的聚类数据集S
i
,其公式(2)为:
[0018]S
i
={r
k,d
}
ꢀꢀꢀꢀꢀ
(2);
[0019]其中,企业用户k属于行业i,d∈[1,12]。
[0020]优选地,所述对所述聚类数据集进行聚类,得到多个类别,包括:
[0021]利用轮廓分析法确定最优聚类簇数;以及
[0022]基于所述最优聚类簇数,通过K均值聚类算法对所述聚类数据集进行划分,得到多个不同类别。
[0023]优选地,
[0024]所述第二水电气月用能比率通过公式(3)计算获得:
[0025][0026]其中,E
k,f
表示企业用户k目标年份f月的用能量,表示企业用户k第一历史年份月均用能量。
[0027]优选地,所述响应于确定所述第二月用能量比率大于等于所述用能异常阈值,所述企业用户为用能异常状态,否则所述企业用户为非用能异常状态,是通过以下公式进行判定:
[0028][0029]其中,stat
k,f
表示企业用户k在目标年份f月的用能状态。
[0030]优选地,所述方法还包括:
[0031]根据所述企业用户所属行业i目标年份第f个月的用能异常企业的数量,得到用能异常用户占比RE
i,f

[0032]所述用能异常用户占比RE
i,f
根据公式(5)计算:
[0033][0034]优选地,所述方法还包括:
[0035]获取所述企业用户的档案数据和历史月度使用水电气数据,并对所述历史月度使用水电气数据的第一缺失值和异常值进行处理。
[0036]优选地,
[0037]所述对所述历史月度使用水电气数据的第一缺失值和异常值进行处理,包括:
[0038]利用箱线图法对所述水电气数据的异常值进行识别,并将所述异常值删除,得到第二缺失值;
[0039]对所述第二缺失值和所述第一缺失值进行补全,其中,利用产生所述第一缺失值和所述第二缺失值的日期前5个月和后5个月的水电气月用能量平均值进行补全。
[0040]基于相同的专利技术构思,本专利技术还提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上所述
的方法。
[0041]本专利技术的有益效果如下:
[0042]本公开提供的基于聚类分析的企业综合用能异常识别方法及相关设备,基于企业用户历史月度的水电气数据得到具有行业用能特性的用能异常阈值,并结合用能量比率判断企业用户在规定的时间段内是否用能异常,大幅度提升识别企业用户用能异常的准确性,利用K均值聚类算法确定用能异常阈值,得到的用能异常阈值更符合不同行业的用能特性,提高了用能异常识别的效率,减少人工排查的成本。
[0043]本专利技术中,能够实现针对不同行业的企业用户的用能特性,对不同时间段的用能异常情况进行识别,采用K均值聚类算法(K

means clustering algorithm)计算得到不同行业的异常用能阈值,基于异常用能阈值对企业用户不同时间段的用能异常情况进行识别;具体的,将数据分为K组,随机选取K个对象作为初始的聚类中心,然后计算每个对象与各个种子聚类中心之间的距离,把每个对象分配给距离它最近的聚类中心。聚类中心以及分配给它们的对象就代表一个聚类。每分配一个样本,聚类的聚类中心会根据聚类中现有的对象被重新计算。这个过程将不断重复直到满足某个终止条件。终止条件可以是没有(或最小数目)对象被重新分配给不同的聚类,没有(或最小数目)聚类中心再发生变化,误差平方和局部最小。
[0044]本专利技术的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本专利技术而了解。本专利技术的目的和其他优点可通过在所写的说明书以及附图中所特别指出的结构来实现和获得。
[0045]下面通过附图和实施例,对本专利技术的技术方案做进一步的详细描述。
附图说明
[0046]附图用来提供对本专利技术的进一步理解,并且构成说明书的一部分,与本专利技术的实施例一起用于解释本专利技术,并不构成对本专利技术的限制。在附图中:
...

【技术保护点】

【技术特征摘要】
1.一种基于聚类分析的企业综合用能异常识别方法,其特征在于,包括:基于企业用户第一历史年份每月的用能量以及第二历史年份月均用能量,得到第一月用能量比率;根据所述第一月用能量比率,得到所述企业用户所属行业的聚类数据集;对所述聚类数据集进行聚类,得到多个类别;从所述多个类别中获取包含所述第一月用能量比率最小值的第一类别;根据第一类别中的信息确定所述企业用户所属行业的用能异常阈值;根据所述企业用户目标年份每月的用能量以及第一历史年份月均用能量,得到第二月用能量比率;响应于确定所述第二月用能量比率大于等于所述用能异常阈值,所述企业用户为用能异常状态;否则所述企业用户为非用能异常状态。2.如权利要求1所述的一种基于聚类分析的企业综合用能异常识别方法,其特征在于,所述用能量包括用水量、用电量和用气量;所述异常阈值为所述第一类别中的所述第一月用能量比率的最大值;所述第一月用能量比率根据公式(1)进行计算:其中,r
k,d
表示第一月用能量比率,E
k,d
表示企业用户k的第一历史年份d月的用能量,表示企业用户k第二历史年份月均用能量。3.如权利要求1所述的一种基于聚类分析的企业综合用能异常识别方法,其特征在于,所述根据所述第一月用能量比率,得到所述企业用户所属行业的聚类数据集,包括:根据公式(2)确定所述企业用户所属行业的聚类数据集S
i
,其公式(2)为:S
i
={r
k,d
}
ꢀꢀꢀꢀꢀ
(2);其中,企业用户k属于行业i,d∈[1,12

]r
k,d
表示第一月用能量比率。4.如权利要求1所述的一种基于聚类分析的企业综合用能异常识别方法,其特征在于,所述对所述聚类数据集进行聚类,得到多个类别,包括:利用轮廓分析法确定最优聚类簇数;以及基于所述最优聚类簇...

【专利技术属性】
技术研发人员:王一蓉王宏刚杨成月李赋欣王豪安然赵晓龙卢谦袁启恒
申请(专利权)人:国家电网有限公司大数据中心
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1