一种基于大数据技术的台区线损率异常诊断方法技术

技术编号:22168863 阅读:32 留言:0更新日期:2019-09-21 11:26
本发明专利技术公开了一种基于大数据技术的台区线损率异常诊断方法,计算各指标变量与台区线损率的相关性大小,继而找到与判断台区线损率有较强相关性的辅助变量;划分春秋、夏冬两个时间段,对于变动属性辅助变量分别计算其均值的变化范围;若变动属性辅助变量都在其合理的区间内,使用固定属性辅助变量与变动属性辅助变量对台区进行聚类;根据聚类的结果划分相应的台区,针对不同类别的台区,计算各变量的均值其变化范围;根据不同类别的台区分别分析,若某类台区某日线损率出现异常,且变动属性变量正常情况下,可以查看固定属性变量的范围,不在此范围则认为是由该属性变量导致的线损率异常。本发明专利技术能更为全面、准确地度量台区线损率的状态。

A Method of Abnormal Line Loss Rate Diagnosis Based on Big Data Technology

【技术实现步骤摘要】
一种基于大数据技术的台区线损率异常诊断方法
本专利技术涉及配电网安全领域,尤其涉及一种基于大数据技术的台区线损率异常诊断方法。
技术介绍
中国配电网规模庞大,具有点多、线长、面广的特点。线损率作为一种综合反映电力系统中规划设计、生产运行、经营管理水平的经济技术指标,是电力部门日常关联工作中所关注的重要内容。我国对低压客户全面实行分台区管理,台区线损直接反映了一个地区的电网营销管理水平,降低线损率能够带来非常可观的经济与社会效益;但是在降低线损率之前,首先是要诊断出线损异常出现的原因,才能对不合理线损进行分析和预测,从而提供较为科学有效的降损措施。目前各个台区主要通过线损率计算公式得到线损率数值,然后依照人工设定的合理线损率进行分析哪些台区的线损率出现了异常。这种人工设定台区合理线损率的一刀切方式,缺乏科学依据,也与精益化的管理目标背道而驰。从台区线损计算公式可以看出统计线损率的逻辑并不复杂,但是仍然有很多因素影响着线损率计算的准确性,例如台区的用户采集覆盖情况、台区的户变关系、台区的供电考核电能表档案参数等等,这些因素都会影响台区线损率计算的准确性和正确性。传统数据分析手段在应对这些数据时存在种种局限性,并且工作量巨大且效率不高。同时在面临新的数据带来的问题时,传统的数据分析技术常常遇到实际困难。通常,传统的数据分析方法只处理包含相同类型属性的数据集,或者是固定属性的,或者是变动属性的。随着用电信息采集系统在智能用电领域的作用越来越大,越来越需要能够处理异种属性的技术,例如静态档案数据与动态采集数据的相关性、台区户变逻辑父子关系等等。
技术实现思路
基于背景技术存在的技术问题,本专利技术提出了一种基于大数据技术的台区线损率异常诊断方法。本专利技术采用的技术方案是:一种基于大数据技术的台区线损率异常诊断方法,其特征在于,包括以下步骤:(1)搜集多个与台区线损率相关的指标变量,包括:峰谷差率、负荷率、电量、负载率、温度、台区运行年限、台区总导线长度、户均容量、台区额定容量,计算各指标与台区线损率的相关系数;(2)剔除与台区线损率无关的变量,得到与台区线损率高度相关的指标变量,将这些指标变量作为台区线损率异常诊断的辅助变量,并将辅助变量进行分类,分为固定属性辅助变量与变动属性辅助变量;(3)由于台区线损率每日都在变动,所以线损率与变动属性辅助变量相关性更大,因此首先将变动属性辅助变量单独进行分析,依照公式:计算各变动属性辅助变量Xi的均值,Xi=X1,X2,……,XN,均值反映总体各单位变量分布的集中趋势和一般水平;(4)步骤(3)得到了各变动属性辅助变量的均值,再根据参考值范围公式:计算各变动属性辅助变量的波动范围,公式中表示极限误差,即用样本值估计总体值时所允许的最大绝对误差;由于一些外在因素的存在,数据中难免有个别超出正常范围的极大值和极小值,在此,我们将分布在均值附近95%的样本作为波动范围衡量的标准,最大限度降低极值带来的影响。由于季节自然因素的作用会对线损率产生一定的影响,因此划分春秋、冬夏两个层面对台区线损率进行分析,分别得到春秋时期以及冬夏时期各变动属性辅助变量集中趋势及波动范围;(5)依据步骤(4)中不同季节各台区变动属性辅助变量的集中趋势和波动范围进行分析,当该台区线损率出现异常时,依次对比各指标变量的波动范围,若某指标的数值不在该范围中,则在一定程度上,可以认为是由该因素导致的台区线损率异常;若各指标数值都在其合理的变化范围中时,利用公式:依次计算台区各指标数值距离其历史数据均值的差异度,差异度较大的指标就为导致台区线损率异常的指标变量,从而诊断出台区线损率异常的原因;(6)当步骤(5)中,各变动属性辅助变量的集中趋势与波动范围都较为合理时,针对固定属性辅助变量进行分析,固定属性指那些长期不变的指标变量,该类变量对于线损率只是一个基础层面的影响,由于其长期固定不变,所以对于线损率的影响也比较有限,当台区线损率发生异常时,若变动属性数据都在其合理范围时,就要考虑固定属性数据对台区线损率的影响,在此,采用k-means聚类的方式进行分析,首先通过肘部法则确定聚类的个数,进行依照变量对台区进行聚类;(7)根据步骤(6)中通过k-means聚类算法将台区划分为不同的类别,分别根据不同类别,计算各类别固定属性辅助变量的均值和变化范围,从而得到变量的集中趋势和波动范围,当某个台区线损率发生异常时,可以通过指标变量在日常时期的走势判断发生异常的原因。本专利技术的优点是:不同于以往只通过线损率数值大小等“一刀切”模式,来判断台区线损率是否发生了异常;本专利技术能够利用包括线损率在内的多个指标变量进行判断,综合采用统计分析方法以及聚类分析方法,从而更为全面、准确地度量台区线损率的状态。附图说明图1为各指标变量与台区线损率的相关性大小矩阵示意图。图2(a)为变动属性辅助变量在春秋季节其均值变化范围示意图。图2(b)为变动属性辅助变量在夏冬季节其均值变化范围示意图。图3为根据“肘部法则”确定聚类个数的示意图。图4为三类台区的各变量指标均值对比图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。一种基于大数据技术的台区线损率异常诊断方法,包括以下步骤:(1)搜集多个与台区线损率相关的指标变量,包括:峰谷差率、负荷率、电量、负载率、温度、台区运行年限、台区总导线长度、户均容量、台区额定容量,计算各指标与台区线损率的相关系数;(2)剔除与台区线损率无关的变量,得到与台区线损率高度相关的指标变量,将这些指标变量作为台区线损率异常诊断的辅助变量,并将辅助变量进行分类,分为固定属性辅助变量与变动属性辅助变量;(3)由于台区线损率每日都在变动,所以线损率与变动属性辅助变量相关性更大,因此首先将变动属性辅助变量单独进行分析,依照公式:计算各变动属性辅助变量Xi的均值,Xi=X1,X2,……,XN,均值反映总体各单位变量分布的集中趋势和一般水平;(4)步骤(3)得到了各变动属性辅助变量的均值,再根据参考值范围公式:计算各变动属性辅助变量的波动范围,公式中表示极限误差,即用样本值估计总体值时所允许的最大绝对误差;由于一些外在因素的存在,数据中难免有个别超出正常范围的极大值和极小值,在此,我们将分布在均值附近95%的样本作为波动范围衡量的标准,最大限度降低极值带来的影响。由于季节自然因素的作用会对线损率产生一定的影响,因此划分春秋、冬夏两个层面对台区线损率进行分析,分别得到春秋时期以及冬夏时期各变动属性辅助变量集中趋势及波动范围;(5)依据步骤(4)中不同季节各台区变动属性辅助变量的集中趋势和波动范围进行分析,当该台区线损率出现异常时,依次对比各指标变量的波动范围,若某指标的数值不在该范围中,则在一定程度上,可以认为是由该因素导致的台区线损率异常;若各指标数值都在其合理的变化范围中时,利用公式:依次计算台区各指标数值距离其历史数据均值的差异度,差异度较大的指标就为导致台区线损率异常的指标变量,从而诊断出台区线损率异常的原因;(6)当步骤(5)中,各变动属性辅助变量的集中趋势与波动范围都较为合理时,针对固定属性辅助变量进行分析,固定本文档来自技高网...

【技术保护点】
1.一种基于大数据技术的台区线损率异常诊断方法,其特征在于,包括以下步骤:(1)搜集多个与台区线损率相关的指标变量,包括:峰谷差率、负荷率、电量、负载率、温度、台区运行年限、台区总导线长度、户均容量、台区额定容量,计算各指标与台区线损率的相关系数;(2)剔除与台区线损率无关的变量,得到与台区线损率高度相关的指标变量,将这些指标变量作为台区线损率异常诊断的辅助变量,并将辅助变量进行分类,分为固定属性辅助变量与变动属性辅助变量;(3)由于台区线损率每日都在变动,所以线损率与变动属性辅助变量相关性更大,因此首先将变动属性辅助变量单独进行分析,依照公式:

【技术特征摘要】
1.一种基于大数据技术的台区线损率异常诊断方法,其特征在于,包括以下步骤:(1)搜集多个与台区线损率相关的指标变量,包括:峰谷差率、负荷率、电量、负载率、温度、台区运行年限、台区总导线长度、户均容量、台区额定容量,计算各指标与台区线损率的相关系数;(2)剔除与台区线损率无关的变量,得到与台区线损率高度相关的指标变量,将这些指标变量作为台区线损率异常诊断的辅助变量,并将辅助变量进行分类,分为固定属性辅助变量与变动属性辅助变量;(3)由于台区线损率每日都在变动,所以线损率与变动属性辅助变量相关性更大,因此首先将变动属性辅助变量单独进行分析,依照公式:计算各变动属性辅助变量Xi的均值,Xi=X1,X2,……,XN,均值反映总体各单位变量分布的集中趋势和一般水平;(4)步骤(3)得到了各变动属性辅助变量的均值,再根据参考值范围公式:计算各变动属性辅助变量的波动范围,公式中表示极限误差,即用样本值估计总体值时所允许的最大绝对误差;由于季节自然因素的作用会对线损率产生一定的影响,因此划分春秋、冬夏两个层面对台区线损率进行分析,分别得到春秋时期以及冬夏时期各变动属性辅助变量集中趋势及波动范围;(5)依据步骤(4)中不同季节各台区变动属性辅助变量的集中趋势和波动范围进行分析,当该台区线损率出现异常时,依次对比各指标变量的波动范围,若某指标的数值不在该范围中,则在一定程度上,可以认为是由该因素导致的台区线损率异常;若各指标数值都在其合理的变化范围中时,利用公式:依次计算台区各...

【专利技术属性】
技术研发人员:杨孝忠韩祝明王成化陈信潘金月王华伟王阳宋驰程小虎史文迪
申请(专利权)人:国网安徽省电力有限公司滁州供电公司
类型:发明
国别省市:安徽,34

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1