一种基于大数据的线损分摊算法制造技术

技术编号:36393069 阅读:14 留言:0更新日期:2023-01-18 09:58
本发明专利技术公开了一种基于大数据的线损分摊算法包括以下步骤:数据标准化:提取数据的电气特征,通过归一法整合数据,过滤异常点;数据聚类:设定聚类数目k,计算轮廓系数St;确定样本中心;基于历史数据对时间断面进行聚类;线损分摊:在不同类别中,以聚类中心作为标准分别计算各分摊主体关于线路损耗的相关系数,确定分摊比例,本基于大数据的线损分摊算法,可实现公平、合理、直观的线损分摊计算,将对区域电网的经济运行、降低区域电网的过网网损和有效发挥资源配置优势等,发挥十分重要的促进作用。用。用。

【技术实现步骤摘要】
一种基于大数据的线损分摊算法


[0001]本专利技术涉及线损分摊计算方法
,具体为一种基于大数据的线损分摊算法。

技术介绍

[0002]当前电力系统中,电网网络结构复杂,线损分摊计算都是通过电量均摊、潮流计算方法等早期简易计算方法,计算结果精度差,在线损计算结果精度提升方面具有较大的空间,而本研究主要围绕基于大数据分析的线损分摊计算方法,大大提高了计算结果的准确度,为电网多主体单位合理分摊线损,指导线损构成分析提供参考依据,使电网的建设有的放矢,投资效益更显著。

技术实现思路

[0003]本专利技术要解决的技术问题是克服现有的缺陷,提供一种基于大数据的线损分摊算法,可实现公平、合理、直观的线损分摊计算,将对区域电网的经济运行、降低区域电网的过网网损和有效发挥资源配置优势等,发挥十分重要的促进作用。
[0004]为实现上述目的,本专利技术提供如下技术方案:一种基于大数据的线损分摊算法,包括以下步骤:
[0005]数据标准化:提取数据的电气特征,通过归一法整合数据,过滤异常点;
[0006]数据聚类:
[0007]设定聚类数目k,计算轮廓系数St;
[0008]确定样本中心;
[0009]基于历史数据对时间断面进行聚类;
[0010]线损分摊:在不同类别中,以聚类中心作为标准分别计算各分摊主体关于线路损耗的相关系数,确定分摊比例。
[0011]作为本专利技术的一种优选技术方案,所述数据聚类中,k从3到8递增,并分别计算轮廓系数St;选取轮廓系数St最大值对应的聚类数目k进行聚类。
[0012]作为本专利技术的一种优选技术方案,所述数据标准化中,每个样本包含5个自变量和1个因变量;自变量包括电源出力平均值X1、电源出力方差X2、负荷平均值X3、负荷方差X4、线路平均负载率X5,因变量为线损率。
[0013]作为本专利技术的一种优选技术方案,所述数据聚类中,
[0014]单一样本i的轮廓系数S(i)=(b(i)

a(i))/(maxa(i),b(i));
[0015]其中
[0016]a(i):i所属簇内其它样本的平均距离,若簇内仅i一个样本,则令s(i)=0
[0017]i∈A,a(i)=average
j∈A,j≠i
(dist(i,j))
[0018]b(i):i与其它簇的样本平均距离的最小值
[0019]i∈A,C≠A,dist(i,C)=averagej∈C(dist(i,j))
[0020]b(i)=minc≠Adist(i,C)
[0021]聚类总体的轮廓系数:所有样本轮廓系数的平均值
[0022][0023]作为本专利技术的一种优选技术方案,所述线损分摊中的相关系数计算公式为
[0024][0025]其中,Cov(Xi,Y)为X与Y的协方差,Var[Xi]为Xi的方差,Var[Y]为Y的方差,Y为聚类中心。
[0026]与现有技术相比,本专利技术的有益效果是:传统线损分摊方法计算准确性问题突出,针对不同交易模式适应性差。本基于大数据的线损分摊算法,能适应所有电网结构且计算精度得到有效提高,虽然此方法导致数据量巨大计算量大增,但是此计算方法计算精度能得到大幅度提升,而计算耗时与原始方法相差不大。
附图说明
[0027]图1为本专利技术逻辑示意图。
具体实施方式
[0028]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0029]在已知电力系统运行状态时,可根据潮流追踪计算分摊比例因子,但存在许多潮流数据丢失的断面,潮流追踪法无法有效计算;
[0030]参阅图1,本专利技术提供一种技术方案:一种基于大数据的线损分摊算法,引入大数据分析技术确定分摊比例因子。
[0031]选取600个样本,每个样本数据包含5个自变量和1个因变量。X1(MW)为电源出力平均值,X2为电源出力方差,X3(MW)为负荷平均值,X4为负荷方差,X5(%)为线路平均负载率,线损率则是因变量。应用步骤具体如下:
[0032](1)提取电气特征指标,进行标准化处理。
[0033](2)采用改进K

Means聚类方法将样本分类。
[0034]1)确定时间断面聚类数目
[0035]利用上述改进K

Means聚类算法对600组标准化处理后的时间断面进行聚类。根据标准化后的数据计算每个样本的性能指标PE,进一步按照PE值的大小对样本进行升序排序。排序的结果如表1所示。
[0036]表1各台区PE值
[0037][0038]由表1可知,PE的取值范围为0.6~11.5。
[0039]为确定最佳的聚类中心数目,令初始聚类数目k从3到8递增,分别计算相应k值下聚类结果总的轮廓系数St,计算结果如表2所示。
[0040]表2不同k值下聚类结果总的轮廓系数
[0041][0042]对比St可知,当聚类数目k为6时,聚类结果总的轮廓系数最大,聚类效果最好。因此本文选取初始聚类数目为6。
[0043]2)确定聚类的样本中心
[0044]将按照PE排序后的样本等分成6类,选取每类的中心样本作为初始聚类中心,如表3所示。
[0045]表3初始聚类中心
[0046][0047]3)基于历史数据对时间断面进行聚类
[0048]对样本进行K

Means聚类分析,聚类结果如表4所示。
[0049]表4各类所包含的样本数
[0050][0051]第一类有155个样本,第二类有305个样本,第三类有9个样本,第四类有39个样本,第五类有84个样本,第六类有8个样本,总共601个样本。
[0052](3)在不同类别中以聚类中心作为标准分别计算各分摊主体关于线路损耗的相关系数,确定分摊比例。
[0053]在利用改进K

means聚类方法对样本数据进行聚类处理后,各类别下分摊比例均以聚类中心计算结果为标准。由于选取样本中分摊主体包括三个电源和九个负荷中心,因此需要计算聚类中心下各分摊主体与线损之间的相关系数。计算结果如表5所示:
[0054]表5各分摊主体与线损相关系数表
[0055][0056]归一化处理后,可以得到各分摊主体的分摊比例如表6所示:
[0057]表6各分摊主体分摊比例表
[0058][0059]表6给出了六类聚类中心的分摊比例因子,对于待给定的时间断面,可采用K

means聚类判定该时间断面的类别,然后根据表6相应类别的分摊比例因子对线损进行分摊即可。
[0060]尽管已经本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于大数据的线损分摊算法,其特征在于,包括以下步骤:数据标准化:提取数据的电气特征,通过归一法整合数据,过滤异常点;数据聚类:设定聚类数目k,计算轮廓系数St;确定样本中心;基于历史数据对时间断面进行聚类;线损分摊:在不同类别中,以聚类中心作为标准分别计算各分摊主体关于线路损耗的相关系数,确定分摊比例。2.根据权利要求1所述的基于大数据的线损分摊算法,其特征在于:所述数据聚类中,k从3到8递增,并分别计算轮廓系数St;选取轮廓系数St最大值对应的聚类数目k进行聚类。3.根据权利要求1所述的基于大数据的线损分摊算法,其特征在于:所述数据标准化中,每个样本包含5个自变量和1个因变量;自变量包括电源出力平均值X1、电源出力方差X2、负荷平均值X3、负荷方差X4、线路平均负载率X5,因变量为线损率。4.根据权利要求1所述的基于大数据的线损分摊算法,其特征在于:所述数...

【专利技术属性】
技术研发人员:罗世刚梁琛李亚昕许青张振王凌波马喜平董晓阳徐瑞魏凯
申请(专利权)人:国网甘肃省电力公司经济技术研究院国网甘肃省电力公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1