System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术属于电力系统监测,更具体地,涉及一种基于多算法融合模型+知识规则的台区月度线损率预测方法及系统。
技术介绍
1、线损率作为一种综合反映电力系统中规划设计、生产运行、经营管理水平的指标,直接反映了一个地区的电网营销管理水平,降低线损率能够带来非常可观的经济与社会效益。但目前常由于粗放性的线损管理,导致供电企业中的大量线损不知去向。一是台区线损率多为被动治理,电力企业无法实时掌握对用户的供电和自身的经营状况,只能通过在月末抄表得到的静态数据来反应经营状况,过程中的损失即使被发现追补也极其困难,对于高损或负损台区采用事后处理方式,对电网经济运行和供电企业自身的发展极为不利。以某市供电公司为例,每月月初电费正式发行后可查询上月电费账单信息,每月预发行结束后可查询本月预发行电费账单信息,20号之前查不到当月电费信息。二是工作人员多凭借主观经验找出线损高低的影响因素(如采集成功率、台账投运错误等),致使线损追因比较落后且缺乏较为科学的数据支撑。
2、为此,亟需运用数据挖掘方式对台区线损进行分析,从已知的历史数据中寻找规律,准确地对线损率进行预测,以提前掌握高负损台区,找出薄弱环节,辅助制定相应管理措施。
3、针对此问题,采用线损率预测方式来提前获取线损率值从而避免台区发生问题是一种常用的解决方法。尽管众多学者对线损率开展了多方面研究,但这些算法模型多是建立在所有台区的预测基础之上,即在大数范围内提升预测准确率。而按现有国网要求,台区有高损和负损,如把高负损台区筛选进行预测,一个地市级供电公司一个月仅仅是几台
技术实现思路
1、为解决现有技术中存在的不足,本专利技术提供一种基于多算法融合模型+知识规则的台区月度线损率预测方法。
2、本专利技术采用如下的技术方案。
3、本专利技术的第一方面提供了一种基于多算法融合模型+知识规则的台区月度线损率预测方法,包括以下步骤:
4、步骤1,提取台区内电力用户用电信息,进行台区线损数据处理包括异常数据处理、缺失数据处理和数据指标处理;
5、步骤2,在处理过的数据中,提取关键特征,进行特征的相关性分析确定影响线损率的关键因素;
6、步骤3,基于确定的关键因素,利用随机森林、arima、lstm、xgboost、svr算法构建融合模型;
7、步骤4,基于多算法融合模型,使用mae和查全率指标评估不同算法模型的性能,结合知识规则的交集和并集优化模型;
8、步骤5,基于优化的模型,在多月份数据上验证模型的稳定性,评估各个台区的线损率。
9、优选地,步骤1中,所述异常数据处理包括对于指标包括供电量、售电量、配变容量,当其值大于上限q3+1.5iqr时,采用处理方式将其设为上限值q3+1.5iqr;当指标值小于下限q1-1.5iqr时,采用处理方式将其设为下限值q1-1.5iqr;四分位数间距iqr计算公式如下:
10、iqr=q3-q1
11、其中,q1为25%分位数,q3为75%分位数;
12、所述缺失数据处理包括对于离散型指标包括三相不平衡次数、业扩报装用户数、时钟异常次数,采用众数进行填充;
13、连续型指标包括损失电量、供电量、售电量、配变容量,根据不同情况采用以下填充规则:
14、采用三阶差分、二阶差分、一阶差分进行填充;
15、对于无法差分的数据,使用向前向后数值插补法进行填充;
16、所述数据指标处理包括对于离散型指标,包括三相不平衡次数、业扩报装用户数、时钟异常次数,采用试错法,将值为0的处理为0.0001;
17、指标户均化处理包括配变容量、供电量、售电量、损失电量指标,采用户均化处理。
18、优选地,步骤2中,所述提取特征包括基于pearson系数的指标相关性分析、基于gini系数的特征筛选和基于试验数学的特征衍生,三种特征提取相互补充;
19、所述基于pearson系数的指标相关性分析,用于提供线损率与各因素之间的直接关系:
20、使用pearson相关系数衡量线损率与多个因素包括户数、供电量、售电量、电压等级、运行容量之间的相关性;pearson相关系数介于-1和1之间,其绝对值越大,相关性越强;正相关表示系数大于0,负相关表示系数小于0;
21、所述基于gini系数的特征筛选,用于筛选出对线损率影响的特征:
22、采用随机森林gini系数重要性评分作为特征选择指标,通过计算每个特征的gini系数,确定其在模型中的重要性,进行特征筛选;
23、所述基于试验数学的特征衍生,用于捕捉不同维度上的线损率变化:
24、从同比环比特征、均值特征、滞后与差分特征多个维度展开特征构建;构建同比增长率和环比增长率特征、均值与标准差特征、滞后与差分特征;
25、结合相关性、特征重要性、特征衍生分析角度,生成台区线损预测模型特征组合,包括含户均容量、户均供电量、户均售电量、户均损失电量、户均户变关系不一致用户数量、近3个月业扩报装用户数量均值、近3个月户变关系不一致用户数量均值、近3个月重载次数均值。
26、优选地,步骤3中,所述多算法融合模型具体包括:
27、随机森林模型:选取cart算法生成回归决策树,节点分裂基于最小均方差,通过迭代树的数量、深度、交叉验证优化超参数;
28、arima模型:计及供售电量的季节性规律,通过arima算法预测线损率,内生变量为线损率本身,通过网格搜索迭代寻找最佳超参数;
29、lstm模型:引入具有时间影响的指标包括三相不平衡次数数、低电压次数、供电量、过载次数,通过lstm算法构建模型,通过迭代优化器、学习率、l2正则项系数寻优模型最佳超参数;
30、xgboost和svr模型:分别采用xgboost和svr算法构建线损率预测模型,与上述算法模型效果进行对比。
31、优选地,步骤3中,在模型预测结果中,采用知识规则进行优化:
32、移动平均阈值规则:分析偏差较大的台区,生成线损率阈值,当历史线损率均值大于阈值时,采用历史线损率均值进行计算输出;
33、交集和并集知识规则:通过分析模型1与模型2的效果,通过穷尽法法则建立交集与并集规则,提升查全率;将通过规则优化的模型进行多月份测试,对比分析查全率稳定性;
34、所述模型1为以滞后法构造特征形成的模型,模型2为以差分法构造特征形成的模型。
35、优选地,步骤4中,对不同模型算法进行选择时,以平均绝对误差mae的大小为指标,mae的计算公式如下:
36、
37、其中:n表示样本数量,yi表示样本真实值;表示模型预测值;
38、采用本文档来自技高网...
【技术保护点】
1.一种基于多算法融合模型+知识规则的台区月度线损率预测方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种基于多算法融合模型+知识规则的台区月度线损率预测方法,其特征在于:
3.根据权利要求1所述的一种基于多算法融合模型+知识规则的台区月度线损率预测方法,其特征在于:
4.根据权利要求1所述的一种基于多算法融合模型+知识规则的台区月度线损率预测方法,其特征在于:
5.根据权利要求1所述的一种基于多算法融合模型+知识规则的台区月度线损率预测方法,其特征在于:
6.根据权利要求1所述的一种基于多算法融合模型+知识规则的台区月度线损率预测方法,其特征在于:
7.根据权利要求1所述的一种基于多算法融合模型+知识规则的台区月度线损率预测方法,其特征在于:
8.根据权利要求1所述的一种基于多算法融合模型+知识规则的台区月度线损率预测方法,其特征在于:
9.根据权利要求1所述的一种基于多算法融合模型+知识规则的台区月度线损率预测方法,其特征在于:
10.一种基于多算法融合模型
...【技术特征摘要】
1.一种基于多算法融合模型+知识规则的台区月度线损率预测方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种基于多算法融合模型+知识规则的台区月度线损率预测方法,其特征在于:
3.根据权利要求1所述的一种基于多算法融合模型+知识规则的台区月度线损率预测方法,其特征在于:
4.根据权利要求1所述的一种基于多算法融合模型+知识规则的台区月度线损率预测方法,其特征在于:
5.根据权利要求1所述的一种基于多算法融合模型+知识规则的台区月度线损率预测方法,其特征在于:
6.根据权利要求1所述的一种基于多算法融合模型+知识规则的台区月度线损...
【专利技术属性】
技术研发人员:许鸣昌,王宁,侯小娥,王亮,万鹏,史渊源,李月华,李明正,丁志刚,王芳,黄璐,
申请(专利权)人:国网宁夏电力有限公司吴忠供电公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。