一种基于随机森林模型的台区停电风险等级预测方法技术

技术编号:30231686 阅读:17 留言:0更新日期:2021-09-29 10:05
本发明专利技术提供一种基于随机森林模型的台区停电风险等级预测方法,涉及配电网故障停电评估技术领域。该基于随机森林模型的台区停电风险等级预测方法,包括以下步骤:建立线路故障风险等级预测指标体系;使用过采样SMOTE算法扩充数据;采用机器学习算法构建预测模型并得到模型的精度,并对预测模型的精度进行测试;识别潜在故障风险线路,在完成停电风险等级预测模型构建后,整理数据库中的线路信息形成预测所需数据表,将数据表输入该模型,识别出潜在的高故障停电风险线路。通过识别出具有相似特征的线路,给出线路的故障停电风险等级,以辅助于线路巡检,提前排除故障停电风险。提前排除故障停电风险。提前排除故障停电风险。

【技术实现步骤摘要】
一种基于随机森林模型的台区停电风险等级预测方法


[0001]本专利技术涉及配电网故障停电评估
,具体为一种基于随机森林模型的台区停电风险等级预测方法。

技术介绍

[0002]随机森林指的是利用多棵树对样本进行训练并预测的一种分类器,在机器学习中,随机森林是一个包含多个决策树的分类器,并且其输出的类别是由个别树输出的类别的众数而定,对于很多种资料,它可以产生高准确度的分类器、处理大量的输入变数、在决定类别时评估变数的重要性等优点。
[0003]目前对于配电网故障停电率预测的研究主要有解析法、模拟法、人工智能算法和混合法,但是都要依托于网架结构搭建数学模型,受限性大,无法提前预测故障停电风险。

技术实现思路

[0004](一)解决的技术问题
[0005]针对现有技术的不足,本专利技术提供了一种基于随机森林模型的台区停电风险等级预测方法,解决了无法预测故障停电风险的问题。
[0006](二)技术方案
[0007]为实现以上目的,本专利技术通过以下技术方案予以实现:一种基于随机森林模型的台区停电风险等级预测方法,包括以下步骤:
[0008]S1:建立线路故障风险等级预测指标体系,将历史故障线路及历史非故障的线路分别作为正、负类样本,通过数据探索性分析方法找到典型故障特征后,按照线路故障风险等级预测指标体系构建形成训练数据;
[0009]S2:使用过采样SMOTE算法扩充数据,通过SMOTE算法对少数类样本进行分析并根据少数类样本人工合成新样本添加到数据集中,平衡正类样本与负类样本的数量差异;
[0010]S3:采用机器学习算法构建预测模型并得到模型的精度,并对预测模型的精度进行测试;
[0011]S4:如果模型测试后识别精度不满足业务需求,则重新调整模型参数并构建模型,即重复S3直至精度符合要求;
[0012]S5:识别潜在故障风险线路,在完成停电风险等级预测模型构建后,整理数据库中的线路信息形成预测所需数据表,并固定周期常态化开展预测,将数据表输入该模型,识别出潜在的高故障停电风险线路,最终整理形成台账。
[0013]优选的,所述线路故障风险等级预测指标体系包括自身影响因素、历史故障特征、外部影响因素和运行影响因素。
[0014]优选的,所述自身影响因素包括区域类别、设备投运时间和设备状况,所述设备投运时间包括变压器平均投运时长,所述设备状况包括线路类型、基准电压等级、累计售电量、上月线损率、一年内平均线损率、累计线损率和变压器数量。
[0015]优选的,所述历史故障特征包括历史故障数量,所述历史故障数量包括一个月内故障次数、两个月内故障次数、一年内故障次数和历史故障总次数。
[0016]优选的,所述外部影响因素包括气温和天气,所述气温包括日最高温、日最低温和日平均气温,所述天气包括天气类型。
[0017]优选的,所述运行影响因素包括运行负载情况和检修状况。
[0018]优选的,所述运行负载情况包括上月售电量、近一年合计售电量、故障前一天/周/月平均变压器超阈值次数合计、故障前一天/周/月平均变压器负载率、自上次检修变压器超阈值次数合计和自上次检修变压器平均负载率,所述检修状况包括最近一次消缺间隔时长、最近一次消缺类型、最近一次消缺等级、最近一次消缺措施、近一年消缺次数和累计消缺次数。
[0019]优选的,所述线路故障风险等级预测指标体系还包括电压质量投诉预测方法体系,所述电量电费投诉预测方法体系包括前一年/半年/季度/月度话后评价、前一年/半年/季度/月度回访分数、前一年/半年/季度来电次数、前一年/半年/季度抱怨次数、最近同业务/不同业务来电间隔、前3天/7天30天来电次数、前3天/7天30天抱怨次数、用户类别、计量方式、城乡类型、所属城市、电压等级、前一年/半年/季度/月度电压合格率极值、前一年/半年/季度/月度电压合格率均值、前一年/半年/季度/月度电压合格率方差、前一年/半年/季度/月度电压合格率变异系数。
[0020]优选的,所述线路故障风险等级预测指标体系还包括停电处置投诉预测方法体系,所述停电处置投诉预测方法体系包括停电通知率、停电次数、报障次数、水期、季节、话务量、平均抱怨率、平均通话时长、用户类别、用电类别、电压等级。
[0021]优选的,所述线路故障风险等级预测指标体系还包括电量电费投诉预测方法体系,所述电量电费投诉预测方法体系包括前12个月欠费次数,前12个月违约金次数,前12个月平均欠费、前12个月平均违约金、前一年/半年/季度来电次数、前一年/半年/季度抱怨次数、用户类别、计费方式、城乡类型、所属城市、电压等级、最近同业务/不同业务来电间隔、前3天/7天30天来电次数、前3天/7天30天抱怨次数、客户前12个月电费水平、客户当前应收电费、客户当前欠费金额、客户当前违约金额、当前催收等级、本月催收次数、上次催收距今时间差。
[0022](三)有益效果
[0023]本专利技术提供了一种基于随机森林模型的台区停电风险等级预测方法。具备以下有益效果:
[0024]本专利技术通过针对线路找到典型故障停电特征和故障停电原因,通过随机森林算法训练并形成机器学习模型,用于识别出具有相似特征的线路,给出线路的故障停电风险等级,以辅助于线路巡检,提前排除故障停电风险。
附图说明
[0025]图1为本专利技术的线路故障风险等级预测指标体系的一部分示意图;
[0026]图2为本专利技术的线路故障风险等级预测指标体系的另一部分示意图。
具体实施方式
[0027]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0028]实施例:
[0029]如图1
‑‑
图2所示,本专利技术实施例提供一种基于随机森林模型的台区停电风险等级预测方法,包括以下步骤:
[0030]S1:建立线路故障风险等级预测指标体系,通过业务专家商讨、数据探索性分析等方法,共整理形成4大类影响因素,8大类指标类型,29项指标,其中,4大类影响因素包括自身影响因素、历史故障特征、外部影响因素和运行影响因素,8大类指标类型包括区域类别、设备投运时间、设备状况、历史故障数量、气温、天气、运行负载情况和检修状况,29项指标主要包括区域类别、变压器平均投运时长、线路类型、基准电压等级、累计售电量、上月线损率、一年内平均线损率、累计线损率、变压器数量、一个月内故障次数、两个月内故障次数、一年内故障次数、历史故障总次数、日最高温、日最低温、日平均气温、天气类型、上月售电量、近一年合计售电量、故障前一天/周/月平均变压器超阈值次数合计、故障前一天/周/月平均变压器负载率、自上次检修变压器超阈值次数合计、自上次检修变压器平均负载率、最近一次消缺间隔时长、最近一次本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于随机森林模型的台区停电风险等级预测方法,其特征在于:包括以下步骤:S1:建立线路故障风险等级预测指标体系,将历史故障线路及历史非故障的线路分别作为正、负类样本,通过数据探索性分析方法找到典型故障特征后,按照线路故障风险等级预测指标体系构建形成训练数据;S2:使用过采样SMOTE算法扩充数据,通过SMOTE算法对少数类样本进行分析并根据少数类样本人工合成新样本添加到数据集中,平衡正类样本与负类样本的数量差异;S3:采用机器学习算法构建预测模型并得到模型的精度,并对预测模型的精度进行测试;S4:如果模型测试后识别精度不满足业务需求,则重新调整模型参数并构建模型,即重复S3直至精度符合要求;S5:识别潜在故障风险线路,在完成停电风险等级预测模型构建后,整理数据库中的线路信息形成预测所需数据表,并固定周期常态化开展预测,将数据表输入该模型,识别出潜在的高故障停电风险线路,最终整理形成台账。2.根据权利要求1所述的一种基于随机森林模型的台区停电风险等级预测方法,其特征在于:所述线路故障风险等级预测指标体系包括自身影响因素、历史故障特征、外部影响因素和运行影响因素。3.根据权利要求2所述的一种基于随机森林模型的台区停电风险等级预测方法,其特征在于:所述自身影响因素包括区域类别、设备投运时间和设备状况,所述设备投运时间包括变压器平均投运时长,所述设备状况包括线路类型、基准电压等级、累计售电量、上月线损率、一年内平均线损率、累计线损率和变压器数量。4.根据权利要求2所述的一种基于随机森林模型的台区停电风险等级预测方法,其特征在于:所述历史故障特征包括历史故障数量,所述历史故障数量包括一个月内故障次数、两个月内故障次数、一年内故障次数和历史故障总次数。5.根据权利要求2所述的一种基于随机森林模型的台区停电风险等级预测方法,其特征在于:所述外部影响因素包括气温和天气,所述气温包括日最高温、日最低温和日平均气温,所述天气包括天气类型。6.根据权利要求2所述的一种基于随机森林模型的台区停电风险等级预测方法,其特征在于:所述运行影响因素包括运行负载情况和检修状况。7.根据权利要求6所述的一种基于随机森林模型的台区停电风险等...

【专利技术属性】
技术研发人员:张勤陈泓宇刘文虎
申请(专利权)人:云南电网有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1