一种基于数据挖掘识别用户窃电行为的方法技术

技术编号:19345024 阅读:46 留言:0更新日期:2018-11-07 14:57
本发明专利技术提供了一种基于数据挖掘识别用户窃电行为的方法,包括以下步骤:数据收集‑数据分析处理‑特征数据提取‑构建窃电行为识别模型‑获取窃电预警度。本发明专利技术通过对窃电相关的数据收集整理,模型训练的不断优化,最终达到最佳的窃电行为识别模型,使之能根据用户的基本属性特征、用电规律、行业特征、用电时间特征、电力行业运行特征进行准确的窃电行为的识别,高效精确的窃电行为识别提高了电力部门对于窃电行为的打击效率,对于保证电力企业的经济合理安全的运行,提高电力的安全使用,减少社会不良风气的发生有着重要的意义。

A method of identifying user stealing electricity based on Data Mining

The invention provides a method for identifying user's electricity theft behavior based on data mining, including the following steps: data collection, data analysis and processing, feature data extraction, construction of identification model of electricity theft behavior, and acquisition of early warning degree of electricity theft. By collecting and sorting out data related to electricity theft and optimizing model training, the invention finally achieves the best identification model of electricity theft behavior, which can accurately identify electricity theft behavior according to the basic attributes of users, electricity consumption law, industry characteristics, electricity consumption time characteristics and operation characteristics of power industry, and is efficient. Accurate identification of electricity theft behavior improves the efficiency of electric power department for striking electricity theft, and has important significance for ensuring the economic and reasonable safe operation of electric power enterprises, improving the safe use of electric power, and reducing the occurrence of adverse social atmosphere.

【技术实现步骤摘要】
一种基于数据挖掘识别用户窃电行为的方法
本专利技术涉及一种基于数据挖掘识别用户窃电行为的方法,属于防窃电分析

技术介绍
随着国民生活水平的不断提高,经济增长的同时,电力需求也日渐增加,在电力部门供电过程中,非法窃电行为一直是电网发展的重大问题之一,随着窃电手段的不断变化发展,使得窃电的影响范围不断的扩大,给电力企业健康、稳定的发展带来了巨大的不确定性,造成电力企业经济损失的同时,还存在着重大的安全隐患,近年来由于非法窃电引起的火灾已经成为了火灾成因的主要原因之一。目前对于非法窃电的防治手段主要为人工巡检,工作人员一方面根据自身多年的工作经验在用户现场进行排查和初步判断,记录用户窃电的可疑行为;另一方面对用户的用电量数据进行判断,辨别用电量数据的异常从而锁定具有窃电行为的可疑嫌疑用户。但是面对庞大的用户群体,想要逐一进行排查需要耗费的人力物力资源巨大,效果也不尽如人意,因此,需要一种高效精确的防窃电方法对用户的窃电行为进行识别锁定。在现有技术中,对防窃电提供了多种方法,如申请号为201310148105.7的中国专利公开的一种基于用电负荷管理系统数据挖掘的反窃电方法,该方法通过较多复杂的计算公式来进行窃电行为的判断,过程复杂,容易造成结果误差较大,其时间花费较长,效率较低。又如申请号为201711260280的中国专利公开的一种基于随机森林的窃电行为的发现方法、申请号为201710842008的中国专利公开的一种基于大数据分析用电行为判定窃电概率的方法和申请号为201710006620的中国专利公开的一种基于用户行为分析的防窃电方法,均是通过较多复杂的计算公式来进行窃电行为的判断,其过程复杂,容易造成结果误差较大,时间花费较长,效率较低的问题。又如申请号为201611157830的中国专利公开的一种单一异常分析防窃电预警分析方法,该方法只建立一个模型,用单一模型进行对所有数据进行分析,并不调整其输入输出结果,得到的结果不是最优的,且容易产生误差,使得结果不精确,错误停电、断电,给用户造成不必要的麻烦。
技术实现思路
为解决上述技术问题,本专利技术提供了一种基于数据挖掘识别用户窃电行为的方法,该基于数据挖掘识别用户窃电行为的方法相对于人工识别的方法,有效的实现了窃电行为识别的效率和识别的准确度,减少了电力企业经济损失和用电安全事故的发生。本专利技术通过以下技术方案得以实现。本专利技术提供的一种基于数据挖掘识别用户窃电行为的方法,包括以下步骤:①数据收集:收集标准用户用电行为数据和用户的用电行为数据,用电行为数据包括用户的基本信息数据、区域用电量、区域电量损失指数、节假日区域用电变化指数、行业数据;②数据分析处理:对用电行为数据进行分析处理,获取数据集;③特征数据提取:根据业务和统计相关性对数据集进行挖掘,提取特征数据,获取特征数据集;④构建窃电行为识别模型:利用特征数据集,构建用户的窃电行为识别模型;⑤获取窃电预警度:对窃电行为识别模型进行训练,获取窃电预警度,根据不同等级的窃电行为预警度对用户采取不同的措施;所述步骤②分为以下步骤:(2.1)分析用电行为数据的完整性、合理性和准确性;用电行为数据不完整的,先分析其合理性和有效性;用电行为数据不合理的无效数据,进行删除,用电行为数据不合理的有效数据,进行插值补充;用电行为数据不准确的,进行修改;(2.2)用电行为数据为异常值的,进行保留或删除;(2.3)对行业数据进行数据的数值转换,使之能够进行后续的数值计算;(2.4)将步骤(2.1)~(2.3)的数据进行整理,然后与标准用户用电行为数据进行比较,将不在标准用户用电行为数据范围内的数据筛选出来,形成数据集。所述步骤①中,用电行为数据从电力营销系统、计量系统、用电采集系统、95598用户服务系统中进行收集。所述基本信息数据包括动态数据和静态数据;所述动态数据包括抄表日期、每月电费、每月用电量、应收电费金额、窃电次数、窃电量;所述静态数据包括用户ID、类别、合同容量、开户日期、高耗能标识、行业分类、缴费方式;所述行业数据包括行业生产产量、产能变化指标。所述步骤③分为以下步骤:(3.1)对数据集进行变量构造,在原始变量的基础上,构建衍生变量;(3.2)对数据集进行统计相关性分析,提取特征数据,对特征数据进行统计相关性分析,获取特征数据集;所述特征数据包括用户的基本属性、用电规律、地区变化电量规律、用户行业用电规律、电力传输损耗规律、窃电用户用电变化规律。所述步骤中(3.1),采用求和、方差、同比、环比,比率对衍生变量进行构建。所述步骤(3.2)分为以下步骤:(3.2.1)根据统计相关性分析结果,将与用电行为数据相关系数大于0.75的特征数据进行保留,对保留下来的特征数据进行特征数据之间的统计相关性分析;(3.2.2)根据统计相关性分析结果,将与用电行为数据相关度大于0.8的特征数据,选择保留和删除。所述步骤④中,利用特征数据集和衍生变量,构建窃电行为识别模型。所述步骤⑤分为以下步骤:(5.1)利用深度神经网络对窃电行为识别模型中的特征数据进行训练;(5.2)反复调整窃电行为识别模型的输入输出;(5.3)利用新的测试用户数据对训练后的窃电行为识别模型进行模型测试,根据输出结果和训练精度,不断进行特征数据的选取和窃电行为识别模型的训练,得到最优输出结果;(5.4)根据输出结果,获取不同等级的窃电预警度,将不同等级的窃电预警度分为低窃电、一般窃电、高窃电、严重窃电。本专利技术的有益效果在于:通过对切断相关的数据收集整理,模型训练的不断优化,最终达到最佳的窃电行为识别模型,使之能根据用户的基本属性特征、用电规律、行业特征、用电时间特征、电力行业运行特征进行准确的窃电行为的识别,高效精确的窃电行为识别提高了电力部门对于窃电行为的打击效率,对于保证电力企业的经济合理安全的运行,提高电力的安全使用,减少社会不良风气的发生有着重要的意义。附图说明图1是本专利技术的流程图。具体实施方式下面进一步描述本专利技术的技术方案,但要求保护的范围并不局限于所述。如图1所示,一种基于数据挖掘识别用户窃电行为的方法,包括以下步骤:①数据收集:收集标准用户用电行为数据(即通过分析处理和工作人员经验分析出来的正常用户用电的数据规范)和用户的用电行为数据;用电行为数据从电力营销系统、计量系统、用电采集系统、95598用户服务系统中进行收集,包括用户的基本信息数据、区域用电量、区域电量损失指数、节假日区域用电变化指数、行业数据;所述基本信息数据包括动态数据和静态数据;所述动态数据包括抄表日期、每月电费、每月用电量、应收电费金额、窃电次数、窃电量;所述静态数据包括用户ID、类别、合同容量、开户日期、高耗能标识、行业分类、缴费方式;所述行业数据包括行业生产产量、产能变化指标(收集的数据包括但不限于上述数据)。②数据分析处理:对用电行为数据进行分析处理,获取数据集;具体分为以下步骤:(2.1)一一对应分析用电行为数据的完整性、合理性和准确性,避免出现逻辑上的错误或者数据不完整,分类不明确的情况;用电行为数据不完整的,先分析其合理性和有效性;用电行为数据不合理的无效数据,进行删除,用电行为数据不合理的有效数据,进行插值补充;用电行为数据不准确的,进行修改;(2.2)本文档来自技高网
...

【技术保护点】
1.一种基于数据挖掘识别用户窃电行为的方法,其特征在于:包括以下步骤:①数据收集:收集标准用户用电行为数据和用户的用电行为数据,用电行为数据包括用户的基本信息数据、区域用电量、区域电量损失指数、节假日区域用电变化指数、行业数据;②数据分析处理:对用电行为数据进行分析处理,获取数据集;③特征数据提取:根据业务和统计相关性对数据集进行挖掘,提取特征数据,获取特征数据集;④构建窃电行为识别模型:利用特征数据集,构建用户的窃电行为识别模型;⑤获取窃电预警度:对窃电行为识别模型进行训练,获取窃电预警度,根据不同等级的窃电行为预警度对用户采取不同的措施;所述步骤②分为以下步骤:(2.1)分析用电行为数据的完整性、合理性和准确性;用电行为数据不完整的,先分析其合理性和有效性;用电行为数据不合理的无效数据,进行删除,用电行为数据不合理的有效数据,进行插值补充;用电行为数据不准确的,进行修改;(2.2)用电行为数据为异常值的,进行保留或删除;(2.3)对行业数据进行数据的数值转换,使之能够进行后续的数值计算;(2.4)将步骤(2.1)~(2.3)的数据进行整理,然后与标准用户用电行为数据进行比较,将不在标准用户用电行为数据范围内的数据筛选出来,形成数据集。...

【技术特征摘要】
1.一种基于数据挖掘识别用户窃电行为的方法,其特征在于:包括以下步骤:①数据收集:收集标准用户用电行为数据和用户的用电行为数据,用电行为数据包括用户的基本信息数据、区域用电量、区域电量损失指数、节假日区域用电变化指数、行业数据;②数据分析处理:对用电行为数据进行分析处理,获取数据集;③特征数据提取:根据业务和统计相关性对数据集进行挖掘,提取特征数据,获取特征数据集;④构建窃电行为识别模型:利用特征数据集,构建用户的窃电行为识别模型;⑤获取窃电预警度:对窃电行为识别模型进行训练,获取窃电预警度,根据不同等级的窃电行为预警度对用户采取不同的措施;所述步骤②分为以下步骤:(2.1)分析用电行为数据的完整性、合理性和准确性;用电行为数据不完整的,先分析其合理性和有效性;用电行为数据不合理的无效数据,进行删除,用电行为数据不合理的有效数据,进行插值补充;用电行为数据不准确的,进行修改;(2.2)用电行为数据为异常值的,进行保留或删除;(2.3)对行业数据进行数据的数值转换,使之能够进行后续的数值计算;(2.4)将步骤(2.1)~(2.3)的数据进行整理,然后与标准用户用电行为数据进行比较,将不在标准用户用电行为数据范围内的数据筛选出来,形成数据集。2.如权利要求1所述的基于数据挖掘识别用户窃电行为的方法,其特征在于:所述步骤①中,用电行为数据从电力营销系统、计量系统、用电采集系统、95598用户服务系统中进行收集。3.如权利要求2所述的基于数据挖掘识别用户窃电行为的方法,其特征在于:所述基本信息数据包括动态数据和静态数据;所述动态数据包括抄表日期、每月电费、每月用电量、应收电费金额、窃电次数、窃电量;所述静态数据包括用户ID、类别、合同容量、开户日期、高耗能标识、行业分类、缴费方式;所述行业数据包括行业生产产量、产能变化指标。4....

【专利技术属性】
技术研发人员:汪林赵筑雨吕飞何文仲吴显峰沈兴富吴俊
申请(专利权)人:贵州黔驰信息股份有限公司
类型:发明
国别省市:贵州,52

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1