System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及电力系统,具体的是一种多模型融合异常用电行为辨识方法及系统。
技术介绍
1、异常用电行为包括窃电、电表故障、计费错误等,其主要来源是窃电现象。随着我国用电需求的快速增加,异常用电行为也时有发生,这不仅给电力公司造成了巨大的经济损失,还对居民的人身安全和正常用电产生威胁。
2、近年来,窃电行为逐渐转变为仪器智能化和手段专业化的高水平窃电方式,这给现场用检人员的排查工作带来了很大的困难。
技术实现思路
1、为解决上述
技术介绍
中提到的不足,本专利技术的目的在于提供一种多模型融合异常用电行为辨识方法及系统,能够快速准确的挖掘出异常用电用户的用电规律,有效提高用检人员的工作效率。
2、第一方面,本专利技术的目的可以通过以下技术方案实现:一种多模型融合异常用电行为辨识方法,方法包括以下步骤:
3、接收用电数据,对用电数据进行预处理,得到处理后的用电数据,其中,所述用电数据包括:带有异常用电标签的用户日用电量和日线损电量数据;
4、计算每个处理后的用电数据对应的皮尔逊相关系数,设定筛选条件,对皮尔逊相关系数进行筛选,筛选出的皮尔逊相关系数对应的处理后的用电数据作为疑似异常用户的用电数据;
5、提取处理后的用电数据内的日用电量数据数值特征,将日用电量数据数值特征输入至预先建立的bp神经网络模型和xgboost模型内,输出得到疑似异常用电概率,对疑似异常用电概率进行筛选,筛选出的异常用电概率对应的处理后的用电数据作为疑似异常用
6、将疑似异常用户的用电数据和疑似异常用电辨识结果所对应的疑似异常用电用户编号进行二次检测。
7、结合第一方面,在第一方面的某些实现方式中,该方法还包括:所述对用电数据进行预处理的过程包括:缺失值插补、异常值处理和数据归一化。
8、结合第一方面,在第一方面的某些实现方式中,该方法还包括:所述缺失值插补的计算过程:
9、
10、其中f(xi)为填补后第i个时间点的用电量,xi为填补前第i个时间点的用电量,nan为缺失值;
11、异常值处理的计算过程:
12、
13、其中x为真实用电向量,为用电量的平均值,σ为标准差,当i时刻测量的用电数据不满足高斯分布时,则i时刻测量值采用进行填充;
14、数据归一化的计算过程:
15、
16、其中min(x)和max(x)分别表示用户用电量最小值和最大值。x′为归一化后的用电量数据。
17、结合第一方面,在第一方面的某些实现方式中,该方法还包括:所述计算每个处理后的用电数据对应的皮尔逊相关系数rxy的计算过程如下:
18、
19、其中n为某测量时段内的观测样本数,xi(yi)和分别为2个变量的观测值和均值。
20、结合第一方面,在第一方面的某些实现方式中,该方法还包括:所述设定筛选条件,对皮尔逊相关系数进行筛选的筛选条件为:
21、设定皮尔逊相关系数阈值;
22、若皮尔逊相关系数大于皮尔逊相关系数阈值或者皮尔逊相关系数为缺失值nan时,对应的处理后的用电数据作为疑似异常用户的用电数据。
23、结合第一方面,在第一方面的某些实现方式中,该方法还包括:所述提取处理后的用电数据内的日用电量数据数值特征包括:
24、基础属性特征和累加统计特征,基础属性特征是指每一个用户id用电量属性全部记录的统计特征,包括最大值、最小值、均值、标准差、中位数和众数;累加统计特征描述用户在一段较长的时间段内用电的波动情况,包括超出2倍标准差的异常点个数、超出3倍标准差的异常点个数,峰度,偏度,方差,极差和变异系数。
25、结合第一方面,在第一方面的某些实现方式中,该方法还包括:所述将日用电量数据数值特征输入至预先建立的bp神经网络模型和xgboost模型内的过程:
26、bp神经网络模型的目标函数如下:
27、
28、其中,n为样本数量,yi为样本的标签,pi为样本预测为正值的概率;
29、xgboost模型的目标函数如下:
30、
31、其中l是损失函数,用于衡量模型对训练数据的拟合程度;ω是正则化项,用于衡量模型复杂度;t为叶节点数,ω为叶节点的分数;
32、计算输出得到概率pann,pxgb,将pann,pxgb作为疑似异常用电概率。
33、结合第一方面,在第一方面的某些实现方式中,该方法还包括:所述疑似异常用电概率的筛选过程通过设定疑似异常用电概率阈值,若疑似异常用电概率大于疑似异常用电概率阈值,则此疑似异常用电概率对应的处理后的用电数据作为疑似异常用电辨识结果。
34、第二方面,为了达到上述目的,本专利技术公开了一种多模型融合异常用电行为辨识系统,包括:
35、数据处理模块,用于接收用电数据,对用电数据进行预处理,得到处理后的用电数据,其中,所述用电数据包括:带有异常用电标签的用户日用电量和日线损电量数据;
36、系数筛选模块,用于计算每个处理后的用电数据对应的皮尔逊相关系数,设定筛选条件,对皮尔逊相关系数进行筛选,筛选出的皮尔逊相关系数对应的处理后的用电数据作为疑似异常用户的用电数据;
37、概率筛选模块,用于提取处理后的用电数据内的日用电量数据数值特征,将日用电量数据数值特征输入至预先建立的bp神经网络模型和xgboost模型内,输出得到疑似异常用电概率,对疑似异常用电概率进行筛选,筛选出的异常用电概率对应的处理后的用电数据作为疑似异常用电辨识结果;
38、二次检测模块,用于将疑似异常用户的用电数据和疑似异常用电辨识结果所对应的疑似异常用电用户编号进行二次检测。
39、结合第二方面,在第二方面的某些实现方式中,该系统还包括:所述数据处理模块内对用电数据进行预处理的过程包括:缺失值插补、异常值处理和数据归一化
40、或者数据处理模块内缺失值插补的计算过程:
41、
42、其中f(xi)为填补后第i个时间点的用电量,xi为填补前第i个时间点的用电量,nan为缺失值;
43、异常值处理的计算过程:
44、
45、其中x为真实用电向量,为用电量的平均值,σ为标准差,当i时刻测量的用电数据不满足高斯分布时,则i时刻测量值采用进行填充;
46、数据归一化的计算过程:
47、
48、其中min(x)和max(x)分别表示用户用电量最小值和最大值;x′为归一化后的用电量数据。
49、或者系数筛选模块内计算每个处理后的用电数据对应的皮尔逊相关系数rxy的计算过程如下:
50、
51、其中n为某测量时段内的观测样本数,xi(yi)和分别为2个变量的观测值和均值;
52、或者系数筛本文档来自技高网...
【技术保护点】
1.一种多模型融合异常用电行为辨识方法,其特征在于,方法包括以下步骤:
2.根据权利要求1所述的一种多模型融合异常用电行为辨识方法,其特征在于,所述对用电数据进行预处理的过程包括:缺失值插补、异常值处理和数据归一化。
3.根据权利要求2所述的一种多模型融合异常用电行为辨识方法,其特征在于,所述缺失值插补的计算过程:
4.根据权利要求1所述的一种多模型融合异常用电行为辨识方法,其特征在于,所述计算每个处理后的用电数据对应的皮尔逊相关系数rxy的计算过程如下:
5.根据权利要求1所述的一种多模型融合异常用电行为辨识方法,其特征在于,所述设定筛选条件,对皮尔逊相关系数进行筛选的筛选条件为:
6.根据权利要求1所述的一种多模型融合异常用电行为辨识方法,其特征在于,所述提取处理后的用电数据内的日用电量数据数值特征包括:
7.根据权利要求1所述的一种多模型融合异常用电行为辨识方法,其特征在于,所述将日用电量数据数值特征输入至预先建立的BP神经网络模型和XGBoost模型内的过程:
8.根据权利要求1所述的一种
9.一种多模型融合异常用电行为辨识系统,其特征在于,包括:
10.根据权利要求9所述的一种多模型融合异常用电行为辨识系统,其特征在于,所述数据处理模块内对用电数据进行预处理的过程包括:缺失值插补、异常值处理和数据归一化
...【技术特征摘要】
1.一种多模型融合异常用电行为辨识方法,其特征在于,方法包括以下步骤:
2.根据权利要求1所述的一种多模型融合异常用电行为辨识方法,其特征在于,所述对用电数据进行预处理的过程包括:缺失值插补、异常值处理和数据归一化。
3.根据权利要求2所述的一种多模型融合异常用电行为辨识方法,其特征在于,所述缺失值插补的计算过程:
4.根据权利要求1所述的一种多模型融合异常用电行为辨识方法,其特征在于,所述计算每个处理后的用电数据对应的皮尔逊相关系数rxy的计算过程如下:
5.根据权利要求1所述的一种多模型融合异常用电行为辨识方法,其特征在于,所述设定筛选条件,对皮尔逊相关系数进行筛选的筛选条件为:
6.根据权利要求1所述的一种多模型融合异常用电行为辨识方法,其特征在于,所述...
【专利技术属性】
技术研发人员:薛溟枫,陈心扬,鲁玉普,李志丹,陈浩,毛晓波,许涵慎,缪佳妮,刘瀚阳,王逸飞,
申请(专利权)人:国网江苏省电力有限公司无锡供电分公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。