一种大用户异常用电分析数据集的关联性挖掘方法和装置制造方法及图纸

技术编号:27284431 阅读:14 留言:0更新日期:2021-02-06 11:52
本发明专利技术公开了一种大用户异常用电分析数据集的关联性挖掘方法和装置,包括:对大用户异常用电分析数据集进行支持度判别,得到筛选后的多个频繁项集;通过筛选后的多个频繁项集对异常用电分析数据集进行置信度判别,得到具有关联性的大用户异常用电分析数据集。本发明专利技术通过支持度和置信度判别,挖掘大用户异常用电分析数据集项集间的关联性,降低了异常用电分析算法的运算数据量,有效提高系统分析效率,具有良好的应用前景。具有良好的应用前景。

【技术实现步骤摘要】
一种大用户异常用电分析数据集的关联性挖掘方法和装置


[0001]本专利技术涉及了一种大用户异常用电分析数据集的关联性挖掘方法和装置,属于电力系统


技术介绍

[0002]随着对异常用电行为查处力度的逐渐增大,窃电行为越来越隐蔽,其中的技术手段也越来越高,异常用电行为呈现出专业化、智能化、隐蔽化。借助常规的统计分析已经难以胜任,新一代人工智能技术的应用逐渐成为主流。标准化的数据集是大数据机器学习分析的基础,但由于大用户异常用电分析数据集包涵的数据项多样,数据量大,直接对数据集进行数据分析计算量极大,为此,需要对大用户异常用电分析的数据集进行数据挖掘,确定数据项间的关联关系,并对无用关联数据进行修剪,降低后续计算量,以满足人工智能分析技术在用户异常用电分析领域的应用,为进一步实现数据智能分析和数据深化应用提供有力支撑。

技术实现思路

[0003]为了克服上述不足,本专利技术公开了一种大用户异常用电分析数据集的关联性挖掘方法和装置,解决了现有大用户异常用电分析数据集数据量大,导致后续计算量大的问题,通过挖掘多源数据间的关联性,降低了异常用电分析算法的运算数据量。
[0004]为了达到上述目的,本专利技术所采用的技术方案是:一种大用户异常用电分析数据集的关联性挖掘方法,包括:
[0005]对大用户异常用电分析数据集进行支持度判别,得到筛选后的多个频繁项集;
[0006]通过筛选后的多个频繁项集对异常用电分析数据集进行置信度判别,得到具有关联性的大用户异常用电分析数据集。
>[0007]进一步的,大用户异常用电分析数据集S由n个用户信息构成:
[0008]S={S1,S2,...,S
x
,...,S
n
}
ꢀꢀ
(29)
[0009]其中,x=1,2,

,n,第x个用户信息S
x
为:
[0010]S
x
={L
id
,L
cl
,L
cal
,C
tv
(t),T
ag
}
ꢀꢀ
(30)
[0011]其中,L
id
为定位信息模块、L
cl
为类别信息模块、L
cal
为计算信息模块、C
tv
(t)为时变信息模块,t为时间,T
ag
为标定信息模块。
[0012]进一步的,定位信息模块L
id
,用于标记用户各类定位信息,为:
[0013]L
id
={n
an
,n
cn
,n
id
,n
ea
,n
lo
,n
oi
}
ꢀꢀ
(31)
[0014]其中,n
an
为电表局编号元素、n
cn
为用户编号元素、n
id
为用户名称元素、n
ea
为用电地址元素、n
lo
为线路编号元素、n
oi
为采集对象身份信息元素;
[0015]类别信息模块L
cl
,为:
[0016]L
cl
={n
csc
,n
wm
,n
sc
,n
tc
,n
on
,n
etc
,n
ml
,n
mm
}
ꢀꢀ
(32)
[0017]其中,n
csc
为用户类型元素、n
wm
为接线方式元素、n
sc
为电表类别元素、n
tc
为行业分
类元素、n
on
为组织编码元素、n
etc
为用电性质元素、n
ml
为计量点等级元素、n
mm
为计量方式元素;
[0018]计算信息模块L
cal
,为:
[0019]L
cal
={n
cc
,n
mc
,n
vc
,n
mvc
,n
mrc
,n
tf
,n
ctf
,n
vtf
}
ꢀꢀ
(33)
[0020]其中,n
cc
为合同容量元素,n
mc
为计量点容量元素、n
vc
为用户电压等级元素、n
mvc
为电表额定电压元素、n
mrc
为电表额定电流元素、n
tf
为综合倍率元素、n
ctf
为电流互感器倍率元素、n
vtf
为电压互感器倍率元素;
[0021]时变信息模块C
tv
(t)的包含项为:
[0022]C
tv
(t)={I(t),U(t),P(t),E(t),L(t)}
ꢀꢀ
(34)
[0023]其中,I(t)为电流曲线元素、U(t)为电压曲线元素、P(t)为功率曲线元素、E(t)为日冻结电量曲线元素、L(t)为线损曲线元素;
[0024]标定信息模块T
ag
,包含项异常类别元素T
type

[0025]T
ag
={T
type
}
ꢀꢀ
(35)
[0026]异常类别元素包括:无异常、失压、失流、串接、三相不平衡。
[0027]进一步的,对大用户异常用电分析数据集进行支持度判别,得到筛选后的多个频繁项集,包括:
[0028]对大用户异常用电分析数据集S提取候选1项集计算其支持度:
[0029][0030]其中,候选1项集表示只包含1个元素的项集表示只包含1个元素的项集为S中第x个用户信息中第m个元素;是异常用电分析数据集S所有第m个信息元素值出现的总次数,指在候选1项集中出现的次数,
[0031]将候选1项集中支持度大于最小频度阈值S
min
对应的保留,得到频繁1项集
[0032][0033]提取候选2项集计算其支持度:
[0034][0035]候选2项集表示集合表示集合为S中第x个用户信息中第l个元素;表示和在候选2项集中同时出现的次数,筛选频繁2项集需要满足:
[0036][0037]同时满足:
[0038][0039]为2项集支持度大于最小频度阈值S
min
对应的候选2项集,通过公式(12)将不包含频繁1项集元素的2项集排除;
[0040]依次计算本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种大用户异常用电分析数据集的关联性挖掘方法,其特征在于,包括:对大用户异常用电分析数据集进行支持度判别,得到筛选后的多个频繁项集;通过筛选后的多个频繁项集对异常用电分析数据集进行置信度判别,得到具有关联性的大用户异常用电分析数据集。2.根据权利要求1所述的大用户异常用电分析数据集的关联性挖掘方法,其特征在于:大用户异常用电分析数据集S由n个用户信息构成:S={S1,S2,...,S
x
,...,S
n
}
ꢀꢀ
(1)其中,x=1,2,

,n,第x个用户信息S
x
为:S
x
={L
id
,L
cl
,L
cal
,C
tv
(t),T
ag
}
ꢀꢀ
(2)其中,L
id
为定位信息模块、L
cl
为类别信息模块、L
cal
为计算信息模块、C
tv
(t)为时变信息模块,t为时间,T
ag
为标定信息模块。3.根据权利要求2所述的大用户异常用电分析数据集的关联性挖掘方法,其特征在于:定位信息模块L
id
,用于标记用户各类定位信息,为:L
id
={n
an
,n
cn
,n
id
,n
ea
,n
lo
,n
oi
}
ꢀꢀ
(3)其中,n
an
为电表局编号元素、n
cn
为用户编号元素、n
id
为用户名称元素、n
ea
为用电地址元素、n
lo
为线路编号元素、n
oi
为采集对象身份信息元素;类别信息模块L
cl
,为:L
cl
={n
csc
,n
wm
,n
sc
,n
tc
,n
on
,n
etc
,n
ml
,n
mm
}
ꢀꢀ
(4)其中,n
csc
为用户类型元素、n
wm
为接线方式元素、n
sc
为电表类别元素、n
tc
为行业分类元素、n
on
为组织编码元素、n
etc
为用电性质元素、n
ml
为计量点等级元素、n
mm
为计量方式元素;计算信息模块L
cal
,为:L
cal
={n
cc
,n
mc
,n
vc
,n
mvc
,n
mrc
,n
tf
,n
ctf
,n
vtf
}
ꢀꢀ
(5)其中,n
cc
为合同容量元素,n
mc
为计量点容量元素、n
vc
为用户电压等级元素、n
mvc
为电表额定电压元素、n
mrc
为电表额定电流元素、n
tf
为综合倍率元素、n
ctf
为电流互感器倍率元素、n
vtf
为电压互感器倍率元素;时变信息模块C
tv
(t)的包含项为:C
tv
(t)={I(t),U(t),P(t),E(t),L(t)}
ꢀꢀ
(6)其中,I(t)为电流曲线元素、U(t)为电压曲线元素、P(t)为功率曲线元素、E(t)为日冻结电量曲线元素、L(t)为线损曲线元素;标定信息模块T
ag
,包含项异常类别元素T
type
,T
ag
={T
type
}
ꢀꢀ
(7)异常类别元素包括:无异常、失压、失流、串接、三相不平衡。4.根据权利要求2所述的大用户异常用电分析数据集的关联性挖掘方法,其特征在于:对大用户异常用电分析数据集进行支持度判别,得到筛选后的多个频繁项集,包括:对大用户异常用电分析数据集S提取候选1项集计算其支持度:其中,候选1项集表示只包含1个元素的项集表示只包含1个元素的项集为S中第x个用户信息
中第m个元素;是异常用电分析数据集S所有第m个信息元素值出现的总次数,指在候选1项集中出现的次数,将候选1项集中支持度大于最小频度阈值S
min
对应的保留,得到频繁1项集保留,得到频繁1项集提取候选2项集计算其支持度:候选2项集表示集合表示集合为S中第x个用户信息中第l个元素;表示和在候选2项集中同时出现的次数,筛选频繁2项集需要满足:同时满足:同时满足:为2项集支持度大于最小频度阈值S
min
对应的候选2项集,通过公式(12)将不包含频繁1项集元素的2项集排除;依次计算得到频繁k项集且k+1项集不满足支持度阈值条件。5.根据权利要求1所述的大用户异常用电分析数据集的关联性挖掘方法,其特征在于:通过筛选后的多个频繁项集对异常用电分析数据集进行置信度判别,得到具有关联性的大用户异常用电分析数据集,包括:置信度从频繁2项集开始判别,对于频繁2项集的某一组2项元素对于第一项元素这个项集第二项为元素的概率是该2项集的置信度,2项集的置信度函数表示为:的置信度函数表示为:表示频繁2项集的某一组2项元素的支持度;表示第一项元素的支持度;判断是否满足最小置信度阈值C
min
,确定强相关频繁2项集,确定强相关频繁2项集依次判断得到强相关频繁k项集进而得到具有关联性的大用户异常用电分析数据集。6.一种大用户异常用电分析数据集的关联性挖...

【专利技术属性】
技术研发人员:陆婋泉周玉邵雪松蔡奇新季欣荣段梅梅易永仙崔高颖祝宇楠宋瑞鹏高雨翔
申请(专利权)人:国家电网有限公司江苏省电力试验研究院有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1