一种输电线路在线监测数据异常分析方法技术

技术编号:23787762 阅读:24 留言:0更新日期:2020-04-15 00:52
本发明专利技术公开了一种输电线路在线监测数据异常分析方法,它包括:步骤1、建立输电线路在线监测平台的异常检测设备衡量标准;步骤2、构建包含t棵iTree的初始孤立森林;步骤3、待搜索空间的二进制编码;步骤4、初始化设置;步骤5、个体极值与全局最优解;步骤6、更新各个粒子的速度和位置;步骤7、当迭代次数达到终止条件结束寻优过程输出最优解,否则回到步骤4;步骤8、对待检测数据进行预测;解决了现有技术存在的iForest算法对于异常数据的监测在一定程度上依赖于树的数量,但是大规模的iForest会占用大量的计算资源,不能有效的提升iForest算法的准确性,甚至会拉低整体的性能等技术问题。

An abnormal analysis method of online monitoring data of transmission lines

【技术实现步骤摘要】
一种输电线路在线监测数据异常分析方法
本专利技术属于输电线路在线监测数据分析领域,尤其涉及一种输电线路在线监测数据异常分析方法。
技术介绍
近些年以来随着我国逐渐加快的城市化进程,较多城市供电系统的负荷也呈现较快增长的应用形式,只有加强城市输电线路的建设才能够完善电力输电系统,以完善并提高电网供电的水平与能力,满足当今社会持续增长的供电系统负荷需求。输电线路的在线监测数据也伴随着输电线路建设得到越来越多的关注。输电线路在线监测数据异常分析主要是通过监测数据来判断设备的运行情况。iForest适用于连续数据(Continuousnumericaldata)的异常检测,将异常定义为“容易被孤立的离群点(morelikelytobeseparated)”——可以理解为分布稀疏且离密度高的群体较远的点。用统计学来解释,在数据空间里面,分布稀疏的区域表示数据发生在此区域的概率很低,因此可以认为落在这些区域里的数据是异常的。iForest目前是异常点检测最常用的算法之一,它的优点非常突出,他具有线性时间复杂度。因为是随机森林的方法,所以可以用在含有海量数据的数据集上,通常树的数量越多,算法越稳定。由于每棵树都是互相独立生成的,因此可以部署在大规模分布式系统上来加速运算。iForest算法对于异常数据的监测在一定程度上依赖于树的数量,但是大规模的iForest会占用大量的计算资源,并且其中部分树的存在并不能有效的提升iForest算法的准确性,甚至会拉低整体的性能。由于iForest算法对于构建树的要求使得其无法参与大规模数据的处理。
技术实现思路
本专利技术要解决的技术问题是:提供一种输电线路在线监测数据异常分析方法,以解决现有技术存在的iForest算法对于异常数据的监测在一定程度上依赖于树的数量,但是大规模的iForest会占用大量的计算资源,并且其中部分树的存在并不能有效的提升iForest算法的准确性,甚至会拉低整体的性能。由于iForest算法对于构建树的要求使得其无法参与大规模数据的处理等技术问题。本专利技术的技术方案是:一种输电线路在线监测数据异常分析方法,它包括:步骤1、建立输电线路在线监测平台的异常检测设备衡量标准;步骤2、构建包含t棵iTree的初始孤立森林;步骤3、待搜索空间的二进制编码;步骤4、初始化设置;步骤5、个体极值与全局最优解;步骤6、更新各个粒子的速度和位置;步骤7、当迭代次数达到终止条件结束寻优过程输出最优解,否则回到步骤4;步骤8、对待检测数据进行预测。步骤1所述建立输电线路在线监测平台的异常检测设备衡量标准的方法包括:针对设备监测异常区域,采用数据库技术实现在线监测设备数据的整合与处理;分析总结脏数据的类型;对数据进行清洗和转换。步骤2所述构建包含t棵iTree的初始孤立森林的方法包括:步骤2.1、建立输电线路在线监测数据训练集PowerTraindata={d1,d2,…dn},取ψ个训练数据为子样本集,作为树的根节点;步骤2.2、随机取阈值以当前点为基准,以阈值范围内的随机步长进行切割;步骤2.3、从切割点形成超平面,将数据分成了两个子空间,将维度小于p和大于p的分别放在节点的左边和右边;步骤2.4、循环执行步骤2.2、2.3形成新的节点,当数据不能继续分割或者分割次数到达log2ψ时,停止分割。步骤2.5、重复步骤2.1~2.4,再构建t-1棵iTree组成孤立森林iForest={T1,T2,…Tt},其中iForest表示t棵iTree的集合。步骤3所述待搜索空间的二进制编码的方法包括:由步骤2中的生成的iForest的非空子集构成搜索空间{F1,F2,…},并用二进制编码表示;当iForest中的T1树在子集F1中时对应的编码为1,iForest中的T1树不在子集F2中对应的编码为0;编码的表示方式如下二进制编码表T1T2T3……TtF1110……0F2011……1F3101……1………………………………。步骤4所述初始化设置的方法包括:设置最大迭代次数iteration,设置最大的速度区间Vmax,防止超出最大的区间;在速度区间和搜索空间上随机初始化速度和位置,设置群体规模m。步骤5所述个体极值与全局最优解的方法为:群体中各个粒子编码分别转换为孤立森林{F1,F2,…Fm},计算各自的适应度值;将PowerTraindata分成N个相等但不相交的子集,孤立森林在每一子集上对度量值的平均值为适应度值;个体极值为每个粒子找到的历史上最优的位置信息,并从这些个体历史最优解中找到一个全局最优解,并与历史最优解比较,选出最佳的作为当前的历史最优解。步骤6所述更新各个粒子的速度和位置的方法包括:建立公式:Vk=ω·Vk+C1·random(0,1)(Pk-Xk)+C2·random(0,1)(Pgk-Xk)Xk=f(Xk,Vk)式中:Vk为粒子编码中第k位置的速度,ω为惯性因子,C1、C2为加速常数,random(0,1)表示0、1上的随机数,Pk表示粒子第k位置的历史最优信息,Xk表示粒子的位置信息编码,Pgk表示全局的历史最优解,f表示粒子k位置更新函数;其中abs()表示取绝对值;sigmoid()表示转换函数表达形式如下:步骤8所述对待检测数据进行预测的方法为:计算待检测数据d在每一棵iTree的路径长度h(d);由于iTree与二叉查找树的结构等价,因此包含d的叶子节点的路径长度等于二叉查找树中失败查询的路径长度;给出了二叉查找树中失败查询的路径长度:C(n)=2H(n-1)-(2(n-1)/n)式中:H(i)=Ln(i)+γ,γ为欧拉常数;n为叶子节点数;C(n)为给定n时h(n)的平均值,用以标准化h(n);数据的异常分数S(d,n)如下所示:E(h(d))为iTree集合中h(d)的平均值;当E(h(d))→C(n)时,S→0.5,即当所有数据均返回的S≈0.5时,全部样本中没有明显的异常值;当E(h(d))→0时,S→1,即当数据返回的S非常接近于1时,它们是异常值;当E(h(d))→-1时,S→0,即当数据返回的S小于0.5时,它们为正常值。本专利技术有益效果:本专利技术克服了传统iForest算法监测精度低,内部冗余量大,推广能力受限的问题。利用二进制粒子群算法的思想选择优秀的iForest来提升算法的精度,减少其内部的冗余量,加快计算速度;解决本文档来自技高网
...

【技术保护点】
1.一种输电线路在线监测数据异常分析方法,它包括:/n步骤1、建立输电线路在线监测平台的异常检测设备衡量标准;/n步骤2、构建包含t棵iTree的初始孤立森林;/n步骤3、待搜索空间的二进制编码;/n步骤4、初始化设置;/n步骤5、个体极值与全局最优解;/n步骤6、更新各个粒子的速度和位置;/n步骤7、当迭代次数达到终止条件结束寻优过程输出最优解,否则回到步骤4;/n步骤8、对待检测数据进行预测。/n

【技术特征摘要】
1.一种输电线路在线监测数据异常分析方法,它包括:
步骤1、建立输电线路在线监测平台的异常检测设备衡量标准;
步骤2、构建包含t棵iTree的初始孤立森林;
步骤3、待搜索空间的二进制编码;
步骤4、初始化设置;
步骤5、个体极值与全局最优解;
步骤6、更新各个粒子的速度和位置;
步骤7、当迭代次数达到终止条件结束寻优过程输出最优解,否则回到步骤4;
步骤8、对待检测数据进行预测。


2.根据权利要求1所述的一种输电线路在线监测数据异常分析方法,其特征在于:步骤1所述建立输电线路在线监测平台的异常检测设备衡量标准的方法包括:针对设备监测异常区域,采用数据库技术实现在线监测设备数据的整合与处理;分析总结脏数据的类型;对数据进行清洗和转换。


3.根据权利要求1所述的一种输电线路在线监测数据异常分析方法,其特征在于:步骤2所述构建包含t棵iTree的初始孤立森林的方法包括:
步骤2.1、建立输电线路在线监测数据训练集PowerTraindata={d1,d2,…dn},取ψ个训练数据为子样本集,作为树的根节点;
步骤2.2、随机取阈值以当前点为基准,以阈值范围内的随机步长进行切割;
步骤2.3、从切割点形成超平面,将数据分成了两个子空间,将维度小于p和大于p的分别放在节点的左边和右边;
步骤2.4、循环执行步骤2.2、2.3形成新的节点,当数据不能继续分割或者分割次数到达log2ψ时,停止分割。
步骤2.5、重复步骤2.1~2.4,再构建t-1棵iTree组成孤立森林iForest={T1,T2,…Tt},其中iForest表示t棵iTree的集合。


4.根据权利要求1所述的一种输电线路在线监测数据异常分析方法,其特征在于:步骤3所述待搜索空间的二进制编码的方法包括:由步骤2中的生成的iForest的非空子集构成搜索空间{F1,F2,…},并用二进制编码表示;当iForest中的T1树在子集F1中时对应的编码为1,iForest中的T1树不在子集F2中对应的编码为0;编码的表示方式如下二进制编码表













T1
T2
T3
……
Tt


F1
1
1
0
……
0


F2
0
1
1
……
1


F3
1
0
1
……
1


……
……
……
……
……
……
<...

【专利技术属性】
技术研发人员:吴建蓉黄欢黄军凯赵超毛先胤文屹吕黔苏张迅杨涛马晓红杨渊吴瑀卢金科刘华麟
申请(专利权)人:贵州电网有限责任公司
类型:发明
国别省市:贵州;52

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1