基于ARNN-KM模型的系统数据异常检测方法技术方案

技术编号:35196026 阅读:16 留言:0更新日期:2022-10-12 18:25
本发明专利技术公开了一种基于ARNN

【技术实现步骤摘要】
基于ARNN

KM模型的系统数据异常检测方法


[0001]本专利技术涉及电力系统配电领域用电业务分析检测,尤其涉及一种基于ARNN

KM模型的系统数据异常检测方法。

技术介绍

[0002]随着电网互联工作的开展,用电业务数据规模增大。如何利用目前先进的智能技术对业务大数据进行深度信息挖掘,成为用电管理工作的关键。
[0003]传统的机器学习方法(例如K

Means分析)使用的相似性度量方法在高维数据上的性能通常较差,且通常在大规模数据集上具有很高的计算复杂度,从而降低了运行效果。因而目前针对大规模用电数据的分析和异常检测效果不佳,给工作人员带来很大困难。

技术实现思路

[0004]专利技术目的:针对以上问题,本专利技术提出一种基于ARNN

KM模型的系统数据异常检测方法,将循环神经网络与K

Means网络进行结合,对用户用电数据进行特征分析,根据分析结果进行用户用电异常数据的检测。
[0005]技术方案:为实现本专利技术的目的,本专利技术所采用的技术方案是:一种基于ARNN

KM模型的系统数据异常检测方法,包括步骤:
[0006](1)初始化模型参数;
[0007](2)更新输入序列数据;
[0008](3)将输入序列数据分成N个片段,Patch_k,k=1,2,

N,确定每个片段的长度和起始点;
[0009](4)将输入序列数据片段Patch_k输入到ARNN模型中,进行并行化处理,进行特征分析,提取特征值;所述ARNN模型为循环神经网络,采用导师驱动模型,将期望值(而非隐藏层的值)作为下一时刻的输入,产生循环连接;
[0010](5)对N个数据片段并行化处理输出结果进行拼接;
[0011](6)数据转换之后,利用K

Means方法分析得到聚类结果;
[0012](7)重复步骤2~6,更新聚类分析结果;
[0013](8)将新的聚类分析结果与以往结果进行比较,如果未发生变化则认为数据正常;否则进入步骤9进一步判断;
[0014](9)根据用户用电数据,判断用电变化量是否大于设定阈值,如果大于阈值则认为是异常数据;否则认为是正常数据。
[0015]进一步地,每个数据片段的处理过程为:将数据片段输入到ARNN模型中,更新网络参数,直到达到最大迭代次数时输出处理结果。
[0016]进一步地,初始化模型参数包括隐藏单元个数、批处理大小、迭代次数。
[0017]进一步地,输入序列数据包括馈线与变电站关系信息、变电站与用户关系信息、用户用电信息。
[0018]进一步地,ARNN模型提取特征包括:用户类型特征、用户区域特征、用户用电时段特征。
[0019]进一步地,利用Concat层对N个数据片段并行化处理输出结果进行拼接。
[0020]有益效果:本专利技术将ARNN神经网络模型自动提取特征和K

Means模型简单方便的优势进行结合。针对用电数据的时序特征,采用循环网络模型,并考虑历史数据和状态对当前特征提取的影响。
[0021]本专利技术针对数据规模较大的特点,采用易于进行并行化处理的ARNN模型,并采用导师驱动模型,该模型将输出层的值(而非隐藏层的值)进行反馈,从而消除相邻时间点隐藏层之间的连接。不仅减少了中间状态值的存储,还实现了基于模型输出和训练目标值之间的解耦,从而在模型训练时可以进行并行化处理。
附图说明
[0022]图1是本专利技术所述的基于ARNN

KM模型的系统数据异常检测方法流程图;
[0023]图2是导师驱动过程训练过程示意图;
[0024]图3是导师驱动过程测试过程示意图;
[0025]图4是本专利技术实施例中用户2019年3月至4月间用电变化曲线;
[0026]图5是用户4月26日用电数据异常检测表。
具体实施方式
[0027]下面结合附图和实施例对本专利技术的技术方案作进一步的说明。
[0028]如图1所示,本专利技术所述的基于ARNN

KM模型的系统数据异常检测方法,包括:
[0029](1)模型初始化,包括初始化模型参数,包括隐藏单元个数、批处理大小、迭代次数等;
[0030](2)更新输入序列数据,包括馈线与变电站关系信息,变电站与用户关系信息,用户用电信息;
[0031](3)将输入序列数据分成N个片段,Patch_k,k=1,2,

N,确定每个片段的长度和起始点;
[0032](4)将输入序列数据片段Patch_k输入到ARNN模型中,进行并行化处理,对用户用电数据进行特征分析,提取特征值,实现降维;
[0033]每个片段的处理过程为:将片段输入到ARNN模型中,更新网络参数,直到达到最大迭代次数时输出处理结果。
[0034]ARNN模型输出结果随着特征选取的不同而发生变化,本专利技术依据ARNN模型自动提取三个不同特征,包括用户类型特征、用户区域特征、用户用电时段特征。
[0035](5)对N个数据片段并行化处理输出结果进行拼接;
[0036]具体地,利用Concat层对N个数据片段并行化处理输出结果进行拼接。
[0037](6)数据转换之后,利用K

Means方法分析得到聚类结果;
[0038](7)重复步骤2~6,更新聚类分析结果;
[0039](8)将更新的聚类分析结果与以往结果进行比较,如果未发生变化则认为数据正常;否则进入步骤9进一步判断;
[0040](9)观察该用户用电数据时间曲线,比较用电变化,判断用电变化量是否大于设定阈值,如果大于阈值则认为是异常数据;否则认为是正常数据。
[0041]为了便于大规模数据的并行化处理,本专利技术的模型在使用测试前,需要对模型进行训练,采用导师驱动过程对模型进行训练。
[0042]ARRN模型训练时,采用的训练模型结构如附图2(图中,X
(T

1)
表示模型在T

1时刻的输入,H
(T

1)
表示模型在T

1时刻隐藏层的状态,O
(T

1)
表示模型在T

1时刻的输出,Y
(T

1)
表示模型在T

1时刻训练集输入对应的实际输出,L
(T

1)
表示模型在T

1时刻模型输出O
(T

1)
与真实输出Y
(T

1)之间
的差值)所示,该模型的特殊之处在于将当前时刻训练集中正确的输出值(或本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于ARNN

KM模型的系统数据异常检测方法,其特征在于,包括步骤:(1)初始化模型参数;(2)更新输入序列数据;(3)将输入序列数据分成N个片段,Patch_k,k=1,2,

N,确定每个片段的长度和起始点;(4)将输入序列数据片段Patch_k输入到ARNN模型中,进行并行化处理,进行特征分析,提取特征值;所述ARNN模型为特殊循环神经网络,采用导师驱动模型,将输出层的值进行反馈,产生循环连接;(5)对N个数据片段并行化处理输出结果进行拼接;(6)输出结果拼接之后,利用K

Means方法分析得到聚类结果;(7)重复步骤2~6,更新聚类分析结果;(8)将新的聚类分析结果与以往结果进行比较,如果未发生变化则认为数据正常;否则进入步骤9进一步判断;(9)根据用户用电数据,判断用电变化量是否大于设定阈值,如果大于阈值则认为是异常数据;否则认为是正常数据。2.根据权利要求1所述的基于ARNN

KM模型的系统数据异常检测方法,其特征在于,每个数据片段的处理过程...

【专利技术属性】
技术研发人员:潘艺旻陈天予施毓祥黄秀华潘坚跃
申请(专利权)人:浙达电力科技杭州有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1