基于图预测网络和自动编码器的异常检测方法及系统技术方案

技术编号:36687652 阅读:8 留言:0更新日期:2023-02-27 19:52
本发明专利技术公开了一种基于图预测网络和自动编码器的异常检测方法及系统,所述方法包括:对收集到的时间序列数据进行预处理,构建数据集;对构建的数据集进行时间依赖性处理;经过时间依赖性处理的时间序列数据集,通过图形结构学习传感器节点依赖性,得到重构时间序列数据集;将重构数据集送入图预测网络进行训练,得到预测重构数据;利用预测重构数据与观测数据误差计算异常分数,并基于异常分数计算各滑动窗口对应的阈值;将滑动窗口异常分数与对应的阈值来进行异常判别。本发明专利技术能够快速有效的学习时间序列中各个传感器的依赖性,同时能够学习时间序列数据对时间的依赖性,共同有效提高时间序列数据异常检测的性能。高时间序列数据异常检测的性能。高时间序列数据异常检测的性能。

【技术实现步骤摘要】
基于图预测网络和自动编码器的异常检测方法及系统


[0001]本专利技术属于异常检测
,更具体地说,涉及一种基于图预测网络和自动编码器的异常检测方法及系统。

技术介绍

[0002]工业自动化、连接技术、互联网应用现今快速发展,信息系统生成的数据几乎呈几何倍数增长,从庞大的产生数据中获取有价值的信息成为数据挖掘中重要研究方向。在工业系统中,从各网络物理系统的互联网设备中收集到大量时间序列数据,诊断出异常状态并发现异常原因;在信息安全邻域中,由异常检测技术发现潜在异常网络流量浮动、恶意攻击、非法操作等异常行为;在医疗领域中,心电图的骤变以及检查报告片异常部位的识别等;在金融领域中,异常检测技术多用于欺诈性的信用卡以及欺诈信用卡的使用等行为。异常检测技术应用广泛,因此,快速准确的异常检测技术至关重要。
[0003]异常检测方法一般分为两类,一类是经典传统的异常检测方法,包括基于线性模型的方法、基于距离的方法、支持向量机的方法、基于密度的方法。然而,目标系统变的更大和复杂,传统的异常检测方法具有局限性;另一类异常检测方法则是基于深度学习技术进行异常检测,深度学习技术具有强大的表征学习能力,在计算机视觉、自然语言处理等均有领域涉及,并且能够处理高维数据、时间序列数据、空间数据都有着优异的表现,逐渐成为时间序列异常检测技术的首选。因此,充分利用深度学习技术学习时间序列数据的特征,从不同的维度进行特征提取,使能够高效准确的识别出异常。

技术实现思路

[0004]为了解决上述技术问题至少之一,根据本专利技术的一方面,提供了一种基于图预测网络和自动编码器的异常检测方法,包括如下步骤:
[0005]S1、对时间序列数据进行划分操作,获得以传感器为索引的三维时间序列数据集X;
[0006]S2、将所述的三维时间序列数据集X,经过自动编码器以及注意力网络对数据集进行时间依赖性学习,得出得到重构数据集X1;
[0007]S3、基于所述重构数据集X1,经过图形结构学习得出关系矩阵A;
[0008]S4、基于重构数据集X1和关系矩阵A,经过图预测网络处理得到重构数据集S;
[0009]S5、基于所述三维时间序列数据集X与重构数据集S,计算误差与异常分数;
[0010]S6、基于异常分数计算每个批量对应的阈值ε;
[0011]S7、将异常分数与对应的阈值ε比较,判断异常。
[0012]进一步的,步骤S1中:
[0013]三维时间序列数据集X(t)为对原始时间序列数据Г进行归一化处理以及下采样处理后得到的数据集。
[0014]进一步的,步骤S1中:
[0015]原始时间序列数据Г={W1,W2,

,W
T
},T表示时间序号,其中每个W
t
表示时间序列中t时刻对应的数据,是一个n维的向量,n表示维度的大小,选用最大最小标准化方法的归一化处理:
[0016][0017]在完成原始数据Г的归一化后,再对归一化的时间序列数据下采样处理,对原始数据每10秒进行一次采样:
[0018]W
t
=resample(10).mean()
ꢀꢀꢀꢀꢀ
(2)
[0019]在完成原始数据Г的归一化以及下采样后,对时间序列数据进行滑动窗口划分,以传感器为索引对象,按照时间顺序,对于t时刻往前选取长度为k的数据,进行时间戳长度为k的滑动窗口划分,每一窗口表示为X
t
={W
t

k+1
,

,W
t
‑1,W
t
},最终原始数据以传感器为索引对象,按照时间顺序以及一定批量被转换为一系列滑动窗口三维时间序列数据X={X1,X2,

,X
T
},其中X
T
表示T时刻以传感器为索引T时刻往前取k个时间戳的滑动窗口数据。
[0020]进一步的,步骤S2中:
[0021]三维时间序列数据集X通过由编码网络和解码网络构成基于Linear全连接的自编码器以及基于自注意力的简化外部注意力机制架构得出时间依赖性的重构数据X1:
[0022]F=query(X)
[0023]attn=key(F)
[0024]attn=softmax(attn,dim=1)
[0025]attn=norm(attn,dim=2)
[0026]out=value(attn)
[0027]X1=Decoder(Encoder(out))
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(3)
[0028]其中,query表示自注意力机制中的查询、key表示自注意力机制中的键、value自注意力机制中的值,都是该时序信号本身,通过相关模块进行编码,norm表示进行标准化。
[0029]进一步的,步骤S3中:
[0030]将所述经过时间依赖性处理的重构数据集X1通过图形结构学习得到各传感器节点V之间的依赖性,且使用一个有向图表示,若存在从一个传感器节点到另一个传感器节点的边,即表示第一个传感器用于建模表示第二个传感器的行为,由于事先没有传感器节点之间的依赖结构,则先考虑某传感器节点与其它节点均存在关系,计算依赖关系:
[0031][0032][0033]A
ji
=1{j∈TopK({e
ki
:k∈C
i
})}
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(4)
[0034]其中,C
i
表示某传感器节点除自身与其他传感器节点都存在关系,N表示有N个传感器节点,e
ji
表示传感器i与传感器j之间的归一化点积,且j属于C
i
,k表示选择这种归一化点积的前k个值,TopK表示其归一化点积中前k个值的传感器索引,A
ji
表示从存在传感器节点i到传感器节点j的依赖关系。
[0035]进一步的,步骤S4中:将重构数据集X1和生成关系矩阵A进行融合通过图结构预测
网络得到重构数据集S:
[0036][0037][0038]N(i)={j,A
ji
>0}
[0039][0040][0041][0042]其中,表示t时刻传感器节点输入的数据,N(i)表示关系矩阵A得到节点i的邻接集合表示串联,表示将传感器V
i
与相应变换后特征连接起来,a表示注意力机制的学习系数向量,α
i,j
表示传感器i与传感器之间注意力机制系数,表示节点特征与相应的时间序列V
i
按元素相乘,S
(t)
表示在t时刻的预测传感器值。
[0043]进一步的于,步骤S5中:通过重构数据集S与三维时间序列数据集X在t时刻的误差值标准化,再将每个传感本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于图预测网络和自动编码器的异常检测方法,其特征在于,包括如下步骤:S1、对时间序列数据进行划分操作,获得以传感器为索引的三维时间序列数据集X;S2、将所述的三维时间序列数据集X,经过自动编码器以及注意力网络对数据集进行时间依赖性学习,得出得到重构数据集X1;S3、基于所述重构数据集X1,经过图形结构学习得出关系矩阵A;S4、基于重构数据集X1和关系矩阵A,经过图预测网络处理得到重构数据集S;S5、基于所述三维时间序列数据集X与重构数据集S,计算误差与异常分数;S6、基于异常分数计算每个批量对应的阈值ε;S7、将异常分数与对应的阈值ε比较,判断异常。2.根据权利要求1所述的方法,其特征在于,步骤S1中:三维时间序列数据集X(t)为对原始时间序列数据Γ进行归一化处理以及下采样处理后得到的数据集。3.根据权利要求2所述的方法,其特征在于,步骤S1中:原始时间序列数据Γ={W1,W2,

,W
T
},T表示时间序号,其中每个W
t
表示时间序列中t时刻对应的数据,是一个n维的向量,n表示维度的大小,选用最大最小标准化方法的归一化处理:在完成原始数据Γ的归一化后,再对归一化的时间序列数据下采样处理,对原始数据每10秒进行一次采样:W
t
=resample(10).mean()
ꢀꢀꢀꢀ
(2)在完成原始数据Γ的归一化以及下采样后,对时间序列数据进行滑动窗口划分,以传感器为索引对象,按照时间顺序,对于t时刻往前选取长度为k的数据,进行时间戳长度为k的滑动窗口划分,每一窗口表示为X
t
={W
t

k+1


,W
t
‑1,W
t
},最终原始数据以传感器为索引对象,按照时间顺序以及一定批量被转换为一系列滑动窗口三维时间序列数据X={X1,X2,

,X
T
},其中X
T
表示T时刻以传感器为索引T时刻往前取k个时间戳的滑动窗口数据。4.根据权利要求1所述的方法,其特征在于,步骤S2中:三维时间序列数据集X通过由编码网络和解码网络构成基于Linear全连接的自编码器以及基于自注意力的简化外部注意力机制架构得出时间依赖性的重构数据X1:F=query(X)attn=key(F)attn=softmax(attn,dim=1)attn=norm(attn,dim=2)out=value(attn)X1=Decoder(Encoder(out))
ꢀꢀꢀꢀ
(3)其中,query表示自注意力机制中的查询、key表示自注意力机制中的键、value自注意力机制中的值,都是该时序信号本身,通过相关模块进行编码,norm表示进行标准化。5.根据权利要求1所述的方法,其特征在于,步骤S3中:将所述经过时间依赖性处理的重构数据集X1通过图形结构学习得到各传感器节点V之
间的依赖性,且使用一个有向图表示,若存在从一个传感器节点到另一个传感器节点的边,即表示第一个传感器用于建模表示第二个传感器的行为,由于事先没有传感器节点之间的依赖结构,则先考虑某传感器节点与其它节点均存在关系,计算依赖关系:依赖结构,则先考虑某传感器节点与其它...

【专利技术属性】
技术研发人员:顾磊张孚容
申请(专利权)人:南京邮电大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1