基于无监督全属性图的异构多源时序异常检测方法技术

技术编号:32132400 阅读:18 留言:0更新日期:2022-01-29 19:34
本发明专利技术公开了一种基于无监督全属性图的异构多源时序异常检测方法,从多台被监测设备获取健康运行状态下的异构多源时序历史数据,并通过预处理得到异构多源时序历史样本;构建图节点特征矩阵,结合多源时序数据和先验知识生成邻接矩阵,实现异构多源时序历史样本到图结构样本的转换,作为训练集;构建无监督全属性图异常检测模型,并使用训练集对模型进行优化;获取待分析设备的异构多源时序数据,进行预处理、图结构样本转换以及数据增强操作,得到测试集;使用优化后的模型对测试集进行异常推理,根据阈值确定异常检测结果。本发明专利技术将多源时序数据嵌入图卷积操作中,为不同设备上的异构多源时序异常检测提供了一种有效且通用的方案。的方案。的方案。

【技术实现步骤摘要】
基于无监督全属性图的异构多源时序异常检测方法


[0001]本专利技术涉及时间序列异常检测领域,特别涉及一种基于无监督全属性图的异构多源时序异常检测方法。

技术介绍

[0002]时间序列数据是机械设备信号的主要表现形式,承载着设备运行健康状态信息,依靠时序分析技术可以实现对设备零件、部件及系统的异常检测。在重大装备的异常检测中,为提高监测数据表征能力,通常采用多个相同或不同类型的传感器以获取全面反映设备运行状态的多源时序数据,提高异常检测结果的可靠性。然而,多源数据的特征冗余性、高度非线性等特点阻碍了多传感器时间序列特征的有效融合,为设备状态的综合评价带来了困难,反而降低了多源时序异常检测结果的可信度和可解释性。此外,不同监测对象的多源时序通常是异构的,这为异常检测算法的通用性、便携性带来了挑战。因此,有必要研究一种有效且通用的异构多源时序异常检测方法。
[0003]传统时序异常检测算法(如孤立森林、单类支持向量机、局部离群因子、k

邻近算法等)在处理多源时间序列时效率低下且难以综合利用多源信息,所推理的异常检测结果并不可靠。近年来,具有特征自动提取能力的深度学习技术被应用于异常检测领域,多源时序特征的自适应融合算法得到发展,如多通道卷积神经网络、多特征长短期记忆网络、多通道自动编码器等。然而,由于深度学习可解释性差,多源融合策略难以制定;固定的欧氏空间输入结构也使得模型无法灵活处理异构多源输入,从而制约了这类模型的通用性。因此,需要研究一种能有效处理异构多源时序数据的异常检测方法。
>
技术实现思路

[0004]本专利技术的目的在于提供一种基于无监督全属性图的异构多源时序异常检测方法,以克服现有技术存在的缺陷,本专利技术基于变分图自编码器,在非欧空间处理异构多源时序数据,结合数据获取对象的先验知识完善图网络的拓扑信息,促进多源时序数据的有效融合,利用全属性图自编码器的重构节点特征、重构邻接矩阵、隐空间分布等进行异常推理,并通过数据增强技术进一步提高推理结果的可靠性,最终实现异构多源时序数据的异常检测。
[0005]为达到上述目的,本专利技术采用如下技术方案:
[0006]基于无监督全属性图的异构多源时序异常检测方法,包括以下步骤:
[0007]步骤1:从多台被监测设备获取健康运行状态下的异构多源时序历史数据,并通过对异构多源时序历史数据进行预处理得到异构多源时序历史样本;
[0008]步骤2:将步骤1中异构多源时序历史样本转换为图结构样本,作为训练集;
[0009]步骤3:构建无监督全属性图异常检测模型;
[0010]步骤4:使用步骤2中的训练集对步骤3所构建模型进行优化;
[0011]步骤5:获取待分析设备的多源时序数据,按步骤1进行预处理,按步骤2转换为图
结构样本,并施加数据增强操作,作为测试集;
[0012]步骤6:利用步骤4优化后的模型对步骤5中测试集进行异常推理,根据阈值确定异常检测结果。
[0013]进一步地,步骤1中所述预处理包括滑动时窗操作和归一化操作,其中,滑动时窗操作将长序列的多源时序历史数据划分为固定长度为L的多源时序历史样本,不允许时窗重叠;归一化操作公式如下:
[0014][0015]式中,为归一化前第i个异构多源时序历史样本中第j源,j=1,...,S
i
,S
i
为x

i
的多源数目,为归一化后第i个异构多源时序历史样本,||
·
||2为2范数。
[0016]进一步地,步骤2中将异构多源时序历史样本转换为图结构样本,包括构建图节点特征矩阵及邻接矩阵,图结构样本表示为G=(x
V
,A),x
V
为图节点特征矩阵,A为邻接矩阵;
[0017]对于第i个图结构样本G
i
,有S
i
个节点,分别对应于异构多源时序样本的各个源,该样本的图节点特征矩阵表示为等价于预处理后的多源时序历史样本邻接矩阵表示为构建邻接矩阵的具体步骤如下:
[0018]首先,对于训练集中结构一致的样本,计算任意两个源之间的距离如下:
[0019][0020]式中,表示第i个多源时序历史样本第j1源x
i
(j1)与第j2源x
i
(j2)的距离;
[0021]其次,生成距离矩阵如下:
[0022][0023]式中,D(j1,j2)为矩阵D第j1行、第j2列的值,N
tr
为结构一致的样本的数目;
[0024]然后,对矩阵D中所有距离按从大到小的顺序排列为并计算初始邻接矩阵A

如下:
[0025][0026]式中,τ
D
为距离阈值,取值为第J大的距离,即τ
D
=D
(J)

[0027]最后,结合所监测设备的先验知识,根据专家经验对A

进行调整,增加相关源所对应图节点之间的联系,减少不相关源所对应图节点之间的联系,得到图结构样本的邻接矩阵A。
[0028]进一步地,步骤3中无监督全属性图异常检测模型的主体为变分图自编码器,包括
图编码器和图解码器;
[0029]所述图编码器包含三个图卷积层、一个激活函数、一个重参数化函数,其编码过程公式化如下:
[0030][0031][0032][0033]z=f
rep
(μ,σ)
[0034]式中,H
E
为图编码器中图卷积层的输出,u和σ分别为图节点特征矩阵x
V
的隐空间特征的均值和方差,z为重参数化的隐空间特征,征的均值和方差,z为重参数化的隐空间特征,分别为编码器中的三个图卷积层,f
relu
为ReLU激活函数,f
rep
为重参数化函数,公式化为:
[0035]f
rep
(μ,σ)=μ+σ

ε
[0036]式中,ε~N(0,I)为一呈高斯分布的随机变量,

为哈达玛积;
[0037]图解码器包含两个图卷积层、一个激活函数,其解码过程公式化如下
[0038][0039]式中,表示重构的图节点特征矩阵,分别表示解码器中的两个图卷积层。
[0040]进一步地,所述图编码器和图解码器中的图卷积层包括两个操作:消息聚合及状态更新;
[0041]消息聚合过程如下:
[0042][0043]式中,为第l个图卷积层中节点v的隐含状态,为节点v的邻居节点集合,表示节点v的邻居节点个数,为第(l

1)个图卷积层在节点w处的输出,为一可训练的权重矩阵;
[0044]状态更新过程如下:
[0045][0046]式中,f
tanh
为Tanh激活函数,为一可训练的权重矩阵,为节点v更新后本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.基于无监督全属性图的异构多源时序异常检测方法,其特征在于,包括以下步骤:步骤1:从多台被监测设备获取健康运行状态下的异构多源时序历史数据,并通过对异构多源时序历史数据进行预处理得到异构多源时序历史样本;步骤2:将步骤1中异构多源时序历史样本转换为图结构样本,作为训练集;步骤3:构建无监督全属性图异常检测模型;步骤4:使用步骤2中的训练集对步骤3所构建模型进行优化;步骤5:获取待分析设备的多源时序数据,按步骤1进行预处理,按步骤2转换为图结构样本,并施加数据增强操作,作为测试集;步骤6:利用步骤4优化后的模型对步骤5中测试集进行异常推理,根据阈值确定异常检测结果。2.根据权利要求1所述的基于无监督全属性图的异构多源时序异常检测方法,其特征在于,步骤1中所述预处理包括滑动时窗操作和归一化操作,其中,滑动时窗操作将长序列的多源时序历史数据划分为固定长度为L的多源时序历史样本,不允许时窗重叠;归一化操作公式如下:式中,为归一化前第i个异构多源时序历史样本中第j源,j=1,...,S
i
,S
i
为x

i
的多源数目,为归一化后第i个异构多源时序历史样本,||
·
||2为2范数。3.根据权利要求2所述的基于无监督全属性图的异构多源时序异常检测方法,其特征在于,步骤2中将异构多源时序历史样本转换为图结构样本,包括构建图节点特征矩阵及邻接矩阵,图结构样本表示为G=(x
V
,A),x
V
为图节点特征矩阵,A为邻接矩阵;对于第i个图结构样本G
i
,有S
i
个节点,分别对应于异构多源时序样本的各个源,该样本的图节点特征矩阵表示为等价于预处理后的多源时序历史样本邻接矩阵表示为构建邻接矩阵的具体步骤如下:首先,对于训练集中结构一致的样本,计算任意两个源之间的距离如下:式中,表示第i个多源时序历史样本第j1源x
i
(j1)与第j2源x
i
(j2)的距离;其次,生成距离矩阵如下:式中,D(j1,j2)为矩阵D第j1行、第j2列的值,N
tr
为结构一致的样本的数目;然后,对矩阵D中所有距离按从大到小的顺序排列为并计算初始邻接矩阵A

如下:式中,τ
D
为距离阈值,取值为第J大的距离,即τ
D
=D
(J)
;最后,结合所监测设备的先验知识,根据专家经验对A

进行调整,增加相关源所对应图节点之间的联系,减少不相关源所对应图节点之间的联系,得到图结构样本的邻接矩阵A。4.根据权利要求3所述的基于无监督全属性图的异构多源时序异常检测方法,其特征在于,步骤3中无监督全属性图异常检测模型的主体为变分图自编码器,包括图编码器和图解码器;所述图编码器包含三个图卷积层、一个激活函数、一个重参数化函数,其编码过程公式化如下:化如下:化如下:z=f
rep
(μ,σ)式中,H
E
为图编码器中图卷积层的输出,u和σ分别为图节点特征矩阵x
V
的隐空间特征的均值和方差,z为重参数化的隐空间特征,均值和方差,z为重参数化的隐空间特征,分别为编码器中的三个图卷积层,f
relu
为ReLU激活函数,f
rep
为重参数化函数,公式化为:f
rep
(μ,σ)=μ...

【专利技术属性】
技术研发人员:陈景龙冯勇訾艳阳
申请(专利权)人:西安交通大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1