一种具有周期性的多元时间序列异常检测方法及系统技术方案

技术编号:28147639 阅读:47 留言:0更新日期:2021-04-21 19:34
本发明专利技术涉及异常数据检测技术领域,尤其涉及一种具有周期性的多元时间序列异常检测方法及系统,该方法包括:构建对抗生成网络的编码器,通过编码器学习时间的周期性,学习时间和变量之间复杂的依赖关系,输出编码器隐含向量;构建对抗生成网络的解码器,通过解码器生成当前时刻的多元序列(假数据);构建模型,通过异常检测分类器识别真假数据来增强分类器的敏感度;构建综合损失函数优化模型准确度;以及异常检测分类器预测待检测数据。本发明专利技术的有益效果在于:解决具有周期性的多元时间序列异常检测问题,提高异常检测模型的敏感性。异常检测问题,提高异常检测模型的敏感性。异常检测问题,提高异常检测模型的敏感性。

【技术实现步骤摘要】
一种具有周期性的多元时间序列异常检测方法及系统


[0001]本专利技术涉及异常数据检测
,尤其涉及一种具有周期性的多元时间序列异常检测方法及系统。

技术介绍

[0002]时间序列是按照时间排序的一组随机变量,它通常是在相等间隔的时间段内依照给定的采样率对某种潜在过程进行观测的结果,多元时间序列数据是指多组随机变量随时间不断变化的趋势,具有周期性的多元时间序列数据是指多组随机变量随时间变化的趋势具有周期性。多元时间序列数据分析是指对多变量时间序列的研究,实际中很多序列的变化规律都会受到其他序列的影响。例如,在工程上要研究电流与电压同时随时间变化的情况;在化学变化中要分析压力、温度和体积的变化关系;在气象预报分析时需要同时考虑该地区的雨量、气温和气压等记录资料。所以多元时间序列数据分析不仅要把他们各分量看做单变量过程来研究,而且要研究各分量之间的关系及变化规律。
[0003]时间序列异常检测是从正常的时间序列中识别不正常的事件或行为的过程。有效的异常检测被广泛用于现实世界的很多领域,例如量化交易,网络安全检测、自动驾驶汽车和大型工业设备的日常维护。以在轨航天器为例,由于航天器昂贵且系统复杂,未能检测到危险可能会导致严重甚至无法弥补的损害。异常随时可能发展为严重故障,因此准确及时的异常检测可以提醒航天工程师今早采取措施。随着多元时间序列数据的发展,多元时间序列异常检测引起了研究者们的关注。专利申请号CN202010439838.6提供一种多元时间序列异常模式预测方法及数据采集监控装置,该方法采用自然近邻原理和MMOD算法实现多元时间序列异常模式的在线识别。专利申请号CN202010752303.4提供一种服务系统异常检测方法、装置、计算机设备和存储介质,采用编解码的方法对多元时间序列数据重构并进行对比,提高异常检测准确度。
[0004]根据多元时间序列数据的特点使得具有周期性多元时间序列异常检测存在以下难点:1、时间趋势上存在周期性,需学习时间局部周期内的变化趋势以及时间全局周期间的变化趋势;2、多元时间序列异常检测需要考虑整体变量之间的关联,一个变量的异常不代表此刻的数据异常,可能是存在数据污染情况,需学习多组随机变量之间的协同关系;3、异常多元时间序列数据收集困难,存在数据偏移。

技术实现思路

[0005]本专利技术为克服上述的不足之处,目的在于提供一种具有周期性的多元时间序列异常检测方法及系统,能够增强模型的鲁棒性、提高检测模型的敏感度,解决具有周期性的多元时间序列异常检测问题。
[0006]本专利技术是通过以下方案达到上述目的:一种具有周期性的多元时间序列异常检测方法,包括以下步骤:
[0007]S1:收集多元时间序列并进行预处理,得到训练数据x形成的多元时间序列实例向
量X;
[0008]S2:构建对抗生成网络的编码器,输出多元时间序列隐含向量T

VM

[0009]S3:构建对抗生成网络的解码器,输出重构后的多元时间序列x_;
[0010]S4:x_部分替换训练数据x形成训练数据x',x'输入对抗生成网络的编码器,输出x'对应重构后的隐含向量T
VM”;
[0011]S5:截取当前周期的多元时间序列得到真实训练数据train_1和异常训练数据train_0,将真实训练数据train_1和异常训练数据train_0输入异常检测分类器,输出标签向量T

class

[0012]S6:构建三重损失函数loss=W
class
×
loss
class
+W
content
×
loss
content
+W
hidden
×
loss
hidden
,其中二分类损失loss
class
为训练数据的标签数据和异常检测分类器输出标签向量T

class
的交叉熵损失值,上下文损失loss
content
为训练数据的重构数据x_与训练数据x的欧式距离,隐含损失loss
hidden
为多元时间序列隐含向量T

VM
和重构后的隐含向量T
VM”的欧式距离,W
class
、W
content
、W
hidden
分别为loss
class
、loss
conten
、loss
hidden
的系数指标;
[0013]S7:根据loss值迭代更新网络参数,生成异常检测模型M;
[0014]S8:待检测数据输入异常检测分类器,异常检测分类器加载异常检测模型M预测结果。
[0015]作为优选,所述预处理包括:多元时间序列数据S∈R
V
×
M
预处理为(m+1)P,(m+2)P,

,M时刻的个多元时间序列实例向量其中M为收集数据的时间步,V为收集数据的变量数,P为多元时间序列的周期,m为常数表示学习的周期数,则(m+1)P时刻及(m+1)P时刻前的训练数据其中表示第V个变量在第(m+1)P时刻的值。
[0016]作为优选,所述步骤S2具体包括以下步骤:
[0017]S21:将训练数据x∈R
V
×
(m+1)P
输入局部时间卷积层,提取训练数据x的局部时间特征T
(m+1)P

[0018]S22:将训练数据x∈R
V
×
(m+1)P
输入全局时间卷积层,提取训练数据x的全局时间特征T';
[0019]S23:将全局时间特征T'输入变量注意力层I,提取全局时间变量注意力向量T”;
[0020]S24:将输出全局时间变量注意力向量T”输入双向LSTM层I,提取变量全局时间向量T
V

[0021]S25:将变量全局时间向量T
V
输入权重矩阵融合层,输出隐含向量T

VM

[0022]作为优选,所述步骤S3具体包括以下步骤:隐含向量T

VM
与全局时间变量注意力向量T”输入变量注意力层II,获得重构后的多元时间序列x_。
[0023]作为优选,所述步骤S5中的真实训练数据train_1从多元时间序列实例向量X中截取P个时间维度的多元时间序列;所述异常训练数据train_0由重构后的多元时间序列x_依次替换真实训练数据train_1中对应位置的数据得到。
[0024]作为优选,真实训练数据train_1和异常训练数据train_0依次通过双向LSTM层II、全连接层、softmax层,输出标签向量T

class

[0025]作为优本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种具有周期性的多元时间序列异常检测方法,其特征在于,包括以下步骤:S1:收集多元时间序列并进行预处理,得到训练数据x形成的多元时间序列实例向量X;S2:构建对抗生成网络的编码器,输出多元时间序列隐含向量T

VM
;S3:构建对抗生成网络的解码器,输出重构后的多元时间序列x_;S4:x_部分替换训练数据x形成训练数据x',x'输入对抗生成网络的编码器,输出x'对应重构后的隐含向量T
VM”;S5:截取当前周期的多元时间序列得到真实训练数据train_1和异常训练数据train_0,将真实训练数据train_1和异常训练数据train_0输入异常检测分类器,输出标签向量T

class
;S6:构建三重损失函数loss=W
class
×
loss
class
+W
content
×
loss
content
+W
hidden
×
loss
hidden
,其中二分类损失loss
class
为训练数据的标签数据和异常检测分类器输出标签向量T

class
的交叉熵损失值,上下文损失loss
content
为训练数据的重构数据x_与训练数据x的欧式距离,隐含损失loss
hidden
为多元时间序列隐含向量T
V
'
M
和重构后的隐含向量T
VM”的欧式距离,W
class
、W
content
、W
hidden
分别为loss
class、
loss
conten、
loss
hidden
的系数指标;S7:根据loss值迭代更新网络参数,生成异常检测模型M;S8:待检测数据输入异常检测分类器,异常检测分类器加载异常检测模型M预测结果。2.根据权利要求1所述的一种具有周期性的多元时间序列异常检测方法,其特征在于,所述预处理包括:多元时间序列数据S∈R
V
×
M
预处理为(m+1)P,(m+2)P,

,M时刻的个多元时间序列实例向量其中M为收集数据的时间步,V为收集数据的变量数,P为多元时间序列的周期,m为常数表示学习的周期数,则(m+1)P时刻及(m+1)P时刻前的训练数据其中表示第V个变量在第(m+1)P时刻的值。3...

【专利技术属性】
技术研发人员:金佳佳丁锴韩潇李建元陈涛
申请(专利权)人:银江股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1