System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于特征分布相似度的时间序列异常检测方法技术_技高网

一种基于特征分布相似度的时间序列异常检测方法技术

技术编号:43149591 阅读:6 留言:0更新日期:2024-10-29 17:49
本发明专利技术公开了一种基于特征分布相似度的时间序列异常检测方法,属于时间序列技术领域,包括数据预处理与分割;将处理后的时间序列作为输入数据通过上下文嵌入和位置嵌入后并行输入至双向GRU重构模块和多尺度卷积稀疏注意力模块进行特征提取,分别得到局部特征和全局特征;通过归一化指数函数和对称的相位KL散度,将得到的局部特征和全局特征分别转化为概率分布和对应概率分布的相似度;利用对比损失函数,缩小局部特征的散度而放大全局特征的散度;完成LGS‑UAD模型在整个数据集上的异常检测任务并获得最终检测结果。本发明专利技术采用上述一种基于特征分布相似度的时间序列异常检测方法,能够应对现实环境中及时从大量数据流中检测异常的需求。

【技术实现步骤摘要】

本专利技术涉及时间序列,尤其是涉及一种基于特征分布相似度的时间序列异常检测方法


技术介绍

1、时间序列,是指将同一统计指标的数值按时间先后顺序排列得到的数值序列(例如:某服务器每小时的网络吞吐量、某网站每分钟的访问次数等)。时间序列异常检测,是指检测时间序列中某个数值或者某个数值子序列是否偏离了正常模式。现有检测时间序列是否异常的方法及缺陷,包括:

2、(1)基于密度估计的方法认为异常点会位于低密度区域,lof检测数据点的局部密度偏差,同时考虑到了数据集的局部和全局属性。cof不使用欧式距离而是链式距离计算离群分数。sos算法通过异度矩阵和关联矩阵计算全局的关联度来评估异常概率。这些方法在处理高维数据时消耗较大,dagmm方法使用自动编码器将数据转换至隐空间中评估异常程度。此种假设将输入序列视作了无结构信息,忽视了其中的时域依赖性。

3、(2)基于簇的方法用单分类思想解决异常检测问题,提取一种特征将正常点集中在簇附近,此时落在区域外的点都会被视为异常。svdd方法通过核函数将数据映射至零一空间,该空间中存在一个超球体包裹绝大部分正常点,使用拉格朗日方法计算球心。deepsvdd使用自动编码器替换核函数,损失函数同时优化网络参数和超球半径。deep sad方法利用了实践中可能得到的少量标签来辅助优化。同样的这种假设也将将输入序列视作了无结构信息,忽视了其中的时域依赖性。

4、(3)基于重构的模型从后验中学习数据隐式的生成规律,使用重构误差来评估异常。lstm-vae使用lstm提取时域特征,vae重新生成新的符合正常模式的数据,重构误差较大的点被判定为异常。omnianomaly使用含参的gru代替lstm,对于vae隐层变量通过线性高斯ssm使其具有时域依赖性,并利用平面归一化流建模分布中的非高斯部分。donut修改了原始的elbo中以应对输入中含有的缺失值对学习效果的影响,并根据窗口中正常值占比调整学习权重。这种方法需要额外设计以排除原始数据中含有的无标签异常数据对模型学习正常分布的干扰。

5、(4)基于对比结构的方法假设正常模式的特征在不同视角都比较相似,而异常点在不同视角下会有较大区别,因此采用对比结构提取原始的不同特征表达,通过差异对比来评估异常。anomalytransformer中先验关联度分支调整高斯核的标度参数适应正常模式,序列关联分支利用注意力机制关注非邻接区域,使用对称kl散度比较两分支间的差异以检测异常。dcdetector采用了patchtst的思想,时间序列的特征相比于point-wise,patch-wise可以更准确的描述,将输入分成patch-wise和in-patch两个分支,使用多头注意力提取不同视角下的特征表示。但由于对比分支结构需要双模型提取特征,现有的方法速度较慢且显存消耗巨大,难以应对现实环境中及时从大量数据流中检测异常的需求。


技术实现思路

1、本专利技术的目的是提供一种基于特征分布相似度的时间序列异常检测方法,以解决上述
技术介绍
中存在的问题。

2、为实现上述目的,本专利技术提供了一种基于特征分布相似度的时间序列异常检测方法,包括以下步骤:

3、s1、数据预处理与分割,获得训练数据集,测试数据集和验证数据集;

4、s2、基于步骤s1得到的训练数据集,每次随机选取64组训练数据,用于训练;

5、s3、将步骤s1处理后的时间序列作为输入数据通过上下文嵌入和位置嵌入后并行输入至双向gru重构模块和多尺度卷积稀疏注意力模块进行特征提取,分别得到局部特征和全局特征;

6、s4、通过归一化指数函数,将步骤s3中得到的局部特征和全局特征分别转化为概率分布,使用对称的相位kl散度评估局部特征和全局特征对应概率分布的相似度,并在检测窗口内归一化,得到每个时间点的相似度评估值;

7、s5、利用对比损失函数,缩小局部特征的散度而放大全局特征的散度,学习正常分布的时域特性并突出异常点,完成lgs-uad模型的一次训练;

8、s6、基于步骤s1中得到的验证数据集,将所有组数据输入到经过训练的lgs-uad模型中,对lgs-uad模型输出的对称相位kl散度进行评估,判断lgs-uad模型是否在继续优化;

9、s7、重复步骤s2-s6,直到得到的评估指标不再提升,此时网络参数更新完毕,lgs-uad模型结束训练;

10、s8、基于步骤s1得到的测试数据集,将所有组数据输入到经过训练的lgs-uad模型中,训练好的lgs-uad模型首先在训练数据集上计算异常得分阈值,根据异常得分阈值评估测试数据集得到lgs-uad模型在该组数据上的异常检测结果;

11、s9、完成lgs-uad模型在整个数据集上的异常检测任务并获得最终检测结果。

12、优选的,步骤s3中的上下文嵌入和位置嵌入,公式如下:

13、xemb=contexembedding(x)+postionembedding(x)

14、其中,表示输入序列,表示编码后的隐藏层变量,contextembedding(·)表示上下文嵌入变换函数,postionembedding(·)表示位置嵌入变换函数。

15、优选的,上下文嵌入变换函数包含一个一维卷积,利用一维卷积实现上下文嵌入,通过局部卷积运算保留时间序列的趋势信息,避免忽视趋势信息造成的误匹配,使得模型能够更好地捕捉时间序列的局部动态变化,参数为:

16、conv1d(in=d,out=dim,kernel_size=3,padding

17、=padding,padding_mode=circular,bias=false)

18、输入通道数为d,输出通道数为dim,大小为3的卷积核在xemb的长度维上滑动,对范围内的各个时间步,分别线性变换其特征维dim=wd,再对范围内变换过后特征按照卷积核参数加权聚合,得到上下文增强后的嵌入编码xcontext;

19、位置嵌入变换函数使用正余弦绝对位置编码,对于序列中的第pos个位置和第i个维度,位置编码的公式如下:

20、

21、其中,d是位置编码向量的维度,将正弦和余弦值分别填充到位置编码矩阵的偶数和奇数列,得到编码后的位置嵌入编码xpostion;上下文增强后的嵌入编码xcontext与编码后的位置嵌入编码xpostion叠加得到输入序列的嵌入编码表示xemb。

22、优选的,步骤s3中的双向gru重构模块由一个正向门控循环单元层(正向gru层)、一个神经元随机丢弃层(dropout层)、一个反向门控循环单元层(反向gru层)组成;能够从随机mask的数据中重构更具泛化性的序列表示,有效过滤时间序列数据中的异常值,提取正常时域特性的局部特征。与单向gru与lstm相比,它能更全面地捕获序列的特征,能够减少过拟合的风险,同时在重构序列表示时,更有效地过滤异常值,本文档来自技高网...

【技术保护点】

1.一种基于特征分布相似度的时间序列异常检测方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种基于特征分布相似度的时间序列异常检测方法,其特征在于,步骤S3中的上下文嵌入和位置嵌入,公式如下:

3.根据权利要求2所述的一种基于特征分布相似度的时间序列异常检测方法,其特征在于,上下文嵌入变换函数包含一个一维卷积,参数为:

4.根据权利要求1所述的一种基于特征分布相似度的时间序列异常检测方法,其特征在于:步骤S3中的双向GRU重构模块由一个正向门控循环单元层、一个神经元随机丢弃层、一个反向门控循环单元层组成;嵌入编码表示Xemb首先经过正向门控循环单元层从左邻域学习重构表示,再通过神经元随机丢弃层隐藏状态后输入反向门控循环单元层从右邻域学习输入的重构表示,最终得到输出局部隐藏特征Xlocal,对于t时刻的输入xt∈Xemb,其输出yt∈Xlocal满足公式

5.根据权利要求1所述的一种基于特征分布相似度的时间序列异常检测方法,其特征在于:步骤S3中的多尺度卷积稀疏注意力模块由卷积投影层,多头划分层,切割和降采样层及点乘注意力层组成。

6.根据权利要求5所述的一种基于特征分布相似度的时间序列异常检测方法,其特征在于:卷积投影层将嵌入编码表示Xemb通过三个结构相同但参数不共享的一维卷积模块,变换为注意力机制所需的query、key和value分量,具体如下

7.根据权利要求6所述的一种基于特征分布相似度的时间序列异常检测方法,其特征在于,对Xlocal,Xglobal添加了残差连接,公式如下:

8.根据权利要求1所述的一种基于特征分布相似度的时间序列异常检测方法,其特征在于,步骤S4中首先将步骤S3中输出的局部特征Xlocal和全局特征Xglobal转化为概率分布plocal、pglobal,公式如下:

9.根据权利要求1所述的一种基于特征分布相似度的时间序列异常检测方法,其特征在于,步骤S5中的对比损失函数为:

...

【技术特征摘要】

1.一种基于特征分布相似度的时间序列异常检测方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种基于特征分布相似度的时间序列异常检测方法,其特征在于,步骤s3中的上下文嵌入和位置嵌入,公式如下:

3.根据权利要求2所述的一种基于特征分布相似度的时间序列异常检测方法,其特征在于,上下文嵌入变换函数包含一个一维卷积,参数为:

4.根据权利要求1所述的一种基于特征分布相似度的时间序列异常检测方法,其特征在于:步骤s3中的双向gru重构模块由一个正向门控循环单元层、一个神经元随机丢弃层、一个反向门控循环单元层组成;嵌入编码表示xemb首先经过正向门控循环单元层从左邻域学习重构表示,再通过神经元随机丢弃层隐藏状态后输入反向门控循环单元层从右邻域学习输入的重构表示,最终得到输出局部隐藏特征xlocal,对于t时刻的输入xt∈xemb,其输出yt∈xlocal满足公式

5.根据权利要求1所述的一种基于特征分布相似度的...

【专利技术属性】
技术研发人员:葛岩樊谨张心仪汪哲瑜邬惠峰毕彦浩
申请(专利权)人:杭州电子科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1