System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及数据异常检测,具体涉及一种用于时间序列异常检测的特征感知预训练方法及系统。
技术介绍
1、目前,异常检测旨在发现数据中的异常值或罕见信号。它在工业界有许多应用,是数据挖掘的一个重要研究领域。企业通常会收集一组监控各种业务场景健康状况的关键数据信息,并随着时间的推移进行观测,以便检测意外行为。这类按照时间顺序排列的一系列数据观测值称为时间序列。然而,随着这些数据的复杂度和维度的增长,企业无法通过人工手动监控这些数据,这就需要能够及时自动检测高维数据中异常的方法。
2、由于时间序列历史数据普遍缺乏标记异常的信息,异常检测问题通常被视为一个无监督的学习问题。在过去的几年里,研究者们开发了许多无监督方法,主要可分为两类:基于传统机器学习的方法和基于深度学习的方法。然而这些方法都是针对不同的下游任务从头开始训练的,由于各时间序列特征各异,如长度、维度和分布,模型很难从一个数据集训练得到的信息迁移到另一个数据集中。而这一流程在实际工业应用中是很不方便的,因为无论何时出现新的数据集,终端都必须训练一个新的模型,这可能会给需要维护数千个模型的大公司带来沉重的训练成本。
3、在工业实际应用中可能没有足够的数据来训练通用模型,这种场景形成了典型的零样本问题。例如,目前现有技术中采用的ts2vec模型虽然能进行预训练,但是其对零样本的时间序列进行异常检测时,检测效果较差。
技术实现思路
1、为了解决现有技术中的预训练模型针对零样本的时间序列进行异常检测时,检测效果较
2、获取单维时间序列数据;
3、根据所述单维时间序列数据和预先设置的卷积编码器,生成数据嵌入向量;
4、根据所述数据嵌入向量,对所述卷积编码器进行预训练,并采用分层对比损失法对所述卷积编码器中的参数进行优化,得到异常检测模型。
5、可选的,所述根据所述单维时间序列数据和预先设置的卷积编码器,生成数据嵌入向量,包括:
6、将所述单维时间序列数据通过全连接层进行高纬度特征映射,得到高维特征向量;
7、根据所述高维特征向量和所述单维时间序列数据对应的属性特征,得到嵌入表征向量;
8、根据所述预先设置的卷积编码器,得到所述卷积编码器中的隐藏层的维度轴;
9、将所述嵌入表征向量沿着所述隐藏层的维度轴进行拼接,生成数据嵌入向量。
10、可选的,所述根据所述高维特征向量和所述单维时间序列数据对应的属性特征,得到嵌入表征向量,包括:
11、将所述单维时间序列数据对应的属性特征作为特征标签;
12、基于预先构建的嵌入向量空间,对所述特征标签进行编码,并将编码后的特征标签嵌入所述高维特征向量,得到嵌入表征向量。
13、可选的,所述根据所述数据嵌入向量,对所述卷积编码器进行预训练,并采用分层对比损失法对所述卷积编码器中的参数进行优化,得到异常检测模型,包括:
14、将所述数据嵌入向量作为输入项输入至所述卷积编码器,得到所述数据嵌入向量在每个时间戳上的表征信息;
15、基于所述数据嵌入向量在每个时间戳上的表征信息,计算所述卷积编码器的分层对比损失函数值;
16、根据所述卷积编码器的分层对比损失函数值,对所述卷积编码器中的参数进行优化,得到异常检测模型。
17、可选的,所述获取单维时间序列数据之后,所述根据所述单维时间序列数据和预先设置的卷积编码器,生成数据嵌入向量之前,还包括:
18、对所述单维时间序列数据采用z分数进行数据标准化,得到标准化处理后的单维时间序列数据;
19、对所述标准化处理后的单维时间序列数据进行实例划分,得到所述标准化处理后的单维时间序列数据对应的各段时间实例数据;
20、将所述各段时间实例数据随机裁剪为包含重叠区域的多个子序列数据;
21、将所述各段时间实例数据对应的子序列数据作为新的单维时间序列数据。
22、可选的,所述采用分层对比损失法对所述卷积编码器中的参数进行优化,得到异常检测模型之后,还包括:
23、获取多维时间序列数据集;
24、对所述多维时间序列数据集进行数据预处理,得到预处理后的多维时间序列数据集;
25、根据所述预处理后的多维时间序列数据集,生成对应的数据嵌入向量;
26、基于所述多维时间序列数据集对应的数据嵌入向量,利用所述异常检测检测模型,得到所述多维时间序列数据集对应的异常检测结果;
27、根据所述异常检测结果,利用预设的最大池化编码器,输出所述异常检测结果对应的最终表征向量;
28、根据所述异常检测结果对应的最终表征向量,计算所述异常检测结果对应的最终表征向量的异常分数。
29、可选的,所述对所述多维时间序列数据集进行数据预处理,得到预处理后的多维时间序列数据集,包括:
30、使用z分数对所述多维时间序列数据集进行标准化,得到标准化后的多维时间序列数据集;
31、对所述标准化后的多维时间序列数据集进行变量划分,得到所述标准化后的多维时间序列数据集中对应的单变量数据集和多变量数据集;
32、对所述多变量数据集采用主成分分析法进行特征降维,得到降维特征数据集;
33、将所述单变量数据集和所述降维特征数据集作为预处理后的多维时间序列数据集。
34、可选的,所述基于所述多维时间序列数据集对应的数据嵌入向量,利用所述异常检测检测模型,得到所述多维时间序列数据集对应的异常检测结果,包括:
35、将所述单变量数据集输入至所述异常检测模型,得到所述单变量数据集对应的异常检测结果;
36、将所述降维特征数据集中的每个变量对应的时间序列作为一个单变量时间序列,分别输入到所述异常检测模型,得到每一个单变量时间序列对应的异常检测结果。
37、可选的,所述多维时间序列数据集包括下述的一种或多种:安全水处理数据集、配水数据集、网络入侵数据集、土壤湿度主动被动卫星数据集和火星科学实验室漫游车数据集。
38、基于同一专利技术构思,本专利技术还提供了一种用于时间序列异常检测的特征感知预训练系统,包括:
39、数据获取模块:用于获取单维时间序列数据;
40、特征感知模块:用于根据所述单维时间序列数据和预先设置的卷积编码器,生成数据嵌入向量;
41、预训练模块:用于根据所述数据嵌入向量,对所述卷积编码器进行预训练,并采用分层对比损失法对所述卷积编码器中的参数进行优化,得到异常检测模型。
42、可选的,所述特征感知模块,具体用于:
43、将所述单维时间序列数据通过全连接层进行高纬度特征映射,得到高维特征向量;
44、根据所述高维特征向量和所述单维时间序列数据对应的属性特征,得到嵌入本文档来自技高网...
【技术保护点】
1.一种用于时间序列异常检测的特征感知预训练方法,其特征在于,包括:
2.如权利要求1所述的方法,其特征在于,所述根据所述单维时间序列数据和预先设置的卷积编码器,生成数据嵌入向量,包括:
3.如权利要求2所述的方法,其特征在于,所述根据所述高维特征向量和所述单维时间序列数据对应的属性特征,得到嵌入表征向量,包括:
4.如权利要求1所述的方法,其特征在于,所述根据所述数据嵌入向量,对所述卷积编码器进行预训练,并采用分层对比损失法对所述卷积编码器中的参数进行优化,得到异常检测模型,包括:
5.如权利要求1所述的方法,其特征在于,所述获取单维时间序列数据之后,所述根据所述单维时间序列数据和预先设置的卷积编码器,生成数据嵌入向量之前,还包括:
6.如权利要求1所述的方法,其特征在于,所述采用分层对比损失法对所述卷积编码器中的参数进行优化,得到异常检测模型之后,还包括:
7.如权利要求6所述的方法,其特征在于,所述对所述多维时间序列数据集进行数据预处理,得到预处理后的多维时间序列数据集,包括:
8.如权利要
9.如权利要求6所述的方法,其特征在于,所述多维时间序列数据集包括下述的一种或多种:安全水处理数据集、配水数据集、网络入侵数据集、土壤湿度主动被动卫星数据集和火星科学实验室漫游车数据集。
10.一种用于时间序列异常检测的特征感知预训练系统,其特征在于,包括:
...【技术特征摘要】
1.一种用于时间序列异常检测的特征感知预训练方法,其特征在于,包括:
2.如权利要求1所述的方法,其特征在于,所述根据所述单维时间序列数据和预先设置的卷积编码器,生成数据嵌入向量,包括:
3.如权利要求2所述的方法,其特征在于,所述根据所述高维特征向量和所述单维时间序列数据对应的属性特征,得到嵌入表征向量,包括:
4.如权利要求1所述的方法,其特征在于,所述根据所述数据嵌入向量,对所述卷积编码器进行预训练,并采用分层对比损失法对所述卷积编码器中的参数进行优化,得到异常检测模型,包括:
5.如权利要求1所述的方法,其特征在于,所述获取单维时间序列数据之后,所述根据所述单维时间序列数据和预先设置的卷积编码器,生成数据嵌入向量之前,还包括:
6.如权利要求...
【专利技术属性】
技术研发人员:黎卓,
申请(专利权)人:国家电网有限公司大数据中心,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。