System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 异常检测方法、模型训练方法、装置、设备、介质及产品制造方法及图纸_技高网

异常检测方法、模型训练方法、装置、设备、介质及产品制造方法及图纸

技术编号:43303827 阅读:0 留言:0更新日期:2024-11-12 16:19
本申请公开了一种异常检测方法、模型训练方法、装置、设备、介质及产品,应用于人工智能领域,该模型训练方法将满足预设要求的业务数据量的时间序列作为训练数据进行模型训练。对数据进行处理得到非周期序列集合以及多个属于周期序列的聚类集合。然后分别基于这些集合,训练数据异常检测模型中对应的序列预测子模型。数据异常检测模型用于根据预测时间序列,确定实际时间序列中不满足预设要求的异常时间点。将用于训练的时间序列分类为多个集合,再基于对应类别的序列集合训练对应的子模型,在后续检测异常时,可针对不同场景下的历史数据,选择更合适的子模型,从而得到更加准确的预测时间序列,进而保证了异常检测的准确性。

【技术实现步骤摘要】

本申请属于人工智能领域,尤其涉及一种异常检测方法、模型训练方法、装置、设备、介质及产品


技术介绍

1、随着运营监控系统由独立静态物理系统的传统基础架构,转向含有本地、托管云、私有环境和公有环境的动态组合基础架构,环境所产生的数据量迎来爆发式增长,传统的信息技术管理解决方案已经无法跟上数据量增长的步伐。在业务的执行过程中,接口的数据量或者网站访问的数据量可能存在数据量过高或者过低的异常,需要及时确定出异常,以及时采取补救措施。

2、目前,确定数据量异常的方式有,通过历史数据预测出一个未来时间段的数据量预测曲线,然后再用实际曲线与预测曲线进行比较,若实际曲线中存在与预测曲线差距过大的点,则判定该点的数据量异常。而传统方案中,是采用大量的训练数据直接训练得到单个预测模型,再将该模型应用到所有场景中,但由于实际应用中的存在多种类型的数据,这些数据的变化趋势并不相同,导致训练出的预测模型无法针对每种场景下的数据量进行精准预测,进而导致异常判定的准确性偏低。


技术实现思路

1、本申请实施例提供一种异常检测方法、模型训练方法、装置、设备、介质及产品,能够提高对未来数据量预测的准确性,从而提高异常判定的准确性。

2、一方面,本申请实施例提供一种异常检测模型训练方法,包括:

3、获取多个初始时间序列;时间序列中各时间点的值为业务数据量,所述初始时间序列中各时间点的业务数据量满足预设要求;

4、滤除各所述初始时间序列的噪声,以得到对应的多个目标时间序列

5、采用周期分类算法,将多个所述目标时间序列划分为周期序列集合以及非周期序列集合;

6、采用聚类算法,将所述周期序列集合按周期特性进行分类,得到多个聚类集合;

7、基于所述非周期序列集合以及各所述聚类集合,分别训练数据异常检测模型中对应的序列预测子模型;所述数据异常检测模型用于根据未来目标时间段的预测时间序列,确定对应的实际时间序列中不满足所述预设要求的异常时间点;所述预测时间序列为基于对应的目标序列预测子模型,根据历史时间序列预测得到。

8、另一方面,所述采用周期分类算法,将多个所述目标时间序列划分为周期序列集合以及非周期序列集合,包括:

9、基于快速傅里叶变换算法,将多个所述目标时间序列划分为第一周期序列集合以及待定序列集合;

10、基于连续小波变换算法,将所述待定序列集合划分为第二周期序列集合以及所述非周期序列集合;所述周期序列集合包括所述第一周期序列集合以及所述第二周期序列集合。

11、另一方面,所述基于快速傅里叶变换算法,将多个所述目标时间序列划分为第一周期序列集合以及待定序列集合,包括:

12、基于快速傅里叶变换算法,确定各所述目标时间序列的频谱中最大幅值所对应的目标频率;

13、基于所述目标频率,确定各所述目标时间序列的目标周期;

14、以各所述目标周期为时间步长,将对应的所述目标时间序列划分为多个目标区间;

15、分别确定各所述目标时间序列中的所有所述目标区间的目标方差;

16、将所述目标方差大于方差阈值的各所述目标时间序列组成的集合,确定为所述第一周期序列集合;

17、将所述目标方差不大于所述方差阈值的各所述目标时间序列,确定为所述待定序列集合。

18、另一方面,所述基于连续小波变换算法,将所述待定序列集合划分为第二周期序列集合以及所述非周期序列集合,包括:

19、基于连续小波变换算法,确定所述待定序列集合中各待定序列的目标小波全谱;

20、将所述目标小波全谱大于小波全谱阈值的各所述待定序列组成的集合,确定为所述非周期序列集合;

21、将所述目标小波全谱不大于所述小波全谱阈值的各所述待定序列组成的集合,确定为所述第二周期序列集合。

22、另一方面,所述采用聚类算法,将所述周期序列集合按周期特性进行分类,得到多个聚类集合,包括:

23、基于形状计算距离方法(constrained shape based distance,csbd),量化所述周期序列集合中各周期序列之间的相似程度,得到量化结果;

24、根据所述量化结果,采用基于密度聚类方法(ordering points to identify theclustering structure,optics),将所述周期序列集合按周期特性进行分类,得到多个所述聚类集合。

25、另一方面,所述滤除各所述初始时间序列的噪声,以得到对应的多个目标时间序列,包括:

26、采用hp滤波算法,滤除各所述初始时间序列的噪声,以得到对应的多个所述目标时间序列。

27、再一方面,本申请实施例提供了一种异常检测方法,包括:

28、获取历史预设时间段的历史时间序列;

29、基于所述历史时间序列,从所述数据异常检测模型的各序列预测子模型中,确定对应的目标序列预测子模型;所述数据异常检测模型根据如上所述的异常检测模型训练方法训练得到;

30、基于所述目标序列预测子模型,根据所述历史时间序列,预测未来目标时间段的预测时间序列;

31、获取所述目标时间段的实际时间序列;

32、基于所述数据异常检测模型,确定所述目标时间段中,所述预测时间序列以及实际时间序列在各时间点的目标差异;

33、在所述目标差异不满足预设差异条件的情况下,确定对应时间点的数据量存在异常。

34、另一方面,所述基于所述历史时间序列,从所述数据异常检测模型的各序列预测子模型中,确定对应的目标序列预测子模型之前,所述方法还包括:

35、获取与所述历史时间序列相同种类的标志历史时间序列;

36、分别基于各所述序列预测子模型,根据所述标志历史时间序列,预测得到多个标志时间序列;

37、分别计算各所述标志时间序列与对应时间段的实际时间序列之间的误差指标;

38、将所述误差指标满足预设误差要求的所述标志时间序列所对应的所述序列预测子模型,确定为所述目标序列预测子模型。

39、另一方面,在所述分别计算各所述标志时间序列与对应时间段的实际时间序列之间的误差指标之前,所述方法还包括:

40、计算所述标志时间序列与实际时间序列之间的目标相似度;

41、基于所述目标相似度,对不同量级的所述标志时间序列以及实际时间序列,进行统一量纲处理。

42、另一方面,所述预设差异条件为所述目标差异大于差异阈值;

43、所述在所述目标差异不满足预设差异条件的情况下,确定对应时间点的数据量存在异常之前,所述方法还包括:

44、基于四分位法设定所述差异阈值。

45、再一方面,本申请实施例提供了一种异常检测模型训练装置,包括:

46、第一获取模块,用于获取多个初始时间序列;本文档来自技高网...

【技术保护点】

1.一种异常检测模型训练方法,其特征在于,包括:

2.根据权利要求1所述的异常检测模型训练方法,其特征在于,所述采用周期分类算法,将多个所述目标时间序列划分为周期序列集合以及非周期序列集合,包括:

3.根据权利要求2所述的异常检测模型训练方法,其特征在于,所述基于快速傅里叶变换算法,将多个所述目标时间序列划分为第一周期序列集合以及待定序列集合,包括:

4.根据权利要求3所述的异常检测模型训练方法,其特征在于,所述基于连续小波变换算法,将所述待定序列集合划分为第二周期序列集合以及所述非周期序列集合,包括:

5.根据权利要求1所述的异常检测模型训练方法,其特征在于,所述采用聚类算法,将所述周期序列集合按周期特性进行分类,得到多个聚类集合,包括:

6.根据权利要求1所述的异常检测模型训练方法,其特征在于,所述滤除各所述初始时间序列的噪声,以得到对应的多个目标时间序列,包括:

7.一种异常检测方法,其特征在于,包括:

8.根据权利要求7所述的异常检测方法,其特征在于,所述基于所述历史时间序列,从所述数据异常检测模型的各序列预测子模型中,确定对应的目标序列预测子模型之前,所述方法还包括:

9.根据权利要求8所述的异常检测方法,其特征在于,在所述分别计算各所述标志时间序列与对应时间段的实际时间序列之间的误差指标之前,所述方法还包括:

10.根据权利要求7所述的异常检测方法,其特征在于,所述预设差异条件为所述目标差异大于差异阈值;

11.一种异常检测模型训练装置,其特征在于,包括:

12.一种异常检测装置,其特征在于,包括:

13.一种电子设备,其特征在于,所述设备包括:处理器以及存储有计算机程序指令的存储器;

14.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序指令,所述计算机程序指令被处理器执行时实现如权利要求1至6任意一项所述的异常检测模型训练方法或如权利要求7至10任意一项所述的异常检测方法。

15.一种计算机程序产品,其特征在于,所述计算机程序产品中的指令由电子设备的处理器执行时,使得所述电子设备执行如权利要求1至6任意一项所述的异常检测模型训练方法或如权利要求7至10任意一项所述的异常检测方法。

...

【技术特征摘要】

1.一种异常检测模型训练方法,其特征在于,包括:

2.根据权利要求1所述的异常检测模型训练方法,其特征在于,所述采用周期分类算法,将多个所述目标时间序列划分为周期序列集合以及非周期序列集合,包括:

3.根据权利要求2所述的异常检测模型训练方法,其特征在于,所述基于快速傅里叶变换算法,将多个所述目标时间序列划分为第一周期序列集合以及待定序列集合,包括:

4.根据权利要求3所述的异常检测模型训练方法,其特征在于,所述基于连续小波变换算法,将所述待定序列集合划分为第二周期序列集合以及所述非周期序列集合,包括:

5.根据权利要求1所述的异常检测模型训练方法,其特征在于,所述采用聚类算法,将所述周期序列集合按周期特性进行分类,得到多个聚类集合,包括:

6.根据权利要求1所述的异常检测模型训练方法,其特征在于,所述滤除各所述初始时间序列的噪声,以得到对应的多个目标时间序列,包括:

7.一种异常检测方法,其特征在于,包括:

8.根据权利要求7所述的异常检测方法,其特征在于,所述基于所述历史时间序列,从所述数据异常检测模型的各序列...

【专利技术属性】
技术研发人员:叶展博张华陈杨蕾刘江辉王璐马维晶刘建
申请(专利权)人:中移动信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1