一种基于LSTM模型的运维系统异常预警方法、装置及设备制造方法及图纸

技术编号:28625199 阅读:18 留言:0更新日期:2021-05-28 16:21
本文属于IT运维监控领域,具体涉及一种基于LSTM模型的运维系统异常预警方法、装置及设备,所述方法包括:获取目标时段的多种运维数据;通过历史运维数据训练得到针对每种运维数据的LSTM模型,并获得每种运维数据的LSTM模型预测基线;根据所述运维数据预测基线,获取每种运维数据在所述目标时段对应的预测数据;根据所述预测数据和所述运维数据,计算得到所述目标时段的异常值;当所述异常值超过预警门限值时,则向用户发出异常预警,本文通过训练得到的LSTM模型对在时间序列分布的运维数据进行预测,从而能够快速确定相应时段运维数据的异常程度,实现了运维监控系统的准确快速的异常定位,提高监控能力。

【技术实现步骤摘要】
一种基于LSTM模型的运维系统异常预警方法、装置及设备
本文属于IT运维监控领域,具体涉及一种基于LSTM模型的运维系统异常预警方法、装置及设备。
技术介绍
随着分布式技术的发展、主机下平台的推进,金融行业系统版本迭代速度不断加快,传统的运维方式已经不能应对系统的规模和复杂度的增长。业内通常通过对交易代码的交易量、响应时间、业务成功率和系统成功率根据人为经验配置阈值形成指标,每个指标可以仅配置交易量的阈值,也可以配置交易量、响应时间、业务成功率和系统成功率阈值的组合。通过指标的报警情况来达到监控的目的,从而判断系统是否可以正常对外提供服务,但是当前的运维方式仅仅依赖于运维人员的手工维护,存在着以下问题:交易代码数量庞大,监控指标配置不全,从整体来看,监控指标不够全面,各系统落地联机监控情况参差不齐,监控指标配置成本较高。另外当前指标里大多包含有多个交易代码,交易代码的组合仅仅依赖于开发人员和运维人员的个人经验,当组合里的交易代码的交易量或者响应时间相差较大时,配置指标很难达到设置的报警阈值,因此造成报警的效率低下,很难满足现有的监控要求,因此如何提高运维系统的监控能力,降低监控成本成为目前亟需解决的技术问题。
技术实现思路
针对现有技术的上述问题,本文的目的在于,提供一种基于LSTM模型的运维系统异常预警方法、装置及设备,能够提高运维系统的监控能力,降低监控成本。为了解决上述技术问题,本文的具体技术方案如下:一方面,本文提供一种基于长短期记忆网络LSTM模型的运维系统异常预警方法,所述方法包括:获取目标时段的多种运维数据;通过历史运维数据训练得到针对每种运维数据的LSTM模型,并获得每种运维数据的LSTM模型预测基线;根据所述运维数据预测基线,获取每种运维数据在所述目标时段对应的预测数据;根据所述预测数据和所述运维数据,计算得到所述目标时段的异常值;当所述异常值超过预警门限值时,则向用户发出异常预警。进一步地,所述历史运维数据包括多个周期数据,每个周期数据包括多组连续预设时段的运维数据,所述预设时段与所述目标时段相同。进一步地,所述LSTM模型包括多层记忆单元结构,每层所述记忆单元结构包括遗忘门、输入门、输出门和细胞状态;遗忘门,用于决定细胞状态中需要舍弃的信息,接收上一个状态的输出和当前时刻的数据输入;输入门,用于确定需要在细胞状态中保存的信息;细胞状态,用于对原细胞状态进行更新,决定需要忘记的信息;输出门,用于确定预测基线对应的输出值。作为可选地,所述通过历史运维数据训练得到针对每种运维数据的LSTM模型,包括:获取每种运维数据对应的历史运维数据;对所述历史运维数据进行预处理,以获得标准化的历史运维数据,并将标准化的历史运维数据分为训练时间段的训练集数据和验证时间段的验证集数据;通过粒子群优化算法PSO对LSTM模型的超参数巡优,计算每次巡优后的LSTM模型针对所述验证时间段的预测集数据;根据所述验证集数据和所述预测集数据,计算LSTM模型每次巡优后的多个适应度函数值;根据多个所述适应度函数值,确定每次迭代中的最优适应度函数值;当达到预设迭代次数,则将全部所述最优适应度函数值中的最小值对应的超参数设定为最终设定值;将所述超参数的最终设定值带入所述LSTM模型中得到训练完成的LSTM模型。作为优选地,所述调整预设LSTM模型的超参数,包括:对所述PSO进行改进,通过改进后的PSO对LSTM模型的超参数巡优,其中所述超参数包括时间窗口大小、批处理数量、第一层隐藏层单元数目、第二层隐藏层单元数目和学习率。进一步地,所述预警门限值获得过程包括:获取所述历史运维数据中每个预设时段的实际运维数据;根据每种运维数据的LSTM模型预测基线,获取每个预设时段的每种运维数据的预测数据;根据每个预设时段的每种运维数据的预测数据和实际运维数据,计算得到每个预设时段的预警门限值。进一步地,所述根据每个预设时段的每种运维数据的预测数据和实际运维数据,计算得到每个预设时段的预警门限值,包括:获取所述历史运维数据中的异常数据;将所述异常数据的对应时段标记为异常时段,其余时段标记为正常时段;根据所述异常数据和所述异常时段对应的预测数据,按照第一函数计算所述异常时段的第一预警门限值;根据所述正常时段和所述正常时段对应的预测数据,按照第二函数计算所述正常时段的第二预警门限值。进一步地,所述方法还包括:确定所述运维数据对应的运维业务种类,根据所述运维业务种类确定所述第二函数。优选地,所述确定所述运维数据对应的运维业务种类,根据所述运维业务种类确定所述第二函数,包括:根据所述运维业务种类,确定不同运维业务种类中各种运维数据的权重关系;根据所述权重关系,生成针对所述运维业务种类的第二函数。另一方面,本文还提供一种基于长短期记忆网络LSTM模型的运维系统异常预警装置,所述装置包括:运维数据获取模块,用于获取目标时段的多种运维数据;预测基线获取模块,用于通过历史运维数据训练得到针对每种运维数据的LSTM模型,并获得每种运维数据的LSTM模型预测基线;预测数据获取模块,用于根据所述运维数据预测基线,获取每种运维数据在所述目标时段对应的预测数据;异常值计算模块,用于根据所述预测数据和所述运维数据,计算得到所述目标时段的异常值;异常预警模块,用于当所述异常值超过预警门限值时,则向用户发出异常预警。另一方面,本文还提供一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述所述的方法步骤。最后,本文还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如上述所述的方法步骤。采用上述技术方案,本文所述一种基于LSTM模型的运维系统异常预警方法、装置及设备,通过运维系统的历史运维数据训练得到的LSTM模型,得到运维数据的预测基线,从而确定目标时段的运维数据的预测数据,然后根据目标时段的实际数据和预测数据计算得到目标时段运维数据的异常值,通过异常值与预设门限值进行比较,当异常值超过预警门限值时,则向用户发出异常预警,本文通过训练得到的LSTM模型对在时间序列分布的运维数据进行预测,从而能够快速确定相应时段运维数据的异常程度,实现了运维监控系统的准确快速的异常定位。为让本文的上述和其他目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附图式,作详细说明如下。附图说明为了更清楚地说明本文实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本文的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提本文档来自技高网...

【技术保护点】
1.一种基于长短期记忆网络LSTM模型的运维系统异常预警方法,其特征在于,所述方法包括:/n获取目标时段的多种运维数据;/n通过历史运维数据训练得到针对每种运维数据的LSTM模型,并获得每种运维数据的LSTM模型预测基线;/n根据所述运维数据预测基线,获取每种运维数据在所述目标时段对应的预测数据;/n根据所述预测数据和所述运维数据,计算得到所述目标时段的异常值;/n当所述异常值超过预警门限值时,则向用户发出异常预警。/n

【技术特征摘要】
1.一种基于长短期记忆网络LSTM模型的运维系统异常预警方法,其特征在于,所述方法包括:
获取目标时段的多种运维数据;
通过历史运维数据训练得到针对每种运维数据的LSTM模型,并获得每种运维数据的LSTM模型预测基线;
根据所述运维数据预测基线,获取每种运维数据在所述目标时段对应的预测数据;
根据所述预测数据和所述运维数据,计算得到所述目标时段的异常值;
当所述异常值超过预警门限值时,则向用户发出异常预警。


2.根据权利要求1所述的预警方法,其特征在于,所述历史运维数据包括多个周期数据,每个周期数据包括多组连续预设时段的运维数据,所述预设时段与所述目标时段相同。


3.根据权利要求1所述的预警方法,其特征在于,所述LSTM模型包括多层记忆单元结构,每层所述记忆单元结构包括遗忘门、输入门、输出门和细胞状态;
遗忘门,用于决定细胞状态中需要舍弃的信息,接收上一个状态的输出和当前时刻的数据输入;
输入门,用于确定需要在细胞状态中保存的信息;
细胞状态,用于对原细胞状态进行更新,决定需要忘记的信息;
输出门,用于确定预测基线对应的输出值。


4.根据权利要求1所述的预警方法,其特征在于,所述通过历史运维数据训练得到针对每种运维数据的LSTM模型,包括:
获取每种运维数据对应的历史运维数据;
对所述历史运维数据进行预处理,以获得标准化的历史运维数据,并将标准化的历史运维数据分为训练时间段的训练集数据和验证时间段的验证集数据;
通过粒子群优化算法PSO对LSTM模型的超参数巡优,计算每次巡优后的LSTM模型针对所述验证时间段的预测集数据;
根据所述验证集数据和所述预测集数据,计算LSTM模型每次巡优后的多个适应度函数值;
根据多个所述适应度函数值,确定每次迭代中的最优适应度函数值;
当达到预设迭代次数,则将全部所述最优适应度函数值中的最小值对应的超参数设定为最终设定值;
将所述超参数的最终设定值带入所述LSTM模型中得到训练完成的LSTM模型。


5.根据权利要求4所述的预警方法,其特征在于,所述通过粒子群优化算法PSO对LSTM模型的超参数巡优,包括:
对所述PSO进行改进,通过改进后的PSO对LSTM模型的超参数巡优,其中所述超参数包括时间窗口大小、批处理数量、第一层隐藏层单元数目、第二层隐藏层单元数目和学习率。


6.根据权利要求1所述...

【专利技术属性】
技术研发人员:肖闪丽唐宁陈利燕苗国宏
申请(专利权)人:中国工商银行股份有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1