【技术实现步骤摘要】
一种基于LSTM模型的运维系统异常预警方法、装置及设备
本文属于IT运维监控领域,具体涉及一种基于LSTM模型的运维系统异常预警方法、装置及设备。
技术介绍
随着分布式技术的发展、主机下平台的推进,金融行业系统版本迭代速度不断加快,传统的运维方式已经不能应对系统的规模和复杂度的增长。业内通常通过对交易代码的交易量、响应时间、业务成功率和系统成功率根据人为经验配置阈值形成指标,每个指标可以仅配置交易量的阈值,也可以配置交易量、响应时间、业务成功率和系统成功率阈值的组合。通过指标的报警情况来达到监控的目的,从而判断系统是否可以正常对外提供服务,但是当前的运维方式仅仅依赖于运维人员的手工维护,存在着以下问题:交易代码数量庞大,监控指标配置不全,从整体来看,监控指标不够全面,各系统落地联机监控情况参差不齐,监控指标配置成本较高。另外当前指标里大多包含有多个交易代码,交易代码的组合仅仅依赖于开发人员和运维人员的个人经验,当组合里的交易代码的交易量或者响应时间相差较大时,配置指标很难达到设置的报警阈值,因此造成报警的效率低下,很难满足现有的监控要求,因此如何提高运维系统的监控能力,降低监控成本成为目前亟需解决的技术问题。
技术实现思路
针对现有技术的上述问题,本文的目的在于,提供一种基于LSTM模型的运维系统异常预警方法、装置及设备,能够提高运维系统的监控能力,降低监控成本。为了解决上述技术问题,本文的具体技术方案如下:一方面,本文提供一种基于长短期记忆网络LSTM模型的运维系统异常预警方法, ...
【技术保护点】
1.一种基于长短期记忆网络LSTM模型的运维系统异常预警方法,其特征在于,所述方法包括:/n获取目标时段的多种运维数据;/n通过历史运维数据训练得到针对每种运维数据的LSTM模型,并获得每种运维数据的LSTM模型预测基线;/n根据所述运维数据预测基线,获取每种运维数据在所述目标时段对应的预测数据;/n根据所述预测数据和所述运维数据,计算得到所述目标时段的异常值;/n当所述异常值超过预警门限值时,则向用户发出异常预警。/n
【技术特征摘要】
1.一种基于长短期记忆网络LSTM模型的运维系统异常预警方法,其特征在于,所述方法包括:
获取目标时段的多种运维数据;
通过历史运维数据训练得到针对每种运维数据的LSTM模型,并获得每种运维数据的LSTM模型预测基线;
根据所述运维数据预测基线,获取每种运维数据在所述目标时段对应的预测数据;
根据所述预测数据和所述运维数据,计算得到所述目标时段的异常值;
当所述异常值超过预警门限值时,则向用户发出异常预警。
2.根据权利要求1所述的预警方法,其特征在于,所述历史运维数据包括多个周期数据,每个周期数据包括多组连续预设时段的运维数据,所述预设时段与所述目标时段相同。
3.根据权利要求1所述的预警方法,其特征在于,所述LSTM模型包括多层记忆单元结构,每层所述记忆单元结构包括遗忘门、输入门、输出门和细胞状态;
遗忘门,用于决定细胞状态中需要舍弃的信息,接收上一个状态的输出和当前时刻的数据输入;
输入门,用于确定需要在细胞状态中保存的信息;
细胞状态,用于对原细胞状态进行更新,决定需要忘记的信息;
输出门,用于确定预测基线对应的输出值。
4.根据权利要求1所述的预警方法,其特征在于,所述通过历史运维数据训练得到针对每种运维数据的LSTM模型,包括:
获取每种运维数据对应的历史运维数据;
对所述历史运维数据进行预处理,以获得标准化的历史运维数据,并将标准化的历史运维数据分为训练时间段的训练集数据和验证时间段的验证集数据;
通过粒子群优化算法PSO对LSTM模型的超参数巡优,计算每次巡优后的LSTM模型针对所述验证时间段的预测集数据;
根据所述验证集数据和所述预测集数据,计算LSTM模型每次巡优后的多个适应度函数值;
根据多个所述适应度函数值,确定每次迭代中的最优适应度函数值;
当达到预设迭代次数,则将全部所述最优适应度函数值中的最小值对应的超参数设定为最终设定值;
将所述超参数的最终设定值带入所述LSTM模型中得到训练完成的LSTM模型。
5.根据权利要求4所述的预警方法,其特征在于,所述通过粒子群优化算法PSO对LSTM模型的超参数巡优,包括:
对所述PSO进行改进,通过改进后的PSO对LSTM模型的超参数巡优,其中所述超参数包括时间窗口大小、批处理数量、第一层隐藏层单元数目、第二层隐藏层单元数目和学习率。
6.根据权利要求1所述...
【专利技术属性】
技术研发人员:肖闪丽,唐宁,陈利燕,苗国宏,
申请(专利权)人:中国工商银行股份有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。