【技术实现步骤摘要】
告警收敛方法及系统
[0001]本申请涉及运维监测
,具体涉及一种告警收敛方法及一种告警收敛系统。
技术介绍
[0002]系统告警是系统运维过程中时常会出现的情况,只要满足告警规则,系统运行过程中会收到各式各样的告警信息。这些告警信息产出自系统控制中的各个环节,虽然告警信息是系统运维过程中保证系统稳定运行必不可少的东西,但常理可知,针对不同环节控制,整个系统运行中存在很多控制链,存在于控制链上的所有环节具有很强的关联性,当一个部位存在故障时,因为后续环节无法正常获得在前下发的指令,也可能联动产出很多告警信息。可见,即使是系统中仅存在一处故障,也极有可能产出大量的告警信息,这些大量的告警信息不仅会给短信网关造成巨大压力,还会增大SRE的故障监管压力,致使其忽略核心根因告警信息。
[0003]为了避免这种情况,需要对应的告警收敛方法对告警信息进行分析、合并和丢弃,以此来降低告警信息的规模。目前普遍的告警收敛方法主要是把同类型的告警进行压缩,在一定周期内只发送有限数量的告警到用户端,以此减少告警重复发送的情况,提高告警效率,降低告警疲劳。但现有告警方法普遍存在判断条件单一、灵活性差、误告警信息多的问题,基于此,需要创造一种新的告警收敛方法。
技术实现思路
[0004]本申请实施例的目的是提供一种告警收敛方法及系统,以解决现有告警方法普遍存在的判断条件单一、灵活性差、误告警信息多的问题。
[0005]为了实现上述目的,本申请第一方面提供一种告警收敛方法,所述方法包括:响应于告警发生信号, ...
【技术保护点】
【技术特征摘要】
1.一种告警收敛方法,其特征在于,所述方法包括:响应于告警发生信号,获取当前告警信息,并基于所述告警信息确定当前告警事件的当前调用链;在预设告警事件库中,判断当前调用链是否存在既往相同告警事件,并基于判断结果确定当前告警事件的执行规则;基于当前告警事件的执行规则执行当前告警事件处理,并基于处理结果进行预设告警事件库更新。2.根据权利要求1所述的方法,其特征在于,所述基于判断结果确定当前告警事件的执行规则,包括:若当前调用链存在既往相同告警事件,则执行收敛规则;若当前调用链不存在既往相同告警事件,则执行冷启动规则。3.根据权利要求2所述的方法,其特征在于,若当前告警事件的执行规则为冷启动规则,所述基于当前告警事件的执行规则执行当前告警事件处理,包括:获取当前调用链的历史日志数据,并从所述历史日志数据中提取历史告警事件的真/假标注信息;在预设时间窗口内,搜寻所有异常信号下的相关指标,获得相关指标集;从所述相关指标集中筛选出与当前调用链相关程度最大的相关指标作为高相关指标;确定所述高相关指标对应的历史告警事件的标注类型,以及确定所述高相关指标在对应历史日志数据中的分布规律;基于所述标注类型和所述分布规律对比当前告警事件,以判断当前告警事件的真/假性质,并基于判断结果执行对应的处理流程。4.根据权利要求3所述的方法,其特征在于,所述从所述相关指标集中筛选出与当前调用链相关程度最大的相关指标作为高相关指标,包括:分别计算所述历史日志数据中历史告警事件与相关指标集中各相关指标的皮尔逊相关系数;对比各相关指标的皮尔逊相关系系数数值,筛选出数值最大的皮尔逊相关系数对应的相关指标作为高相关指标。5.根据权利要求3所述的方法,其特征在于,所述确定所述高相关指标在对应历史日志数据中的分布规律,包括:记录历史告警事件对应的高相关指标在对应预设时间窗口下的异常次数作为所述高相关指标在对应历史日志数据中的分布规律。6.根据权利要求3所述的方法,其特征在于,所述基于所述标注类型和所述分布规律对比当前告警事件,以判断当前告警事件的真/假性质,包括:获取当前告警事件在相同大小时间窗口下的异常次数,并计算与所述高相关指标在对应历史日志数据中的分布规律之间的相似度;其中,相似度计算规则为皮尔逊相关系数算法、Cosine相似度算法、Spearman秩相关系数算法、Tanimoto系数算法和对数似然相似度算法中的任一种;若确定识别到与当前告警事件之间的相似度大于预设相似度阈值的历史告警事件,识别该历史告警事件的真/假标注信息,基于该真/假标注信息确定当前告警事件的真/假性
质,当前告警事件与相似度大于预设相似度阈值的历史告警事件的真/假性质相同。7.根据权利要求3所述的方法,其特征在于,所述基于判断结果执行对应的处理流程,包括:若当前告警事件的性质为真告警事件,则进行当前告警事件推送;若当前告警事件的性质为假告警事件...
【专利技术属性】
技术研发人员:刘东阳,
申请(专利权)人:建信金融科技有限责任公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。