告警收敛方法及系统技术方案

技术编号:36079425 阅读:62 留言:0更新日期:2022-12-24 10:52
本申请实施例提供一种告警收敛方法及系统。方法包括:响应于告警发生信号,获取当前告警信息,并基于所述告警信息确定当前告警事件的当前调用链;在预设告警事件库中,判断当前调用链是否存在既往相同告警事件,并基于判断结果确定当前告警事件的执行规则;基于当前告警事件的执行规则执行当前告警事件处理,并基于处理结果进行预设告警事件库更新。本发明专利技术方案将告警信息的判断依据多样化,提高告警事件准确性。准确性。准确性。

【技术实现步骤摘要】
告警收敛方法及系统


[0001]本申请涉及运维监测
,具体涉及一种告警收敛方法及一种告警收敛系统。

技术介绍

[0002]系统告警是系统运维过程中时常会出现的情况,只要满足告警规则,系统运行过程中会收到各式各样的告警信息。这些告警信息产出自系统控制中的各个环节,虽然告警信息是系统运维过程中保证系统稳定运行必不可少的东西,但常理可知,针对不同环节控制,整个系统运行中存在很多控制链,存在于控制链上的所有环节具有很强的关联性,当一个部位存在故障时,因为后续环节无法正常获得在前下发的指令,也可能联动产出很多告警信息。可见,即使是系统中仅存在一处故障,也极有可能产出大量的告警信息,这些大量的告警信息不仅会给短信网关造成巨大压力,还会增大SRE的故障监管压力,致使其忽略核心根因告警信息。
[0003]为了避免这种情况,需要对应的告警收敛方法对告警信息进行分析、合并和丢弃,以此来降低告警信息的规模。目前普遍的告警收敛方法主要是把同类型的告警进行压缩,在一定周期内只发送有限数量的告警到用户端,以此减少告警重复发送的情况,提高告警效率,降低告警疲劳。但现有告警方法普遍存在判断条件单一、灵活性差、误告警信息多的问题,基于此,需要创造一种新的告警收敛方法。

技术实现思路

[0004]本申请实施例的目的是提供一种告警收敛方法及系统,以解决现有告警方法普遍存在的判断条件单一、灵活性差、误告警信息多的问题。
[0005]为了实现上述目的,本申请第一方面提供一种告警收敛方法,所述方法包括:响应于告警发生信号,获取当前告警信息,并基于所述告警信息确定当前告警事件的当前调用链;在预设告警事件库中,判断当前调用链是否存在既往相同告警事件,并基于判断结果确定当前告警事件的执行规则;基于当前告警事件的执行规则执行当前告警事件处理,并基于处理结果进行预设告警事件库更新。
[0006]在本申请实施例中,所述基于判断结果确定当前告警事件的执行规则,包括:若当前调用链存在既往相同告警事件,则执行收敛规则;若当前调用链不存在既往相同告警事件,则执行冷启动规则。
[0007]在本申请实施例中,若当前告警事件的执行规则为冷启动规则,所述基于当前告警事件的执行规则执行当前告警事件处理,包括:获取当前调用链的历史日志数据,并从所述历史日志数据中提取历史告警事件的真/假标注信息;在预设时间窗口内,搜寻所有异常信号下的相关指标,获得相关指标集;从所述相关指标集中筛选出与当前调用链相关程度最大的相关指标作为高相关指标;确定所述高相关指标对应的历史告警事件的标注类型,以及确定所述高相关指标在对应历史日志数据中的分布规律;基于所述标注类型和所述分
布规律对比当前告警事件,以判断当前告警事件的真/假性质,并基于判断结果执行对应的处理流程。
[0008]在本申请实施例中,所述从所述相关指标集中筛选出与当前调用链相关程度最大的相关指标作为高相关指标,包括:分别计算所述历史日志数据中历史告警事件与相关指标集中各相关指标的皮尔逊相关系数;对比各相关指标的皮尔逊相关系系数数值,筛选出数值最大的皮尔逊相关系数对应的相关指标作为高相关指标。
[0009]在本申请实施例中,所述确定所述高相关指标在对应历史日志数据中的分布规律,包括:记录历史告警事件对应的高相关指标在对应预设时间窗口下的异常次数作为所述高相关指标在对应历史日志数据中的分布规律。
[0010]在本申请实施例中,所述基于所述标注类型和所述分布规律对比当前告警事件,以判断当前告警事件的真/假性质,包括:获取当前告警事件在相同大小时间窗口下的异常次数,并计算与所述高相关指标在对应历史日志数据中的分布规律之间的相似度;其中,相似度计算规则为皮尔逊相关系数算法、Cosine相似度算法、Spearman秩相关系数算法、Tanimoto系数算法和对数似然相似度算法中的任一种;若确定识别到与当前告警事件之间的相似度大于预设相似度阈值的历史告警事件,识别该历史告警事件的真/假标注信息,基于该真/假标注信息确定当前告警事件的真/假性质,当前告警事件与相似度大于预设相似度阈值的历史告警事件的真/假性质相同。
[0011]在本申请实施例中,所述基于判断结果执行对应的处理流程,包括:若当前告警事件的性质为真告警事件,则进行当前告警事件推送;若当前告警事件的性质为假告警事件,则舍弃当前告警事件。
[0012]在本申请实施例中,若当前告警事件的执行规则为收敛规则,所述基于当前告警事件的执行规则执行当前告警事件处理,包括:基于既往相同告警事件处理信息,抽取当前调用链的高相关指标;基于所述高相关指标在预设时间窗口内进行异常检测,统计异常次数;基于所述异常次数计算当前告警事件与既往相同告警事件之间的相似度;对比所述相似度与预设相似度阈值,基于对比结果确定当前告警事件的真/假性质,并基于判断结果执行对应的处理流程。
[0013]在本申请实施例中,所述异常检测的方法为3σ原则法或箱线图法。
[0014]在本申请实施例中,所述对比所述相似度与预设相似度阈值,基于对比结果确定当前告警事件的真/假性质,包括:若当前告警事件与既往相同告警事件之间的相似度大于预设相似度阈值且既往相同告警事件为真告警事件,判定当前告警事件为真告警事件;若当前告警事件与既往相同告警事件之间的相似度大于预设相似度阈值且既往相同告警事件为假告警事件,判定当前告警事件为假告警事件;若当前告警事件与既往相同告警事件之间的相似度小于预设相似度阈值,判定当前告警事件为新发告警事件。
[0015]在本申请实施例中,所述基于判断结果执行对应的处理流程,包括:若当前告警事件为真告警事件,则进行当前告警事件推送;若当前告警事件为假告警事件,则舍弃当前告警事件;若当前告警事件为新发告警事件,则进行当前告警事件推送,并在当前告警事件处理完成后,将当前告警事件的处理信息记录到预设告警事件库中。
[0016]在本申请实施例中,所述方法还包括:进行真告警事件推送时,基于真告警事件对应的历史告警事件的处理流程或既往相同告警事件留存的处理流程,进行真告警事件的对
应处理流程推送。
[0017]在本申请实施例中,所述基于处理结果进行预设告警事件库更新,包括:更新当前告警事件的事件信息和对应的处理流程到预设告警事件库中;其中,所述事件信息包括:真/假性质、高关联指标、高关联指标在预设时间窗口内的异常次数和根因信息。
[0018]本申请第二方面提供一种告警收敛系统,所述系统包括:采集单元,用于响应于告警发生信号,获取当前告警信息,并基于所述告警信息确定当前告警的当前调用链;处理单元,用于在预设告警事件库中,判断当前调用链是否存在既往相同告警事件,并基于判断结果确定当前告警事件的执行规则;执行单元,用于基于当前告警事件的执行规则执行当前告警事件处理,并基于处理结果进行预设告警事件库更新。
[0019]本申请第三方面提供一种计算机可读储存介质,该机器可读存储介质上存储有指令,该指令在被处理器执行时使得所述处理器被配置成本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种告警收敛方法,其特征在于,所述方法包括:响应于告警发生信号,获取当前告警信息,并基于所述告警信息确定当前告警事件的当前调用链;在预设告警事件库中,判断当前调用链是否存在既往相同告警事件,并基于判断结果确定当前告警事件的执行规则;基于当前告警事件的执行规则执行当前告警事件处理,并基于处理结果进行预设告警事件库更新。2.根据权利要求1所述的方法,其特征在于,所述基于判断结果确定当前告警事件的执行规则,包括:若当前调用链存在既往相同告警事件,则执行收敛规则;若当前调用链不存在既往相同告警事件,则执行冷启动规则。3.根据权利要求2所述的方法,其特征在于,若当前告警事件的执行规则为冷启动规则,所述基于当前告警事件的执行规则执行当前告警事件处理,包括:获取当前调用链的历史日志数据,并从所述历史日志数据中提取历史告警事件的真/假标注信息;在预设时间窗口内,搜寻所有异常信号下的相关指标,获得相关指标集;从所述相关指标集中筛选出与当前调用链相关程度最大的相关指标作为高相关指标;确定所述高相关指标对应的历史告警事件的标注类型,以及确定所述高相关指标在对应历史日志数据中的分布规律;基于所述标注类型和所述分布规律对比当前告警事件,以判断当前告警事件的真/假性质,并基于判断结果执行对应的处理流程。4.根据权利要求3所述的方法,其特征在于,所述从所述相关指标集中筛选出与当前调用链相关程度最大的相关指标作为高相关指标,包括:分别计算所述历史日志数据中历史告警事件与相关指标集中各相关指标的皮尔逊相关系数;对比各相关指标的皮尔逊相关系系数数值,筛选出数值最大的皮尔逊相关系数对应的相关指标作为高相关指标。5.根据权利要求3所述的方法,其特征在于,所述确定所述高相关指标在对应历史日志数据中的分布规律,包括:记录历史告警事件对应的高相关指标在对应预设时间窗口下的异常次数作为所述高相关指标在对应历史日志数据中的分布规律。6.根据权利要求3所述的方法,其特征在于,所述基于所述标注类型和所述分布规律对比当前告警事件,以判断当前告警事件的真/假性质,包括:获取当前告警事件在相同大小时间窗口下的异常次数,并计算与所述高相关指标在对应历史日志数据中的分布规律之间的相似度;其中,相似度计算规则为皮尔逊相关系数算法、Cosine相似度算法、Spearman秩相关系数算法、Tanimoto系数算法和对数似然相似度算法中的任一种;若确定识别到与当前告警事件之间的相似度大于预设相似度阈值的历史告警事件,识别该历史告警事件的真/假标注信息,基于该真/假标注信息确定当前告警事件的真/假性
质,当前告警事件与相似度大于预设相似度阈值的历史告警事件的真/假性质相同。7.根据权利要求3所述的方法,其特征在于,所述基于判断结果执行对应的处理流程,包括:若当前告警事件的性质为真告警事件,则进行当前告警事件推送;若当前告警事件的性质为假告警事件...

【专利技术属性】
技术研发人员:刘东阳
申请(专利权)人:建信金融科技有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1