本申请公开了告警信息处理方法和装置。所述方法的一具体实施方式包括:根据接收到的告警信息判断告警风暴是否产生;判断告警风暴产生之后,设置用于对告警信息进行合并的、窗口时间跨度可变的时间窗口;对所述时间窗口内接收到的告警信息进行合并,并将合并后的结果进行发送。该实施方式有效的抑制了告警风暴带来的负面影响。
【技术实现步骤摘要】
本申请涉及通信领域,具体涉及网络管理技术,尤其涉及告警信息处理方法和装置。
技术介绍
在超大规模服务器的管理实践中,为了能及时感知服务器及运行于其上的服务内部发生的异常和错误,会对服务器及运行于其上的服务加上各种类型的监控,监控可以帮助工作人员在服务器及运行其上的服务发生异常与错误时第一时间感知并介入处理,确保损失被控制在最小范围。然而,随着监控手段的丰富与增长,各类监控关系的日趋复杂化,监控系统在捕获到异常和错误时所触发的告警也越来越多。监控系统短时间内大量告警信息的上报称为告警风暴,告警风暴虽然能引起工作人员对异常和错误的高度关注,增强工作人员的紧迫感,迫使其尽早响应,但同时也带来许多负面影响,例如,当告警风暴发生时,由于监控系统需要在短时间内上报大量报警信息,因此会大量消耗系统资源,导致监控系统反应迟缓甚至崩溃。又例如,当告警风暴发生时会产生告警噪音,告警噪音在工作人员介入处理之后存在一定程度的危害(例如分散工作人员注意力)。因此,如何抑制告警风暴带来的负面影响是一个亟需解决的问题。
技术实现思路
本申请的目的在于提出一种改进的告警信息处理方法和装置,来解决以上
技术介绍
部分提到的技术问题。第一方面,本申请提供了一种告警信息处理方法,所述方法包括:根据接收到的告警信息判断告警风暴是否产生;判断告警风暴产生之后,设置用于对告警信息进行合并的、窗口时间跨度可变的时间窗口;对所述时间窗口内接收到的告警信息进行合并,并将合并后的结果进行发送。在一些实施例中,所述方法还包括:判断是否满足预先设定的时间窗口重置条件,如果满足,则将所述时间窗口的窗口时间跨度设置为初始窗口时间跨度,其中,所述时间窗口的初始窗口时间跨度是预先设定的。在一些实施例中,所述时间窗口重置条件为所述时间窗口的运行时间达到预先设定的重置时间,其中,所述时间窗口的运行时间指的从所述时间窗口设置为初始窗口时间跨度开始到当前时间的时间间隔。在一些实施例中,所述方法还包括:判断是否满足预先设定的时间窗口关闭条件,如果满足,则关闭时间窗口。在一些实施例中,所述时间窗口关闭条件为以下任意一种:连续接收的两条告警信息之间的时间间隔超过预先设定的时间阈值;检测到被检测对象运行正常。在一些实施例中,所述时间窗口的起始时间是变化的;以及所述判断告警风暴产生之后,设置用于对告警信息进行合并的、窗口时间跨度可变的时间窗口,包括:以判断告警风暴产生的时刻为所述时间窗口的初始起始时间,设置所述时间窗口的初始窗口时间跨度;当判断当前时间与所述时间窗口的起始时间之间的时间间隔等于所述时间窗口的窗口时间跨度时,则以当前时间为所述时间窗口的新起始时间,并在所述时间窗口的当前窗口时间跨度的基础上增加设定时长作为所述时间窗口的新窗口时间跨度。第二方面,本申请提供了一种告警信息处理装置,所述装置包括:判断单元,用于根据接收到的告警信息判断告警风暴是否产生;设置单元,用于判断告警风暴产生之后,设置用于对告警信息进行合并的、窗口时间跨度可变的时间窗口;合并单元,用于对所述时间窗口内接收到的告警信息进行合并,并将合并后的结果进行发送。在一些实施例中,所述装置还包括:重置单元,用于判断是否满足预先设定的时间窗口重置条件,如果满足,则将所述时间窗口的窗口时间跨度设置为初始窗口时间跨度,其中,所述时间窗口的初始窗口时间跨度是预先设定的。在一些实施例中,所述时间窗口重置条件为所述时间窗口的运行时间达到预先设定的重置时间,其中,所述时间窗口的运行时间指的从所述时间窗口设置为初始窗口时间跨度开始到当前时间的时间间隔。在一些实施例中,所述装置还包括:关闭单元,用于判断是否满足预先设定的时间窗口关闭条件,如果满足,则关闭时间窗口。在一些实施例中,所述时间窗口关闭条件为以下任意一种:连续接收的两条告警信息之间的时间间隔超过预先设定的时间阈值;检测到被检测对象运行正常。在一些实施例中,所述时间窗口的起始时间是变化的;以及所述设置单元进一步用于:以判断告警风暴产生的时刻为所述时间窗口的初始起始时间,设置所述时间窗口的初始窗口时间跨度;当判断当前时间与所述时间窗口的起始时间之间的时间间隔等于所述时间窗口的窗口时间跨度时,则以当前时间为所述时间窗口的新起始时间,并在所述时间窗口的当前窗口时间跨度的基础上增加设定时长作为所述时间窗口的新窗口时间跨度。本申请提供的告警信息处理方法和装置,在判断告警风暴产生之后设置用于对告警信息进行合并的、窗口时间跨度可变的时间窗口,并对时间窗口内接收到的告警信息进行合并,并将合并后的结果进行发送,减少了时间窗口内告警信息的上报次数,从而有效的抑制了告警风暴带来的负面影响。附图说明通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:图1是本申请可以应用于其中的示例性系统架构图;图2是根据本申请的告警信息处理方法的一个实施例的流程图;图3是根据本申请的告警信息处理方法的又一个实施例的流程图;图4是根据本申请的告警信息处理装置的一个实施例的结构示意图;图5是适于用来实现本申请实施例的监控设备或服务器的计算机系统的结构示意图。具体实施方式下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关专利技术,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关专利技术相关的部分。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。图1示出了可以应用本申请的告警信息处理方法或告警信息处理装置的实施例的示例性系统架构100。如图1所示,系统架构100可以包括监控设备101、102,网络103和服务器104、105、106。网络103用以在监控设备101、102和服务器104、105、106之间提供通信链路的介质。网络103可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。工作人员(例如运维人员)可以使用具有监控功能的监控设备101、102通过网络103对服务器104、105、106及运行于其上的服务进行监控,例如对服务器104、105、106的CPU、磁盘、内存、本文档来自技高网...
【技术保护点】
一种告警信息处理方法,其特征在于,所述方法包括:根据接收到的告警信息判断告警风暴是否产生;判断告警风暴产生之后,设置用于对告警信息进行合并的、窗口时间跨度可变的时间窗口;对所述时间窗口内接收到的告警信息进行合并,并将合并后的结果进行发送。
【技术特征摘要】
1.一种告警信息处理方法,其特征在于,所述方法包括:
根据接收到的告警信息判断告警风暴是否产生;
判断告警风暴产生之后,设置用于对告警信息进行合并的、窗口
时间跨度可变的时间窗口;
对所述时间窗口内接收到的告警信息进行合并,并将合并后的结
果进行发送。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
判断是否满足预先设定的时间窗口重置条件,如果满足,则将所
述时间窗口的窗口时间跨度设置为初始窗口时间跨度,其中,所述时
间窗口的初始窗口时间跨度是预先设定的。
3.根据权利要求2所述的方法,其特征在于,所述时间窗口重置
条件为所述时间窗口的运行时间达到预先设定的重置时间,其中,所
述时间窗口的运行时间指的从所述时间窗口设置为初始窗口时间跨度
开始到当前时间的时间间隔。
4.根据权利要求1所述的方法,其特征在于,所述方法还包括:
判断是否满足预先设定的时间窗口关闭条件,如果满足,则关闭
时间窗口。
5.根据权利要求4所述的方法,其特征在于,所述时间窗口关闭
条件为以下任意一种:
连续接收的两条告警信息之间的时间间隔超过预先设定的时间阈
值;
检测到被检测对象运行正常。
6.根据权利要求1-5之一所述的方法,其特征在于,所述时间窗
\t口的起始时间是变化的;以及
所述判断告警风暴产生之后,设置用于对告警信息进行合并的、
窗口时间跨度可变的时间窗口,包括:
以判断告警风暴产生的时刻为所述时间窗口的初始起始时间,设
置所述时间窗口的初始窗口时间跨度;
当判断当前时间与所述时间窗口的起始时间之间的时间间隔等于
所述时间窗口的窗口时间跨度时,则以当前时间为所述时间窗口的新
起始时间,并在所述时间窗口的当前窗口时间跨度的基础上增加设定
时长作为所述时间窗口的新窗口时间跨度。
【专利技术属性】
技术研发人员:丁飞,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。