System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 异常设备监测方法、系统及装置制造方法及图纸_技高网

异常设备监测方法、系统及装置制造方法及图纸

技术编号:44593180 阅读:2 留言:0更新日期:2025-03-14 12:51
本申请提供一种异常设备监测方法、系统及装置,该方法包括:响应于接收到被监管设备发送的日志信息,对日志信息进行解析获取日志解析结果;将日志解析结果与预设规则集合中的告警规则进行匹配;响应于确定与日志解析结果匹配的第一告警规则且第一告警规则关联异常处理指令,将用于进行隐患或故障的自动修复的异常处理指令发送至被监管设备;响应于确定与日志解析结果匹配的、未关联异常处理指令的第二告警规则,输出告警提示,且对应同一异常的多个日志信息在一个时间周期内输出一次告警提示。本申请通过日志集中收集和在线分析,对IT系统环境下的隐患、故障进行实时监测,尽量减少故障发生,在故障发生后快速解决,保持系统稳定运行。

【技术实现步骤摘要】

本申请涉及计算机,尤其涉及一种异常设备监测方法、系统及装置


技术介绍

1、设备硬件的可靠性,机房环境变化、系统设计未考虑到的业务场景触发bug(故障),操作系统及平台组件bug等都会导致it(information technology,互联网技术)系统在运行过程中出现各种异常,难以保证系统始终稳定运行。因此,强化监测,尽早发现隐患并消除,在有故障发生时,尽快定位并消除故障,尽量减少it系统故障对支撑业务的影响,是it运维的重要工作。

2、其中,端到端业务监测、系统用户反馈、安装代理软件监测服务器运行状态是目前监测并发现it系统故障的一些主要措施。

3、对于端到端业务监测,通过业务操作日志,自动模拟拨测等方式了解业务支撑情况,能主动发现业务过程中出现的异常情形,及时通知it运维人员进行相关排查。但监测到业务异常只是it系统异常的表象,定位产生异常的网元设备及服务器,还需一系列的复杂过程。

4、it系统前端用户反馈通过系统用户告知系统异常情况,是一种被动方式。异常事件在用户反馈时可能早已发生,故障发现的时效性差,定位困难,排查工作量大。

5、安装代理软件监测服务器运行状态能及时主动的发现并报告服务器运行中出现的隐患及故障情况,时效性好,且能直接定位故障服务器。但代理软件需针对不同操作系统版本分别开发,代理软件的监测范围及能力也与开发阶段工程师的认知有关,一些未考虑到的隐患、故障情形容易被忽略,具有局限性。且代理软件不适用于网元设备,难以通过代理软件监测到it运行环境中交换机、网线等异常情况。在服务器较多的环境下,给每台服务器安装部署代理软件也是一个较为繁杂的工作,容易出现漏装,尤其新增设备往往会被忽略,造成遗漏。另外,代理软件本身会对设备造成较大资源消耗,自身也可能存在bug,并诱发服务器异常。

6、由于系统日志记录服务器、网元设备运行过程中发生的各种事件,尤其是设备运行过程中发生的各种异常事件都会被及时详细的记录,因此,系统日志对故障原因分析及排查具有重要参考意义。

7、通过对日志流的实时分析可以及时的发现日志中反映的异常情况,并快速定位发生异常的设备。针对已发生过的故障案例进行分析,可以发现很多故障在发生时都产生了特征显著的日志内容。一些故障在发生前,已经有很多隐患信息记录在系统日志中,对日志流进行实时监测可以在隐患出现时及时捕捉到并立即进行处理,避免隐患转化为影响业务正常开展的故障。但在复杂it环境下,如何实现对大量设备产生的日志进行全量监测和快速分析是一个较大挑战。

8、利用日志流的实时分析监测隐患、故障的另一个问题是如何解决日志风暴。例如,磁盘剩余空间不足,无法满足写文件请求,这种情况下进程通常不会停止,会继续根据业务请求持续发出写文件请求,不断产生写失败的日志记录。根据业务情况不同,很可能一秒钟会产生数十条写失败的日志记录,如对每条写失败记录都触发一次告警,将会给运维工作造成很大干扰,降低运维工作效率。且由于网络、业务依赖相互关联,一个故障的产生,可能引发大量关联设备、关联业务同时出现异常,并在短时间内形成大量关联告警,这是日志风暴的另一种体现形式。

9、由此可见,现有的it系统故障监测中,端到端业务监测的方式存在定位异常设备过程复杂的弊端;系统用户反馈的监测方式存在故障发现的时效性差,定位困难,排查工作量大的问题;安装代理软件进行监测的方式具有较大的局限性,且安装过程繁杂、代理软件会对设备造成较大资源消耗;现有的基于分析系统日志进行故障监测的方式难以对多个设备产生的日志进行全量监测,且日志风暴会给运维工作造成很大干扰,影响了利用日志分析进行故障监测的应用效果。


技术实现思路

1、鉴于上述问题,本申请实施例提供一种克服上述问题或者至少部分地解决上述问题的异常设备监测方法、系统及装置。

2、第一方面,本申请实施例提供一种异常设备监测方法,应用于日志收集设备,所述日志收集设备与多个被监管设备关联,所述方法包括:

3、响应于接收到所述被监管设备发送的日志信息,对所述日志信息进行解析,获取日志解析结果;

4、将所述日志解析结果与预设规则集合中的告警规则进行匹配,以对所述被监管设备进行异常监测;

5、响应于确定与所述日志解析结果匹配的第一告警规则且所述第一告警规则关联异常处理指令,将所述异常处理指令发送至所述被监管设备,所述异常处理指令用于进行隐患或故障的自动修复;

6、响应于确定与所述日志解析结果匹配的、未关联异常处理指令的第二告警规则,输出告警提示,且对应同一异常的多个日志信息在一个时间周期内输出一次告警提示。

7、第二方面,本申请实施例提供一种异常设备监测系统,包括:日志收集设备,与所述日志收集设备关联的多个被监管设备,以及,与所述日志收集设备连接的告警设备;

8、所述日志收集设备接收所述被监管设备发送的日志信息,对所述日志信息进行解析,获取日志解析结果,将所述日志解析结果与预设规则集合中的告警规则进行匹配,以对所述被监管设备进行异常监测;

9、响应于确定与所述日志解析结果匹配的第一告警规则且所述第一告警规则关联异常处理指令,所述日志收集设备将所述异常处理指令发送至所述被监管设备,所述异常处理指令用于进行隐患或故障的自动修复;

10、响应于确定与所述日志解析结果匹配的、未关联异常处理指令的第二告警规则,所述日志收集设备向所述告警设备发送告警提示;

11、其中,对应同一异常的多个日志信息,所述日志收集设备在一个时间周期内输出一次告警提示。

12、第三方面,本申请实施例提供一种异常设备监测装置,应用于日志收集设备,所述日志收集设备与多个被监管设备关联,所述装置包括:

13、解析获取模块,用于响应于接收到所述被监管设备发送的日志信息,对所述日志信息进行解析,获取日志解析结果;

14、匹配监测模块,用于将所述日志解析结果与预设规则集合中的告警规则进行匹配,以对所述被监管设备进行异常监测;

15、发送模块,用于响应于确定与所述日志解析结果匹配的第一告警规则且所述第一告警规则关联异常处理指令,将所述异常处理指令发送至所述被监管设备,所述异常处理指令用于进行隐患或故障的自动修复;

16、第一输出模块,用于响应于确定与所述日志解析结果匹配的、未关联异常处理指令的第二告警规则,输出告警提示,且对应同一异常的多个日志信息在一个时间周期内输出一次告警提示。

17、第四方面,本申请实施例提供一种电子设备,包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现第一方面所述的异常设备监测方法。

18、第五方面,本申请实施例提供一种计算机可读存储介质,所述计算机可读存储介质上存储计算机程序,所述计算机程序被处理器执行时实现第一方面所述的异常设备监测方法。

19、本申请实本文档来自技高网...

【技术保护点】

1.一种异常设备监测方法,应用于日志收集设备,其特征在于,所述日志收集设备与多个被监管设备关联,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述日志解析结果包括日志发生时间,所述方法还包括:

3.根据权利要求1所述的方法,其特征在于,还包括:

4.根据权利要求1至3任一项所述的方法,其特征在于,所述日志解析结果包括日志内容、日志级别和日志发送设备对应的设备标识,所述预设规则集合包括对应于公共属性的第一规则子集和对应于私有属性的第二规则子集;

5.根据权利要求1所述的方法,其特征在于,其中,

6.根据权利要求1或5所述的方法,其特征在于,还包括:

7.根据权利要求1所述的方法,其特征在于,在基于所述日志解析结果与告警规则的匹配情况发送所述异常处理指令或者输出告警提示后,还包括:

8.一种异常设备监测系统,其特征在于,包括:日志收集设备,与所述日志收集设备关联的多个被监管设备,以及,与所述日志收集设备连接的告警设备;

9.根据权利要求8所述的系统,其特征在于,还包括:与所述日志收集设备连接的数据库,以及与所述数据库连接的日志数据平台;

10.一种异常设备监测装置,应用于日志收集设备,其特征在于,所述日志收集设备与多个被监管设备关联,所述装置包括:

11.一种电子设备,其特征在于,包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如权利要求1至7任一项所述的异常设备监测方法的步骤。

...

【技术特征摘要】

1.一种异常设备监测方法,应用于日志收集设备,其特征在于,所述日志收集设备与多个被监管设备关联,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述日志解析结果包括日志发生时间,所述方法还包括:

3.根据权利要求1所述的方法,其特征在于,还包括:

4.根据权利要求1至3任一项所述的方法,其特征在于,所述日志解析结果包括日志内容、日志级别和日志发送设备对应的设备标识,所述预设规则集合包括对应于公共属性的第一规则子集和对应于私有属性的第二规则子集;

5.根据权利要求1所述的方法,其特征在于,其中,

6.根据权利要求1或5所述的方法,其特征在于,还包括:

7.根据权利要求1所述的方法,其特征在于,在基于所述日志...

【专利技术属性】
技术研发人员:杨建昆张辉李俊李顺畅刘红伟
申请(专利权)人:中国电信股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1