一种Linux平台组件统一监控的方法技术

技术编号:15566847 阅读:70 留言:0更新日期:2017-06-10 01:08
本发明专利技术提供一种Linux平台组件统一监控的方法,属于生产环境监控技术领域,本发明专利技术监控服务启动成功后,会读取指定目录中的配置文件,根据组件配置的健康探测类型和方法,监控进程实时调用确认组件运行状态,并对失败的状态进行记录,如果达到特定次数,则系统认为该组件无法正常提供服务,将按照配置的脚本进行服务重启。确保组件健康,保证系统的稳定运行。

Method for unified monitoring of Linux platform components

The invention provides a method for Linux platform component unified monitoring, belonging to the production field of environmental monitoring technology, the monitoring service started successfully, reads the specified directory in the configuration file, according to the health detection type and method of component configuration, monitoring the process of real-time components with a confirmation operation state, and the failure of the state record if you reach a certain number, the system assumes that the components do not normally provide services, will be in accordance with the configuration script to restart the service. Ensure the health of components and ensure the stable operation of the system.

【技术实现步骤摘要】

本专利技术涉及生产环境监控技术,尤其涉及一种Linux平台组件统一监控的方法
技术介绍
随着信息化水平的发展,各类系统层出不穷,伴随着消费者复杂多变的需求,产品部署所需的技术组件也日益增多,如何保证生产环境产品的安全、稳定运行也逐步成为企业关注的重点。
技术实现思路
面对各类层出不穷的软件产品,为了保障产品的安全、稳定运行,本专利技术提出了一种Linux平台组件统一监控的方法,定义统一的健康检查规范,对于系统运行所需的核心组件,可以按照规范,自定义针对组件的yaml格式配置,无论是单机还是集群组件,均可对运行状况进行监控,保证系统的健康运行。本专利技术的目的是对Linux平台下组件健康状态进行实时统一监控管理,保证产品的稳定运行。本专利技术的技术方案是:一种Linux平台组件统一监控的方法,监控服务启动成功后,会读取指定目录中的配置文件,根据组件配置的健康探测类型和方法,监控进程实时调用确认组件运行状态,并对失败的状态进行记录,如果达到特定次数,则系统认为该组件无法正常提供服务,将按照配置的脚本进行服务重启。健康监控服务启动时可以指定监控配置的路径,监控服务会遍历该路径下的所有yaml配置文件。配置文件模板如下:针对每个组件,监控服务会首先对按照detect配置其进行探测,检测进程pid文件是否存在,除了pid方式外,监控服务支持file方式,指定组件探测文件,服务会自动进行调用,并按照返回值来判定执行结果以及组件的可用状态,对于监测失败的组件,服务会自动对失败次数进行计数,若失败次数到达detect定义的retry数,则对该服务进行重启。配置中start、stop、restart分别对应组件的启动、停止、重启命令,type支持standard和file方式,standard标识该服务为系统标准的服务,运行标准服务的启停命令来进行操作;针对非标准的服务,定义为file的方式,定义自己的操作脚本。本专利技术的有益效果是对Linux平台组件的运行状况进行有效的监测,有效保障了系统运行的稳定性。附图说明图1是健康监测示意图。具体实施方式下面对本专利技术的内容进行更加详细的阐述:健康监控服务启动时可以指定监控配置的路径,监控服务会遍历该路径下的所有yaml配置文件,配置文件模板如下:针对每个组件,监控服务会首先对按照detect配置其进行探测,最常见的方式为检测进程pid文件是否存在,除了pid方式外,监控服务支持file方式,指定组件探测文件,服务会自动进行调用,并按照返回值来判定执行结果以及组件的可用状态,对于监测失败的组件,服务会自动对失败次数进行计数,若失败次数到达detect定义的retry数,则对该服务进行重启。配置中start、stop、restart分别对应组件的启动、停止、重启命令,type支持standard和file方式,standard标识该服务为系统标准的服务,运行标准服务的启停命令来进行操作,比如sshd服务在CentOS7下对应为:systemctlstartsshd.service针对非标准的服务,比如Tomcat,可以定义为file的方式,定义自己的操作脚本。cluster配置该组件是单节点还是集群部署,若为单节点则直接按照detect等配置进行操作,对于集群部署的组件,若没有管理节点,则启停或检测会涉及多个节点,需要配置节点ip地址以及各节点操作顺序,当然也可以指定文件,各节点的操作均在文件中指定。此外,不同组件之间可能存在功能依赖,比如NFS组件依赖于rpcbind组件,则可以在NFS的配置中配置dependency,多个组件按照依赖顺序检测。另外,为了满足个性化的需求,也可针对特定服务进行相应的拓展,定义相应的名单。本专利技术是一种对Linux平台下组件健康状态进行实时统一监控管理的方法,基于该方法,对于安装在系统中的组件,只需要按照支持的选项对组件进行配置,并统一放到特定路径下,即可将组件纳入统一健康监控管理。本文档来自技高网...
一种Linux平台组件统一监控的方法

【技术保护点】
一种Linux平台组件统一监控的方法,其特征在于,监控服务启动成功后,会读取指定目录中的配置文件,根据组件配置的健康探测类型和方法,监控进程实时调用确认组件运行状态,并对失败的状态进行记录,如果达到特定次数,则系统认为该组件无法正常提供服务,将按照配置的脚本进行服务重启。

【技术特征摘要】
1.一种Linux平台组件统一监控的方法,其特征在于,监控服务启动成功后,会读取指定目录中的配置文件,根据组件配置的健康探测类型和方法,监控进程实时调用确认组件运行状态,并对失败的状态进行记录,如果达到特定次数,则系统认为该组件无法正常提供服务,将按照配置的脚本进行服务重启。2.根据权利要求1所述的方法,其特征在于,健康监控服务启动时可以指定监控配置的路径,监控服务会遍历该路径下的所有yaml配置文件。3.根据权利要求2所述的方法,其特征在于,配置文件模板如下4.根据权利要求3所述的方法,其特征在于,针对每个组件,监控服务会首先对按照detect配置其进行探测,检...

【专利技术属性】
技术研发人员:李永信
申请(专利权)人:郑州云海信息技术有限公司
类型:发明
国别省市:河南;41

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1