本发明专利技术提供了一种软件监控装置和方法。本发明专利技术的软件监控装置包括代理服务器,主管理服务器,自动维护管理服务器,智能部署管理系统。本发明专利技术的装置和方法通过开放性的监控协议,实现对被监控对象的自动化配置发现,实现代理服务器的自动化批量安装和监控指标的自动化部署技术,实现对多台服务器的自动化监控部署,提升监控管理效率。本发明专利技术通过基于不同服务水平的主管理服务器,提升软件监控系统的智能化和自动化水平。本发明专利技术还通过多监控消息队列、多监控管理服务等软件结构设计,实现监控软件的线性扩展能力及监控系统的高可用性。
【技术实现步骤摘要】
【专利摘要】本专利技术提供了一种软件监控装置和方法。本专利技术的软件监控装置包括代理服务器,主管理服务器,自动维护管理服务器,智能部署管理系统。本专利技术的装置和方法通过开放性的监控协议,实现对被监控对象的自动化配置发现,实现代理服务器的自动化批量安装和监控指标的自动化部署技术,实现对多台服务器的自动化监控部署,提升监控管理效率。本专利技术通过基于不同服务水平的主管理服务器,提升软件监控系统的智能化和自动化水平。本专利技术还通过多监控消息队列、多监控管理服务等软件结构设计,实现监控软件的线性扩展能力及监控系统的高可用性。【专利说明】
本专利技术涉及软件监控
,尤其涉及一种。
技术介绍
软件平台范围包括操作系统及运行在之上的数据库、中间件及应用程序等。由于软件平台种类繁多,而且其运行的健康状况直接影响信息系统进行服务的能力,因此有必要对其健康情况进行有效监控。对于大型的数据中心而言,由于管理的软件平台数量多,更需要一个智能化的监控系统对软件平台进行自动化、快速的监控部署和管理。目前IBM的ITM、HP Openview, BMC Patrol等产品实现了对操作系统、数据库、中间件等软件平台的监控。但均存在如下问题:监控协议相对封闭。以上商业产品均需在被监控软件平台所在的服务器上部署Agent。对于相关软件平台的监控指标,需要按照该商业产品提供的接口进行相关监控逻辑的开发,这就使新增监控逻辑的开发受限于相关商业产品提供的专有的开发语言。监控部署和管理的自动化和智能化程度不足。相关产品进行Agent安装及监控指标部署时,需要较多的手工安装及配置操作。不能提供基于服务水平(SLA)的监控模板化部署。不能实现按照被监控软件平台重要程度和服务水平的不同进行智能化监控模板选择和部署。不能提供软件监控管理平台线性的扩展能力。由于软件监控平台监控的软件平台数量的增长,会遇到性能瓶颈。上述产品的架构设计不能提供快速添加监控服务器从而实现监控能力线性增长的功能。
技术实现思路
有鉴于此,本专利技术提供了一种,能够减少了监控系统监控指标逻辑开发以及监控系统容量扩展的难度,提升了监控管理的智能化和自动化程度,大大提升了运维效率。本专利技术提供的软件监控装置,包括代理服务器,主管理服务器,自动维护管理服务器,智能部署管理系统,其中,所述代理服务器,使用开放性的监控协议,采用任意编程语言在监控机器上运行调度监控脚本,并将运行得到的性能数据与报警信息传送给主管理服务器;所述主管理服务器,通过多监控消息队列及多监控管理服务实现监控软件的线性扩展及监控系统的高可用性;通过检查中心数据库中的作业状态,来保证代理服务器上作业的状态与中心数据库中的作业状态一致;以及向代理服务器派发脚本作业;并把代理服务器发送来的报警事件与性能数据存入中心数据库;所述自动维护管理服务器,用于对代理服务器和主管理服务器进行安装、更新及维护管理;所述智能部署管理系统,用于实现监控脚本与监控机器及软件的智能匹配和部署,提供基于服务水平的自动化和差异部署管理。所述代理服务器包括:第一系统服务注册、管理模块:用于将代理服务器程序注册成监控机器的系统服务程序;当操作系统重启时,自动启动代理服务器程序;当代理服务器程序运行异常时,自动重启代理服务器程序;第一环境检查模块:用于在代理服务器程序启动时,对启动需要的资源进行检查,当检查到所需资源全部到位后,再启动代理服务器程序;第一通信模块:用于与主管理服务器进行实时双向的数据传递;第一数据协议模块:用于提供与主管理服务器进行通信所需的自定义数据协议;作业调度引擎:用于调度监控作业;作业执行引擎:用于为监控作业提供执行环境;数据缓存模块:用于缓存监控作业采集到的性能数据与报警信息,并当发送窗口到来时,将所述监控作业采集到的性能数据与报警信息集中发送给主管理服务器;数据补偿模块:用于在代理服务器程序启动时检查数据缓存模块中是否存在未发送的数据,如果存在,则进行数据补偿;自动升级模块:用于根据主管理服务器的远程命令,升级监控作业、启停代理服务器、启停监控作业。所述主管理服务器包括:第二系统服务注册、管理模块:用于将主管理服务器程序注册成的系统服务程序;第二环境检查模块:用于在主管理服务器启动时对主管理服务器启动需要的资源进行检查,当所需资源全部到位后,再启动主管理服务器程序;第二通信模块:用于与代理服务器进行实时双向的数据传递;第二数据库模块:用于接收并存储用户的作业指令,并与中心数据库进行数据交互;数据收集模块:用于收集代理服务器上报的各种数据,包括事件数据、性能数据、心跳数据;第二作业模块:用于调度并执行主管理服务器的内部作业;第二数据协议模块:用于提供与代理服务器进行通信所需的自定义数据协议。所述自动维护管理服务器包括:SSH交互模块:用于通过SSH协议自动维护主管理服务器与Agent之间的交互;安装介质库模块:用于通过树型的管理方式,把安装介质及更新介质进行分类存放,并支持快速查找、传输;安装服务模块:用于通过调用SSH交互模块和安装介质库模块将代理服务器和/或主管理服务器安装到相应的服务器硬件上;更新服务模块:用于通过调用SSH交互模块和安装介质库模块对代理服务器和/或主管理服务器进行更新;第三系统服务注册、管理模块:用于将自动维护管理服务器程序注册成的系统服务程序;第三环境检查模块:用于在自动维护管理服务器启动时对自动维护管理服务器启动需要的资源进行检查,当所需资源全部到位后,再启动自动维护管理服务器;第三数据库模块:用于接收并存储用户的作业指令,并与中心数据库进行数据交互;第三作业模块:用于调度并执行自动维护管理服务器的内部作业。所述智能部署管理系统包括:对象管理模块:用于采用树状分层结构对监控机器以及在所述监控机器上部署的软件产品进行管理,所有管理目标在数据库中以对象形式存在;脚本管理模块,用于管理各种脚本,包括脚本添加、脚本删除、脚本修改、脚本分组;部署管理模块,用于实现脚本与对象的智能匹配和自动化搜索定位以及对象功能的部署;事件管理模块,用于存储监控作业生成的事件,并对事件进行显示、标记已知以及删除;作业管理模块,用于管理监控作业,并对监控作业进行显示、停止以及启动;性能数据管理模块,用于管理监控作业生成的性能数据,并进行图形展示;一键式自动发现部署模块,包括第一子模块和第二子模块,其中,第一子模块用于设置每一种对象类型在不同服务级别需要部署的脚本组;第二子模块用于根据机器类型和服务级别自动搜索监控机器需要部署的脚本组,并将脚本组自动部署到所述监控机器对象及其子对象节点上。所述对象管理模块通过发现脚本自动生成对象的树状分层结构。所述脚本管理模块通过脚本添加将脚本文件导入数据库并记录管理;通过脚本修改对脚本的所有信息进行修改,其中,脚本信息包括脚本类型、脚本参数、脚本执行内容、默认调度参数;通过脚本分组建立脚本组,向脚本组中添加脚本;并在首次添加脚本时选择脚本组的公共参数;在再次添加脚本时设置脚本的公共参数值;以及根据需要,修改脚本组中每个脚本的参数;删除脚本组中的脚本。部署管理模块通过拖拽的形式将脚本部署到对象上,包括:将脚本指定到预部署对象上,将脚本类型跟对象以及所述对象的子对象的所有类型进行比较,如果有匹配则本文档来自技高网...
【技术保护点】
一种软件监控装置,其特征在于,所述装置包括代理服务器,主管理服务器,自动维护管理服务器,智能部署管理系统,其中,所述代理服务器,使用开放性的监控协议,采用任意编程语言在监控机器上运行调度监控脚本,并将运行得到的性能数据与报警信息传送给主管理服务器;所述主管理服务器,通过多监控消息队列及多监控管理服务实现监控软件的线性扩展及监控系统的高可用性;通过检查中心数据库中的作业状态,来保证代理服务器上作业的状态与中心数据库中的作业状态一致;以及向代理服务器派发脚本作业;并把代理服务器发送来的报警事件与性能数据存入中心数据库;所述自动维护管理服务器,用于对代理服务器和主管理服务器进行安装、更新及维护管理;所述智能部署管理系统,用于实现监控脚本与监控机器及软件的智能匹配和部署,提供基于服务水平的自动化和差异部署管理。
【技术特征摘要】
【专利技术属性】
技术研发人员:王跃,张延彬,邓嵬,李雪,王鑫,
申请(专利权)人:中国民航信息网络股份有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。