操作管理方法和操作管理服务器技术

技术编号:2861156 阅读:143 留言:0更新日期:2012-04-11 18:40
可以由软件单元来确定故障位置。收集在被监控的单元中出现的事件信息(步骤ST1)。接着,对收集到的事件信息进行分组以生成事件组(步骤ST2)。而且,在事件组与多个模式定义组之间比较事件信息发生模式,其中,在所述多个模式定义组中定义了在发生故障期间输出的事件信息的发生模式(步骤ST3)。然后,提取故障解决方案信息,其被预先与具有相似的事件信息发生模式的模式定义组关联起来(步骤ST4)。(*该技术在2022年保护过期,可自由使用*)

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及用于对目标设备的操作进行管理的操作管理方法、操作管理服务器以及操作管理程序,还涉及用于存储该操作管理程序的计算机可读的存储介质。更具体来说,本专利技术涉及有效地对受到管理的目标设备进行故障排除的操作管理方法、操作管理服务器以及操作管理程序,还涉及用于存储该操作管理程序的计算机可读的存储介质。
技术介绍
近年来因特网访问环境的流行已导致对提高系统可靠性的努力。一种方法是为系统引入功能冗余。采用冗余设计,系统的某个部分中的故障不会使整个操作崩溃。该系统依然可以利用其它有效的功能来进行操作。一般来讲,以消息的形式把服务器中出现的故障或其它问题事件报告给某些其它设备(例如,操作管理服务器)。在冗余系统中,一个功能中的故障将传播到其它相关功能,由此使得会发送更多错误消息。即,当服务器遇到异常时,该服务器并非一定是唯一生成错误消息的服务器。实际上,其它相关服务器也会发送错误消息。错误消息的多个发送者的存在使得难以定位真正的问题源。通常把该任务委托给精通网络的工程师,他们可以基于他/她的经验来定位出问题。然而,某些缺乏经验的工程师要花费很长时间来恢复系统。对于企业网络,其恢复的延迟将对该公司的商业活动造成极大的影响。因而需要一种不依赖于单个维护工程师的技能就可以从故障中恢复的网络系统。已提出的一种方案是配备一数据库,其存储有每个网络故障的记录以及由此生成的故障通知消息的时间序列。通过与数据库记录进行比较来检查从网络实际发送的消息,可以定位出故障。所提出的设备自动检索故障的位置,由此使得能够快速恢复网络系统。例如,参见特开第2001-257677号公报(图1)。然而,在特开第2001-257677号公报(图1)中公开的设备针对的是网络上的通信故障。它不涉及任何有关如何处理在服务器上运行的应用或其它程序可能遇到的故障。所提出的设备未提供根据从服务器上的应用、中间件或OS(操作系统)产生的错误消息来调查故障源的功能。当服务器故障产生多条消息时,现有技术不能使我们能够查明该服务器故障的真实位置。例如,假定服务器上的应用由于某种原因而终止。除了源应用本身,包括中间件和OS模块的某些其它程序也可能发出错误消息。特别是在多个服务器协同操作的环境中,另一服务器上的某些应用也会产生错误消息。从以上讨论可知,多功能计算机系统上的一个故障可以影响在多个不同服务器上运行的各种应用,从而导致多个错误消息。尽管初始故障源自特定服务器上的特定软件程序,但是不容易仅通过单独考查接收到的消息来找到真实原因并定位出错误。在多任务和/或多线程系统环境中情况更复杂。在这些系统中,在没有明显原因的情况下,内存管理的问题可能导致应用的性能劣化,或者可能使中间件模块崩溃,尽管该应用本身没有任何问题。很难找到这种问题的原因,这是因为问题的实际发源地不在执行得很差的软件程序中,而在某个其它地方。
技术实现思路
鉴于上述情况,本专利技术的目的是提供可以指出成为故障源的软件程序的操作管理方法、操作管理服务器、操作管理程序,以及存储有该程序的计算机可读的存储介质。为实现上述目的,本专利技术提供了一种图1所示的操作管理方法。将该方法设计成按以下方式执行操作管理任务。首先,从多个监控目标对象收集事件信息(步骤ST1),其中,所述多个监控目标对象是在服务器上执行的多个功能。然后通过对收集到的多条事件信息进行分组来生成事件组(步骤ST2)。按事件信息的发生模式对该事件组与多个模式定义组进行比较(步骤ST3),其中,每个模式定义组定义了在发生特定故障时从多个监控目标对象输出的事件信息的发生模式。随后,提取故障对策信息,该故障对策信息被预先与按事件信息的发生模式类似于所述事件组的模式定义组关联起来,并且该故障对策信息指示成为故障原因的监控目标对象(步骤ST4)。根据上述操作管理方法,把由多个监控目标对象产生的事件信息收集起来并组合成事件组。然后对该事件组与多个模式定义组进行比较。当找到按时间信息的发生模式与该事件组相似的模式定义组时,提取被预先与找到的模式定义组关联起来的故障对策信息。该故障对策信息指示成为故障原因的监控目标对象。此外,为实现上述目的,提供了一种用于管理服务器的操作管理方法。该方法包括以下步骤收集输入到服务器的命令;通过对收集到的多个所述命令进行分组,来生成操作历史记录信息;按所述命令的输入模式,对多个操作模式信息与所述操作历史记录信息进行比较,所述操作模式信息定义成为故障发生原因的命令输入模式;以及提取故障对策信息,该故障对策信息已被预先与按所述命令的输入模式类似于所述操作历史记录信息的所述操作模式信息关联起来,并且该故障对策信息表示成为故障原因的所述监控目标对象。根据上述操作管理方法,把输入到服务器的命令收集起来并组合成操作历史记录信息。然后对操作模式信息与该操作历史记录信息进行比较。当找到按命令的输入模式与该操作历史记录信息相似的特定操作模式信息时,提取已被预先与该操作模式信息关联起来的故障对策信息,该故障对策信息表示成为故障原因的监控目标对象。根据结合附图的以下详细说明,本专利技术的上述和其他目的、特征以及优点将变得显见,这些附图通过示例例示了本专利技术的多个优选实施例。附图说明图1是本专利技术的概念图。图2示出使用故障信息回归型解决方法的示例。图3示出消息标准化过程。图4示出配置管理数据的示例结构。图5示出事件信息分组过程的概念。图6示意性地示出比较过程。图7示出事件组匹配和对策信息输出的示例。图8示出比较结果排序过程。图9是示出由比较部执行的过程的流程图。图10示出设有故障检测功能的示例系统配置。图11示出在本专利技术一实施例中使用的操作管理服务器的示例硬件配置。图12是示出操作管理服务器的内部结构的框图。图13示出硬件配置数据的示例数据结构。图14示出软件配置数据的示例数据结构。图15示出网络配置数据的示例数据结构。图16示出系统配置数据的示例数据结构。图17是消息分组过程的流程图。图18示出事件分组的示例过程。图19示出事件组日志的示例数据结构。图20示出客户数据库的示例数据结构。图21示出事件模式数据库的示例数据结构。图22示出当日事件日志的示例数据结构。图23示出当日事件组日志的示例数据结构。图24是模式匹配过程的流程图。图25是示出预处理的详情的流程图。图26是示出重复事件过滤过程的流程图。图27是事件模式提取过程的流程图。图28示出临时事件模式数据库的示例数据结构。图29是组合匹配过程的流程图。图30是信息输出过程的流程图。图31是以往事件检查过程的流程图。图32是后处理顺序的流程图。图33示出信息的流动。图34示出事件组检索屏面的示例。图35示出事件选择屏面的示例。图36示出分析结果屏面的示例。图37示出历史记录表的示例数据结构。图38示出操作模式数据库的示例数据结构。具体实施例方式下面参照附图对本专利技术的优选实施例进行描述。以下说明从对本专利技术的概述开始,然后进行到本专利技术的更具体的实施例。图1是本专利技术的概念图。在图1中,操作管理服务器1执行根据本专利技术的操作管理方法。该操作管理服务器1连接到多个服务器2到4。在服务器2上运行的软件程序包括应用程序2a、中间件程序2b以及OS程序2c,这些软件程序都属于操作管理服务器1监控的处理对象。在其它服务器3和本文档来自技高网
...

【技术保护点】
一种用于管理服务器的操作管理方法,包括以下步骤:从多个监控目标对象收集事件信息,该多个监控目标对象是在所述服务器上执行的多个功能;通过对收集到的多条所述事件信息进行分组来生成事件组;按所述事件信息的发生模式对多个模式定义组与所述事件组进行比较,所述模式定义组定义在故障发生时从多个所述监控目标对象输出的事件信息的发生模式;以及提取故障对策信息,该故障对策信息已被预先与按所述事件信息的发生模式类似于所述事件组的所述模式定义组关联起来,该故障对策信息表示成为故障原因的所述监控目标对象。

【技术特征摘要】
【国外来华专利技术】1.一种用于管理服务器的操作管理方法,包括以下步骤从多个监控目标对象收集事件信息,该多个监控目标对象是在所述服务器上执行的多个功能;通过对收集到的多条所述事件信息进行分组来生成事件组;按所述事件信息的发生模式对多个模式定义组与所述事件组进行比较,所述模式定义组定义在故障发生时从多个所述监控目标对象输出的事件信息的发生模式;以及提取故障对策信息,该故障对策信息已被预先与按所述事件信息的发生模式类似于所述事件组的所述模式定义组关联起来,该故障对策信息表示成为故障原因的所述监控目标对象。2.如权利要求1所述的操作管理方法,其特征在于,所述事件信息是从多个服务器收集的。3.如权利要求1所述的操作管理方法,其特征在于,在收集所述事件信息时,把每个所述监控目标对象的数据格式转换为统一的数据格式。4.如权利要求1所述的操作管理方法,其特征在于,在生成所述事件组时,通过参照定义多个所述监控目标对象之间的关联性的数据库,对从存在关联性的所述监控目标对象输出的所述事件信息进行分组。5.如权利要求1所述的操作管理方法,其特征在于,在生成所述事件组时,对在预定时段内收集的所述事件信息进行分组。6.如权利要求1所述的操作管理方法,其特征在于,在对所述事件信息的发生模式进行比较时,找到共同的所述事件信息。7.如权利要求1所述的操作管理方法,其特征在于,在提取多个所述故障对策信息时,根据所述模式定义组相对于所述事件组在所述事件信息的发生模式方面的共同度,对多个故障对策信息进行排序。8.如权利要求7所述的操作管理方法,其特征在于,如果所述模式定义组与所述事件组具有共同的所述事件信息越多,则将所述模式定义组判断为具有越高的共同度。9.如权利要求7所述的操作管理方法,其特征在于,在所述事件组或所述模式定义组包含的所述事件信息中,如果只属于其中一方的所述事件信息越少,则将所述模式定义组判断为具有越高的共同度。10.如权利要求1所述的操作管理方法,其特征在于,所述故障对策信息包括故障发生原因和解决故障的对策信息。11.一种用于管理服务器的操作管理方法,其特征在于包括以下步骤收集输入到所述服务器的命令;通过对收集到的多个所述命令进行分组,来生成操作历史记录信息;按所述命令的输入模式,对多个操作模式信息与所述操作历史记录信息进行比较,所述操作模式信息定义成为故障发生原因的命令输入模式;以及提取故障对策信息,该故障对策信息已被预先与按所述命令的输入模式类似于所述操作历史记录信息的所述操作模式信息关联起来,该故障对策信息表示成为故障原因的所述监控目标对象。12.一种用于管理服务器的操作管理设备,其特征在于包括收集装置,用于收集多个监控目标对象处发生的事件信息,该多个监控目标对象是在所述服务器上执行的多个功能;生成装置,用于通过对收集到的多条所述事件信息进行分组来生成事件组;比较装置,用于按所述事件信息的发生模式对多个模式定义组与所述事件组进行比较,所述模式定义组定义在故障发生时从多个所述监控目标对象输出的事件信息的发生模式;以及提取装置,用于提取故障对策信息,该故障对策信息已被预先与按所述事件信息的发生...

【专利技术属性】
技术研发人员:高桥大作吉位裕贵子加来义朗小野仁铃木洋河嶋千晶
申请(专利权)人:富士通株式会社
类型:发明
国别省市:JP[日本]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利