存储系统监控及故障收集方法、装置、终端及存储介质制造方法及图纸

技术编号:34566965 阅读:14 留言:0更新日期:2022-08-17 12:57
本发明专利技术涉及存储系统监控领域,具体公开一种存储系统监控及故障收集方法、装置、终端及存储介质,搭建监控服务器,使监控服务器与存储系统通信;登录存储系统,周期性访问存储系统,查询存储系统状态;当存储系统状态异常时,触发dump文件收集;根据收集的dump文件中数据进行存储系统故障原因分析及故障原因定位。本发明专利技术搭建监控服务器,在故障时及时收集dump信息或者OSES信息,所收集信息中包含故障信息,从而进行故障信息分析和定位,避免故障问题无法复现或复现困难的窘境。法复现或复现困难的窘境。法复现或复现困难的窘境。

【技术实现步骤摘要】
存储系统监控及故障收集方法、装置、终端及存储介质


[0001]本专利技术涉及存储系统监控领域,具体涉及一种存储系统监控及故障收集方法、装置、终端及存储介质。

技术介绍

[0002]在测试过程中,测试人员无法一直盯着存储系统运行,或者有些需要长时间进行的故障注入或反复测试,需要通过脚本进行这些调度,所以不能频繁的去查看存储系统状态,而存储系统的日志会随着时间增长,可能日志会被覆盖,当发现异常的时候无法查看问题发生时的日志。有些故障的发生具有概率性,不能每次都可以复现,所以有些故障一旦错过了当时的信息,再次复现需要花费大量的人力成本和时间成本。

技术实现思路

[0003]为解决上述问题,本专利技术提供一种存储系统监控及故障收集方法、装置、终端及存储介质,实现在故障发生后,收集所需要的所有信息,进行故障分析及定位。
[0004]第一方面,本专利技术的技术方案提供一种存储系统监控及故障收集方法,包括以下步骤:搭建监控服务器,使监控服务器与存储系统通信;登录存储系统,周期性访问存储系统,查询存储系统状态;当存储系统状态异常时,触发dump文件收集;根据收集的dump文件中数据进行存储系统故障原因分析及故障原因定位。
[0005]进一步地,监控服务器通过串口连接到存储系统的每个控制器;该方法还包括以下步骤:若无法登录存储系统,则每间隔预设时间进行一次登录尝试;若尝试登录预设次数后,仍无法登录存储系统,则进入每个控制器的机箱管理服务;在机箱管理服务下,通过指令查询指定信息进行记录;根据记录的指定信息进行存储系统故障原因分析及故障原因定位。
[0006]进一步地,正常登陆存储系统时,访问存储系统的周期与存储系统的故障注入周期相同。
[0007]进一步地,查询的存储系统状态包括集群状态、告警事件;存储系统状态异常包括集群状态与预期不符或者产生了非预期的告警事件。
[0008]第二方面,本专利技术的技术方案提供一种存储系统监控及故障收集装置,其特征在于,搭建监控服务器,使监控服务器与存储系统通信;该装置包括,登录模块:登录存储系统;状态查询模块:周期性访问存储系统,查询存储系统状态;
文件收集触发模块:当存储系统状态异常时,触发dump文件收集;第一故障分析定位模块:根据收集的dump文件中数据进行存储系统故障原因分析及故障原因定位。
[0009]进一步地,监控服务器通过串口连接到存储系统的每个控制器;登录模块若无法登录存储系统,则每间隔预设时间进行一次登录尝试;该装置还包括,机箱管理服务进入模块:若尝试登录预设次数后,仍无法登录存储系统,则进入每个控制器的机箱管理服务;指定信息查询记录模块:在机箱管理服务下,通过指令查询指定信息进行记录;第二故障分析定位模块:根据记录的指定信息进行存储系统故障原因分析及故障原因定位。
[0010]进一步地,状态查询模块访问存储系统的周期与存储系统的故障注入周期相同。
[0011]进一步地,故障查询模块查询的存储系统状态包括集群状态、告警事件;存储系统状态异常包括集群状态与预期不符或者产生了非预期的告警事件。
[0012]第三方面,本专利技术的技术方案提供一种终端,包括:存储器,用于存储存储存储系统监控及故障收集程序;处理器,用于执行所述存储存储系统监控及故障收集程序时实现如上述任一项所述存储存储系统监控及故障收集方法的步骤。
[0013]第四方面,本专利技术的技术方案提供一种计算机可读存储介质,所述可读存储介质上存储有存储存储系统监控及故障收集程序,所述存储存储系统监控及故障收集程序被处理器执行时实现如上述任一项所述存储存储系统监控及故障收集方法的步骤。
[0014]本专利技术提供的一种存储存储系统监控及故障收集方法、装置、终端及存储介质,相对于现有技术,具有以下有益效果:搭建监控服务器,在故障时及时收集dump信息或者OSES信息,所收集信息中包含故障信息,从而进行故障信息分析和定位,避免故障问题无法复现或复现困难的窘境。
附图说明
[0015]为了更清楚的说明本申请实施例或现有技术的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0016]图1是本专利技术实施例提供的一种存储系统监控及故障收集方法流程示意图。
[0017]图2是本专利技术实施例提供的一种存储系统监控及故障收集装置结构示意框图。
[0018]图3为本专利技术实施例提供的一种终端的结构示意图。
具体实施方式
[0019]以下对本专利技术涉及的英文术语进行解释。
[0020]Dump:Dump文件是进程的内存镜像,可以把程序的执行状态通过调试器保存到dump文件中。
[0021]OSES:是Organic SAS Enclosure Service的简称,中文全称为统一SAS机箱服务,OSES作为存储设备的整机箱管理模块,具有强大的功能,既可以实时监测设备的运行状态,也可以实现与存储各系统模块之间的交互与管理;SAS,是Serial Attached SCSI的简称,中文全称为串口连接接口。
[0022]LDBE:是一个能够查看dump信息的工具。
[0023]为了使本
的人员更好地理解本申请方案,下面结合附图和具体实施方式对本申请作进一步的详细说明。显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
[0024]本专利技术的核心是针对存储系统日志可能会覆盖,导致故障信息无法获取的问题,创建监控服务器,对存储系统进行状态监控,在存储系统故障时,主动收集dump文件或通过OSES记录相关信息,从而进行故障分析及定位,避免日志被覆盖而无法分析故障。
[0025]图1是本专利技术实施例提供的一种存储系统监控及故障收集方法流程示意图,如图1所示,该方法包括以下步骤。
[0026]S101,搭建监控服务器,使监控服务器与存储系统通信。
[0027]预先搭建监控服务器,用来进行存储系统的监控以及指令的下发。可以理解的是,监控服务器与存储系统通信,既实现监控服务器对存储系统的监控,又实现监控服务器从存储系统进行数据收集。
[0028]所搭建的监控服务器可以是Linux服务器。
[0029]S102,登录存储系统,周期性访问存储系统,查询存储系统状态。
[0030]监控服务器首先登录存储系统,可以配置监控服务器到存储系统的免密登录,当然,也根据具体情况和用户需求设置密码登录,具体登录方式的选择不影响本申请实施例的实现。
[0031]监控服务器周期性访问存储系统,每隔一定时间访问一次存储系统,查询存储系统状态,判断存储系统是否出现异常。
[0032]S103,当存储系统本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种存储系统监控及故障收集方法,其特征在于,包括以下步骤:搭建监控服务器,使监控服务器与存储系统通信;登录存储系统,周期性访问存储系统,查询存储系统状态;当存储系统状态异常时,触发dump文件收集;根据收集的dump文件中数据进行存储系统故障原因分析及故障原因定位。2.根据权利要求1所述的存储系统监控及故障收集方法,其特征在于,监控服务器通过串口连接到存储系统的每个控制器;该方法还包括以下步骤:若无法登录存储系统,则每间隔预设时间进行一次登录尝试;若尝试登录预设次数后,仍无法登录存储系统,则进入每个控制器的机箱管理服务;在机箱管理服务下,通过指令查询指定信息进行记录;根据记录的指定信息进行存储系统故障原因分析及故障原因定位。3.根据权利要求2所述的存储系统监控及故障收集方法,其特征在于,正常登陆存储系统时,访问存储系统的周期与存储系统的故障注入周期相同。4.根据权利要求3所述的存储系统监控及故障收集方法,其特征在于,查询的存储系统状态包括集群状态、告警事件;存储系统状态异常包括集群状态与预期不符或者产生了非预期的告警事件。5.一种存储系统监控及故障收集装置,其特征在于,搭建监控服务器,使监控服务器与存储系统通信;该装置包括,登录模块:登录存储系统;状态查询模块:周期性访问存储系统,查询存储系统状态;文件收集触发模块:当存储系统状态异常时,触发dump文件收集;第一故障分析定位模块:根据收集的dump文件中数据进行存储系...

【专利技术属性】
技术研发人员:王福军
申请(专利权)人:苏州浪潮智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1