本发明专利技术公开了一种服务器故障定位方法,包括:BMC接收BIOS发送的故障信息,并记录至诊断日志文件;接收运维系统下发的获取指令;将所述诊断日志文件通过SFTP协议上传至运维系统,以使所述运维系统通过所述诊断日志文件对服务器进行故障定位。可见,在本方案中,通过BMC将BIOS发送的故障信息记录在诊断日志文件中,可实现对故障信息的全面收集;通过SFTP协议上传至运维系统,从而使运维系统实现了对服务器的批量管理,并且,通过诊断日志文件可快速定位至故障原因,节省了时间成本和人力成本;本发明专利技术还公开了一种服务器故障定位装置、设备及计算机可读存储介质,同样能实现上述技术效果。
【技术实现步骤摘要】
服务器故障定位方法、装置、设备及计算机可读存储介质
本专利技术涉及服务器故障定位
,更具体地说,涉及一种服务器故障定位方法、装置、设备及计算机可读存储介质。
技术介绍
目前,服务器BIOS的故障信息一般都是通过发送SEL的形式记录到SEL日志中。这种记录方式收集信息不全面、且不支持上传到远程服务器,当遇到服务器发生故障时,按照传统的方式定位问题,即先复现问题,然后在版本中增加调试信息,一步一步跟踪定位的方式,对大批量服务器而言,时间成本和人力成本较大。因此,如何全面的收集故障信息,实现对服务器故障的精准定位是本领域技术人员需要解决的问题。
技术实现思路
本专利技术的目的在于提供一种服务器故障定位方法、装置、设备及计算机可读存储介质,以实现全面的收集故障信息,实现对服务器故障的精准定位。为实现上述目的,本专利技术实施例提供了如下技术方案:一种服务器故障定位方法,包括:BMC接收BIOS发送的故障信息,并记录至诊断日志文件;接收运维系统下发的获取指令;将所述诊断日志文件通过SFTP协议上传至运维系统,以使所述运维系统通过所述诊断日志文件对服务器进行故障定位。其中,所述BMC接收BIOS发送的故障信息,包括:所述BMC接收BIOS发送的硬件运行信息。其中,所述接收运维系统下发的获取指令,包括:接收运维系统下发的获取诊断日志文件的IPMI命令。其中,本方案还包括:BMC将操作系统的下电事件、上电事件、重启事件记录到诊断日志文件中;并在记录上电事件和重启事件时,将BMC内预置的CPU、内存丝印信息记录到诊断日志文件中。一种服务器故障定位装置,包括:第一记录模块,用于接收BIOS发送的故障信息,并记录至诊断日志文件;指令接收模块,用于接收运维系统下发的获取指令;诊断日志文件上传模块,用于将所述诊断日志文件通过SFTP协议上传至运维系统,以使所述运维系统通过所述诊断日志文件对服务器进行故障定位。其中,所述故障信息记录模块,具体用于接收BIOS发送的硬件运行信息,并记录至诊断日志文件。其中,所述指令接收模块,具体用于接收运维系统下发的获取诊断日志文件的IPMI命令。其中,本方案还包括:第二记录模块,用于将操作系统的下电事件、上电事件、重启事件记录到诊断日志文件中;并在记录上电事件和重启事件时,将BMC内预置的CPU、内存丝印信息记录到诊断日志文件中。一种服务器故障定位设备,包括:存储器,用于存储计算机程序;处理器,用于执行所述计算机程序时实现如上述服务器故障定位方法的步骤。一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上述服务器故障定位方法的步骤。通过以上方案可知,本专利技术实施例提供的一种服务器故障定位方法,包括:BMC接收BIOS发送的故障信息,并记录至诊断日志文件;接收运维系统下发的获取指令;将所述诊断日志文件通过SFTP协议上传至运维系统,以使所述运维系统通过所述诊断日志文件对服务器进行故障定位。可见,在本方案中,通过BMC将BIOS发送的故障信息记录在诊断日志文件中,可实现对故障信息的全面收集;通过SFTP协议上传至运维系统,从而使运维系统实现了对服务器的批量管理,并且,通过诊断日志文件可快速定位至故障原因,节省了时间成本和人力成本;本专利技术还公开了一种服务器故障定位装置、设备及计算机可读存储介质,同样能实现上述技术效果。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术实施例公开的一种服务器故障定位方法流程示意图;图2为本专利技术实施例公开的一种服务器故障定位装置结构示意图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。本专利技术实施例公开了一种服务器故障定位方法、装置、设备及计算机可读存储介质,以实现全面的收集故障信息,实现对服务器故障的精准定位。参见图1,本专利技术实施例提供的一种服务器故障定位方法,包括:S101、BMC接收BIOS发送的故障信息,并记录至诊断日志文件;具体的,BMC(BaseboardManagementController,简称BMC)为基板管理控制器,是服务器特有的管理控制器;在本实施例中,通过BMC自动监控服务器运行状态,并把BIOS发送的故障信息记录在诊断日志中。通过BMC收集故障诊断日志的功能,帮助用户和运维人员查看BMC的运行状态,排查的故障原因。其中,所述BMC接收BIOS发送的故障信息,包括:所述BMC接收BIOS发送的硬件运行信息。具体来说,BIOS发送的硬件运行信息,可以是在BIOS启动时,将MMIO等硬件运行信息,或者诊断过程中需要用到的信息发送至BMC,通过BMC一一记录到文诊断日志文件中。该硬件运行信息还包括CPU、内存、PCIe的运行状态信息等,在此并不具体限定。需要说明的是,如果操作系统OS运行过程中发生硬件故障,触发了SMI中断,BIOS的SMI处理会上报Start收集消息给BMC,BMC记录精准日志,紧跟着Start消息,BIOS的SMI中断处理程序会继续上报硬件故障相关的寄存器消息,BMC一一接收并记录到诊断日志文件中;当硬件寄存器收集完毕,BIOS的SMI中断处理程序会上报End消息给BMC,以使BMC精准记录日志。需要说明的是,本实施例中的BMC除了收集BIOS发送的故障信息之外,还可记录一些故障事件,具体包括:BMC将操作系统的下电事件、上电事件、重启事件记录到诊断日志文件中;并在记录上电事件和重启事件时,将BMC内预置的CPU、内存丝印信息记录到诊断日志文件中。也就是说,BMC将发生下电/上电/重启事件,均记录到诊断日志文件中。同时,如果是上电/重启,把BMC内预置的CPU、内存丝印信息记录到诊断日志文件中,如果是下电,则没有后面的流程。S102、接收运维系统下发的获取指令;其中,所述接收运维系统下发的获取指令,包括:接收运维系统下发的获取诊断日志文件的IPMI命令。具体来说,如果运维系统想要获取服务器的诊断日志文件,这时.运维系统会向BMC下发对应的IPMI命令给BMC,要求上传诊断日志文件。BMC接收IPMI命令后,便启动故障文件处理任务,把诊断日志文件打包为tar.gz压缩包,压缩包命名为“时间戳+SN.tar.gz”,例如“2018-06-0319:30:33SN0123456.tar.gz”,并通过SFTP(SecureFileTransferProtocol,安全文件传送协议)上传到运维系统。S103、将所述诊断日志文件通过SFTP协议上传至运维系统,以使所述运维系统通过所述诊断日志文件对服务器进行故障定位。具体的,每个服务器均可以通过BMC收集故障信息,并上传至运维系统,这种将诊断日志文件上传到统一的服务器,能帮助用户统一管理大批量服务器,减本文档来自技高网...
【技术保护点】
1.一种服务器故障定位方法,其特征在于,包括:BMC接收BIOS发送的故障信息,并记录至诊断日志文件;接收运维系统下发的获取指令;将所述诊断日志文件通过SFTP协议上传至运维系统,以使所述运维系统通过所述诊断日志文件对服务器进行故障定位。
【技术特征摘要】
1.一种服务器故障定位方法,其特征在于,包括:BMC接收BIOS发送的故障信息,并记录至诊断日志文件;接收运维系统下发的获取指令;将所述诊断日志文件通过SFTP协议上传至运维系统,以使所述运维系统通过所述诊断日志文件对服务器进行故障定位。2.根据权利要求1所述的服务器故障定位方法,其特征在于,所述BMC接收BIOS发送的故障信息,包括:所述BMC接收BIOS发送的硬件运行信息。3.根据权利要求2所述的服务器故障定位方法,其特征在于,所述接收运维系统下发的获取指令,包括:接收运维系统下发的获取诊断日志文件的IPMI命令。4.根据权利要求1至3中任意一项所述的服务器故障定位方法,其特征在于,还包括:BMC将操作系统的下电事件、上电事件、重启事件记录到诊断日志文件中;并在记录上电事件和重启事件时,将BMC内预置的CPU、内存丝印信息记录到诊断日志文件中。5.一种服务器故障定位装置,其特征在于,包括:第一记录模块,用于接收BIOS发送的故障信息,并记录至诊断日志文件;指令接收模块,用于接收运维系统下发的获取指令;诊断日志文件上传模块,用于将所述...
【专利技术属性】
技术研发人员:王成威,
申请(专利权)人:郑州云海信息技术有限公司,
类型:发明
国别省市:河南,41
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。