一种八路机架式服务器的故障隔离与恢复方法技术

技术编号:37246124 阅读:17 留言:0更新日期:2023-04-20 23:26
本发明专利技术公开了一种八路机架式服务器的故障隔离与恢复方法,其中故障隔离分为物理故障隔离、控制信息隔离、数据隔离;其中故障隔离恢复方法包括:步骤1构建五维故障隔离恢复模型;步骤2构建评估指标;步骤3对时间指标进行归一化;步骤4建立恢复能力评估模型;步骤5根据评估结果判断恢复情况。本发明专利技术构建包含主机、系统、网络、数据库、中间件等运维对象恢复评估模型,形成智能运五维模型,覆盖从业务、事务、拓扑、物理链路和基础设施多维度,贯穿业务和软硬件资源,全面评估数据中心保障要点与故障恢复能力,本发明专利技术提前对故障发生进行预测并采用相应的故障预防策略避免故障的发生,帮助缩短故障恢复时间,提高系统的安全性、可靠性与可用性。用性。用性。

【技术实现步骤摘要】
一种八路机架式服务器的故障隔离与恢复方法


[0001]本专利技术涉及信息
中服务器故障隔离及恢复方法,具体的涉及一种八路机架式服务器的故障隔离与恢复方法。

技术介绍

[0002]随着信息技术的逐渐发展,各种各样的计算机和电子设备逐渐走入人们的生活,成了我们生活不可缺少的一部分,与我们息息相关。
[0003]故障隔离与恢复设计并不是单一的设计技术,而是一个整体的、系统的设计方法学,需要从设计的多个层次、多个阶段进行综合的把握,形成全局的RAS体系结构视图,从而指导高可靠处理器及服务器的设计实现。简要的来说,需要从设计的多个层次,包括电路设计、微体系结构设计、体系结构设计、固件设计、OS设计、应用设计等层次通盘考虑,需要从设计的各个阶段,包括系统概要设计、模块详细设计、后端物理设计等阶段统筹设计,以便分层次采用不同的检测技术,取得最优的检测效果,同时,分层次采用软硬件结合的方法对错误进行处理,以便将错误的影响局限到最小范围,从而提高整个服务器系统级的可靠性与可用性。
[0004]现有技术中CN108963980B公开了一种基于故障隔离库的多模态故障隔离方法,本方法的驱动信号由同相层叠

正弦脉宽调制(Phase Disposition

Sinusoidal Pulse Width Modulation,PD

SPWM)算法产生。该多模态故障隔离方法是建立在一个故障隔离库的基础上,其中故障类型与故障隔离方法相对应。首先根据故障诊断的结果确定多电平级联逆变器故障IGBT的数量及位置,将故障诊断结果与故障隔离库作比较确定故障类型;此后,针对不同的故障类型按库启用不同的隔离策略。本专利技术的多模态故障隔离策略可以解决多种不同的故障类型,且针对不同的故障类型有最适合的的隔离方法与其相对应,这种故障与故障隔离方法相对应的策略相对简洁、实施效率高。但是现有技术中,只是根据故障发生后判断故障的类型与故障解决方法,无法在故障发生前进行预测。
[0005]因此为解决上述问题现提出一种八路机架式服务器的故障隔离与恢复方法。

技术实现思路

[0006]本专利技术的目的在于提供一种八路机架式服务器的故障隔离与恢复方法,以解决上述
技术介绍
中提出的问题。
[0007]为实现上述目的,本专利技术提供如下技术方案:一种八路机架式服务器的故障隔离与恢复方法,所述故障隔离分为物理故障隔离、控制信息隔离、数据隔离;
[0008]所述物理故障隔离:防止故障部件从热、电、机械方面去毁坏非故障部件;
[0009]所述控制信息隔离:防止故障部件的错误信号使非故障部件产生错误动作;
[0010]所述数据隔离:防止故障部件的错误数据污染非故障部件的数据;
[0011]所述故障隔离诊断方法包括:诊断网络中若干节点机在网络运行时出现的故障;诊断网络中通信链路在网络运行时出现的故障;
[0012]所述故障隔离恢复方法包括:
[0013]S1:构建五维故障隔离恢复模型;
[0014]S2:构建评估指标;
[0015]S3:对时间指标进行归一化;
[0016]S4:建立恢复能力评估模型;
[0017]S5:根据评估结果判断恢复情况。
[0018]优选的,所述通信链路的故障可通过对节点机的故障诊断推断得出。
[0019]优选的,所述物理隔离在网络系统硬件设计中完成,所述控制信息隔离与数据隔离采用软硬件相结合,用隔离电路对故障点进行隔离。
[0020]优选的,所述五维故障隔离恢复模型包括:基础设施层、物理链路层、逻辑拓扑层、功能事务层、业务流程层。
[0021]优选的,所述基础设施层用于记录服务器设备指标与环境指标;所述物理链路层用于记录服务器设备连接关系与服务器运行指标、日志;所述逻辑拓扑层用于记录软件连接关系与软件运行指标、日志;所述功能事务层用于记录系统运行时软件内的请求调用关系;所述业务流程层用于记录系统功能项与业务流程间的依赖关系。
[0022]优选的,所述服务器设备指标与环境指标包括:设备台账、机房温度、服务器温度、服务器异常告警、服务器投运时长;所述服务器设备连接关系包括:主机与交换机之间的连接关系、主机与负载之间的连接关系、防火墙与交换机之间的连接关系;所述服务器运行指标包括:CPU、内存、IO的使用率;所述请求调用关系包括请求的发起源信息、目的信息、代码调用栈信息和SQL执行信息。
[0023]优选的,所述评估指标包括:故障检测时间、业务流程恢复时间、业务流程恢复程度、功能事务恢复时间、功能事务恢复程度、逻辑拓扑恢复时间、逻辑拓扑恢复程度、物理链路恢复时间、物理链路恢复程度、基础设施恢复时间、基础设施恢复程度。
[0024]优选的,所述对时间指标进行归一化,其中时间包括故障检测时间、业务流程恢复时间、功能事务恢复时间、逻辑拓扑恢复时间、物理链路恢复时间、基础设施恢复时间,所述归一化函数如下:
[0025][0026]式中:t表示采集的时间指标;T表示归一化的时间指标;t
min
表示当时间不超过该值,恢复能力较好,此时归一化的时间指标T为1;t
max
表示超过该值时,恢复能力较差,此时归一化的时间指标T为0。
[0027]优选的,所述恢复能力评估模型如下:
[0028][0029]式中:y为故障恢复能力的综合得分;x
i
为第i个指标的得分;ω
i
为第i个指标的权
重其计算公式如下:
[0030][0031]式中:0≤x
i
≤1,
[0032]优选的,所述当恢复能力评估模型得分范围在[0,1]区间,其值越接近1表示恢复能力越强,其值越接近0表示恢复能力越弱。
[0033]与现有技术相比,本专利技术的有益效果是:
[0034]1、采用改进的集中式与分布式相结合的方式进行诊断,即将系统中的节点根据功能划分为若干组,在组内采用集中式诊断,组间采用分布式诊断。这样可充分利用集中诊断的优点,克服分布诊断的缺点,从而使对整个系统的诊断既准确又便于管理,同时又防止了系统出现负载不均衡的情况,提前对故障发生进行预测并采用相应的故障预防策略避免故障的发生,帮助缩短故障恢复时间,提高系统的安全性、可靠性与可用性。
[0035]2、构建包含主机、系统、网络、数据库、中间件等运维对象恢复评估模型,形成智能运五维模型,覆盖从业务、事务、拓扑、物理链路和基础设施多维度,贯穿业务和软硬件资源,全面评估数据中心保障要点与故障恢复能力。
附图说明
[0036]图1为本专利技术的故障隔离分类图;
[0037]图2为本专利技术的故障隔离恢复方法流程图;
具体实施方式
[0038]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种八路机架式服务器的故障隔离与恢复方法,其特征在于,所述故障隔离分为物理故障隔离、控制信息隔离、数据隔离;所述物理故障隔离:防止故障部件从热、电、机械方面去毁坏非故障部件;所述控制信息隔离:防止故障部件的错误信号使非故障部件产生错误动作;所述数据隔离:防止故障部件的错误数据污染非故障部件的数据;所述故障隔离诊断方法包括:诊断网络中若干节点机在网络运行时出现的故障;诊断网络中通信链路在网络运行时出现的故障;所述故障隔离恢复方法包括:S1:构建五维故障隔离恢复模型;S2:构建评估指标;S3:对时间指标进行归一化;S4:建立恢复能力评估模型;S5:根据评估结果判断恢复情况。2.根据权利要求1所述的一种八路机架式服务器的故障隔离与恢复方法,其特征在于,所述通信链路的故障可通过对节点机的故障诊断推断得出。3.根据权利要求1所述的一种八路机架式服务器的故障隔离与恢复方法,其特征在于,所述物理隔离在网络系统硬件设计中完成,所述控制信息隔离与数据隔离采用软硬件相结合,用隔离电路对故障点进行隔离。4.根据权利要求1所述的一种八路机架式服务器的故障隔离与恢复方法,其特征在于,所述五维故障隔离恢复模型包括:基础设施层、物理链路层、逻辑拓扑层、功能事务层、业务流程层。5.根据权利要求4所述的一种八路机架式服务器的故障隔离与恢复方法,其特征在于,所述基础设施层用于记录服务器设备指标与环境指标;所述物理链路层用于记录服务器设备连接关系与服务器运行指标、日志;所述逻辑拓扑层用于记录软件连接关系与软件运行指标、日志;所述功能事务层用于记录系统运行时软件内的请求调用关系;所述业务流程层用于记录系统功能项与业务流程间的依赖关系。6.根据权利要求5所述的一种八路机架式服务器的故障隔离与恢复方法,其特征在于,所述服务器设备指标与环境指标包括:设备台账、机房温度、服务器温度、服务器异常告警、...

【专利技术属性】
技术研发人员:杨艳苏谢丛茵谢贵超谭明哲陈睿博冯明宽
申请(专利权)人:中电长城圣非凡信息系统有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1