一种预测内存故障的方法、系统、设备和存储介质技术方案

技术编号:38324114 阅读:12 留言:0更新日期:2023-07-29 09:06
本发明专利技术提供一种预测内存故障的方法、系统、设备和存储介质,方法包括:根据内存可纠正错误的影响因素确定内存故障的关联要素;基于所述关联要素构建层次分析模型;以及收集预设时间内所述关联要素的数据信息,并将所述数据信息代入所述层次分析模型以生成内存故障的预测结果。本发明专利技术在运维层面可以实现内存故障的提前预警,以便运维人员在计划时间内停机维护,极大减少因内存故障导致的服务器宕机,提升服务器运行的稳定性,提高客户的用户体验。提高客户的用户体验。提高客户的用户体验。

【技术实现步骤摘要】
一种预测内存故障的方法、系统、设备和存储介质


[0001]本专利技术涉及服务器领域,更具体地,特别是指一种预测内存故障的方法、系统、设备和存储介质。

技术介绍

[0002]在服务器运维过程中,服务器硬件故障预测是运维领域的痛点也是技术难点,其中由内存引起的服务器故障是所有故障中占比最高的,在传统模式下只有当内存发生故障后,才会对内存进行更换或者维修处理,对处于亚健康的内存或者有故障隐患但是尚未发生故障的内存,没有发现机制。这样就存在两个问题,一是处理问题比较被动,无法提前预测故障以便在计划内停机维修;其次在内存发生故障之后,往往伴随着宕机的发生,对使用者来说也会造成一些损失。因此如果有效预测服务器内存故障,并且对可能发生故障的内存进行有计划的更换,便可以有效降低服务器故障,减少服务器宕机的发生。

技术实现思路

[0003]有鉴于此,本专利技术实施例的目的在于提出一种预测内存故障的方法、系统、计算机设备及计算机可读存储介质,本专利技术根据内存故障的发生与内存使用年限、温度、内存利用率、内存可纠正错误、内存不可纠正错误等因素的关系,结合历史数据以及层次分析法,通过已知数据预测内存健康状态,在服务器发生故障之前,及时识别到即将发生故障的内存条,为运维人员及时发出告警,以方便运维人员在计划时间内对潜在故障的服务器进行停机更换新的内存,防止因内存导致的意外宕机的发生。
[0004]基于上述目的,本专利技术实施例的一方面提供了一种预测内存故障的方法,包括如下步骤:根据内存可纠正错误的影响因素确定内存故障的关联要素;基于所述关联要素构建层次分析模型;以及收集预设时间内所述关联要素的数据信息,并将所述数据信息代入所述层次分析模型以生成内存故障的预测结果。
[0005]在一些实施方式中,所述基于所述关联要素构建层次分析模型包括:设置目标层为内存故障预测,设置准则层为所述关联要素,并设置方案层为健康状态、亚健康状态和故障状态。
[0006]在一些实施方式中,所述将所述数据信息代入所述层次分析模型以生成内存故障的预测结果包括:计算所述准则层的关联要素对所述目标层的权向量,并计算所述方案层中每个状态对所述准则层的权重;以及根据所述权向量和权重计算所述方案层中每个状态对应的权值,并将权值最大的状态作为预测结果。
[0007]在一些实施方式中,所述计算所述准则层的关联要素对所述目标层的权向量包括:根据所述关联要素的数据信息构造判断矩阵,并根据所述判断矩阵计算每个关联要素对所述目标层的权向量。
[0008]在一些实施方式中,所述计算所述方案层中每个状态对所述准则层的权重包括:以每个关联要素为顶点构造方案层对准则层的比较矩阵,并根据所述比较矩阵计算方案层
中每个状态对每个关联要素的权重。
[0009]在一些实施方式中,所述根据所述权向量和权重计算所述方案层中每个状态对应的权值包括:将关联要素对所述目标层的权向量和对应状态对所述关联要素的权重的乘积作为中间结果,并将所有关联要素的中间结果之和作为所述对应状态对应的权值。
[0010]在一些实施方式中,所述方法还包括:计算所述判断矩阵的最大特征根,并根据所述最大特征根对所述判断矩阵进行一致性检验。
[0011]本专利技术实施例的另一方面,提供了一种预测内存故障的系统,包括:确定模块,配置用于根据内存可纠正错误的影响因素确定内存故障的关联要素;构建模块,配置用于基于所述关联要素构建层次分析模型;以及执行模块,配置用于收集预设时间内所述关联要素的数据信息,并将所述数据信息代入所述层次分析模型以生成内存故障的预测结果。
[0012]本专利技术实施例的又一方面,还提供了一种计算机设备,包括:至少一个处理器;以及存储器,所述存储器存储有可在所述处理器上运行的计算机指令,所述指令由所述处理器执行时实现如上方法的步骤。
[0013]本专利技术实施例的再一方面,还提供了一种计算机可读存储介质,计算机可读存储介质存储有被处理器执行时实现如上方法步骤的计算机程序。
[0014]本专利技术具有以下有益技术效果:通过神经网络BP算法训练一个预测模型,通过关联要素及训练好的神经网络模型,预测UCE(UncorrectableErrors,不可纠正错误)发生的可能性;该方案的实现,在运维层面可以实现内存故障的提前预警,以便运维人员在计划时间内停机维护,极大减少因内存故障导致的服务器宕机,提升服务器运行的稳定性,提高客户的用户体验。
附图说明
[0015]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的实施例。
[0016]图1为本专利技术提供的预测内存故障的方法的实施例的示意图;
[0017]图2为本专利技术提供的历史可纠正错误数量与未来可纠正错误数量的关系示意图;
[0018]图3为本专利技术提供的可纠正错误与不可纠正错误的关系示意图;
[0019]图4为本专利技术提供的内存使用时间与可纠正错误的关系示意图;
[0020]图5为本专利技术提供的内存利用率与可纠正错误的关系示意图;
[0021]图6为本专利技术提供的温度与可纠正错误的关系示意图;
[0022]图7为本专利技术提供的层次分析模型示意图;
[0023]图8为本专利技术提供的预测内存故障的系统的实施例的示意图;
[0024]图9为本专利技术提供的预测内存故障的计算机设备的实施例的硬件结构示意图;
[0025]图10为本专利技术提供的预测内存故障的计算机存储介质的实施例的示意图。
具体实施方式
[0026]为使本专利技术的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照
附图,对本专利技术实施例进一步详细说明。
[0027]需要说明的是,本专利技术实施例中所有使用“第一”和“第二”的表述均是为了区分两个相同名称非相同的实体或者非相同的参量,可见“第一”“第二”仅为了表述的方便,不应理解为对本专利技术实施例的限定,后续实施例对此不再一一说明。
[0028]本专利技术实施例的第一个方面,提出了一种预测内存故障的方法的实施例。图1示出的是本专利技术提供的预测内存故障的方法的实施例的示意图。
[0029]如图1所示,本专利技术实施例包括如下步骤:
[0030]S1、根据内存可纠正错误的影响因素确定内存故障的关联要素;
[0031]S2、基于所述关联要素构建层次分析模型;以及
[0032]S3、收集预设时间内所述关联要素的数据信息,并将所述数据信息代入所述层次分析模型以生成内存故障的预测结果。
[0033]根据内存可纠正错误的影响因素确定内存故障的关联要素。
[0034]图2为本专利技术提供的历史可纠正错误数量与未来可纠正错误数量的关系示意图,如图2所示,左侧代表不同平台本月发生可纠正错误故障的机器与本月未发生可纠本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种预测内存故障的方法,其特征在于,包括如下步骤:根据内存可纠正错误的影响因素确定内存故障的关联要素;基于所述关联要素构建层次分析模型;以及收集预设时间内所述关联要素的数据信息,并将所述数据信息代入所述层次分析模型以生成内存故障的预测结果。2.根据权利要求1所述的预测内存故障的方法,其特征在于,所述基于所述关联要素构建层次分析模型包括:设置目标层为内存故障预测,设置准则层为所述关联要素,并设置方案层为健康状态、亚健康状态和故障状态。3.根据权利要求2所述的预测内存故障的方法,其特征在于,所述将所述数据信息代入所述层次分析模型以生成内存故障的预测结果包括:计算所述准则层的关联要素对所述目标层的权向量,并计算所述方案层中每个状态对所述准则层的权重;以及根据所述权向量和权重计算所述方案层中每个状态对应的权值,并将权值最大的状态作为预测结果。4.根据权利要求3所述的预测内存故障的方法,其特征在于,所述计算所述准则层的关联要素对所述目标层的权向量包括:根据所述关联要素的数据信息构造判断矩阵,并根据所述判断矩阵计算每个关联要素对所述目标层的权向量。5.根据权利要求4所述的预测内存故障的方法,其特征在于,所述计算所述方案层中每个状态对所述准则层的权重包括:以每个关联要素为顶点构造方案层对准则层的比较矩阵,并根据所述比较矩阵计算方案层中每个...

【专利技术属性】
技术研发人员:张玉峰郭锋
申请(专利权)人:济南浪潮数据技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1