System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 目标不可纠正故障预测模型训练方法以及相关设备技术_技高网

目标不可纠正故障预测模型训练方法以及相关设备技术

技术编号:43232705 阅读:7 留言:0更新日期:2024-11-05 17:20
本申请实施例公开了一种目标不可纠正故障预测模型训练方法以及相关设备,用于在可以及时且准确预测内存不可纠故障的情况下,进行目标不可纠正故障预测模型训练。本申请实施例方法包括:获得内存的初始时间窗口的内存日志样本,对初始时间窗口的内存日志样本进行目标时间窗口的各个维度指标的可纠故障特征抽取,得到目标时间窗口的可纠故障特征样本,由目标不可纠正故障预测模型对目标时间窗口的可纠故障特征样本进行不可纠故障发生规律的分析,以得到预测不可纠故障识别结果,当预测不可纠故障识别结果与标注的不可纠故障识别结果之间的损失满足收敛条件时,得到训练完成的目标不可纠正故障识别模型。

【技术实现步骤摘要】

本申请实施例涉及内存故障的预测领域,更具体的,是目标不可纠正故障预测模型训练方法、目标不可纠正故障预测模型训练装置、计算机设备以及计算机可读存储介质。


技术介绍

1、随着互联网应用飞速发展,现代生产环境中服务器集群规模逐渐增大,集群中服务器内存数量也逐渐增加。而内存模块可能由于电路故障,位线数据传输等原因出现错误,其中不可纠正故障(不可修正的错误)将严重影响上层应用甚至服务器集群的性能与可靠性。因此对内存的不可纠正故障的预测研究变得十分重要。

2、现有的不可纠正故障预测模型训练方法是,收集内存的以往的可纠正故障的信息,其中这些可纠正故障的信息标注有不可纠故障识别结果,然后将这些可纠正故障的信息输入不可纠正故障预测模型中,由不可纠正故障预测模型对这些可纠正故障的信息进行数量、基于分布、基于位特征的分析,得到可纠正故障的预测不可纠故障识别结果,再基于预测不可纠故障识别结果与标注的不可纠故障识别结果进行损失计算,直至满足收敛条件,以得到训练完成的不可纠正故障识别模型。

3、但是,现有的不可纠正故障预测模型训练方法,模型是基于收集的以往的可纠正故障的信息进行训练的,并非基于生产环境数据进行训练,因此对于生产环境的通用性与优化不足,且在训练时仅仅是对可纠正故障的信息进行数量、基于分布、基于位特征的角度进行分析,分析角度不足,无法充分描述内存健康状态,导致较低的预测覆盖率。总而言之,现有的不可纠正故障预测模型训练方法,无法获得适应于生产环境的能够准确预测内存不可纠故障的目标不可纠正故障预测模型。


>技术实现思路

1、本申请实施例提供了一种目标不可纠正故障预测模型训练方法、目标不可纠正故障预测模型训练装置、目标不可纠正故障预测模型训练设备以及计算机可读存储介质,用于在可以及时且准确预测内存不可纠故障的情况下,进行目标不可纠正故障预测模型训练。

2、第一方面,本申请实施例提供了一种目标不可纠正故障预测模型训练方法,包括:

3、获得内存的初始时间窗口的内存日志样本;

4、对初始时间窗口的内存日志样本进行目标时间窗口的各个维度指标的可纠故障特征抽取,得到目标时间窗口的可纠故障特征样本;其中,目标时间窗口的可纠故障特征样本标注有内存的在目标时间点出现不可纠正故障与否的不可纠故障识别结果;目标时间点为初始时间窗口之后的时间点;目标时间窗口为初始时间窗口中故障预测时段内的时段,故障预测时段为初始时间窗口中除故障预留处置时段之外的时段;故障预测时段内的时间先于故障预留处置时段的时间;

5、将目标时间窗口的可纠故障特征样本输入目标不可纠正故障预测模型,由目标不可纠正故障预测模型对目标时间窗口的可纠故障特征样本进行不可纠故障发生规律的分析,得到目标时间窗口的可纠故障特征样本对应的不可纠故障发生规律的预测存在与否信息,以基于预测存在与否信息得到不可纠正故障预测模型输出的目标时间窗口的可纠故障特征样本的预测不可纠故障识别结果;

6、当预测不可纠故障识别结果与标注的不可纠故障识别结果之间的损失满足收敛条件时,得到训练完成的目标不可纠正故障识别模型。

7、第二方面,本申请实施例提供了一种目标不可纠正故障预测模型训练装置,包括:

8、获得单元,用于获得内存的初始时间窗口的内存日志样本;

9、抽取单元,用于对初始时间窗口的内存日志样本进行目标时间窗口的各个维度指标的可纠故障特征抽取,得到目标时间窗口的可纠故障特征样本;其中,目标时间窗口的可纠故障特征样本标注有内存的在目标时间点出现不可纠正故障与否的不可纠故障识别结果;目标时间点为初始时间窗口之后的时间点;目标时间窗口为初始时间窗口中故障预测时段内的时段,故障预测时段为初始时间窗口中除故障预留处置时段之外的时段;故障预测时段内的时间先于故障预留处置时段的时间;

10、输入单元,用于将目标时间窗口的可纠故障特征样本输入目标不可纠正故障预测模型,由目标不可纠正故障预测模型对目标时间窗口的可纠故障特征样本进行不可纠故障发生规律的分析,得到目标时间窗口的可纠故障特征样本对应的不可纠故障发生规律的预测存在与否信息,以基于预测存在与否信息得到不可纠正故障预测模型输出的目标时间窗口的可纠故障特征样本的预测不可纠故障识别结果;

11、计算单元,用于当预测不可纠故障识别结果与标注的不可纠故障识别结果之间的损失满足收敛条件时,得到训练完成的目标不可纠正故障识别模型。

12、第三方面,本申请实施例提供了一种计算机设备,包括:

13、中央处理器,存储器,输入输出接口,有线或无线网络接口以及电源;

14、存储器为短暂存储存储器或持久存储存储器;

15、中央处理器配置为与存储器通信,并执行存储器中的指令操作以执行前述目标不可纠正故障预测模型训练方法。

16、第四方面,本申请实施例提供了一种计算机可读存储介质,计算机可读存储介质包括指令,当指令在计算机上运行时,使得计算机执行前述目标不可纠正故障预测模型训练方法。

17、第五方面,本申请实施例提供了一种包含指令的计算机程序产品,当计算机程序产品在计算机上运行时,使得计算机执行前述目标不可纠正故障预测模型训练方法。

18、从以上技术方案可以看出,本申请实施例具有以下优点:本申请实施例中,内存的初始时间窗口的内存日志样本的数据直接来源于实际的生产环境,可以反映真实世界中的内存使用情况和故障模式,且可以对初始时间窗口的内存日志样本进行目标时间窗口的各个维度指标的可纠故障特征抽取,分析角度不充足,且通过在故障预留处置时段之外的时间进行预测,避免了预测过程中的干扰,提高了在生产环境进行预测的准确性。因此,可以获得适应于生产环境的能够准确预测内存不可纠故障的目标不可纠正故障预测模型。进一步的,通过分析目标时间窗口的可纠故障特征,以及对故障预测时段的设定,模型能够实时捕捉到可能发生的不可纠正故障,提高了预测的及时性,因此,获得的目标不可纠正故障预测模型还可以提高预测内存不可纠故障的及时性。

本文档来自技高网...

【技术保护点】

1.一种目标不可纠正故障预测模型训练方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述对所述初始时间窗口的内存日志样本进行目标时间窗口的各个维度指标的可纠故障特征抽取,得到所述目标时间窗口的可纠故障特征样本之前,所述方法还包括:

3.根据权利要求1所述的方法,其特征在于,所述目标时间窗口的可纠故障特征样本包括第一数量的第一可纠故障特征样本和第二数量的第二可纠故障特征样本;所述目标时间窗口的第一可纠故障特征样本表征在目标时间点出现不可纠正故障的不可纠故障识别结果;所述目标时间窗口的第二可纠故障特征样本表征在目标时间点不出现不可纠正故障的不可纠故障识别结果;

4.根据权利要求3所述的方法,其特征在于,所述第二数量与所述第一数量的差值大于预设差值阈值;

5.根据权利要求3所述的方法,其特征在于,所述目标时间窗口的可纠故障特征样本包括基础指标维度的基础特征样本、分布指标维度的分布特征样本、位指标维度的位特征样本和/或历史指标维度的历史特征样本;

6.根据权利要求1所述的方法,其特征在于,所述将所述目标时间窗口的可纠故障特征样本输入目标不可纠正故障预测模型之前,所述方法还包括:

7.根据权利要求1至6中任一项所述的方法,其特征在于,所述得到训练完成的目标不可纠正故障识别模型之后,所述方法还包括:

8.一种目标不可纠正故障预测模型训练装置,其特征在于,包括:

9.一种计算机设备,其特征在于,包括:

10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质包括指令,当所述指令在计算机上运行时,使得计算机执行如权利要求1至7中任意一项所述的方法。

...

【技术特征摘要】

1.一种目标不可纠正故障预测模型训练方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述对所述初始时间窗口的内存日志样本进行目标时间窗口的各个维度指标的可纠故障特征抽取,得到所述目标时间窗口的可纠故障特征样本之前,所述方法还包括:

3.根据权利要求1所述的方法,其特征在于,所述目标时间窗口的可纠故障特征样本包括第一数量的第一可纠故障特征样本和第二数量的第二可纠故障特征样本;所述目标时间窗口的第一可纠故障特征样本表征在目标时间点出现不可纠正故障的不可纠故障识别结果;所述目标时间窗口的第二可纠故障特征样本表征在目标时间点不出现不可纠正故障的不可纠故障识别结果;

4.根据权利要求3所述的方法,其特征在于,所述第二数量与所述第一数量的差值大于预设差值阈值;

5.根据权利要求3所...

【专利技术属性】
技术研发人员:李诗逸郑小博夏文
申请(专利权)人:哈尔滨工业大学深圳哈尔滨工业大学深圳科技创新研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1