一种磁盘故障预测模型的构建方法及应用技术

技术编号：37234548 阅读：11 留言：0更新日期：2023-04-20 23:16

本发明专利技术公开了一种磁盘故障预测模型的构建方法及应用，属于磁盘故障预测技术领域，本发明专利技术将磁盘异构、模型老化、环境差异等因素视作数据异构这一因素进行处理，并将磁盘故障预测中的小样本问题看作处理数据异构所导致的结果，通过将采集到的磁盘样本集按照磁盘故障预测中不同因素所对应的属性(磁盘型号、服务器环境、采样时间)进行分层划分，得到多个所包含的故障样本数量基本相当的子样本集，能够很好的平衡数据异构问题和小样本问题，在此基础上，将划分得到的多个子样本集视作多任务，进行多任务学习，实现了多个域下的迁移学习，能够适应多问题混合存在的磁盘故障预测场景，预测精度较高。测精度较高。测精度较高。

全部详细技术资料下载

【技术实现步骤摘要】
一种磁盘故障预测模型的构建方法及应用

[0001]本专利技术属于磁盘故障预测
，更具体地，涉及一种磁盘故障预测模型的构建方法及应用。

技术介绍

[0002]随着信息产业的发展，大量的数据不断生成，推动了数据存储服务的发展。存储系统的稳定性与服务供应商的效益密切相关，存储系统故障会给使用者造成巨大损失。大多数存储系统故障都来源于磁盘的故障，因此，对磁盘是否发生故障进行预测，提高磁盘的可靠性是必要且重要的。
[0003]随着机器学习技术的发展与应用，机器学习模型被大量应用在磁盘故障预测领域中，基于机器学习的磁盘故障预测模型，通过磁盘的日志数据，即自我监测分析和报告技术(SAMRT)，实现了较高的磁盘故障预测准确性。然而磁盘故障预测的准确性受诸如磁盘异构、模型老化、环境差异、小样本等因素的影响较大，在现有的基于机器学习模型的磁盘故障预测方法中，一部分方法是在考虑某一具体因素的影响下进行的磁盘故障预测，通过按照某一具体因素的相应属性对磁盘SMART数据进行划分后进行适应于该因素影响下的磁盘故障预测，然而这种方法只善于处理单一特定因素影响下的故障预测问题，对于多个因素同时存在的场景，预测准确性较低。
[0004]为了解决上述挑战，一部分方法采用迁移学习配合周期性更新的方法，使适应于磁盘异构因素影响下的磁盘故障预测模型也能够解决模型老化因素影响下的磁盘故障预测问题。然而这种方法仅适用于处理存在磁盘异构和模型老化这两个因素的场景，当磁盘异构、模型老化、环境差异、小样本等更多因素混合存在时无法进行推广。另外，适...

【技术保护点】

【技术特征摘要】
1.一种磁盘故障预测模型的构建方法，其特征在于，包括以下步骤：S1、将在不同服务器环境下所采集的带标签的磁盘样本集，按照磁盘型号划分成多个第一子样本集；其中，所述磁盘样本集包括故障样本和非故障样本；S2、将故障样本数量大于预设数量N的每一个所述第一子样本集，按照服务器环境进一步进行划分，得到多个第二子样本集；S3、分别对故障样本数量大于N的每一个所述第二子样本集，将其中的样本按照采集时间的先后顺序进行排列，从第一个样本开始，每隔N个故障样本标记一个划分点，并按照所标记的划分点将第二子样本集进一步划分成多个第三子样本集；S4、将所得的各所述第三子样本集、以及未被进一步划分的各所述第一子样本集和各所述第二子样本集共同构成一组子任务集，并将每一个所述子任务集均划分为支持集和查询集；S5、为每一个所述子任务集均分配一个与所述磁盘故障预测模型相同的子任务模型，并对各所述子任务模型分别采用对应的所述子任务集中的支持集进行训练；S6、分别将每一个所述子任务集中的查询集输入到对应的所述子任务模型中，计算得到每一个所述子任务模型的分类损失值；基于各所述子任务模型的分类损失值之和对所述磁盘故障预测模型中的参数进行更新；S7、重复步骤S5
‑
S6进行迭代，直至所述磁盘故障预测模型达到收敛。2.根据权利要求1所述的磁盘故障预测模型的构建方法，其特...

【专利技术属性】
技术研发人员：刘渝，关云川，周可，李强，李娟，张海军，
申请(专利权)人：华中科技大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人