System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于IIoT的工业边缘机房硬盘故障预测方法技术_技高网

一种基于IIoT的工业边缘机房硬盘故障预测方法技术

技术编号:43333100 阅读:0 留言:0更新日期:2024-11-15 20:30
本发明专利技术公开了一种基于IIoT的工业边缘机房硬盘故障预测方法,涉及硬盘故障预测技术领域,包括S1、数据收集及预处理;S2、特征选择;S3、模型构建;S4、参数调优。该基于IIoT的工业边缘机房硬盘故障预测方法,采用FARM采集硬盘数据,提高了数据采集的便捷性、可靠性,在此基础上选择与硬盘故障预测相关度较高的数据作为模型数据,模型建立过程中考虑到了实际数据关系,采用RBF核,提高了模型训练的准确性;此外,通过将硬盘状态分为故障、数据异常但仍正常工作及正常三类状态,进一步提高了硬盘故障预测的灵活性和准确性;同时明确了模型训练的目标是提高检出率,降低漏报率、误报率,使得本模型具有更强的适应性。

【技术实现步骤摘要】

本专利技术涉及硬盘故障预测,具体为一种基于iiot的工业边缘机房硬盘故障预测方法。


技术介绍

1、随着工业互联网的快速发展,工业企业上云上平台速度逐步加快,越来越多的工业生产数据被采集和存储,工业数据对于指导工业生产流程,记录工业生产状态具有非常重要的作用,一旦产生数据损毁、丢失等情况,可能会对整个生产制造环节造成影响。硬盘是进行工业数据存储的重要设备,硬盘的稳定运行有助于提高工业数据存储的安全性、稳定性。

2、随着数据存储容量的不断增长,硬盘故障已经成为常态而非例外。硬盘故障预测主要是基于硬盘设备历史故障数据进行学习训练,得到硬盘故障预测模型,对硬盘故障进行预测,并进行提前预警预防,使数据得到更可靠的存储。目前,已有不少研究人员开展了硬盘故障预测技术的研究,就比如专利cn109240867a公开了硬盘故障预测方法,采用smart值作为采集数据,将smart值输入训练过的深度信念网络dbn模型,得到硬盘故障预警时间;专利cn107392320a公开了一种使用机器学习预测硬盘故障的方法,采用随机森林算法,对历史数据进行训练建模,生成故障预测模型,提高故障预测率。

3、但类似于上述申请的现有硬盘故障预测技术依然存在以下不足:

4、深度信念网络,即dbn,虽然能够从数据中提取高层次的特征表示,但在处理大规模数据时可能会遇到计算复杂度高和训练时间长的问题,此外,dbn虽然具有强大的特征提取能力,但对于时序数据的处理可能不够灵活,难以充分捕捉时序数据中的长期依赖关系。而随机森林算法虽然具有较高的准确性和稳定性,但它在处理高维度数据时可能会遇到特征选择的问题,同时对于时序数据的处理也不是其强项,此外,随机森林算法对于缺失值和异常值的处理也需要谨慎,否则可能会影响模型的性能。综上可知,现有预测技术普遍存在预测精度不高、对不同品牌、型号硬盘预测准确性存在差异等问题,不利于硬盘故障预测技术的应用推广。

5、因此,急需对此缺点进行改进,本专利技术则是针对现有的技术及不足予以研究改良,提供一种基于iiot的工业边缘机房硬盘故障预测方法。


技术实现思路

1、本专利技术的目的在于提供一种基于iiot的工业边缘机房硬盘故障预测方法,以解决上述
技术介绍
中提出的问题。

2、为实现上述目的,本专利技术提供如下技术方案:一种基于iiot的工业边缘机房硬盘故障预测方法,包括以下步骤:

3、s1、数据收集及预处理:通过部署物联网传感器收集硬盘运行时的各种环境参数,并利用farm指标,通过特定的数据采集软件或设备,从硬盘本身或其运行环境中获取关键的可靠性指标,然后将物联网传感器收集的环境参数数据和farm指标数据进行集成;

4、s2、特征选择:从特征中挑选出与硬盘故障预测最相关的特征子集,选择最重要的特征作为模型的输入;

5、s3、模型构建:

6、采用svr模型来对硬盘运行状态数据进行拟合,通过步骤s2选择出与硬盘故障密切相关的性能参数x1、x2、x3……xn,将硬盘状态记为x=(x1,x2,x3,…,xn),且硬盘状态标记为三种,分别是故障状态y=0、轻度数据异常但仍可正常运行y=1、正常状态y=2;

7、通过svr模型对硬盘运行状态数据级(x,y)进行训练,训练出拟合函数:y=ωt+b,并利用不敏感损失函数阈值ε来控制函数边界,规定预测硬盘状态在f(x)+ε到f(x)-ε之间为正常状态硬盘,硬盘状态在f(x)+ε1到f(x)+ε2,以及f(x)-ε1到f(x)–ε2之间为有异常数据但仍可正常运行的硬盘,硬盘状态超过f(x)-ε2或低于f(x)-ε2时为故障硬盘,只要预测值在相应的虚线之间时即表示预测正确;

8、最大化间隔带并使损失最小,以此来确定ω和b的值,提高预测的准确性,在引入松弛变量ξi≥0后,最后支持向量机回归的最优化问题表示如下:

9、

10、s.t yi-ωtxi-b≤ε+ξi

11、ωtxi+b-yi≤ε+ξi*

12、ξi≥0,

13、s4、参数调优:调整svr模型内部的参数,所述参数控制着模型的复杂度和泛化能力,具体包括:

14、c,即惩罚系数:用于控制模型对误差的容忍度;

15、gamma,即核函数的系数:对于使用径向基函数核的svr,用于决定数据点间的影响范围;

16、ε,即不敏感损失函数中的阈值:用于定义回归函数对样本数据不敏感区域的宽度;

17、s5、模型评估:使用测试集评估模型,将最优参数下的svr模型应用于测试集数据,计算svr模型预测的检出率、误报率、漏报率。

18、进一步的,所述步骤s1中,物联网传感器收集数据的具体操作为:在硬盘运行的工业环境中,部署包括温度传感器、湿度传感器、振动传感器在内的各种物联网传感器,通过传感器实时收集硬盘运行时的各种环境参数,如温度、湿度、振动等,并将所收集的数据通过有线或无线方式传输到数据收集系统。

19、进一步的,所述步骤s1中,farm指标数据包括但不限于硬盘的读写速度、响应时间、错误率,用于反映硬盘的健康状况和潜在故障风险,且在目前的硬盘运维实践中,硬盘的数据采集基于smart体系;farm是对smart体系改良,farm本身获取方便、参数覆盖广,farm的120多项参数包含了硬盘更加底层的传感器和磁头级别的相关参数,以及飞行高度、工作负载、环境等使用状况的参数,能够对硬盘进行全面检测。

20、进一步的,所述步骤s1中,数据集成通过在数据收集系统中设置数据接口,实现不同来源数据的统一管理和分析,且集成后的数据将形成一个全面的硬盘运行数据集,为后续的硬盘故障预测提供数据支持。

21、进一步的,所述步骤s2中,特征选择的具体操作如下:

22、s21、使用统计学中的相关性分析方法来度量特征之间以及特征与硬盘故障之间的线性或非线性关系;

23、s22、绘制相关性热图或矩阵,直观地展示特征之间的相关性强弱;

24、s23、根据相关性系数的大小,筛选出与硬盘故障相关性较高的特征。

25、进一步的,所述步骤s3中,构建的svr模型中,核函数决定了数据在高维空间中的映射方式,所述核函数选择的选择范围包括线性核、多项式核、径向基函数核和sigmoid核,针对硬盘故障预测问题,数据具有非线性特性,优先选择径向基函数核,且径向基函数核适用于处理非线性关系,并对于参数的选择相对不敏感。

26、进一步的,所述步骤s3中,硬盘故障预测的目标是提高检出率,降低误报率和漏报率,

27、检出率(fdr):即故障检测率、召回率,表示所有的故障盘中被检测出来的比例;

28、误报率(far):即虚警率、误检率,表示所有的正常盘中被预测为故障盘的比例;

29、漏报率(mar):即漏检率、漏警率,表示故障盘被预测为正常盘的比例。

30、进一步的,本文档来自技高网...

【技术保护点】

1.一种基于IIoT的工业边缘机房硬盘故障预测方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种基于IIoT的工业边缘机房硬盘故障预测方法,其特征在于,所述步骤S1中,物联网传感器收集数据的具体操作为:在硬盘运行的工业环境中,部署包括温度传感器、湿度传感器、振动传感器在内的各种物联网传感器,通过传感器实时收集硬盘运行时的各种环境参数,并将所收集的数据通过有线或无线方式传输到数据收集系统。

3.根据权利要求1所述的一种基于IIoT的工业边缘机房硬盘故障预测方法,其特征在于,所述步骤S1中,FARM指标数据包括但不限于硬盘的读写速度、响应时间、错误率,用于反映硬盘的健康状况和潜在故障风险,且在目前的硬盘运维实践中,硬盘的数据采集基于SMART体系。

4.根据权利要求1所述的一种基于IIoT的工业边缘机房硬盘故障预测方法,其特征在于,所述步骤S1中,数据集成通过在数据收集系统中设置数据接口,实现不同来源数据的统一管理和分析,且集成后的数据将形成一个全面的硬盘运行数据集,为后续的硬盘故障预测提供数据支持。

5.根据权利要求1所述的一种基于IIoT的工业边缘机房硬盘故障预测方法,其特征在于,所述步骤S2中,特征选择的具体操作如下:

6.根据权利要求1所述的一种基于IIoT的工业边缘机房硬盘故障预测方法,其特征在于,所述步骤S3中,构建的SVR模型中,核函数决定了数据在高维空间中的映射方式,所述核函数选择的选择范围包括线性核、多项式核、径向基函数核和Sigmoid核,针对硬盘故障预测问题,优先选择径向基函数核,且径向基函数核适用于处理非线性关系,并对于参数的选择相对不敏感。

7.根据权利要求1所述的一种基于IIoT的工业边缘机房硬盘故障预测方法,其特征在于,所述步骤S3中,硬盘故障预测的目标是提高检出率,降低误报率和漏报率,

8.根据权利要求1所述的一种基于IIoT的工业边缘机房硬盘故障预测方法,其特征在于,所述步骤S4中,C参数的调优逻辑为:C值越大,则模型拟合训练数据的程度越高,但C值过大会导致过拟合,反之,C值越小,模型对误差的惩罚越小,且C值过小会导致欠拟合,通过调整C的值帮助平衡模型的复杂度和泛化能力。

9.根据权利要求1所述的一种基于IIoT的工业边缘机房硬盘故障预测方法,其特征在于,所述步骤S4中,gamma参数的调优逻辑为:gamma值越大,则每个数据点的影响范围较小,并使模型更加复杂且容易过拟合,gamma值越小,则模型过于简单。

10.根据权利要求1所述的一种基于IIoT的工业边缘机房硬盘故障预测方法,其特征在于,所述步骤S4中,ε参数的调优逻辑为:当预测值与实际值之间的差异小于ε时,模型不会对这些差异进行惩罚,反之,当预测值与实际值之间的差异大于或等于ε时,模型则对这些差异进行惩罚,通过调整ε的值帮助控制模型对误差的敏感度。

...

【技术特征摘要】

1.一种基于iiot的工业边缘机房硬盘故障预测方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种基于iiot的工业边缘机房硬盘故障预测方法,其特征在于,所述步骤s1中,物联网传感器收集数据的具体操作为:在硬盘运行的工业环境中,部署包括温度传感器、湿度传感器、振动传感器在内的各种物联网传感器,通过传感器实时收集硬盘运行时的各种环境参数,并将所收集的数据通过有线或无线方式传输到数据收集系统。

3.根据权利要求1所述的一种基于iiot的工业边缘机房硬盘故障预测方法,其特征在于,所述步骤s1中,farm指标数据包括但不限于硬盘的读写速度、响应时间、错误率,用于反映硬盘的健康状况和潜在故障风险,且在目前的硬盘运维实践中,硬盘的数据采集基于smart体系。

4.根据权利要求1所述的一种基于iiot的工业边缘机房硬盘故障预测方法,其特征在于,所述步骤s1中,数据集成通过在数据收集系统中设置数据接口,实现不同来源数据的统一管理和分析,且集成后的数据将形成一个全面的硬盘运行数据集,为后续的硬盘故障预测提供数据支持。

5.根据权利要求1所述的一种基于iiot的工业边缘机房硬盘故障预测方法,其特征在于,所述步骤s2中,特征选择的具体操作如下:

6.根据权利要求1所述的一种基于iiot的工业边缘机房硬盘故障预测方法,其特征在于,所述步骤s3中,构建的svr模型中,核函数决定了数据在...

【专利技术属性】
技术研发人员:邱奔王少鹏郭亮李洁
申请(专利权)人:中国信息通信研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1