服务器磁盘故障检测方法及系统、存储介质、电子设备技术方案

技术编号:36936369 阅读:16 留言:0更新日期:2023-03-22 18:58
本申请属于服务器磁盘技术领域,公开了服务器磁盘故障检测方法及系统、存储介质、电子设备,所述方法包括收集服务器监控数据;对服务器监控数据进行聚类分析,获取磁盘故障因素;根据磁盘故障因素,在服务器监控数据中,筛选出磁盘IO特征数据;收集磁盘故障单;对磁盘故障单进行预处理;将磁盘故障单作为标签的磁盘IO特征数据,作为训练集,训练出能够识别磁盘故障的BP神经网络模型;将待测磁盘的IO特征输入BP神经网络模型,来检测磁盘的故障状况。因此,本公开实施例能够通过BP神经网络模型来检测服务器磁盘的故障,解决了现有技术中服务器磁盘检测的精准设置阈值难度大从而引起适用性差的问题,从而降低了服务器磁盘检测的难度。度。度。

【技术实现步骤摘要】
服务器磁盘故障检测方法及系统、存储介质、电子设备


[0001]本申请属于服务器磁盘
,涉及一种服务器磁盘故障检测方法及系统、存储介质、电子设备。

技术介绍

[0002]目前,计算机的系统运维工作都会涉及到磁盘的监控和故障诊断,随着业务的不断扩展,计算机系统运维所维护的磁盘数量会大大增加,并且磁盘会经常出现坏盘或者故障的情况,这将严重影响业务系统的正常运行,所以时刻对磁盘是否存在故障进行诊断是很有必要的。
[0003]磁盘故障诊断就是研究与硬盘故障率相关的多个因素,比如环境因素,磁盘IO负载,磁盘S.M.A.R.T参数,上架时间,机型,业务等。磁盘IO负载有多种说法,有时被称为活跃程度利用率等。
[0004]现有的服务器磁盘故障检测存在着一些缺点,即用户只能根据磁盘监控指标并根据自身经验或者固定的指标阈值进行磁盘诊断,这种方案要求技术人员对磁盘的故障原理有深刻的理解,例如当今几乎所有的硬盘驱动厂商都开始在他们的产品中实施S.M.A.R.T,通过S.M.A.R.T可以对各硬盘的内部特性进行监控并且使用一个阈值算法来引发一个S.M.A.R.T告警信号,即当任何特性超过某个阈值时发出报警。这种方法对阈值的设置是非常关键的,这就要求技术人员对磁盘非常熟悉。目前也有研究者观测随着时间的推移S.M.A.R.T参数的变化,采用HMM和HSM来为好盘和坏盘建模从而实现硬盘的故障预测,并评估了预测效果。这些方案不能有效地降低技术人员的技术门槛。

技术实现思路

[0005]为了对披露的实施例的一些方面有基本的理解,下面给出了简单的概括。所述概括不是泛泛评述,也不是要确定关键/重要组成元素或描绘这些实施例的保护范围,而是作为后面的详细说明的序言。
[0006]为了解决相关技术中存在的问题,本公开实施例提供了服务器磁盘故障检测方法及系统、存储介质、电子设备,用以解决现有技术中服务器磁盘检测的精准设置阈值难度大从而引起适用性差的问题。
[0007]第一方面,在一些实施例中,提供了一种服务器磁盘故障检测方法,所述方法包括:收集磁盘故障单;对磁盘故障单进行预处理;收集服务器监控数据;对服务器监控数据进行聚类分析,获取磁盘故障因素;根据磁盘故障因素,在服务器监控数据中,筛选出磁盘IO特征数据;将磁盘故障单作为标签的磁盘IO特征数据,作为训练集,训练出能够识别磁盘故
障的BP神经网络模型;将待测磁盘的IO特征输入BP神经网络模型,来检测磁盘的故障状况。
[0008]优选地,对服务器监控数据进行聚类分析,获取磁盘故障因素,包括:判断服务器监控数据是否进行相关性分析;在服务器监控数据不需要进行相关性分析的情况下,选取聚类数据列,并使用K

means算法实现聚类;在服务器监控数据需要进行相关性分析的情况下,则判断是否需要结合上架时间,若是则分析机械随上架时间的硬盘故障率变化;若否,则分析机型的总体硬盘故障率。
[0009]优选地,训练BP神经网络模型,包括:对模型参数进行初始化;求隐藏层、输出层各单元的输出;对训练集计算总体误差;判断损失函数Loss是否满足要求,若否,则继续;若是,则结束;应用链式法则,求损失函数关于每层权值矩阵的梯度;梯度下降算法调整各层的权值和偏置;重新执行求隐藏层、输出层各单元的输出。
[0010]优选地,收集服务器监控数据,包括:采用时间序列数据库Influxdb存储磁盘监控数据。
[0011]优选地,收集磁盘故障单,包括:从mysql中获取磁盘故障单。
[0012]优选地,对磁盘故障单进行预处理,包括:过滤掉非磁盘数据;补全故障单中的字段;忽略无信息故障条目;合并重复的故障条目。
[0013]优选地,在训练的BP神经网络模型中使用均方误差损失函数、二项分类的交叉熵损失函数和多项分类的交叉熵损失函数的任一种;均方误差损失函数公式为,;二项分类的交叉熵损失函数公式为,;多项分类的交叉熵损失函数为,
[0014]式中,为训练样本总数,为神经网络的输出,为训练标签。
[0015]第二方面,在一些实施例中,公开了一种服务器磁盘故障检测系统,包括:
收集监控数据模块,被配置为收集服务器监控数据;磁盘故障因素模块,被配置为对服务器监控数据进行聚类分析,获取磁盘故障因素;特征数据模块,被配置为根据磁盘故障因素,在服务器监控数据中,筛选出磁盘IO特征数据;收集磁盘故障单模块,被配置为收集磁盘故障单;磁盘故障单预处理模块,被配置为对磁盘故障单进行预处理;训练BP神经网络模块,被配置为将磁盘故障单作为标签的磁盘IO特征数据,作为训练集,训练出能够识别磁盘故障的BP神经网络模型;预测模块,被配置为将待测磁盘的IO特征输入BP神经网络模型,来检测磁盘的故障状况。
[0016]第三方面,在一些实施例中,公开了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行如上述的服务器磁盘故障检测方法。
[0017]第四方面,在一些实施例中,公开了一种电子设备,包括存储器和处理器,其特征在于,所述存储器用于存储一条或多条计算机程序指令,其中,所述一条或多条计算机程序指令被所述处理器执行如上述的服务器磁盘故障检测方法。
[0018]本公开实施例提供的一种服务器磁盘故障检测方法及系统、存储介质、电子设备,可以实现以下技术效果:本公开实施例公开了服务器磁盘故障检测方法及系统、存储介质、电子设备,所述方法在通过在服务器监控数据分析出磁盘故障因素,从而筛选出磁盘IO特征数据,同时磁盘故障单,然后将磁盘故障单作为标签的磁盘IO特征数据,作为训练集,训练出能够识别磁盘故障的BP神经网络模型,最后通过BP神经网络模型来检测服务器磁盘的故障状况。因此,本公开实施例能够通过BP神经网络模型来检测服务器磁盘的故障,解决了现有技术中服务器磁盘检测的精准设置阈值难度大从而引起适用性差的问题,从而降低了服务器磁盘检测的难度。
[0019]以上的总体描述和下文中的描述仅是示例性和解释性的,不用于限制本申请。
附图说明
[0020]一个或多个实施例通过与之对应的附图进行示例性说明,这些示例性说明和附图并不构成对实施例的限定,附图中具有相同参考数字标号的元件示为类似的元件,附图不构成比例限制,并且其中:图1是本公开实施例提供的一种服务器磁盘故障检测方法的流程图;图2是本公开实施例提供的另一种服务器磁盘故障检测方法的流程图;图3是本公开实施例提供的另一种服务器磁盘故障检测方法的流程图;图4是本公开实施例中一种磁盘故障诊断的神经网络结构设计示意图;图5是本公开实施例提供的一种服务器磁盘故障检测系统的示意图;图6是本公开实施例提供的一种服务器磁盘故障检测电子设备示意图。
具体实施方式
[0021]为了能够更加详尽地了解本公开实施例的特点与
技术实现思路
,下面结合附图对本公开实施例的实现进行详细阐述,所附附图仅供参考说明之用,并非用来限定本公开实施例。在以下的技术描述中,为方便解释起见,通过多个细节以提供对所披露实施例的充本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种服务器磁盘故障检测方法,其特征在于,所述方法包括:收集磁盘故障单;对磁盘故障单进行预处理;收集服务器监控数据;对服务器监控数据进行聚类分析,获取磁盘故障因素;根据磁盘故障因素,在服务器监控数据中,筛选出磁盘IO特征数据;将磁盘故障单作为标签的磁盘IO特征数据,作为训练集,训练出能够识别磁盘故障的BP神经网络模型;将待测磁盘的IO特征输入BP神经网络模型,来检测磁盘的故障状况。2.根据权利要求1所述的一种服务器磁盘故障检测方法,其特征在于,对服务器监控数据进行聚类分析,获取磁盘故障因素,包括:判断服务器监控数据是否进行相关性分析;在服务器监控数据不需要进行相关性分析的情况下,选取聚类数据列,并使用K

means算法实现聚类;在服务器监控数据需要进行相关性分析的情况下,则判断是否需要结合上架时间,若是则分析机械随上架时间的硬盘故障率变化;若否,则分析机型的总体硬盘故障率。3.根据权利要求1所述的一种服务器磁盘故障检测方法,其特征在于,训练BP神经网络模型,包括:对模型参数进行初始化;求隐藏层、输出层各单元的输出;对训练集计算总体误差;判断损失函数Loss是否满足要求,若否,则继续;若是,则结束;应用链式法则,求损失函数关于每层权值矩阵的梯度;梯度下降算法调整各层的权值和偏置;重新执行求隐藏层、输出层各单元的输出。4.根据权利要求1所述的一种服务器磁盘故障检测方法,其特征在于,收集服务器监控数据,包括:采用时间序列数据库Influxdb存储磁盘监控数据。5.根据权利要求1所述的一种服务器磁盘故障检测方法,其特征在于,收集磁盘故障单,包括:从mysql中获...

【专利技术属性】
技术研发人员:刘爱贵周意贺阮薛平
申请(专利权)人:北京大道云行科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1