一种机械硬盘故障风险评估方法、机械硬盘和存储介质技术

技术编号:36609249 阅读:17 留言:0更新日期:2023-02-08 09:56
本申请实施例公开了一种机械硬盘故障风险评估方法、机械硬盘和存储介质,涉及存储领域,可以在机械硬盘上实现。该方案中,可以获取到机械硬盘局部区域内的故障数据,并根据该局部区域内的故障数据确定该局部区域的故障风险信息,其中局部区域的故障风险信息用于指示该局部区域发生故障的几率,考虑了硬盘的局部故障,可以支持对硬盘的局部区域进行隔离,避免了浪费硬盘中可正常使用区域的存储空间。免了浪费硬盘中可正常使用区域的存储空间。免了浪费硬盘中可正常使用区域的存储空间。

【技术实现步骤摘要】
一种机械硬盘故障风险评估方法、机械硬盘和存储介质


[0001]本申请实施例涉及存储领域,尤其涉及一种机械硬盘故障风险评估方法、机械硬盘和存储介质。

技术介绍

[0002]硬盘故障会造成输入/输出(input/output,I/O)返回慢或超时,超冗余时会导致数据丢失等问题。
[0003]为了延长硬盘使用寿命,降低硬盘更换成本,需要及时预测出硬盘的故障风险,了解到硬盘发生故障的几率。具体的,可以使用自我监测、分析及报告技术(self

monitoring analysis and reporting technology,SMART)、I/O等数据,通过支持向量机(support vector machine,SVM)、随机森林、神经网络等统计和机器学习方法预测硬盘的整盘故障或坏块新增。
[0004]但是当硬盘只是局部故障时,例如机械硬盘(hard disk drive,HDD)的一个磁头或磁道发生故障,但硬盘其他区域仍可正常使用,此时获取到硬盘的整盘发生故障的几率只能评价整个硬盘的故障风险,没有考虑硬盘的局部故障。

技术实现思路

[0005]本申请实施例提供一种机械硬盘故障风险评估方法,用于基于机械硬盘的局部区域生产故障风险信息,可以支持对硬盘的局部区域进行隔离,避免了浪费硬盘中可正常使用区域的存储空间,本申请实施例还提供了相应的机械硬盘和计算机可读存储介质。
[0006]本申请第一方面提供一种机械硬盘故障风险评估方法,包括:获取机械硬盘局部区域内的故障数据;根据局部区域内的故障数据确定局部区域的故障风险信息,局部区域的故障风险信息用于指示局部区域发生故障的几率。
[0007]本申请中,机械硬盘的局部区域是对机械硬盘进行划分得到的,全部的局部区域组成完整的机械硬盘,局部区域的故障数据为该局部区域内存在的故障数据。
[0008]该第一方面,获取到机械硬盘局部区域内的故障数据,就可以根据局部区域内的故障数据确定局部区域的故障风险信息,其中局部区域的故障风险信息用于指示局部区域发生故障的几率,由此得到的故障风险信息考虑了硬盘的局部故障,可以支持对硬盘的局部区域进行隔离,避免了浪费硬盘中可正常使用区域的存储空间。
[0009]在第一方面的一种可能的实现方式中,该方法还包括:当局部区域的故障风险信息所指示的发生故障的几率超出风险线,确定局部区域为机械硬盘的故障区域;对故障区域进行隔离。
[0010]本申请中的风险线可以是用户预先设置好的。
[0011]该种可能的实现方式中,确定故障风险信息所指示的发生故障的几率超出风险线的局部区域,然后对该局部区域进行隔离,即只对故障区域进行隔离,使得未故障的局部区域可以继续使用,避免了浪费硬盘中可正常使用区域的存储空间。
[0012]在第一方面的一种可能的实现方式中,机械硬盘位于存储系统,存储系统包括机械硬盘在内的多块硬盘;多块硬盘构成存储池;存储池包含预留空间;上述步骤对故障区域进行隔离包括:获取故障区域的物理地址;获取物理地址对应在存储池中的逻辑地址;将位于逻辑地址对应的故障区域内的数据搬迁至预留空间。
[0013]本申请中,存储系统包括存储池,存储池由多块硬盘组成,预留空间为存储池中的部分硬盘。
[0014]该种可能的实现方式中,获取到故障区域的物理地址后,可以将物理地址转换为对应的逻辑地址,基于该逻辑地址,可以将故障区域的数据搬迁至预留空间,从而实现隔离,提升了方案的可实现性。
[0015]在第一方面的一种可能的实现方式中,该方法还包括:当预留空间的空间大小小于第一预设值时,从存储池中选择第一硬盘,第一硬盘的故障区域的数量小于第二预设值;其中,第一硬盘是不同于机械硬盘的硬盘;使用第一硬盘的剩余存储空间存储第一硬盘的故障区域中的数据,以释放预留空间中第一硬盘的故障区域占用的空间大小。
[0016]该种可能的实现方式中,当预留空间的空间大小过小时,需要释放预留空间,因此可以从存储池中选择出故障区域最少的第一硬盘,来用第一硬盘修复自身的故障数据,即使用第一硬盘的剩余存储空间存储第一硬盘的故障区域中的数据,从而可以释放出预留空间中第一硬盘的故障区域占用的空间大小,增加了预留空间的空间大小。
[0017]在第一方面的一种可能的实现方式中,上述步骤:获取机械硬盘局部区域内的故障数据包括:获取机械硬盘局部区域内的第一不可修复错误计数UNC;根据局部区域内的故障数据确定局部区域的故障风险信息包括:根据局部区域内的第一UNC的数量确定局部区域的故障风险信息。
[0018]该种可能的实现方式中,将UNC作为故障数据的指标,提升了方案的可实现性。
[0019]在第一方面的一种可能的实现方式中,上述步骤:获取机械硬盘局部区域内的第一不可修复错误计数UNC包括:获取机械硬盘局部区域内的第一UNC以及第一UNC的时空分布数据,时空分布数据包括第一UNC发生的时间以及第一UNC位于机械硬盘中的位置;基于时空分布数据预测和统计出UNC特征;对第一UNC和UNC特征进行选择以得到机械硬盘局部区域内的第二UNC;根据局部区域内的第一UNC的数量确定局部区域的故障风险信息包括:根据局部区域内的第二UNC的数量确定局部区域的故障风险信息。
[0020]该种可能的实现方式中,可以基于UNC的时空分布数据预测和统计出新的UNC特征,构造出新的扩展的特征,然后从新的UNC特征和原本的UNC选择出更具代表性的第二UNC,将第二UNC作为故障数据的指标,提高了故障风险信息风险评估的准确性。
[0021]在第一方面的一种可能的实现方式中,UNC特征包括第一UNC的增速信息,上述步骤:根据局部区域内的第二UNC的数量确定局部区域的故障风险信息包括:根据局部区域内的第二UNC的数量和第一UNC的增速信息确定局部区域的故障风险信息。
[0022]本申请中,第一UNC的增速信息为第一UNC在预设时间段内增加的速度信息。
[0023]该种可能的实现方式中,将第二UNC和第一UNC的增速信息一起作为故障数据的指标,进一步提高了故障风险信息风险评估的准确性。
[0024]在第一方面的一种可能的实现方式中,局部区域包括机械硬盘的磁头或磁道。
[0025]该种可能的实现方式中,对机械硬盘划分的局部区域可以为机械硬盘的一个磁
头,也可以为机械硬盘的一个磁道,提升了方案的可实现性。
[0026]在第一方面的一种可能的实现方式中,上述步骤:获取机械硬盘局部区域内的故障数据包括:获取机械硬盘的整盘维度数据;基于整盘维度数据统计出整盘维度特征;基于整盘维度数据和整盘维度特征确定局部区域的故障数据。
[0027]该种可能的实现方式中,机械硬盘的整盘维度数据为机械硬盘的整个盘维度的数据,机械硬盘自身可以统计和记录整盘数据,然后基于整盘维度数据还可以进一步统计和扩展出整盘维度特征,然后对整盘维度数据和整盘维度特征进行选择,从而确定局部区域的故障数据,提升了方案的可实现本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种机械硬盘故障风险评估方法,其特征在于,包括:获取机械硬盘局部区域内的故障数据;根据所述局部区域内的故障数据确定所述局部区域的故障风险信息,所述局部区域的故障风险信息用于指示所述局部区域发生故障的几率。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:当所述局部区域的故障风险信息所指示的发生故障的几率超出风险线,确定所述局部区域为所述机械硬盘的故障区域;对所述故障区域进行隔离。3.根据权利要求2所述的方法,其特征在于,所述机械硬盘位于存储系统,所述存储系统包括所述机械硬盘在内的多块硬盘;所述多块硬盘构成存储池;所述存储池包含预留空间;所述对所述故障区域进行隔离包括:获取所述故障区域的物理地址;获取所述物理地址对应在所述存储池中的逻辑地址;将位于所述逻辑地址对应的所述故障区域内的数据搬迁至所述预留空间。4.根据权利要求3所述的方法,其特征在于,所述方法还包括:当所述预留空间的空间大小小于第一预设值时,从所述存储池中选择第一硬盘,所述第一硬盘的故障区域的数量小于第二预设值;其中,所述第一硬盘是不同于所述机械硬盘的硬盘;使用所述第一硬盘的剩余存储空间存储所述第一硬盘的故障区域中的数据,以释放所述预留空间中所述第一硬盘的故障区域占用的空间大小。5.根据权利要求1

4中任一项所述的方法,其特征在于,所述获取机械硬盘局部区域内的故障数据包括:获取所述机械硬盘局部区域内的第一不可修复错误计数UNC;所述根据所述局部区域内的故障数据确定所述局部区域的故障风险信息包括:根据所述局部区域内的第一UNC的数量确定所述局部区域的故障风险信息。6.根据权利要求5所述的方法,其特征在于,所述获取所述机械硬盘局部区域内的第一不可修复错误计数UNC包括:获取所述机械硬盘局部区域内的所述第一UNC以及所述第一UNC的时空分布数据,所述时空分布数据包括所述第一UNC发生的时间以及所述第一UNC位于所述机械硬盘中的位置;基于所述时空分布数据预测和统计出UNC特征;对所述第一UNC和所述UNC特征进行选择以得到所述机械硬盘局部区域内的第二UNC;所述根据所述局部区域内的第一UNC的数量确定所述局部区域的故障风险信息包括:根据所述局部区域内的第二UNC的数量确定所述局部区域的故障风险信息。7.根据权利要求6所述的方法,其特征在于,所述UNC特征包括所述第一UNC的增速信息,所述根据所述局部区域内的第二UNC的数量确定所述局部区域的故障风险信息包括:根据所述局部区域内的第二UNC的数量和所述第一UNC的增速信息确定所述局部区域的故障风险信息。8.根据权利要求1

4、6或7中任一项所述的方法,其特征在于,所述局部区域包括所述机械硬盘的磁头或磁道。
9.一种机械硬盘,其特征在于,包括:获取单元,用于获取机械硬盘局部区域内的故障数据;第一...

【专利技术属性】
技术研发人员:刘冬实杨其锦张箭乔光毅胡崝
申请(专利权)人:华为技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1