一种降低数据中心硬盘故障率制造技术

技术编号:37075090 阅读:11 留言:0更新日期:2023-03-29 19:51
本发明专利技术涉及硬盘技术领域,具体涉及降低数据中心硬盘故障率方法、系统、终端及存储介质。该方法包括获取硬盘故障数据;根据获取的故障数据,判断故障类型,所述故障类型包括扇区损坏和磁头损坏;根据故障类型对硬盘进行修复,其包括:若扇区损坏,则对损坏块扇区进行重新读写,实现自我修复;若磁头损坏,则关闭损坏的磁头,重新格式化硬盘,重新上线使用;以及,当所述扇区损坏未能修复且触发坏块计数阈值和/或所述磁头未能成功关闭时,则对硬盘进行更换。本发明专利技术结合硬盘SMART坏块自动修复和硬盘重生两种技术方案,通过对硬盘坏块故障的重新读写修复和磁头故障的屏蔽,使硬盘重新回复健康状态,实现硬盘的再生。实现硬盘的再生。实现硬盘的再生。

【技术实现步骤摘要】
一种降低数据中心硬盘故障率


[0001]本专利技术涉及硬盘
,尤其涉及降低数据中心硬盘故障率方法、系统、终端及存储介质。

技术介绍

[0002]随着云技术的普及和发展,尤其是5G、物联网、云计算、大数据、人工智能、工业互联网等新基建将带来更大的数据洪流。根据IDC预测,全球年新增数据量2025年将达到175ZB,我们将进入ZB级数据存储时代。
[0003]海量数据存储的需求下,服务器在数据中心的部署也呈现指数级的增长。信息的高安全性和系统的高可靠性越来越成为公司、企业最为关注的事情,而硬盘作为数据存储的主要载体,其稳定性和可靠性也越来越受到重视,因此对于服务器存储最关键的部件之一,必须要确保客户数据的安全性和确保产品的质量。同时,数据中心的运维管理难度越来越大,运维的成本也越来越高,企业也在面临着日益严峻的挑战。
[0004]目前服务器数据中心运维方式主要分为如下两类:
[0005]一、利用服务器带外管理系统BMC对硬盘的监控报警信息和故障记录信息,以及结合操作系统带内日志报警和报错信息,指导运维人员对故障硬盘进行相应处理,再安排专业技术人员对故障进行分析。
[0006]二、除了利用上述BMC带外管理系统和操作系统带内管理系统故障诊断外,还会跟硬盘厂商联合开发专业的故障诊断和预警方案,甚至有些更为专业的数据中心,会结合自身业务需求和解析上千案例,形成准确的故障案例和判断规则,并综合开发云诊断系统,使诊断结果更为科学和可信。最终通过云诊断系统诊断后指导运维人员对故障硬盘进行相应处理,再安排专业技术人员对故障进行。
[0007]针对上述两种数据中心运维方式,无论是传统的只通过带内带外诊断还是更为先进的更为合理的云诊断系统,都只是对故障进行预警分析和诊断,通过诊断结果对存在隐患的硬盘进行持续监控或者直接更换。
[0008]这样对于存在隐患但尚未达到更换条件继续监控的硬盘来说,可能存在随时故障掉盘的风险,像存在少量坏块的硬盘,是可以通过硬盘自修复的方法来让硬盘恢复健康状态。另外对于只是硬盘某个磁头出现故障或降级,但是其它磁头都表现良好的故障类型,同样可以通过硬盘再生技术关闭故障或隐患磁头,使硬盘恢复健康状态。
[0009]因此,当前技术会存在对于隐患硬盘本身可能出现系统报错或掉盘的风险,未完全坏掉硬盘更换也会带来人力成本的增加、硬盘资源的浪费以及处理故障盘费用的增加。

技术实现思路

[0010]为了解决上述现有技术中存在的技术问题,本专利技术提供了一种降低数据中心硬盘故障率方法、系统、终端及存储介质。
[0011]为实现上述目的,本专利技术实施例提供了如下的技术方案:
[0012]第一方面,在本专利技术提供的一个实施例中,提供了降低数据中心硬盘故障率方法,该方法包括以下步骤:
[0013]获取硬盘故障数据;
[0014]根据获取的故障数据,判断故障类型,所述故障类型包括扇区损坏和磁头损坏;
[0015]根据故障类型对硬盘进行修复,其包括:若扇区损坏,则对损坏块扇区进行重新读写,实现自我修复;若磁头损坏,则关闭损坏的磁头,重新格式化硬盘,重新上线使用;
[0016]以及,当所述扇区损坏未能修复且触发坏块计数阈值和/或所述磁头未能成功关闭时,则对硬盘进行更换。
[0017]作为本专利技术的进一步方案,所述获取硬盘故障数据,包括:通过带内工具抓取硬盘的SMART日志,并对Pending Sector计数进行实时获取计数数据和监控硬盘的磁头监控状态获取磁头状态数据。
[0018]作为本专利技术的进一步方案,所述根据获取的故障数据,判断故障类型,所述故障类型包括扇区损坏和磁头损坏,包括:
[0019]若计数数据为非零,则故障类型为扇区损坏;
[0020]读取磁头状态,判断磁头故障是否达到预定的阀值一,若达到则故障类型为磁头损坏。
[0021]作为本专利技术的进一步方案,所述判断磁头故障是否达到预定的阀值一,具体为,将磁头状态与原始磁头状态进行比较,判断磁头故障是否达到预定的阀值一。
[0022]作为本专利技术的进一步方案,所述若扇区损坏,则对损坏块扇区进行重新读写,实现自我修复,其包括:
[0023]若计数数据为非零,调用坏块修复工具,对扇区进行修复;
[0024]所述调用坏块修复工具,包括采用通用sg3命令获取pending sector具体LBA地址,然后对该LBA地址内容进行重新读写的操作。
[0025]作为本专利技术的进一步方案,所述若扇区损坏,则对损坏块扇区进行重新读写,实现自我修复,还包括:
[0026]确认扇区是否修复成功,若修复成功,则继续监控坏块数量;
[0027]若未修复成功,判断是否从触发坏块更换的阀值二,若未超过设定阀值二,则继续监控坏块数量,若超过设定阀值二,则更换对应的硬盘。
[0028]作为本专利技术的进一步方案,所述若磁头损坏,则关闭损坏的磁头,重新格式化硬盘,重新上线使用,还包括:
[0029]格式化硬盘后,对硬盘LBA进行分配;
[0030]判断关闭磁头动作是否成功,若成功,则作为全新硬盘重新上线使用,继续对磁头状态进行监控;
[0031]若磁头修复不成功,发出更换故障硬盘指令。
[0032]第二方面,在本专利技术提供的又一个实施例中,提供了降低数据中心硬盘故障率系统,该系统包括:数据获取单元、判断单元和修复单元;
[0033]所述数据获取单元,用于获取硬盘故障数据;
[0034]所述判断单元,用于根据获取的故障数据,判断故障类型,所述故障类型包括扇区损坏和磁头损坏;
[0035]所述修复单元,用于根据故障类型对硬盘进行修复,其包括:若扇区损坏,则对损坏块扇区进行重新读写,实现自我修复;若磁头损坏,则关闭损坏的磁头,重新格式化硬盘,重新上线使用。
[0036]第三方面,在本专利技术提供的又一个实施例中,提供了一种终端,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器加载并执行所述计算机程序时实现降低数据中心硬盘故障率方法的步骤。
[0037]第四方面,在本专利技术提供的再一个实施例中,提供了一种存储介质,存储有计算机程序,所述计算机程序被处理器加载并执行时实现所述降低数据中心硬盘故障率方法的步骤。
[0038]本专利技术提供的技术方案,具有如下有益效果:
[0039]本专利技术提供的降低数据中心硬盘故障率方法、系统、终端及存储介质,获取硬盘故障数据;根据获取的故障数据,判断故障类型,所述故障类型包括扇区损坏和磁头损坏;根据故障类型对硬盘进行修复,其包括:若扇区损坏,则对损坏块扇区进行重新读写,实现自我修复;若磁头损坏,则关闭损坏的磁头,重新格式化硬盘,重新上线使用。本专利技术结合硬盘SMART坏块自动修复和硬盘重生两种技术方案,通过对硬盘坏块故障的重新读写修复和磁头故障的屏蔽,使硬盘重新回复健康状态,实现硬盘的再生,大大降低了硬盘的故障率,并减少了随之带来的运维和分析人力成本。<本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种降低数据中心硬盘故障率方法,其特征在于,该方法包括:获取硬盘故障数据;根据获取的故障数据,判断故障类型,所述故障类型包括扇区损坏和磁头损坏;根据故障类型对硬盘进行修复,其包括:若扇区损坏,则对损坏块扇区进行重新读写,实现自我修复;若磁头损坏,则关闭损坏的磁头,重新格式化硬盘,重新上线使用;以及,当所述扇区损坏未能修复且触发坏块计数阈值和/或所述磁头未能成功关闭时,则对硬盘进行更换。2.如权利要求1所述的降低数据中心硬盘故障率方法,其特征在于,所述获取硬盘故障数据,包括:通过带内工具抓取硬盘的SMART日志,并对Pending Sector计数进行实时获取计数数据和监控硬盘的磁头监控状态获取磁头状态数据。3.如权利要求1所述的降低数据中心硬盘故障率方法,其特征在于,所述根据获取的故障数据,判断故障类型,所述故障类型包括扇区损坏和磁头损坏,包括:若计数数据为非零,则故障类型为扇区损坏;读取磁头状态,判断磁头故障是否达到预定的阀值一,若达到则故障类型为磁头损坏。4.如权利要求3所述的降低数据中心硬盘故障率方法,其特征在于,所述判断磁头故障是否达到预定的阀值一,具体为,将磁头状态与原始磁头状态进行比较,判断磁头故障是否达到预定的阀值一。5.如权利要求1所述的降低数据中心硬盘故障率方法,其特征在于,所述若扇区损坏,则对损坏块扇区进行重新读写,实现自我修复,其包括:若计数数据为非零,调用坏块修复工具,对扇区进行修复;所述调用坏块修复工具,包括采用通用sg3命令获取pending sector具体LBA地址,然后对该LBA地址内容进行重新读写的操作。6.如权利要...

【专利技术属性】
技术研发人员:刘凤刚
申请(专利权)人:苏州浪潮智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1