本公开提供了一种包括磁盘驱动阵列以及可通信地联接至磁盘驱动阵列的控制器的系统。控制器用于在磁盘驱动阵列内识别预测性故障磁盘。控制器也在再生模式下在备用驱动上重建预测性故障磁盘的数据并且确定再生时间基线。控制器也在复制模式下在备用驱动上重建预测性故障磁盘的数据并且确定复制模式执行时间。如果复制模式执行时间大于再生时间基线则控制器切换至再生模式。
【技术实现步骤摘要】
【国外来华专利技术】【专利说明】
技术介绍
独立磁盘的冗余阵列(RAID)是通过存储具有冗余的数据而控制多个磁盘驱动并且提供容错(fau 11 to 1 erance)的存储技术。访问存储在磁盘驱动中数据的故障将使得阵列控制器使磁盘驱动发生故障并且启动从RAID中的其他磁盘驱动再生丢失的数据的重建进程。在该重建进程期间,RAID处于退化状态并且可以不是容错性的,这取决于所使用的特定RAID配置。如果发生另一故障,则来自故障磁盘驱动的整批数据可以丢失。【附图说明】参照附图在以下详细描述中描述了某些示例性实施例,其中:图1是独立磁盘冗余阵列(RAID)系统的框图;图2是重建预测性故障磁盘驱动的方法的进程流程图;图3是示出了根据图2的方法200所执行的具体重建进程的示例的时间线;以及图4是示出了存储了被配置为重建预测性故障磁盘驱动的代码的有形、非暂时性、计算机可读介质的框图。【具体实施方式】本公开涉及用于被预测为将要故障的RAID的磁盘重建磁盘驱动数据的技术。预测性备用重建(PSR:Predictive Spare Rebuild)是这样的进程:阵列控制器通过该进程识别被预测为将要故障的数据磁盘并且该进程在真实故障之前为其激活备用磁盘。通过直接地从预测性故障磁盘复制数据或者从阵列中的其他磁盘再生数据而在备用磁盘上重建关于预测性故障磁盘的主机数据。一旦备用重建操作完成,预测性故障磁盘被识别为已故障,因此其可以由客户替换。通过积极主动地替换被预测为将要故障的磁盘,可以避免RAID阵列的退化和潜在的数据丢失。实施预测性备用重建的一种方式是从预测性故障磁盘复制主机数据并且仅在遇到不可纠正的读取错误时再生数据。然而,在一些情形中,预测性故障磁盘可以处于退化工作状态,并且因此可以缓慢地处理数据操作请求。在这些情况下,从预测性故障磁盘复制主机数据可以比从已有的良好数据磁盘再生主机数据花费更长时间,这导致低效的预测性备用重建。此外,在重建期间,主机(输入/输出)1/0将均写入至备用和预测性故障磁盘两者。因此,重建中的任何时间损失导致对以次优条件执行的磁盘的不必要的写入工作量。差的I/O工作量性能全局地影响存储阵列并且对整体系统性能产生负面影响。本公开描述了可以通过实施重建性能监控工具而加速的预测性故障磁盘的重建的技术。性能算法通过基于每个模式的相对性能而在复制模式与再生模式之间切换而优化重建时间。结果是,可以更快地完成预测性备用重建。图1是独立磁盘冗余阵列(RAID)系统的框图。RAID系统100可以包括被配置为操作磁盘驱动器阵列104的阵列的控制器102 AAID系统还可以包括主机计算机106,其可以通过阵列控制器102访问磁盘驱动器阵列104。每个磁盘驱动器110被配置为在一个或多个部分116或盘片(platter)上存储从主机106接收到的数据。阵列控制器102可以包括被配置为如果检测到故障条件则重建磁盘驱动数据的数据重建引擎108。数据重建引擎108可以以硬件或者硬件与编程代码的组合而实施。例如,重建引擎108可以包括用于存储指令的非暂时性计算机可读介质、用于执行指令的一个或多个处理器、或者其组合。在一些实施例中,检测到的故障条件是预测的故障,其中磁盘驱动仍然是可操作的,但是基于各种可靠性的指示器而被预测为将要在不久的未来故障。各种自动监控系统可以用于预测磁盘驱动的故障。这种监控系统可以称作自我监控、分析及报告技术^^.1?.1'.)。如在此所使用,例如,术语“预测性故障磁盘”是指由诸如3.1^.1?.1'.系统的监控系统预测为将要故障的磁盘驱动。监控系统可以在阵列控制器102中实施。如果监控系统检测到故障条件,则监控系统可以触发预测性备用重建,其是在备用磁盘驱动上重新创建关于预测故障磁盘的数据的进程。磁盘阵列104的RAID级别可以是任何合适的RAID级别,其可以基于特定实施方式的设计考虑而确定,诸如期望的冗余级别和性能特性。例如,磁盘阵列104可以配置作为RAID级别0、1、2、3、4、5或6。磁盘阵列104可以包括许多磁盘驱动110。磁盘阵列104还可以包括如果检测到故障条件则可以被激活的备用驱动112。在一些实施例中,磁盘阵列104还包括奇偶校验(parity)驱动114。奇偶校验驱动114可以包含如果原始数据毁坏或不可访问则可以用于再生预测性故障磁盘的数据的数据或逻辑。奇偶校验驱动114中的数据可以基于保留在磁盘驱动110上的现有数据而重新创建丢失的数据。在一些实施例中,奇偶校验驱动114包含多个部分118,其中每个部分118对应于其各自的磁盘驱动部分116。在一些实施例中,驱动阵列114可以不包括专用的奇偶校验驱动114,而是奇偶校验部分118分布在磁盘驱动116之中。在一些实施例中,驱动阵列104可以具有多于一个的奇偶校验驱动114。在一些实施例中,驱动阵列104不包括奇偶校验驱动114。取决于RAID配置,数据分条(striping)可以用于将主机数据存储至磁盘驱动阵列104。在数据分条中,诸如文件的逻辑有序的数据被分段并且存储在不同的磁盘驱动110或者磁盘驱动110的不同部分116上。被称作“数据条(stripe)”的数据分段可以均是相同的固定大小,其可以由用户指定。在将数据从预测性故障磁盘重建至备用驱动上期间,数据以被称作重建数据条操作的增量而在备用驱动上被重现创建。每个重建数据条操作在备用驱动上重建单个数据条的数据。数据重建引擎可以使用用于在备用驱动112上重建预测性故障磁盘的数据的任何合适的技术。在数据的重建期间,数据重建引擎108可以在再生模式和复制模式之间切换。在复制模式下,数据从预测性故障磁盘被直接复制并且被存储至备用驱动112。在一些实施例中,阵列控制器102使用小型计算机系统接口(SCSI)命令以从预测性故障磁盘请求数据并且将数据存储至备用磁盘112。在再生模式下,数据重建引擎108使用在其他磁盘驱动110上的冗余数据而重建数据,在一些实施例中包括奇偶校验驱动114。如在此使用的,术语“再生”或“再生模式”是指用于未使用预测性故障磁盘而重建预测性故障磁盘的数据的任何技术。数据重建引擎108还可以包括重建监控工具120和模式选择器122。重建监控工具120监控在再生模式期间和在复制模式期间所实现的性能。例如,重建监控工具120可以监控并记录其利用数据再生而重建一部分预测性故障驱动所花费的时间量以及其利用直接复制而重建一部分预测性故障驱动所花费的时间量。在一些实施例中,可以通过测量重建数据条操作的执行时间而监控每个模式的相对性能。两种技术的相对性能用于确定哪个模式用于重新创建预测性故障磁盘的数据。模式选择器122指示数据重建引擎108在再生模式或复制模式下操作,这取决于如由重建监控工具120所报告的两种模式的相对性能。例如,如果数据的再生比直接复制更快地被完成,则模式选择器122可以指示数据重建引擎108SP便所再生的数据在预测性故障磁盘上仍然可以是可访问的也使用再生模式。图2是重建预测性故障磁盘驱动的方法的进程流程图。方法200可以例如由图1中所示的阵列控制器102的数据重建引擎108而执行。在方框202处,阵列控制器102检测磁盘驱动的预测性故障。如上所述,例如可以由分析磁盘驱动的各个本文档来自技高网...
【技术保护点】
一种系统,包括:磁盘驱动的阵列;以及控制器,可通信地联接至所述磁盘驱动的阵列,所述控制器用于:在所述磁盘驱动的阵列内,识别预测性故障磁盘;在再生模式下在备用驱动上重建所述预测性故障磁盘的数据并且确定再生时间基线;在复制模式下在所述备用驱动上重建所述预测性故障磁盘的数据并且确定复制模式执行时间;以及如果所述复制模式执行时间大于所述再生时间基线,则切换至再生模式。
【技术特征摘要】
【国外来华专利技术】
【专利技术属性】
技术研发人员:沙伦·J·查德韦尔,
申请(专利权)人:惠普发展公司,有限责任合伙企业,
类型:发明
国别省市:美国;US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。