RAID存储系统、存储控制器以及RAID阵列巡查方法技术方案

技术编号:17251516 阅读:20 留言:0更新日期:2018-02-11 10:29
本发明专利技术提供RAID存储系统、存储控制器以及RAID阵列巡查方法,以便能够早期地检测RAID阵列中的介质错误。根据实施方式,RAID存储系统具备:包括至少一个RAID阵列的RAID存储装置、和对向上述至少一个RAID阵列的访问进行控制的存储控制器。上述至少一个RAID阵列具有多个条带组。上述存储控制器具备输入输出控制器和巡查控制器。上述输入输出控制器根据来自主机装置的访问请求,执行向上述至少一个RAID阵列内的被请求的条带组的写访问或者读访问。上述巡查控制器对上述多个条带组中的被写访问的条带组比其他条带组优先地进行巡查。

【技术实现步骤摘要】
RAID存储系统、存储控制器以及RAID阵列巡查方法
本专利技术的实施方式涉及RAID存储系统、存储控制器以及RAID阵列巡查(patrol)方法。
技术介绍
以往,公知有一种RAID存储系统。RAID存储系统具备RAID存储装置、和存储控制器。RAID存储装置具备至少一个RAID阵列,该至少一个RAID阵列具有被称为RedundantArraysofIndependentDisks(RAID:磁盘阵列)的结构(RAID结构)。RAID阵列一般使用多个硬盘驱动器(HDD)来构成。存储控制器对向RAID阵列的访问进行控制。存储控制器还进行用于在RAID阵列内的多个HDD的一个发生了故障的情况下,基于其余的HDD内的数据来恢复发生故障的HDD内的数据的动作(所谓的重建(rebuild))。但是,当在其余的HDD的任意一个中因介质错误那样的错误而无法正常地读数据的情况下,存储控制器无法进行重建。即,存储控制器无法将RAID阵列中的RAID结构复原。在这样的情况下,RAID阵列成为至少2个HDD具有故障的多重故障。专利文献【专利文献1】日本特开2003-303057号公报【专利文献2】日本特开2011-164868号公报【专利文献3】国际公开第2009/001413号为了避免上述的多重故障,存储控制器使用读操作来对构成RAID阵列的所有HDD的所有存储区域进行巡查。通过该巡查,存储控制器例如事先检测介质错误。但是,近年来,由于RAID阵列内的HDD的容量增加起来,所以对HDD(RAID阵列)进行巡查所需要的时间也处于大幅增加的趋势。另一方面,伴随着HDD的大容量化,容易引起被称为弱写(Weak-Write)的现象。弱写是指在使用头向HDD的介质(盘)写数据的情况下,由于该头的浮上高度因某些因素而变高,所以该介质上的相应位置的磁化变得不充分的现象。弱写还指由于如上述那样写时的磁化不充分,所以接下来无法通过用于从该位置读数据的读操作来正常地进行读的现象。作为弱写的一个重要因素,可举出介质上的微小的颗粒。即,由于颗粒进入到头与介质之间使得头的浮上高度变高,所以发生弱写。因弱写引起的介质错误能够通过上述巡查进行检测且修复。但是,如果巡查时间伴随着HDD的大容量化而大幅增加,则导致到介质错误被检测出为止的时间也延长。于是,在到介质错误被检测出为止的时间的期间,例如在其他的HDD中发生介质错误而导致RAID阵列成为多重故障的可能性变高。
技术实现思路
本专利技术所要解决的课题在于,提供能够早期检测RAID阵列中的介质错误的RAID存储系统、存储控制器以及RAID阵列巡查方法。根据实施方式,RAID存储系统具备:包括至少一个RAID阵列的RAID存储装置、和对向上述至少一个RAID阵列的访问进行控制的存储控制器。上述至少一个RAID阵列具有多个条带(stripe)组,上述多个条带组的每一个由包括冗余块的多个块的集合构成。上述存储控制器具备输入输出控制器和巡查控制器。上述输入输出控制器根据来自利用上述RAID存储装置的主机装置的访问请求,执行向上述至少一个RAID阵列内的被请求的条带组的写访问或者读访问。上述巡查控制器使用读操作对上述多个条带组中的被写访问的条带组比其他条带组优先地进行巡查。上述巡查控制器根据上述被优先地巡查的条带组的上述巡查的完成,来降低上述被优先地巡查的条带组的作为与上述巡查有关的优先等级的巡查优先等级。附图说明图1是表示包括一个实施方式涉及的RAID存储系统的计算机系统的典型的硬件结构的框图。图2是表示图1所示的RAID存储装置的典型的RAID结构的图。图3是主要表示图1所示的存储控制器的典型的功能结构的框图。图4是表示图3所示的管理表的数据结构例的图。图5是表示在该实施方式中应用的巡查处理的典型的顺序的流程图。图6是表示图5所示的巡查处理中包含的第1巡查处理的典型的顺序的流程图。图7是表示图5所示的巡查处理中包含的第2巡查处理的典型的顺序的流程图。图8是表示图5所示的巡查处理中包含的第3巡查处理的典型的顺序的流程图。图9是表示第1至第3巡查处理的每一个中包含的等待时间重新设定处理的典型的顺序的流程图。图10是表示在该实施方式中应用的中断处理的典型的顺序的流程图。图11是表示在该实施方式的第1以及第2变形例中应用的RAID存储装置的RAID结构的图。图12是表示在第1变形例中应用的管理表的数据结构例的图。图13是表示在第2变形例中应用的管理表的数据结构例的图。【附图标记说明】10…RAID存储系统,11、110…RAID存储装置,12…存储控制器,111~113…RAID阵列,111_1~111_4、112_1~112_4、113_1~113_4…HDD,123…存储器,124…本地HDD,125…CPU,126…巡查控制器,127…等待控制器,128…输入输出控制器,129、1291、1292…管理表。具体实施方式以下,参照附图对实施方式进行说明。图1是表示包括一个实施方式涉及的RAID存储系统的计算机系统的典型的硬件结构的框图。图1所示的计算机系统由RAID存储系统10以及主机计算机(以下称为主机)20构成。即,计算机系统具备单一的主机。但是,计算机系统也可以具备多个主机。主机20是服务器或者客户端个人计算机那样的物理计算机,将RAID存储系统10(更详细而言为RAID存储系统10的RAID存储装置11)利用为自身的外部存储装置。主机20例如经由主机接口总线30与RAID存储系统10(更详细而言为RAID存储系统10的存储控制器12)连接。在本实施方式中,主机接口总线30是光纤信道(FC)。但是,主机接口总线30也可以是如小型计算机系统接口(SCSI)、串行连接SCSI(SAS)、因特网SCSI(iSCSI)、以太网(注册商标)或者串行AT附件(SATA)那样的FC以外的接口总线。另外,主机20也可以经由存储区域网络(SAN)、因特网或者内联网那样的网络与RAID存储系统10连接。RAID存储系统10具备RAID存储装置11和存储控制器12。RAID存储装置11经由存储接口总线13与存储控制器12连接。在本实施方式中,存储接口总线13是光纤信道(FC)。但是,存储接口总线13也可以与主机接口总线30同样是FC以外的接口总线。RAID存储装置11例如包括具有RAID结构的RAID阵列111。RAID阵列111也被称为RAID组,使用多个硬盘驱动器(HDD)、例如4个HDD111_1至111_4的集合而构成。存储控制器12接受从主机20赋予的、使用了逻辑地址的访问(读访问或者写访问)的请求(输入输出请求),执行被请求的访问(输入输出)。在该访问的执行时,存储控制器13使用公知的地址变换表将逻辑地址变换为物理地址。逻辑地址是指包括被虚拟化的存储区域的逻辑单元内的地址。对被虚拟化的存储区域分配RAID存储装置11内的存储区域(物理存储区域)。物理地址表示RAID存储装置11所包含且与逻辑地址建立有对应关系的存储区域的物理位置。存储控制器13基于物理地址来访问RAID存储装置11(更详细而言为RAID存储装置11的RAID阵列111内的条带组(stripgroup))。存储控制器12具备主机接口控制器(以下本文档来自技高网
...
RAID存储系统、存储控制器以及RAID阵列巡查方法

【技术保护点】
一种RAID存储系统,具备:RAID存储装置,包括至少一个RAID阵列,该至少一个RAID阵列具有分别由包括冗余块的多个块的集合构成的多个条带组;以及存储控制器,对向上述至少一个RAID阵列的访问进行控制,上述存储控制器具备:输入输出控制器,根据来自利用上述RAID存储装置的主机装置的访问请求,来执行向上述至少一个RAID阵列内的被请求的条带组的写访问或者读访问;以及巡查控制器,使用读操作,对上述多个条带组中的被写访问的条带组,比其他条带组优先地进行巡查,根据上述被优先地巡查的条带组的上述巡查的完成,来降低上述被优先地巡查的条带组的作为与上述巡查有关的优先等级的巡查优先等级。

【技术特征摘要】
2016.08.01 JP 2016-1512501.一种RAID存储系统,具备:RAID存储装置,包括至少一个RAID阵列,该至少一个RAID阵列具有分别由包括冗余块的多个块的集合构成的多个条带组;以及存储控制器,对向上述至少一个RAID阵列的访问进行控制,上述存储控制器具备:输入输出控制器,根据来自利用上述RAID存储装置的主机装置的访问请求,来执行向上述至少一个RAID阵列内的被请求的条带组的写访问或者读访问;以及巡查控制器,使用读操作,对上述多个条带组中的被写访问的条带组,比其他条带组优先地进行巡查,根据上述被优先地巡查的条带组的上述巡查的完成,来降低上述被优先地巡查的条带组的作为与上述巡查有关的优先等级的巡查优先等级。2.根据权利要求1所述的RAID存储系统,上述巡查控制器,根据向第1条带组的写访问,对上述第1条带组赋予最高的巡查优先等级作为上述巡查优先等级,在对上述第1条带组赋予了上述最高的巡查优先等级的状态下对上述第1条带组进行了巡查的情况下,根据上述第1条带组的上述巡查的完成,将对上述第1条带组赋予的上述巡查优先等级变更为最低的巡查优先等级。3.根据权利要求2所述的RAID存储系统,上述最高的巡查优先等级以及上述最低的巡查优先等级分别是第1优先等级以及第3优先等级,上述巡查控制器,根据向上述第1条带组的读访问,对上述第1条带组赋予比上述第1优先等级低且比上述第3优先等级高的第2优先等级作为上述巡查优先等级,在对上述第1条带组赋予了上述第2优先等级的状态下对上述第1条带组进行了巡查的情况下,根据上述第1条带组的上述巡查的完成将对上述第1条带组赋予的上述巡查优先等级变更为上述第3优先等级,在不存在被赋予了上述第1优先等级的条带组的情况下,对被赋予了上述第2优先等级的条带组进行巡查,在被赋予了上述第1优先等级的条带组以及被赋予了上述第2优先等级的条带组都不存在的情况下,对被赋予了上述第3优先等级的条带组进行巡查。4.根据权利要求3所述的RAID存储系统,上述巡查控制器在对上述第1条带组赋予了上述第3优先等级的状态下对上述第1条带组进行了巡查的情况下,在上述第1条带组的上述巡查的完成后也将对上述第1条带组赋予的上述巡查优先等级维持为上述第3优先等级。5.根据权利要求3或4所述的RAID存储系统,上述巡查控制器,在被赋予了上述第1优先等级的一个以上的第2条带组的巡查的期间对一个以上的第3条带组赋予了上述第1优先等级的情况下,在对上述第2条带组进行了巡查之后且对被赋予了上述第2优先等级的一个以上的第4条带组进行巡查之前,对上述第3条带组进行巡查。6.根据权利要求5所述的RAID存储系统,上述巡查控制器,使用管理信息来管理对上述多个条带组分别赋予的上述巡查优先等级、以及作为与上述多个条带组各自的巡查有关的状态的巡查状态,通过根据向上述多个条带组各自的写访问对上述管理信息进行更新,来设定表示巡查未实施的第1状态作为上述多个条带组各自的上述巡查状态,该第1状态还表示在对上述多个条带组分别赋予了上述第1优先等级的情况下上述多个条带组分别处于巡查的等待状态,通过在开始上述第2条带组的上述巡查之前对上述管理信息进行更新,来将上述第2条带组的上述巡查状态从上述第1状态变更为表示巡查未实施且上述巡查的等待状态被解除的第2状态,基于上述第2以及第3条带组的上述巡查状态是上述第1以及第2状态的哪一个,来识别对上述第2以及第3条带组赋予了上述第1优先等级的时期的不同,与上述第3条带组相比优先对被变更为...

【专利技术属性】
技术研发人员:长谷川知史
申请(专利权)人:株式会社东芝东芝解决方案株式会社
类型:发明
国别省市:日本,JP

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1