一种实现存储设备自我修复的装置及方法制造方法及图纸

技术编号:38641745 阅读:12 留言:0更新日期:2023-08-31 18:34
本发明专利技术提出了一种实现存储设备自我修复的装置,包括:存储设备、外部供电模块、存储设备控制器,所述存储设备控制器与存储设备通信连接,用于获取存储设备的报错信息,响应于存储设备停止运行后,向报错存储设备发送自我修复指令;所述存储设备与外部供电模块通信连接,用于通过将存储设备接口的预留引脚定义为外部供电模块的控制引脚,在接收到存储设备控制器的修复指令后,通过控制外部供电模块对存储设备进行上电或下电,实现报错存储设备的自我修复,本发明专利技术还提出了一种实现存储设备自我修复的方法,有效解决由于现有技术造成存储设备出错修复费时费力、影响业务长时间运行的问题,实现存储设备快速、可靠地自我修复,能够大大降低人工维修存储设备数量。减少维修费用,减少存储设备浪费数量。减少存储设备浪费数量。减少存储设备浪费数量。

【技术实现步骤摘要】
一种实现存储设备自我修复的装置及方法


[0001]本专利技术涉及存储设备领域,尤其是涉及一种实现存储设备自我修复的装置及方法。

技术介绍

[0002]随着云计算持续发展,为了满足人们将更多的数据上传到云端,存储型服务器需求日益增加,而存储服务器的存储设备密度越来越高,往往一台服务器中会同时安装几十个,上百个存储设备,这种称谓高密度存储服务器。经过行业统计,高密度存储服务器在长时间的运转后出现故障最多的部件是存储设备(例如,硬盘),而且很大一部分存储设备重复安装后,存储设备问题会消失,存储设备功能和性能保持原样,这种存储设备往往可以继续使用。
[0003]当前绝大部分的存储设备维修都是需要人工去机器现场更换存储设备操作做到存储设备完全维修完毕,但现在服务器种类繁多,有的存储服务器有多种形态,有的存储设备安装在服务器的前窗和后窗,人工维修时只需要从前窗或者后窗拔出即可,有的存储设备安装在服务器内部,人工维修时需要断电拆开机器维修。有的存储设备使用存储设备框,更换存储设备时需要将存储设备框拉出更换。有些服务器是浸没在液体中的液冷服务器,液冷服务器中在做设备维修时,不能人为将手深入到液体中,只能将机器拖出液冷机柜。维修人员需要克服上述问题去现场更换存储设备。
[0004]但是,现有的业界统计,绝大部分的存储设备并没有完全损坏,有可能是本身存储设备启动异常导致,也有可能是存储设备与主设备互相通讯出现交换异常导致,这些问题往往通过存储设备重新上下电,或者存储设备重新插拔就能解决。
[0005]相关解决方案,一种是存储设备出现故障时,维修人员将服务器下电,找出问题存储设备后,将存储设备更换为新存储设备,新存储设备运行正常后,维修完毕,故障存储设备寄回厂家分析。但是,一块存储设备故障,需要人为去现场下电整个服务器,更换存储设备,同时此机器对应的业务需要暂停,此种维修方式既需要人工操作,耗费一块存储设备,同时又长时间影响了业务。
[0006]另外一种是,远程控制整个服务器下电,所有设备包括存储设备重新启动,重新工作,确认所有存储设备及其他设备运行正常后,维修完毕。此种方法虽然能够避免现场操作机器,节省了现场维修费用,但是此种方法需要下电所有设备,如果此服务器有业务运行,需要暂停业务,影响业务运行。
[0007]即相关解决方案费时费力,更有可能会影响整机的业务长时间运行,不利于存储设备快速、可靠地自我修复。

技术实现思路

[0008]本专利技术为了解决现有技术中存在的问题,创新提出了一种实现存储设备自我修复的装置及方法,有效解决由于现有技术造成存储设备出错修复费时费力、影响业务长时间
运行的问题,实现存储设备快速、可靠地自我修复。
[0009]本专利技术第一方面提供了一种实现存储设备自我修复的装置,包括:存储设备、外部供电模块、存储设备控制器,所述存储设备控制器与存储设备通信连接,用于获取存储设备的报错信息,响应于存储设备停止运行后,向报错存储设备发送自我修复指令;所述存储设备与外部供电模块通信连接,用于通过将存储设备接口的预留引脚定义为外部供电模块的控制引脚,在接收到存储设备控制器的修复指令后,通过控制外部供电模块对存储设备进行上电或下电,实现报错存储设备的自我修复。
[0010]可选地,所述外部供电模块包括第一供电模块以及第二供电模块,所述第一供电模块与第二供电模块并联,且第一供电模块的输出电压与第二供电模块的输出电压不同。
[0011]进一步地,所述第一供电模块的输出电压为5V,所述第二供电模块的输出电压为12V。
[0012]可选地,所述存储设备控制器获取存储设备的报错信息后,将存储设备的报错信息上传给操作系统做报错记录,使得操作系统暂停报错存储设备的业务运行;响应于存储设备停止运行后,向报错存储设备发送自我修复指令。
[0013]进一步地,所述存储设备包括控制芯片,所述控制芯片的控制输出端与存储设备的预留引脚通信连接,用于控制外部供电模块的上电或下电;所述控制芯片的控制输入端与存储设备控制器的输入端通信连接,用于将自身存储设备的报错信息发送至存储设备控制器,并接收存储设备控制器的自我修复指令。
[0014]进一步地,当报错存储设备接收到自我修复指令后,存储设备中的控制芯片将预留引脚控制为高电平,从而使外部供电模块停止对报错存储设备供电;当报错存储设备供电消失后,报错存储设备内的控制芯片停止工作,预留引脚重新恢复为低电平,外部供电模块恢复对报错存储设备供电;报错存储设备重新启动,与存储设备控制器重新连接开始工作。
[0015]可选地,所述报错存储设备内控制芯片将上一次接收到存储设备自我修复命令做记录,保留自我修复信息,并对预留引脚的控制释放,不再控制。
[0016]可选地,所述存储设备的预留引脚通过开关模块与外部供电模块的使能控制端通信连接,实现对存储设备的上电或下电控制。
[0017]进一步地,所述开关模块包括稳压子模块、电源子模块、MOS管,所述MOS管的栅极一路与存储设备的预留引脚通信连接,另一路连接稳压子模块的输入端通信连接;所述MOS管的漏极通过上拉电阻与电源子模块通信连接;所述MOS管的源极一路接地,另一路与稳压子模块的输出端通信连接;所述稳压子模块包括第一稳压二极管以及第二稳压二极管,所述第一稳压二极管的阳极一路与MOS管的栅极通信连接,另一路连接存储设备的预留引脚;所述第一稳压二极管的阴极与第二稳压二极管的阴极通信连接,所述第二稳压管的阳极一路与MOS管的源极通信连接,另一路接地。
[0018]本专利技术第二方面提供了一种实现存储设备自我修复的方法,基于本专利技术第一方面所述的一种实现存储设备自我修复的装置的基础上实现的,包括:
[0019]存储设备控制器获取存储设备的报错信息,响应于存储设备停止运行后,向报错存储设备发送自我修复指令;
[0020]存储设备通过将存储设备接口的预留引脚定义为外部供电模块的控制引脚,在接
收到存储设备控制器的修复指令后,通过控制外部供电模块对存储设备进行上电或下电,实现报错存储设备的自我修复。
[0021]本专利技术采用的技术方案包括以下技术效果:
[0022]1、本专利技术技术方案中所述存储设备控制器与存储设备通信连接,用于获取存储设备的报错信息,响应于存储设备停止运行后,向报错存储设备发送自我修复指令;所述存储设备与外部供电模块通信连接,用于通过将存储设备接口的预留引脚定义为外部供电模块的控制引脚,在接收到存储设备控制器的修复指令后,通过控制外部供电模块对存储设备进行上电或下电,实现报错存储设备的自我修复,有效解决由于现有技术造成存储设备出错修复费时费力、影响业务长时间运行的问题,实现存储设备快速、可靠地自我修复,能够大大降低人工维修存储设备数量。减少维修费用,减少存储设备浪费数量。
[0023]2、本专利技术技术方案中通过存储设备自身预留引脚进行重定义,作为外部供电模块的控制引脚,能够保证存储设备的重启完全依靠自己,不需要外部的管理模块(例如CPLD本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种实现存储设备自我修复的装置,其特征是,包括:存储设备、外部供电模块、存储设备控制器,所述存储设备控制器与存储设备通信连接,用于获取存储设备的报错信息,响应于存储设备停止运行后,向报错存储设备发送自我修复指令;所述存储设备与外部供电模块通信连接,用于通过将存储设备接口的预留引脚定义为外部供电模块的控制引脚,在接收到存储设备控制器的修复指令后,通过控制外部供电模块对存储设备进行上电或下电,实现报错存储设备的自我修复。2.根据权利要求1所述的一种实现存储设备自我修复的装置,其特征是,所述外部供电模块包括第一供电模块以及第二供电模块,所述第一供电模块与第二供电模块并联,且第一供电模块的输出电压与第二供电模块的输出电压不同。3.根据权利要求2所述的一种实现存储设备自我修复的装置,其特征是,所述第一供电模块的输出电压为5V,所述第二供电模块的输出电压为12V。4.根据权利要求1所述的一种实现存储设备自我修复的装置,其特征是,所述存储设备控制器获取存储设备的报错信息后,将存储设备的报错信息上传给操作系统做报错记录,使得操作系统暂停报错存储设备的业务运行;响应于存储设备停止运行后,向报错存储设备发送自我修复指令。5.根据权利要求4所述的一种实现存储设备自我修复的装置,其特征是,所述存储设备包括控制芯片,所述控制芯片的控制输出端与存储设备的预留引脚通信连接,用于控制外部供电模块的上电或下电;所述控制芯片的控制输入端与存储设备控制器的输入端通信连接,用于将自身存储设备的报错信息发送至存储设备控制器,并接收存储设备控制器的自我修复指令。6.根据权利要求4所述的一种实现存储设备自我修复的装置,其特征是,当报错存储设备接收到自我修复指令后,存储设备中的控制芯片将预留引脚控制为高电平,从而使外部供电模块停止对报错存储设备供电;当报错存储设备供电...

【专利技术属性】
技术研发人员:唐传贞
申请(专利权)人:苏州浪潮智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1