System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种固态硬盘管理方法、装置、设备、介质及产品制造方法及图纸_技高网

一种固态硬盘管理方法、装置、设备、介质及产品制造方法及图纸

技术编号:44793225 阅读:3 留言:0更新日期:2025-03-28 19:46
本发明专利技术公开了一种固态硬盘管理方法、装置、设备、介质及产品,应用于存储技术领域,用于解决传统技术中难以实现及时准确地固态硬盘异常检测导致数据丢失的问题,方法应用于部署有服务层和存储层的分布式存储系统,存储层部署有多个对象存储设备,每一对象存储设备部署有多个固态硬盘,包括:对服务层进行监控以确定其是否存在异常;若存在异常,则在存储层确定异常固态硬盘和固态硬盘异常类型;固态硬盘异常类型包括硬盘自身异常和/或硬盘寿命到期;当固态硬盘异常类型为硬盘自身异常时,利用预设故障检测策略对异常固态硬盘进行故障检测,获得故障检测结果;利用固态硬盘异常类型和故障检测结果确定目标保护策略以对异常固态硬盘进行冗余保护。

【技术实现步骤摘要】

本专利技术涉及存储,特别涉及一种固态硬盘管理方法,还涉及一种固态硬盘管理装置、电子设备、非易失性存储介质以及计算机程序产品。


技术介绍

1、目前,一块固态硬盘(ssd,solid state disk)通常会部署多个osd服务的db(database,数据库分区)分区,若ssd盘发生故障,会同时导致多个osd发生故障,其影响程度要远大于普通磁盘发生故障。

2、相关技术中,当存储系统中出现短时间内的连续ssd盘故障,或在临近超故障域场景下出现ssd故障时,由于故障的osd数量较多,因此若集群存储池本身的数据水位不低,则所有故障的osd上的数据均需要重构,重构的数据量较大。若先发生故障的一批osd上的数据并未重构完成,后发生故障的ssd盘相当于是在存储池数据冗余度已经降低的场景下发生了叠加故障,会使得数据的冗余度发生进一步的下降,该场景会导致存储数据丢失的风险快速增大,甚至可能直接导致系统超故障域并造成数据丢失。针对该场景,目前常见的方案通常是定时检测系统的磁盘状态和数据冗余状态,在检测到磁盘异常时对系统健康状况进行告警。但这种方案对磁盘检测的精确度和工作人员的处理及时程度都有很高的要求,如果不能及时识别到磁盘故障并及时处理,则依然无法避免数据丢失问题。

3、因此,如何及时且准确地识别到固态硬盘的健康状态,以便于实现快速高效地故障盘的冗余保护,避免数据丢失问题是本领域技术人员亟待解决的问题。


技术实现思路

1、本专利技术的目的是提供一种固态硬盘管理方法,该固态硬盘管理方法可以及时且准确地识别到固态硬盘的健康状态,有助于实现快速高效地故障盘的冗余保护,有效地避免了数据丢失问题;本专利技术的另一目的是提供一种固态硬盘管理装置、电子设备、非易失性存储介质以及计算机程序产品,均具有上述有益效果。

2、第一方面,本专利技术提供了一种固态硬盘管理方法,应用于分布式存储系统,所述分布式存储系统包括服务层和存储层,所述存储层部署有多个对象存储设备,每一所述对象存储设备部署有多个固态硬盘,所述方法包括:

3、对所述分布式存储系统中的所述服务层进行监控,以确定所述服务层是否存在异常;

4、当所述服务层存在异常时,在所述存储层确定异常固态硬盘和固态硬盘异常类型;所述固态硬盘异常类型包括硬盘自身异常和/或硬盘寿命到期;

5、当所述固态硬盘异常类型为所述硬盘自身异常时,利用预设故障检测策略对所述异常固态硬盘进行故障检测,获得故障检测结果;

6、利用所述固态硬盘异常类型和所述故障检测结果确定目标保护策略,并利用所述目标保护策略对所述异常固态硬盘进行冗余保护。

7、其中,对所述分布式存储系统中的所述服务层进行监控,以确定所述服务层是否存在异常,包括:

8、对所述分布式存储系统中所述服务层的对象存储设备读写流程进行监控,以确定是否监控到输入输出堵塞事件;

9、若监控到所述输入输出堵塞事件,则确定所述服务层存在异常;

10、若未监控到所述输入输出堵塞事件,则确定所述服务层不存在异常。

11、其中,对所述分布式存储系统中的所述服务层进行监控,以确定所述服务层是否存在异常,包括:

12、对所述分布式存储系统中所述服务层的对象存储设备读写流程进行监控,以确定是否监控到错误码;

13、若未监控到所述错误码,则确定所述服务层存在异常;

14、若监控到所述错误码,则根据所述错误码确定异常磁盘分区;

15、若所述异常磁盘分区所属的存储介质为固态硬盘,则确定所述服务层存在异常;

16、若所述异常磁盘分区所属的存储介质不为固态硬盘,则确定所述服务层不存在异常。

17、其中,对所述分布式存储系统中的所述服务层进行监控,以确定所述服务层是否存在异常,包括:

18、对所述分布式存储系统中所述服务层的对象存储设备启动流程进行监控,以确定是否监控到挂载失败事件;其中,所述挂载失败事件包括磁盘分区挂载失败事件和/或文件系统挂载失败事件;

19、若监控到所述挂载失败事件,则确定所述服务层存在异常;

20、若未监控到所述挂载失败事件,则确定所述服务层不存在异常。

21、其中,对所述分布式存储系统中的所述服务层进行监控,以确定所述服务层是否存在异常,包括:

22、对所述分布式存储系统中所述服务层的对象存储设备启动流程和/或对象存储设备读写流程进行监控,以确定是否监控到硬盘移除事件;

23、若监控到所述硬盘移除事件,则确定所述服务层存在异常;

24、若未监控到所述硬盘移除事件,则确定所述服务层不存在异常。

25、其中,对所述分布式存储系统中的所述服务层进行监控,以确定所述服务层是否存在异常,包括:

26、对所述分布式存储系统中所述服务层的对象存储设备启动流程和/或对象存储设备读写流程进行监控,以确定是否监控到硬盘寿命到期信号;

27、若监控到所述硬盘寿命到期信号,则确定所述服务层存在异常;

28、若未监控到所述硬盘寿命到期信号,则确定所述服务层不存在异常。

29、其中,利用预设故障检测策略对所述异常固态硬盘进行故障检测,获得故障检测结果,包括:

30、对所述异常固态硬盘进行参数采集,获得硬盘参数;其中,所述硬盘参数包括上电时间、磨损度、数据写入量中的一种或多种的组合;

31、若所有所述硬盘参数均不超出对应的参数阈值,则确定所述故障检测结果为所述异常固态硬盘不存在故障;

32、若任一所述硬盘参数超出对应的参数阈值,则确定所述故障检测结果为所述异常固态硬盘存在故障

33、其中,利用预设故障检测策略对所述异常固态硬盘进行故障检测,获得故障检测结果,包括:

34、在系统日志中获取所述异常固态硬盘对应的硬盘日志;

35、若所述硬盘日志中不存在硬盘报错日志,则确定所述故障检测结果为所述异常固态硬盘不存在故障;

36、若所述硬盘日志中存在所述硬盘报错日志,则确定所述故障检测结果为所述异常固态硬盘存在故障。

37、其中,利用预设故障检测策略对所述异常固态硬盘进行故障检测,获得故障检测结果,包括:

38、判断是否接收到关于所述异常固态硬盘的异常报错信息;

39、若未接收关于所述异常固态硬盘的异常报错信息,则确定所述故障检测结果为所述异常固态硬盘不存在故障;

40、若接收到关于所述异常固态硬盘的异常报错信息,则确定所述故障检测结果为所述异常固态硬盘存在故障。

41、其中,所述固态硬盘管理方法还包括:

42、当所述故障检测结果为所述异常固态硬盘存在故障时,确定所述异常固态硬盘所属的故障对象存储设备;

43、控制所述故障对象存储设备停止运行。

44、其中,利用所述固态硬盘异常类型和所述故障检测本文档来自技高网...

【技术保护点】

1.一种固态硬盘管理方法,其特征在于,应用于分布式存储系统,所述分布式存储系统包括服务层和存储层,所述存储层部署有多个对象存储设备,每一所述对象存储设备部署有多个固态硬盘,所述方法包括:

2.根据权利要求1所述的固态硬盘管理方法,其特征在于,对所述分布式存储系统中的所述服务层进行监控,以确定所述服务层是否存在异常,包括:

3.根据权利要求1所述的固态硬盘管理方法,其特征在于,对所述分布式存储系统中的所述服务层进行监控,以确定所述服务层是否存在异常,包括:

4.根据权利要求1所述的固态硬盘管理方法,其特征在于,对所述分布式存储系统中的所述服务层进行监控,以确定所述服务层是否存在异常,包括:

5.根据权利要求1所述的固态硬盘管理方法,其特征在于,对所述分布式存储系统中的所述服务层进行监控,以确定所述服务层是否存在异常,包括:

6.根据权利要求1所述的固态硬盘管理方法,其特征在于,对所述分布式存储系统中的所述服务层进行监控,以确定所述服务层是否存在异常,包括:

7.根据权利要求1所述的固态硬盘管理方法,其特征在于,利用预设故障检测策略对所述异常固态硬盘进行故障检测,获得故障检测结果,包括:

8.根据权利要求1所述的固态硬盘管理方法,其特征在于,利用预设故障检测策略对所述异常固态硬盘进行故障检测,获得故障检测结果,包括:

9.根据权利要求1所述的固态硬盘管理方法,其特征在于,利用预设故障检测策略对所述异常固态硬盘进行故障检测,获得故障检测结果,包括:

10.根据权利要求1所述的固态硬盘管理方法,其特征在于,还包括:

11.根据权利要求1至10任一项所述的固态硬盘管理方法,其特征在于,利用所述固态硬盘异常类型和所述故障检测结果确定目标保护策略,并利用所述目标保护策略对所述异常固态硬盘进行冗余保护,包括:

12.根据权利要求11所述的固态硬盘管理方法,其特征在于,根据所述固态硬盘异常类型和所述故障检测结果确定所述异常固态硬盘对应的异常场景,包括:

13.根据权利要求11所述的固态硬盘管理方法,其特征在于,根据所述固态硬盘异常类型和所述故障检测结果确定所述异常固态硬盘对应的异常场景,包括:

14.根据权利要求11所述的固态硬盘管理方法,其特征在于,当所述异常场景为所述短时间内硬盘连续故障场景时,利用所述目标保护策略对所述异常固态硬盘进行冗余保护,包括:

15.根据权利要求11所述的固态硬盘管理方法,其特征在于,当所述异常场景为所述临近超故障域状态下硬盘到期场景时,利用所述目标保护策略对所述异常固态硬盘进行冗余保护,包括:

16.根据权利要求11所述的固态硬盘管理方法,其特征在于,根据所述固态硬盘异常类型和所述故障检测结果确定所述异常固态硬盘对应的异常场景,包括:

17.一种固态硬盘管理装置,其特征在于,应用于分布式存储系统,所述分布式存储系统包括服务层和存储层,所述存储层部署有多个对象存储设备,每一所述对象存储设备部署有多个固态硬盘,所述装置包括:

18.一种电子设备,其特征在于,包括:

19.一种非易失性存储介质,其特征在于,所述非易失性存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至16任一项所述的固态硬盘管理方法的步骤。

20.一种计算机程序产品,包括计算机程序/指令,其特征在于,所述计算机程序/指令被处理器执行时实现权利要求1至16任一项所述固态硬盘管理方法的步骤。

...

【技术特征摘要】

1.一种固态硬盘管理方法,其特征在于,应用于分布式存储系统,所述分布式存储系统包括服务层和存储层,所述存储层部署有多个对象存储设备,每一所述对象存储设备部署有多个固态硬盘,所述方法包括:

2.根据权利要求1所述的固态硬盘管理方法,其特征在于,对所述分布式存储系统中的所述服务层进行监控,以确定所述服务层是否存在异常,包括:

3.根据权利要求1所述的固态硬盘管理方法,其特征在于,对所述分布式存储系统中的所述服务层进行监控,以确定所述服务层是否存在异常,包括:

4.根据权利要求1所述的固态硬盘管理方法,其特征在于,对所述分布式存储系统中的所述服务层进行监控,以确定所述服务层是否存在异常,包括:

5.根据权利要求1所述的固态硬盘管理方法,其特征在于,对所述分布式存储系统中的所述服务层进行监控,以确定所述服务层是否存在异常,包括:

6.根据权利要求1所述的固态硬盘管理方法,其特征在于,对所述分布式存储系统中的所述服务层进行监控,以确定所述服务层是否存在异常,包括:

7.根据权利要求1所述的固态硬盘管理方法,其特征在于,利用预设故障检测策略对所述异常固态硬盘进行故障检测,获得故障检测结果,包括:

8.根据权利要求1所述的固态硬盘管理方法,其特征在于,利用预设故障检测策略对所述异常固态硬盘进行故障检测,获得故障检测结果,包括:

9.根据权利要求1所述的固态硬盘管理方法,其特征在于,利用预设故障检测策略对所述异常固态硬盘进行故障检测,获得故障检测结果,包括:

10.根据权利要求1所述的固态硬盘管理方法,其特征在于,还包括:

11.根据权利要求1至10任一项所述的固态硬盘管理方法,其特征在于,利用所述固态硬...

【专利技术属性】
技术研发人员:赵文达
申请(专利权)人:济南浪潮数据技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1