一种故障迁移方法及装置制造方法及图纸

技术编号:31581932 阅读:43 留言:0更新日期:2021-12-25 11:25
本申请公开了一种故障迁移方法及装置,在各个预设的时间节点内向分布式文件系统的NAS机头发送心跳探测信息,若检测到连续多个时间点未接收到回复信息,确定NAS机头处于心跳丢失状态并向NAS机头发送探测指令,若未接收到探测返回信号,确定NAS机头处于故障状态,对分布式文件系统执行故障迁移操作。基于上述,通过确定NAS机头是否处于心跳丢失状态和确定NAS机头是否处于故障状态来健全故障判别机制,及时定位到发生故障的分布式文件系统,对发生故障的分布式文件系统进行迁移,由于故障判别机制和分布式文件系统迁移的流程为全自动,去掉了人工干预的影响,减少分布式文件系统迁移的时间,提高分布式文件系统迁移的效率。率。率。

【技术实现步骤摘要】
一种故障迁移方法及装置


[0001]本申请涉及数据处理
,更具体地说,涉及一种故障迁移方法及装置。

技术介绍

[0002]分布式文件系统存储提供了可拓展的共享文件系统存储服务,可以与云虚拟机等服务搭配使用,并且其提供了标准的网络文件系统(NetworkFile System,NFS)访问协议,为多台云虚拟机或者其他计算服务提供共享的数据源,支持弹性容量和性能的扩展,适用于大数据分析、媒体处理和内容管理等多种场景。
[0003]当分布式文件系统出现故障时,需要对分布式文件系统的故障进行迁移,目前,关于分布式文件系统的故障迁移方法多数需要人工进行干预,人工干预的迁移方法使分布式文件系统的迁移所花费的时间多,从而造成对业务的影响时间长,并且迁移效率低。
[0004]因此,现有的分布式文件系统的故障迁移的所花费的时间多且迁移效率低。

技术实现思路

[0005]有鉴于此,本申请公开了一种故障迁移方法及装置,旨在减少分布式文件迁移的时间,提高分布式文件迁移的效率。
[0006]为了实现上述目的,其公开的技术方案如下:
[0007]本申请第一方面公开了一种故障迁移方法,所述方法包括:
[0008]在各个预设的时间节点内向分布式文件系统的NAS机头发送心跳探测信息;
[0009]当检测到连续多个时间点未接收到所述心跳探测信息对应的回复信息时,确定所述NAS机头处于心跳丢失状态;
[0010]在所述NAS机头处于所述心跳丢失状态下,向所述NAS机头发送探测指令;
[0011]若未接收到所述探测指令对应的探测返回信号,则确定所述NAS机头处于故障状态,并对所述分布式文件系统执行故障迁移操作。
[0012]优选的,所述在各个预设的时间节点向分布式文件系统中的NAS机头发送心跳探测信息,包括:
[0013]在各个预设的时间节点内,通过NAS机头管控节点的心跳探测进程向分布式文件系统中的NAS机头发送心跳探测信息。
[0014]优选的,所述在所述NAS机头处于所述心跳丢失状态下,向所述NAS机头发送探测指令,包括:
[0015]在所述NAS机头处于所述心跳丢失状态下,通过NAS机头管控节点的探测进程向所述NAS机头发送探测指令。
[0016]优选的,所述对所述分布式文件系统执行故障迁移操作,包括:
[0017]通过预设顺序获取处于故障状态的NAS机头中的n个待迁移文件系统;所述预设顺序由所述n个待迁移文件系统的大小确定;所述n为正整数;
[0018]将所述n个待迁移文件系统迁移至多个目标NAS机头;所述多个目标NAS机头由负
载度和文件挂载数量确定;
[0019]在所述多个目标NAS机头上进行配置nfsd进程操作、云硬盘挂载操作、添加权限组操作和建立路由表操作;所述配置nfsd进程操作用于使所述各个目标NAS机头具有挂载操作功能;所述建立路由表操作用于确保所述n个待迁移文件系统与所述目标NAS机头处于通信状态。
[0020]优选的,在所述对所述分布式文件系统执行故障迁移操作之前,还包括:
[0021]删除所述处于故障状态的NAS机头对应的路由表,并将所述处于故障状态的NAS机头与云硬盘进行解绑操作。
[0022]本申请第二方面公开了一种故障迁移装置,所述装置包括:
[0023]第一发送单元,用于在各个预设的时间节点内向分布式文件系统的NAS机头发送心跳探测信息;
[0024]确定单元,用于当检测到连续多个时间点未接收到所述心跳探测信息对应的回复信息时,确定所述NAS机头处于心跳丢失状态;
[0025]第二发送单元,用于在所述NAS机头处于所述心跳丢失状态下,向所述NAS机头发送探测指令;
[0026]执行单元,用于若未接收到所述探测指令对应的探测返回信号,则确定所述NAS机头处于故障状态,并对所述分布式文件系统执行故障迁移操作。
[0027]优选的,所述第一发送单元,具体用于:
[0028]在各个预设的时间节点内,通过NAS机头管控节点的心跳探测进程向分布式文件系统中的NAS机头发送心跳探测信息。
[0029]优选的,所述第二发送单元,具体用于:
[0030]在所述NAS机头处于所述心跳丢失状态下,通过NAS机头管控节点的探测进程向所述NAS机头发送探测指令。
[0031]优选的,所述执行单元,包括:
[0032]获取模块,用于通过预设顺序获取处于故障状态的NAS机头中的n个待迁移文件系统;所述预设顺序由所述n个待迁移文件系统的大小确定;所述n为正整数;
[0033]迁移模块,用于将所述n个待迁移文件系统迁移至多个目标NAS机头;所述多个目标NAS机头由负载度和文件挂载数量确定;
[0034]操作模块,用于在所述多个目标NAS机头上进行配置nfsd进程操作、云硬盘挂载操作、添加权限组操作和建立路由表操作;所述配置nfsd进程操作用于使所述各个目标NAS机头具有挂载操作功能;所述建立路由表操作用于确保所述n个待迁移文件系统与所述目标NAS机头处于通信状态。
[0035]优选的,还包括:
[0036]操作单元,用于删除所述处于故障状态的NAS机头对应的路由表,并将所述处于故障状态的NAS机头与云硬盘进行解绑操作。
[0037]经由上述技术方案可知,本申请公开了一种故障迁移方法及装置,在各个预设的时间节点内向分布式文件系统中的NAS机头发送心跳探测信息,当检测到连续多个时间点未接收到心跳探测信息对应的回复信息时,确定NAS机头处于心跳丢失状态,在NAS机头处于所述心跳丢失状态下,向NAS机头发送探测指令,若未接收到探测指令对应的探测返回信
号,则确定NAS机头处于故障状态,并对分布式文件系统执行故障迁移操作。基于上述,通过确定NAS机头是否处于心跳丢失状态和确定NAS机头是否处于故障状态来健全故障判别机制,及时定位到发生故障的分布式文件系统,并对发生故障的分布式文件系统进行故障迁移,由于故障判别机制和分布式文件系统迁移的流程为全自动,去掉了人工干预的影响,减少分布式文件系统迁移的时间,提高分布式文件系统迁移的效率。
附图说明
[0038]为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
[0039]图1为本申请实施例公开的一种故障迁移方法的流程示意图;
[0040]图2为本申请实施例公开的对分布式文件系统执行故障迁移操作的流程示意图;
[0041]图3为本申请实施例公开的一种故障迁移装置的结构示意图。
具体实施方式
[0042]下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种故障迁移方法,其特征在于,所述方法包括:在各个预设的时间节点内向分布式文件系统的NAS机头发送心跳探测信息;当检测到连续多个时间点未接收到所述心跳探测信息对应的回复信息时,确定所述NAS机头处于心跳丢失状态;在所述NAS机头处于所述心跳丢失状态下,向所述NAS机头发送探测指令;若未接收到所述探测指令对应的探测返回信号,则确定所述NAS机头处于故障状态,并对所述分布式文件系统执行故障迁移操作。2.根据权利要求1所述的方法,其特征在于,所述在各个预设的时间节点向分布式文件系统中的NAS机头发送心跳探测信息,包括:在各个预设的时间节点内,通过NAS机头管控节点的心跳探测进程向分布式文件系统中的NAS机头发送心跳探测信息。3.根据权利要求1所述的方法,其特征在于,所述在所述NAS机头处于所述心跳丢失状态下,向所述NAS机头发送探测指令,包括:在所述NAS机头处于所述心跳丢失状态下,通过NAS机头管控节点的探测进程向所述NAS机头发送探测指令。4.根据权利要求1所述的方法,其特征在于,所述对所述分布式文件系统执行故障迁移操作,包括:通过预设顺序获取处于故障状态的NAS机头中的n个待迁移文件系统;所述预设顺序由所述n个待迁移文件系统的大小确定;所述n为正整数;将所述n个待迁移文件系统迁移至多个目标NAS机头;所述多个目标NAS机头由负载度和文件挂载数量确定;在所述多个目标NAS机头上进行配置nfsd进程操作、云硬盘挂载操作、添加权限组操作和建立路由表操作;所述配置nfsd进程操作用于使所述各个目标NAS机头具有挂载操作功能;所述建立路由表操作用于确保所述n个待迁移文件系统与所述目标NAS机头处于通信状态。5.根据权利要求1所述的方法,其特征在于,在所述对所述分布式文件系统执行故障迁移操作之前,还包括:删除所述处于故障状态的NAS机头对应的路由表,并将所述处于故障状态的NAS机头与云硬盘...

【专利技术属性】
技术研发人员:寇墨林逄新谢乾阳
申请(专利权)人:中国建设银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1