一种分布式存储分组在线升级方法、装置、终端及介质制造方法及图纸

技术编号:35606378 阅读:25 留言:0更新日期:2022-11-16 15:28
本发明专利技术涉及一种分布式存储分组在线升级方法、装置、终端及介质。按预设的分组规则将待升级节点分组,所述分组规则使不同分组之间的待升级节点不涉及相同的存储池;为每一个分组配置一个升级线程以控制分组中待升级节点的升级流程,按设定的第一时间间隔启动各个升级线程,使各分组并发错时的进行升级。本发明专利技术多个分组之间并发升级,能够压缩在线升级的总时长。不同分组之间的待升级节点不涉及相同的存储池,分组中的待升级节点逐一按顺序升级时,对应同一存储池的待升级节点不会同时两个或多个升级,且各个分组之间的错时升级,避免待升级节点大规模同一时间重启服务导致业务中断的情况。断的情况。断的情况。

【技术实现步骤摘要】
一种分布式存储分组在线升级方法、装置、终端及介质


[0001]本专利技术涉及分布式存储集群分组在线升级
,尤其涉及一种分布式存储分组在线升级方法、装置、终端及介质。

技术介绍

[0002]分布式存储装置具有高扩展性的特点,可由若干个节点至上千节点组成。每个节点可以包含若干个存储设备,如固态硬盘、磁盘等。每个存储设备通过一个OSD服务进程管理。数据通过CRUSH算法映射到PG和OSD。PG和OSD可划分到不同的存储池。除了OSD服务,集群还有MON服务来监控集群状态,以及保存osdmap等集群元数据信息。MON服务不需要部署到所有节点,一般需要部署奇数个MON服务。
[0003]分布式存储的在线升级一般由控制节点发出升级指令到升级节点,升级节点执行新版本的安装包,替换分布式集群的MON、OSD等服务的可执行文件、相关库文件、配置文件等,然后重启服务生效。由于在线升级往往要求业务不能中断,因此每次只升级一个节点。对于大规模集群,升级时间会很长。假设每个节点升级需要10分钟,对于100节点的集群就需要1000分钟超过16小时的升级时间。这对于需要将升级时间固定到低业务时段的几小时的用户来说是无法接收的。为了优化在线升级的时长,当前方案采取将升级节点分组的方式,将处于不同存储池中互不干扰的节点分成若干组,每次升级从每个组都选取一个节点进行升级。然而,当前方案在分组划分较多时,如存储池划分较多,每次会有多个节点同时升级。虽然由于这些节点位于不同的存储池中,相互之间不会受到故障域、数据重构、PG的Peering等制约,但是同时重启多个节点会导致OSD向MON上报大量的消息,这些消息无法及时处理,会导致PG在Peering阶段卡住,从而影响前端业务。

技术实现思路

[0004]为了解决上述技术问题或者至少部分地解决上述技术问题,本专利技术提供一种分布式存储分组在线升级方法、装置、终端及介质。
[0005]第一方面,本专利技术提供一种分布式存储分组在线升级方法,包括:按预设的分组规则将待升级节点分组,所述分组规则使不同分组之间的待升级节点不涉及相同的存储池;
[0006]为每一个分组配置一个升级线程以控制分组中待升级节点的升级流程,按设定的第一时间间隔启动各个升级线程,使各分组并发错时的进行升级,避免待升级节点大规模同一时间重启服务。
[0007]更进一步地,升级线程通过ssh的方式调用分组中各待升级节点上的升级脚本,所述升级脚本执行升级包、验证重启条件、在重启条件满足或者从执行升级包起时间超出设定时间阈值仍未达到重启条件则重启服务,在重启服务后进行数据重构。
[0008]更进一步地,所述验证重启条件包括:所述升级脚本执行升级包后,判断是否待升级节点所有OSD都处于Up阶段且无放置组处于peering状态,是则,重启条件满足并重启服务,否则,间隔第二时间间隔后再次进行验证重启条件,直至执行升级包后时间达到设定时
间阈值或重启条件满足终止验证重启条件。
[0009]更进一步地,升级线程遍历相应分组中各个待升级节点,通过ssh的方式调用被遍历到的升级节点上的升级脚本,被遍历到的升级节点升级脚本执行完数据重构后,继续遍历分组中下一待升级节点,直至分组遍历完成。
[0010]更进一步地,统计输出满足重启条件重启服务和达到设定时间阈值重启服务的待升级节点并输出相应日志。
[0011]更进一步地,所述分组规则包括:统计各个待升级节点的OSD所属存储池,每个待升级节点的所有OSD均属于一存储池,则按存储池分组;每个待升级节点的OSD分组不同的存储池时,将存在存储池交叉的待升级节点分到一组,将不存在存储池交叉的待升级节点分到不同分组,若对于不同分组,存在一待升级节点与不同分组中待升级节点分别交叉,则将不同分组合并为同一分组。
[0012]第二方面,本专利技术提供一种分布式存储分组在线升级装置,包括:分组模块,所述分组模块按照按预设的分组规则将待升级节点分组,所述分组规则使不同分组之间的待升级节点不涉及相同的存储池;
[0013]升级控制模块,所述升级控制模块为每一个分组配置一个升级线程以控制分组中待升级节点的升级流程,所述升级控制模块按设定的第一时间间隔启动各个升级线程,使各分组并发错时的进行升级,避开同一时间重启服务;
[0014]升级执行模块,所述升级执行模块配置升级脚本,升级脚本执行升级包、验证重启条件、在重启条件满足或者从执行升级包起时间超出设定时间阈值仍未达到重启条件则重启服务,在重启服务后进行数据重构。
[0015]更进一步地,所述的分布式存储分组在线升级装置,还包括日志模块,日志模块用于统计输出满足重启条件重启服务和达到设定时间阈值重启服务的待升级节点并输出相应日志。
[0016]第三方面,本专利技术提供一种分布式存储分组在线升级终端,包括:处理单元,总线单元和存储单元,其中,所述总线单元连接存储单元、处理单元,所述存储单元存储计算机程序,计算机程序被处理单元执行时实现所述的分布式存储分组在线升级方法。
[0017]第四方面,本专利技术提供一种实现分布式存储分组在线升级方法的存储介质,所述存储介质存储计算机程序,所述计算机程序被处理器执行时实现所述的分布式存储分组在线升级方法。
[0018]本专利技术实施例提供的上述技术方案与现有技术相比具有如下优点:
[0019]本专利技术通过预设的分组规则对待升级节点进行分组,不同分组之间的待升级节点不涉及相同的存储池,为每一个分组配置一个升级线程以控制分组中待升级节点的升级流程,按设定的第一时间间隔启动各个升级线程,使各分组并发错时的进行升级。本专利技术多个分组之间并发升级,能够压缩在线升级的总时长。不同分组之间的待升级节点不涉及相同的存储池,分组中的待升级节点逐一按顺序升级时,对应同一存储池的待升级节点,不存在同时升级的两个或多个的情况,且各个分组之间的错时升级,避免待升级节点大规模同一时间重启服务导致业务中断的情况。
附图说明
[0020]此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本专利技术的实施例,并与说明书一起用于解释本专利技术的原理。
[0021]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0022]图1为本专利技术实施例提供的一种分布式存储分组在线升级方法的流程图;
[0023]图2为本专利技术实施例提供的利用分组规则进行待升级节点分组的流程图;
[0024]图3为本专利技术实施例提供的升级线程控制分组中待升级节点的升级的流程图;
[0025]图4为本专利技术实施例提供的升级线程按预设第一时间间隔启动的效果示意图;
[0026]图5为本专利技术实施例提供的一种分布式存储分组在线升级装置的示意图;
[0027]图6为本专利技术实施例提供的一种分布式存储分组在线升级终端的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种分布式存储分组在线升级方法,其特征在于,包括:按预设的分组规则将待升级节点分组,所述分组规则使不同分组之间的待升级节点不涉及相同的存储池;为每一个分组配置一个升级线程以控制分组中待升级节点的升级流程,按设定的第一时间间隔启动各个升级线程,使各分组并发错时的进行升级,避免待升级节点大规模同一时间重启服务。2.根据权利要求1所述的分布式存储分组在线升级方法,其特征在于,升级线程通过ssh的方式调用分组中各待升级节点上的升级脚本,所述升级脚本执行升级包、验证重启条件、在重启条件满足或者从执行升级包起时间超出设定时间阈值仍未达到重启条件则重启服务,在重启服务后进行数据重构。3.根据权利要求2所述的分布式存储分组在线升级方法,其特征在于,所述验证重启条件包括:所述升级脚本执行升级包后,判断是否待升级节点所有OSD都处于Up阶段且无放置组处于peering状态,是则,重启条件满足并重启服务,否则,间隔第二时间间隔后再次进行验证重启条件,直至执行升级包后时间达到设定时间阈值或重启条件满足终止验证重启条件。4.根据权利要求2所述的分布式存储分组在线升级方法,其特征在于,升级线程遍历相应分组中各个待升级节点,通过ssh的方式调用被遍历到的升级节点上的升级脚本,被遍历到的升级节点升级脚本执行完数据重构后,继续遍历分组中下一待升级节点,直至分组遍历完成。5.根据权利要求2所述的分布式存储分组在线升级方法,其特征在于,统计输出满足重启条件重启服务和达到设定时间阈值重启服务的待升级节点并输出相应日志。6.根据权利要求1所述的分布式存储分组在线升级方法,其特征在于,所述分组规则包括:统计各个待升级节点的OSD所属存储池,每个待升级节点的所有OSD均属于一存储...

【专利技术属性】
技术研发人员:刘鑫孟祥瑞
申请(专利权)人:济南浪潮数据技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1