一种容错计算方法、装置、计算机设备及存储介质制造方法及图纸

技术编号:39248516 阅读:12 留言:0更新日期:2023-10-30 12:00
本发明专利技术涉及通信技术领域,公开了一种容错计算方法、装置、计算机设备及存储介质,其中容错计算方法包括:根据计算任务执行主进程;当主进程执行至预设操作步骤获取到第一条件指令时,获取主进程的计算路径;根据计算路径生成第一子计算路径和第二子计算路径;获取容错计算系统中计算模块的负载信息;根据负载信息将第一子计算路径和第二子计算路径分别分配至与其匹配的计算模块上执行副进程。由此副进程中与第一子计算路径和第二子计算路径相对应的分段计算任务可以在容错计算系统的不同部分并行进行,不仅可以使副进程的计算尽量不影响系统的性能,而且系统中计算资源的利用更加合理,任务的调度更加精细。任务的调度更加精细。任务的调度更加精细。

【技术实现步骤摘要】
一种容错计算方法、装置、计算机设备及存储介质


[0001]本专利技术涉及通信
,具体涉及一种容错计算方法、装置、计算机设备及存储介质。

技术介绍

[0002]容错计算是在系统存在故障的情况下,仍能正确地执行给定的算法。为了实现这一点,系统需要具有故障检测与诊断、功能切换与系统重组(reconfiguration)、系统恢复与重新运行、系统的重构(reintegration)与可扩展等功能,而且这些功能不能影响系统的正常运行或至少不能使系统的性能下降到不能容忍的程度。
[0003]硬件容错常用的方法包括多备份技术、增加内存、能源系统冗余等。硬件错误通常能够在两个物理机上进行隔离处理。软件容错主要是对软件的鲁棒性特征进行增强。容错计算是服务器可靠性计算的一种技术,其一种较为通用的计算方式是“配置两套资源算两遍”,通过冗余主进程计算任务和冗余计算资源的设计,实现了完全相同的两个主进程计算任务,但是会对系统的性能产生影响。

技术实现思路

[0004]有鉴于此,本专利技术提供了一种容错计算方法、装置、计算机设备及存储介质,以解决容错计算对系统的性能产生影响的问题。
[0005]第一方面,本专利技术实施例提供了一种容错计算方法,应用于容错计算系统,方法包括以下步骤:获取计算任务,根据计算任务执行主进程;当主进程执行至预设操作步骤获取到第一条件指令时,获取主进程的计算路径;根据计算路径生成第一子计算路径和第二子计算路径;获取容错计算系统中计算模块的负载信息;根据负载信息将第一子计算路径和第二子计算路径分别分配至与其匹配的计算模块上执行副进程。
[0006]本专利技术实施例提供的容错计算方法,通过对计算任务进行主进程计算,当主进程执行至预设操作步骤获取到第一条件指令时,获取主进程的计算路径,将计算路径拆分为第一子计算路径和第二子计算路径,其中第一子计算路径和第二子计算路径可并行进行;获取容错计算系统中的计算模块,以及每一个计算模块的负载信息;根据每一个计算模块的负载信息将第一子计算路径和第二子计算路径分别分配至与其匹配的计算模块上,由此副进程中与第一子计算路径和第二子计算路径相对应的分段计算任务可以在容错计算系统的不同部分并行进行,不仅可以使副进程的计算尽量不影响系统的性能,而且系统中计算资源的利用更加合理,任务的调度更加精细。
[0007]另外,需要说明的是,虽然副进程是在主进程执行至预设操作步骤获取到第一条件指令时才开启,即主进程与副进程之间存在延时,但是由于副进程采用的是并行计算,所以可以加快副进程的计算速度,即可以通过并行执行来减小延时的损失。
[0008]在一种可选的实施方式中,根据计算路径生成第一子计算路径和第二子计算路径包括:在操作步骤处将计算路径进行拆分得到第一子计算路径和第二子计算路径,其中第
一子计算路径为计算路径中预设操作步骤及预设操作步骤之前的部分,第二子计算路径为计算路径中预设操作步骤及预设操作步骤之后的部分。
[0009]由此可以使得得到的第一子计算路径和第二子计算路径更加合理,而且由于第一子计算路径和第二子计算路径中均包括预设操作步骤,可以在主进程中断时,利用副进程对主进程进行恢复。
[0010]在一种可选的实施方式中,根据计算任务执行主进程包括:获取容错计算系统中的计算模块,以及每一个计算模块的负载信息;基于计算任务、容错计算系统中的计算模块,以及每一个计算模块的负载信息执行主进程。
[0011]由于主进程在执行过程中考虑了计算模块的负载信息,因此可以使得主进程的执行更加合理。
[0012]在一种可选的实施方式中,在获取容错计算系统中的计算模块,以及每一个计算模块的负载信息之后,还包括:基于计算模块,以及每一个计算模块的负载信息生成资源查询表,并周期性的更新资源查询表。
[0013]由此可以使得在根据负载信息将第一子计算路径和第二子计算路径分别分配至与其匹配的计算模块之前,可以利用资源查询表快速的得到容错计算系统中计算模块的负载信息。
[0014]在一种可选的实施方式中,在根据每一个计算模块的负载信息将第一子计算路径和第二子计算路径分别分配至与其匹配的计算模块上执行副进程之后,还包括:继续获取容错计算系统中每一个计算模块的负载信息;
[0015]根据继续获取到的每一个计算模块的负载信息确定是否存在空闲的计算模块;当存在空闲的计算模块时,获取与第三条件指令相对应的备用计算路径,并利用空闲的计算模块根据备用计算路径进行计算,其中第一条件指令和第三条件指令为对预设操作步骤进行计算得到的不同结果。
[0016]由于备用计算路径根据空闲的计算资源进行计算,因此不会影响系统的性能;而且可以在主进程的计算结果错误时,快速的重建主进程。
[0017]在一种可选的实施方式中,容错计算方法还包括以下步骤:当主进程中断时,判断主进程中断之前是否存在第一条件指令;当存在时,根据主进程中断之前最后一个第一条件指令、以及副进程中与最后一个第一条件指令之后相对应的第二子计算路径的计算结果,对主进程进行恢复。
[0018]由此在主进程中断时,可以根据副进程的计算结果对主进程恢复。
[0019]在一种可选的实施方式中,容错计算方法还包括以下步骤:当主进程与副进程对于预设操作步骤的计算结果不同时,在主进程和副进程中,分别对预设操作步骤进行二次计算;根据二次计算的计算结果确定主进程对于预设操作步骤的计算结果是否正确;当主进程对于预设操作步骤的计算结果不正确时,利用备用计算路径的计算结果重建主进程。
[0020]由此可以在主进程的计算结果错误时,快速的重建主进程。
[0021]第二方面,本专利技术实施例还提供了一种容错计算装置,包括第一获取模块、主进程执行模块、主进程计算路径获取模块、主进程计算路径拆分模块、第二获取模块和副进程执行模块;第一获取模块用于获取计算任务;主进程执行模块用于根据计算任务执行主进程;主进程计算路径获取模块用于当主进程执行至预设操作步骤获取到第一条件指令时,获取
主进程的计算路径;主进程计算路径拆分模块用于根据计算路径生成第一子计算路径和第二子计算路径;第二获取模块,用于获取容错计算系统中计算模块的负载信息;副进程执行模块,用于根据负载信息将第一子计算路径和第二子计算路径分别分配至与其匹配的计算模块上执行副进程。
[0022]第三方面,本专利技术实施例还提供了一种计算机设备,包括存储器和处理器,存储器和处理器之间互相通信连接,存储器中存储有计算机指令,处理器通过执行计算机指令,从而执行上述第一方面或其对应的任一实施方式的容错计算方法。
[0023]第四方面,本专利技术实施例还提供了一种计算机可读存储介质,计算机可读存储介质上存储有计算机指令,计算机指令用于使计算机执行上述第一方面或其对应的任一实施方式的容错计算方法。
附图说明
[0024]为了更清楚地说明本专利技术具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种容错计算方法,其特征在于,应用于容错计算系统,所述方法包括:获取计算任务,根据所述计算任务执行主进程;当所述主进程执行至预设操作步骤获取到第一条件指令时,获取所述主进程的计算路径;根据所述计算路径生成第一子计算路径和第二子计算路径;获取所述容错计算系统中计算模块的负载信息;根据所述负载信息将所述第一子计算路径和所述第二子计算路径分别分配至与其匹配的计算模块上执行副进程。2.根据权利要求1所述的方法,其特征在于,所述根据所述计算路径生成第一子计算路径和第二子计算路径包括:在所述操作步骤处将所述计算路径进行拆分得到所述第一子计算路径和所述第二子计算路径,其中所述第一子计算路径为所述计算路径中所述预设操作步骤及所述预设操作步骤之前的部分,所述第二子计算路径为所述计算路径中所述预设操作步骤及所述预设操作步骤之后的部分。3.根据权利要求1所述的方法,其特征在于,根据所述计算任务执行主进程包括:获取所述容错计算系统中的计算模块,以及每一个计算模块的负载信息;基于所述计算任务、所述容错计算系统中的计算模块,以及每一个计算模块的负载信息执行所述主进程。4.根据权利要求3所述的方法,其特征在于,在所述获取所述容错计算系统中的计算模块,以及每一个计算模块的负载信息之后,还包括:基于所述计算模块,以及每一个所述计算模块的负载信息生成资源查询表,并周期性的更新所述资源查询表。5.根据权利要求1~4任一项所述的方法,其特征在于,在根据每一个计算模块的负载信息将所述第一子计算路径和所述第二子计算路径分别分配至与其匹配的计算模块上执行副进程之后,还包括:继续获取所述容错计算系统中每一个计算模块的负载信息;根据继续获取到的每一个计算模块的负载信息确定是否存在空闲的计算模块;当存在空闲的计算模块时,获取与第三条件指令相对应的备用计算路径,并利用所述空闲的计算模块根据所述备用计算路径进行计算,其中所述第一条件...

【专利技术属性】
技术研发人员:林宁亚王贤坤孔令军庞兆春邹晓峰
申请(专利权)人:山东云海国创云计算装备产业创新中心有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1