嵌入式平台节点故障恢复系统及方法技术方案

技术编号:33734695 阅读:16 留言:0更新日期:2022-06-08 21:31
本发明专利技术公开了嵌入式平台节点故障恢复系统及方法,所述方法包括以下步骤:包括节点管理器、节点控制器、调度器和应用管理器;每个节点上均设置有节点管理器;节点管理器生成节点的心跳信息,并将心跳信息发送给节点控制器;节点管理器根据接收的应用文件和调度算法进行应用启动或故障恢复;所述节点控制器,负责实时接收节点管理器的心跳模块发送的心跳信息并判断节点是否故障。本发明专利技术提供了节点管理器、支持多种异构平台的应用执行和周期性心跳上报,发送节拍可配置,默认为1秒;支持分布式系统资源的按需分配,提高资源利用率。提高资源利用率。提高资源利用率。

【技术实现步骤摘要】
嵌入式平台节点故障恢复系统及方法


[0001]本专利技术涉及雷达目标检测领域,具体涉及嵌入式平台节点故障恢复系统及方法。

技术介绍

[0002]面对嵌入式平台运行环境不断变化带来的挑战,要求嵌入式平台面向任务功能可扩展、处理能力不断提升,以满足及时响应新的应用需求。
[0003]集群是一组相互独立的,通过高速网络互连的计算机,它们构成了一个组,并以单一系统的模式来管理。用户与集群相互作用时,集群像是一个独立的服务器。集群技术是一种通用技术,可以解决单机运算、IO能力的不足,提高服务的可靠性。传统方式下嵌入式平台发生故障时需要关机重启或者返厂维修,需要设计一种嵌入式平台节点故障恢复方法,用以保证后端应用的可靠运行。

技术实现思路

[0004]为了解决上述问题,本专利技术提出了一种嵌入式平台节点故障恢复系统,包括节点管理器、节点控制器、调度器和应用管理器;
[0005]每个节点上均设置有节点管理器;节点管理器生成节点的心跳信息,并将心跳信息发送给节点控制器;节点管理器根据接收的应用文件和调度算法进行应用启动或故障恢复;
[0006]所述节点控制器,负责实时接收节点管理器的心跳模块发送的心跳信息并判断节点是否故障;若节点故障,则将节点状态标记为故障并将标记为故障的节点状态发送给调度器;
[0007]所述调度器接收节点控制器发送的包含故障信息的节点状态并生成第二调度算法,并分配物理资源和逻辑资源;
[0008]所述应用管理器,接收应用文件,并根据调度器的调度算法将应用文件分发到对应的节点,由节点上的节点管理器进行应用启动或故障恢复;所述调度算法包括第一和第二调度算法。
[0009]进一步地,所述判断节点是否故障具体为:节点控制器检测到节点管理器的心跳信息连续丢失三次时判断节点故障。
[0010]进一步地,所述系统内的应用管理器、节点管理器、节点控制器和调度器之间的均以数据库为媒介采用发布订阅的模式完成数据通信。
[0011]进一步地,所述节点管理器,由应用启动模块和心跳模块组成;心跳模块生成节点的心跳信息,并将心跳信息发送给节点控制器;应用启动模块根据接收的应用文件和调度算法进行应用启动或故障恢复;
[0012]所述应用启动具体为:应用启动模块根据调度器的第一调度算法和应用管理器发送的应用文件启动应用;
[0013]所述调度器根据上位机的资源请求生成第一调度算法。
[0014]进一步地,所述调度器生成第一调度算法的依据包括资源类型、资源需求量、资源剩余量、资源负载、应用关联性五个因素。
[0015]本专利技术还提供了一种嵌入式平台节点故障恢复方法,所述方法基于上述任一系统实现,具体包括以下步骤:
[0016]节点管理器向节点控制器发送节点的心跳信息;
[0017]节点控制器根据节点的心跳信息判断节点是否故障;若故障,则将故障的节点状态发送给调度器,调度器根据故障的节点状态生成第二调度算法并进行故障恢复。
[0018]进一步地,所述节点管理器包括心跳模块和应用启动模块;所述节点管理器的心跳模块按照指定周期对心跳信息设置为active后发送给节点控制器。
[0019]进一步地,所述节点控制器包括节点心跳接收线程和节点心跳检测线程;
[0020]节点心跳接收线程获取来自节点管理器的心跳信息,并保存心跳信息;
[0021]节点心跳检测线程按照指定周期对心跳信息进行设置,所述设置具体为:遍历节点的心跳信息,若遍历到的节点的心跳信息为Active,则将心跳信息置为Confirm;若遍历到的心跳信息为Confirm,则将心跳信息置为Miss1;若遍历到的心跳信息为Miss1,则将心跳信息置为Miss2;若遍历到的心跳信息为Miss2,则将心跳信息置为Miss3并判定该节点故障;将故障节点的故障信息更新到节点状态中。
[0022]进一步地,所述第二调度算法具体为:
[0023]若故障应用有热备应用,故障时先用热备应用替换当前应用,满足应用恢复条件后根据CPU负载指标重新选择节点部署热备应用,若故障应用没有热备应用,则选择本节点或其他节点进行故障恢复;若是本节点恢复,则在故障应用所在节点上重新启动应用完成应用恢复,若是在其他节点上恢复,则根据待选节点的CPU负载指标选择负载最轻的节点作为目标节点来恢复应用完成应用迁移。
[0024]进一步地,还包括以下步骤:
[0025]调度器接收上位机的资源请求并根据资源请求生成第一调度算法;
[0026]应用管理器接收应用文件和第一调度算法并发送给节点管理器;
[0027]节点管理器通过根据第一调度算法并进行应用启动。
[0028]与现有技术相比,本专利技术具有以下有益效果:
[0029]1、本专利技术提供了节点管理器、支持多种异构平台的应用执行和周期性心跳上报,发送节拍可配置,默认为1秒;支持分布式系统资源的按需分配,提高资源利用率;
[0030]2、本专利技术提供了节点控制器模块,实时判断故障节点,实现嵌入式平台的高可靠设计,有效预防系统软硬件单点故障问题;
[0031]3、本专利技术提供了调度器模块,支持多种故障恢复调度算法,灵活配置;
[0032]4、本专利技术提供了应用管理器模块,为高实时嵌入式平台故障恢复功能服务。
附图说明
[0033]图1为本专利技术的节点故障恢复架构示意图。
[0034]图2为本专利技术的节点故障判断流程图。
具体实施方式
[0035]本专利技术的目的在于:解决传统嵌入式平台节点故障导致的后端应用无法持续运行问题,
[0036]以下结合附图对本专利技术的嵌入式平台节点故障恢复系统方法的具体实施方式做详细说明。
[0037]实施例一
[0038]如图1所示,本实施例提供的一种嵌入式平台节点故障恢复系统,包括节点管理器、节点控制器、调度器和应用管理器。
[0039]所述节点管理器,由应用启动模块和心跳模块组成,在每个节点上均设置有节点管理器。初始时,所述应用启动模块根据调度器的第一调度算法和应用管理器发送的应用文件启动应用;属于不同工作模式之间的应用,在分配过程中资源可复用;心跳模块生成节点的心跳信息,并将心跳信息发送给节点控制器,其中发送节拍可配置,默认为1秒。应用启动模块根据接收的应用文件和调度算法(包括第一调度算法和第二调度算法)进行应用启动或应用恢复。
[0040]所述节点控制器,负责实时接收节点管理器的心跳模块发送的心跳信息,节点控制器检测到节点管理器的心跳信息连续丢失三次,将节点状态标记为故障并将其发送给调度器。
[0041]所述调度器接收节点控制器发送的包含故障信息的节点状态,将第二调度算法发送给应用管理器进行应用恢复,应用管理器将第二调度算法发送给节点管理器,节点管理器根据第二调度算法启动应用并进行应用恢复。初始时,所述调度器根据上位机的资源请求形成第一调度算法,并分配物理资源和逻辑资源;调度器形成第一调度算本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种嵌入式平台节点故障恢复系统,其特征在于,包括节点管理器、节点控制器、调度器和应用管理器;每个节点上均设置有节点管理器;节点管理器生成节点的心跳信息,并将心跳信息发送给节点控制器;节点管理器根据接收的应用文件和调度算法进行应用启动或故障恢复;所述节点控制器,负责实时接收节点管理器的心跳模块发送的心跳信息并判断节点是否故障;若节点故障,则将节点状态标记为故障并将标记为故障的节点状态发送给调度器;所述调度器接收节点控制器发送的包含故障信息的节点状态并生成第二调度算法,并分配物理资源和逻辑资源;所述应用管理器,接收应用文件,并根据调度器的调度算法将应用文件分发到对应的节点,由节点上的节点管理器进行应用启动或故障恢复;所述调度算法包括第一和第二调度算法。2.根据权利要求1所述的嵌入式平台节点故障恢复系统,其特征在于,所述判断节点是否故障具体为:节点控制器检测到节点管理器的心跳信息连续丢失三次时判断节点故障。3.根据权利要求2所述的嵌入式平台节点故障恢复系统,其特征在于,所述系统内的应用管理器、节点管理器、节点控制器和调度器之间的均以数据库为媒介采用发布订阅的模式完成数据通信。4.根据权利要求3所述的嵌入式平台节点故障恢复系统,其特征在于,所述节点管理器,由应用启动模块和心跳模块组成;心跳模块生成节点的心跳信息,并将心跳信息发送给节点控制器;应用启动模块根据接收的应用文件和调度算法进行应用启动或故障恢复;所述应用启动具体为:应用启动模块根据调度器的第一调度算法和应用管理器发送的应用文件启动应用;所述调度器根据上位机的资源请求生成第一调度算法。5.根据权利要求4所述的嵌入式平台节点故障恢复系统,其特征在于,所述调度器生成第一调度算法的依据包括资源类型、资源需求量、资源剩余量、资源负载、应用关联性五个因素。6.一种嵌入式平台节点故障恢复方法,其特征在于,所述方法基于权利要求1

5任一权利要求所述系统实现,具体包括...

【专利技术属性】
技术研发人员:檀学文韩文俊丁琳琳李路野程杭林
申请(专利权)人:中国电子科技集团公司第十四研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1