一种基于天基分布式卫星集群的动态调度方法和系统技术方案

技术编号:36603705 阅读:19 留言:0更新日期:2023-02-04 18:22
本发明专利技术提供了一种基于天基分布式卫星集群的动态调度方法,包括以下步骤:对待调度Pod根据业务类型、资源需求、紧迫程度和服务质量计算优先级评分并进行排序;按照排序依次对待调度Pod进行调度,判断卫星集群资源是否充足,若充足则将当前Pod部署到能够满足该Pod资源需求的卫星节点中资源最充分的节点上;否则根据抢占开销进行抢占式调度,若存在抢占开销小于当前Pod的处于服务中的Pod,则将抢占开销最小的Pod的服务停止,把资源释放给当前Pod,终止服务的Pod返回等待队列;否则当前Pod返回等待队列,直到有Pod完成任务释放出节点资源。本发明专利技术相比现有技术对卫星集群资源进行更加合理充分地利用,提高了卫星集群稳定性和服务可靠性。靠性。靠性。

【技术实现步骤摘要】
一种基于天基分布式卫星集群的动态调度方法和系统


[0001]本专利技术属于容器集群管理
,特别涉及一种基于天基分布式卫星集群的动态调度方法和系统。

技术介绍

[0002]随着新一代卫星技术的日益发展,卫星应用服务内容和种类的日益丰富,然而依然面临如下问题:首先,单个卫星节点的计算和存储能力有限,难以独自快速地完成大量的计算密集型业务,而且有可能由于单点故障导致服务不可用。其次,星间链路存在拓扑高动态变化和传输时延较大的特点,会对业务的执行产生较大的影响。最后,丰富多样的应用和业务使得星间链路面临较大的流量压力,再加上星上计算、存储和通信资源均非常稀缺,这会导致一些优先级较高的业务不能得到及时响应和执行。因此,为满足用户对高质量卫星应用服务的需求,,卫星分布式集群方法应运而生。多个低轨卫星以星座或者编队的形式组成天基卫星集群,可以有效协调多个卫星的通信、计算和存储资源,满足用户的应用需求。
[0003]Kubernetes作为当前应用最为普遍的容器云编排管理系统,广泛部署和应用于多种分布式计算场景。Kubernetes的资源调度器Scheduler主要负责为新创建的Pod寻找合适的节点Node进行部署。Scheduler是一个独立的进程,该进程不断从相应模块拉取未被调度的Pod和可部署的节点Node列表,这一阶段拉取Pod的策略主要有:先进先出调度(First In First Out,FIFO)、公平份额调度(Fair Scheduler)、计算能力调度(Capacity Scheduler)等。然后通过默认的调度算法筛选出合适的节点Node并于Pod进行绑定。这一阶段调度过程主要包括预选(Predicates)和优选(Priorities)两个过程。预选阶段Scheduler会根据预设条件(如节点资源是否充足、端口是否冲突等)筛选出可被调度的候选节点。优选阶段调度器会根据候选节点剩余CPU利用率、内存利用率等多种评价指标,利用加权求和方式进行评分,选择评分最高的节点进行Pod部署。随着Kubernetes的普及和应用,为解决资源不足情况下Pod的调度问题,Kubernetes 1.9版本提出Pod的抢占式调度,并在1.10版本实现了具有抢占式调度的策略。抢占式调度可以在资源不足情况下,允许终止并释放正在运行的低优先级Pod所占用的资源,以满足未调度的高优先级Pod的资源需求。但是发生抢占调度时,默认根据业务类型优先级进行抢占,没有充分考虑业务之间的抢占开销以及个性化的业务需求,可能会产生大量的低优先级Pod被驱逐返回调度队列,并且这些Pod再次调度也需要较长等待时间,频繁的Pod驱逐事件也会降低容器资源利用效率和服务质量。
[0004]然而,天基分布式卫星集群容器编排调度系统不同于地面分布式集群,其受限于空间环境中链路拓扑高动态变化和高传输时延,计算、存储和带宽等资源稀缺等条件,直接采用Kubernetes原生资源调度机制存在以下问题:首先Kubernetes拉取Pod主要采用先入先出策略,其默认队列中所有业务的Pod优先级相同,只会按时间顺序来进行调度。首先没有充分考虑应用服务的业务类型和紧迫程度,会出现资源不足导致一些紧迫的或者高优先级的业务不能执行,该情形还往往会引起后续大量抢占调度事件的发生。
[0005]文献“基于Kubernetes的资源动态调度的研究与实现[D].杨鹏飞.浙江大学,
2017”提出了一种基于网络负载的优先级调度策略,该方案根据网络负载状况来划分虚拟机优先级进行最终调度。但该方案收集网络负载指标的方法在天基卫星集群的应用场景并不适用。

技术实现思路

[0006]本专利技术解决的技术问题是:克服现有技术的不足,提供了一种基于天基分布式卫星集群的动态调度方法和系统,更加合理、充分地利用卫星容器集群的资源,提高了容器集群稳定性和服务可靠性。
[0007]本专利技术的技术解决方案是:
[0008]一种基于天基分布式卫星集群的动态调度方法,包括以下步骤:
[0009]1)对待调度Pod根据业务类型、资源需求、紧迫程度和服务质量计算优先级评分,并按照优先级评分从高到低的顺序对待调度Pod进行排序,形成待调度队列;
[0010]2)从待调度队列中选择排序最靠前的待调度Pod,判断卫星集群中是否存在能够满足当前待调度Pod的资源需求的卫星节点,若存在则进入步骤3),否则进入步骤4);
[0011]3)将当前待调度Pod部署到能够满足该Pod的资源需求的卫星节点中资源最充分的节点上,进入步骤5);
[0012]4)计算各卫星节点处于服务中的Pod的抢占开销,判断处于服务中的Pod的抢占开销是否存在小于当前待调度Pod的优先级评分的,若不存在,当前待调度Pod返回待调度队列,待有Pod服务执行完毕释放节点资源后,再进行调度;否则将抢占开销最小的处于服务中的Pod的服务终止,释放其所在卫星节点的资源并将当前待调度的Pod部署到该卫星节点上,终止服务的Pod返回待调度队列;进入步骤5);
[0013]5)判断待调度队列是否为空,若为空则结束调度任务,否则进入步骤1)。
[0014]优选的,所述步骤1)中,对动态到达的待调度Pod根据业务类型、资源需求、紧迫程度和服务质量计算优先级评分,具体为:
[0015][0016]其中,p
type
为业务类型优先级评分,p
resource
为资源需求优先级评分,p
ugency
为紧迫程度优先级评分,p
QoS
为服务质量优先级评分;α为业务类型优先等级权重,Type_Prio表示Pod的业务类型优先等级数值;β为资源需求优先等级权重,cpu
total
、mem
total
、disk
total
、net
total
分别为卫星集群中CPU、内存、磁盘、网络带宽资源总量,cpu、mem、disk、net分别为Pod的CPU、内存、磁盘、网络带宽资源需求;δ为紧迫程度优先等级权重,T
current
为当前时刻,T
arrive
为Pod的到达时间,Deadline为Pod的截止时间,ε为服务质量优先等级权重,QoS_Prio表示Pod的服务质量优先等级数值。
[0017]优选的,所述步骤4)中,计算各卫星节点处于服务中的Pod的抢占开销,具体为:
[0018]P
ij
=p
ij

×
com
ij
[0019]其中,p
ij
为处于服务中的Pod的优先级评分,com
ij
为处于服务中的Pod的已完成业
务量百分比,γ为已完成业务量抢占开销权重。
[0020]优选的,所述业务类型优先等级权重α、资源需求优先等级权重β、紧迫程度优先等级权重δ和服务质量优先等级权重ε满足以下关系:
[0021本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于天基分布式卫星集群的动态调度方法,其特征在于,包括以下步骤:1)对待调度Pod根据业务类型、资源需求、紧迫程度和服务质量计算优先级评分,并按照优先级评分从高到低的顺序对待调度Pod进行排序,形成待调度队列;2)从待调度队列中选择排序最靠前的待调度Pod,判断卫星集群中是否存在能够满足当前待调度Pod的资源需求的卫星节点,若存在则进入步骤3),否则进入步骤4);3)将当前待调度Pod部署到能够满足该Pod的资源需求的卫星节点中资源最充分的节点上,进入步骤5);4)计算各卫星节点处于服务中的Pod的抢占开销,判断处于服务中的Pod的抢占开销是否存在小于当前待调度Pod的优先级评分的,若不存在,当前待调度Pod返回待调度队列,待有Pod服务执行完毕释放节点资源后,再进行调度;否则将抢占开销最小的处于服务中的Pod的服务终止,释放其所在卫星节点的资源并将当前待调度的Pod部署到该卫星节点上,终止服务的Pod返回待调度队列;进入步骤5);5)判断待调度队列是否为空,若为空则结束调度任务,否则进入步骤1)。2.根据权利要求1所述的一种基于天基分布式卫星集群的动态调度方法,其特征在于,所述步骤1)中,对动态到达的待调度Pod根据业务类型、资源需求、紧迫程度和服务质量计算优先级评分,具体为:其中,p
type
为业务类型优先级评分,p
resource
为资源需求优先级评分,p
ugency
为紧迫程度优先级评分,p
QoS
为服务质量优先级评分;α为业务类型优先等级权重,Type_Prio表示Pod的业务类型优先等级数值;β为资源需求优先等级权重,cpu
total
、mem
total
、disk
total
、net
total
分别为卫星集群中CPU、内存、磁盘、网络带宽资源总量,cpu、mem、disk、net分别为Pod的CPU、内存、磁盘、网络带宽资源需求;δ为紧迫程度优先等级权重,T
current
为当前时刻,T
arrive
为Pod的到达时间,Deadline为Pod的截止时间,ε为服务质量优先等级权重,QoS_Prio表示Pod的服务质量优先等级数值。3.根据权利要求2所述的一种基于天基分布式卫星集群的动态调度方法,其特征在于,所述步骤4)中,计算各卫星节点处于服务中的Pod的抢占开销,具体为:P
ij
=p
ij

×
com
ij
其中,p
ij
为处于服务中的Pod的优先级评分,com
ij
为处于服务中的Pod的已完成业务量百分比,γ为已完成业务量抢占开销权重。4.根据权利要求2或3所述的一种基于天基分布式卫星集群的动态调度方法,其特征在于,所述业务类型优先等级权重α、资源需求优先等级权重β、紧迫程度优先等级权重δ和服务质量优先等级权重ε满足以下关系:β+δ+ε≤α。5.一种基于天基分布式卫星集群的动态调度系统...

【专利技术属性】
技术研发人员:曾骏杰陶滢高梓贺张磊任术波高曌刘伟龚思龙
申请(专利权)人:中国空间技术研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1