告警检测任务均衡调度的方法、装置、设备及可读介质制造方法及图纸

技术编号:30759902 阅读:20 留言:0更新日期:2021-11-10 12:13
本发明专利技术提供了一种集群告警检测任务均衡调度的方法、装置、设备及可读介质,该方法包括:获取每个告警检测任务的耗时和资源消耗,并基于获取到的耗时和资源消耗将告警检测任务进行分类;基于告警检测任务的分类为每个告警检测任务分配工作线程数,并实时检测每个告警检测任务的资源消耗;响应于检测到有告警检测任务的资源消耗超过预设阈值,将该告警检测任务执行频率降低。通过使用本发明专利技术的方案,能够有效增加告警线程的利用效率,能够自适应任务线程资源占用限制,避免资源占用过高对系统中其他服务造成影响,能够避免引起CPU资源峰值占用。值占用。值占用。

【技术实现步骤摘要】
告警检测任务均衡调度的方法、装置、设备及可读介质


[0001]本领域涉及计算机领域,并且更具体地涉及一种集群告警检测任务均衡调度的方法、装置、设备及可读介质。

技术介绍

[0002]本专利技术涉及到分布式存储集群相关的领域,分布式存储集群系统一般包含多台存储服务器(Server),这些服务器组成一个集群统一对外提供服务,文中也将服务器用“节点”表示,分布式集群一般都有其告警管理系统,需要定时检测集群节点上软硬件异常并进行告警,软硬件检测指标项比较多(包括系统资源利用率、集群各项服务及硬盘、电源、风扇等硬件设备状态),需要针对各个告警指标项单独建立检测任务线程,进行周期性检测指标项的状态。由于软硬件指标检测耗时和资源消耗不同,会造成任务线程分配不均,并且会引起不必要的系统资源开销。

技术实现思路

[0003]有鉴于此,本专利技术实施例的目的在于提出一种集群告警检测任务均衡调度的方法、装置、设备及可读介质,通过使用本专利技术的技术方案,能够有效增加告警线程的利用效率,能够自适应任务线程资源占用限制,避免资源占用过高对系统中其他服务造成影响,能够避免引起CPU资源峰值占用。
[0004]基于上述目的,本专利技术的实施例的一个方面提供了一种集群告警检测任务均衡调度的方法,包括以下步骤:
[0005]获取每个告警检测任务的耗时和资源消耗,并基于获取到的耗时和资源消耗将告警检测任务进行分类;
[0006]基于告警检测任务的分类为每个告警检测任务分配工作线程数,并实时检测每个告警检测任务的资源消耗;
[0007]响应于检测到有告警检测任务的资源消耗超过预设阈值,将该告警检测任务执行频率降低。
[0008]根据本专利技术的一个实施例,还包括:
[0009]获取每个告警检测任务的运行周期;
[0010]将具有相同运行周期的告警检测任务设置为在告警检测任务执行前在预设时间段内随机休眠后再进行执行。
[0011]根据本专利技术的一个实施例,预设时间段为1秒至30秒。
[0012]根据本专利技术的一个实施例,获取每个告警检测任务的耗时和资源消耗,并基于获取到的耗时和资源消耗将告警检测任务进行分类包括:
[0013]响应于告警检测任务的耗时超过1分钟和/或资源消耗大于30M物理内存,将告警检测任务分类为重量级检测任务;
[0014]响应于告警检测任务的耗时未超过1分钟且资源消耗不大于30M物理内存,将告警
检测任务分类为轻量级检测任务。
[0015]根据本专利技术的一个实施例,基于告警检测任务的分类为每个告警检测任务分配工作线程数,并实时检测每个告警检测任务的资源消耗包括:
[0016]将执行告警检测任务的总线程数中的三分之二分配给重量级检测任务;
[0017]将执行告警检测任务的总线程数中其余的三分之一分配给轻量级检测任务。
[0018]根据本专利技术的一个实施例,响应于检测到有告警检测任务的资源消耗超过预设阈值,将该告警检测任务执行频率降低包括:
[0019]响应于检测到有告警检测任务的资源消耗超过CPU单核的50%,将该告警检测任务执行频率降低50%。
[0020]根据本专利技术的一个实施例,获取每个告警检测任务的耗时和资源消耗包括:
[0021]在集群启动后,将所有告警检测任务执行预设次数并获取每个告警检测任务的总耗时时间和总资源消耗;
[0022]将总耗时时间和总资源消耗取平均值以得到每个告警检测任务的耗时和资源消耗。
[0023]本专利技术的实施例的另一个方面,还提供了一种集群告警检测任务均衡调度的装置,装置包括:
[0024]获取模块,获取模块配置为获取每个告警检测任务的耗时和资源消耗,并基于获取到的耗时和资源消耗将告警检测任务进行分类;
[0025]分配模块,分配模块配置为基于告警检测任务的分类为每个告警检测任务分配工作线程数,并实时检测每个告警检测任务的资源消耗;
[0026]调整模块,调整模块配置为响应于检测到有告警检测任务的资源消耗超过预设阈值,将该告警检测任务执行频率降低。
[0027]本专利技术的实施例的另一个方面,还提供了一种计算机设备,该计算机设备包括:
[0028]至少一个处理器;以及
[0029]存储器,存储器存储有可在处理器上运行的计算机指令,指令由处理器执行时实现上述任意一项方法的步骤。
[0030]本专利技术的实施例的另一个方面,还提供了一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,计算机程序被处理器执行时实现上述任意一项方法的步骤。
[0031]本专利技术具有以下有益技术效果:本专利技术实施例提供的集群告警检测任务均衡调度的方法,通过获取每个告警检测任务的耗时和资源消耗,并基于获取到的耗时和资源消耗将告警检测任务进行分类;基于告警检测任务的分类为每个告警检测任务分配工作线程数,并实时检测每个告警检测任务的资源消耗;响应于检测到有告警检测任务的资源消耗超过预设阈值,将该告警检测任务执行频率降低的技术方案,能够有效增加告警线程的利用效率,能够自适应任务线程资源占用限制,避免资源占用过高对系统中其他服务造成影响,能够避免引起CPU资源峰值占用。
附图说明
[0032]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本
专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的实施例。
[0033]图1为根据本专利技术一个实施例的集群告警检测任务均衡调度的方法的示意性流程图;
[0034]图2为根据本专利技术一个实施例的集群告警检测任务均衡调度的装置的示意图;
[0035]图3为根据本专利技术一个实施例的计算机设备的示意图;
[0036]图4为根据本专利技术一个实施例的计算机可读存储介质的示意图。
具体实施方式
[0037]为使本专利技术的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本专利技术实施例进一步详细说明。
[0038]基于上述目的,本专利技术的实施例的第一个方面,提出了一种集群告警检测任务均衡调度的方法的一个实施例。图1示出的是该方法的示意性流程图。
[0039]如图1中所示,该方法可以包括以下步骤:
[0040]S1获取每个告警检测任务的耗时和资源消耗,并基于获取到的耗时和资源消耗将告警检测任务进行分类。
[0041]在集群启动后,将所有告警检测任务执行预设次数并获取每个告警检测任务的总耗时时间和总资源消耗,将总耗时时间和总资源消耗取平均值以得到每个告警检测任务的耗时和资源消耗,例如,集群启动后将所有的告警检测任务执行50次,监测每个告警检测任务在执行这50次的过程中的总耗时和总的资源消耗,然后取平均值就可以获得每个告警检测任务的平均耗时和资源消耗。还可以根据告警检测任务执行的历史记录获取平均本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种集群告警检测任务均衡调度的方法,其特征在于,包括以下步骤:获取每个告警检测任务的耗时和资源消耗,并基于获取到的耗时和资源消耗将告警检测任务进行分类;基于告警检测任务的分类为每个告警检测任务分配工作线程数,并实时检测每个告警检测任务的资源消耗;响应于检测到有告警检测任务的资源消耗超过预设阈值,将所述告警检测任务执行频率降低。2.根据权利要求1所述的方法,其特征在于,还包括:获取每个告警检测任务的运行周期;将具有相同运行周期的告警检测任务设置为在告警检测任务执行前在预设时间段内随机休眠后再进行执行。3.根据权利要求1所述的方法,其特征在于,所述预设时间段为1秒至30秒。4.根据权利要求1所述的方法,其特征在于,获取每个告警检测任务的耗时和资源消耗,并基于获取到的耗时和资源消耗将告警检测任务进行分类包括:响应于告警检测任务的耗时超过1分钟和/或资源消耗大于30M物理内存,将告警检测任务分类为重量级检测任务;响应于告警检测任务的耗时未超过1分钟且资源消耗不大于30M物理内存,将告警检测任务分类为轻量级检测任务。5.根据权利要求4所述的方法,其特征在于,基于告警检测任务的分类为每个告警检测任务分配工作线程数,并实时检测每个告警检测任务的资源消耗包括:将执行告警检测任务的总线程数中的三分之二分配给所述重量级检测任务;将执行告警检测任务的总线程数中其余的三分之一分配给所述轻量级检测任务。6.根据权利要求1所述的方法,其特征在于,响应于检测到...

【专利技术属性】
技术研发人员:张大帅
申请(专利权)人:济南浪潮数据技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1