一种高性能计算集群运行效率评价方法及系统技术方案

技术编号:37432815 阅读:15 留言:0更新日期:2023-05-05 19:47
本发明专利技术提供了一种高性能计算集群运行效率评价方法及系统,属于信息技术领域。该方法通过对高性能计算集群的各项资源负载数据进行采集,然后利用高性能计算集群的各项资源负载数据获得集群运行效率指标,并将集群运行效率指标进行展示。利用本发明专利技术能够通过高性能计算集群的各项资源负载数据获得地球物理高性能计算集群的单节点CPU利用率、集群CPU利用率、集群在用节点CPU利用率、集群节点可用率、集群节点使用率,并通过可视化页面直观地展示了各类指标,便于后续对业务资源使用情况进行分析,以及对资源调度策略和资源配置进行完善、对业务运行效率进行优化、对业务故障进行报警和预警等。报警和预警等。报警和预警等。

【技术实现步骤摘要】
一种高性能计算集群运行效率评价方法及系统


[0001]本专利技术属于信息
,具体涉及一种高性能计算集群运行效率评价方法及系统。

技术介绍

[0002]在进行地球物理领域的科研生产活动中,由于相关应用的执行、相关实验的持续开展,会产生大量的集群资产的消耗,特别是计算资源,运维人员需要对用户的整个计算资源进行监控和管理,这样才能够有效地分配资源,使资源达到最大化利用,同时能够提升计算效率和为资源能够进行实时调配提供依据。
[0003]随着这种使用计算资源的需求不断加大,集群资产的数据也在不断的扩容,给运维人员带来了很大的运维管理成本,以及排除故障的能力,往往需要根据经验不断地进行挖掘,并耗费大量的时间才能得出结论。
[0004]从上世纪六十年代开始,计算机技术即被应用于石油地球物理勘探。40多年来,几乎所有油气公司、地球物理服务公司、石油地球物理研究机构都建立了软硬件资源集群环境,用于基于地球物理的高性能计算。在从事地球物理领域的科研生产中,基于对集群计算资源全程监控的整体需求,需要对集群的运行效率进行监控和评价。
[0005]目前的方法仅仅通过CPU的利用率来进行监控和评价,但是由于应用的计算方法问题,比如有的时候一个节点(即一台服务器)CPU的利用率只有10%,但是从资源使用的角度来说该资源已经被100%使用。

技术实现思路

[0006]本专利技术的目的在于解决上述现有技术中存在的难题,提供一种高性能计算集群运行效率评价方法及系统,在地球物理高性能计算集群的环境下,实现一个集群运行效率评价方法,提高计算资源运行效率;对基于地球物理的高性能计算集群的运行效率进行监控和评价,根据数据分析每一天哪个时间段资源利用率最忙或者最空闲,分析今年哪个时间段资源利用率最忙或者最空闲,分析哪套集群资源利用率最忙或者最空闲,并根据数据分析情况对集群的整体运行效率的提高给出配置修改建议和业务调整策略。
[0007]本专利技术是通过以下技术方案实现的:
[0008]本专利技术的第一个方面,提供了一种高性能计算集群运行效率评价方法,所述方法通过对高性能计算集群的各项资源负载数据进行采集,然后利用高性能计算集群的各项资源负载数据获得集群运行效率指标,并将集群运行效率指标进行展示。
[0009]本专利技术的进一步改进在于:
[0010]所述方法包括:
[0011](1)采集高性能计算集群的各项资源负载数据;
[0012](2)将高性能计算集群的各项资源负载数据写入数据库中;
[0013](3)根据高性能计算集群的各项资源负载数据获得集群运行效率指标,并将集群
运行效率指标写入数据库中;
[0014](4)将集群运行效率指标进行可视化展示。
[0015]本专利技术的进一步改进在于:
[0016]所述高性能计算集群的各项资源负载数据包括CPU、内存、磁盘、网络的负载信息。
[0017]优选的,所述步骤(2)还包括:
[0018]将采集到的高性能计算集群的各项资源负载数据进行实时展示。
[0019]本专利技术的进一步改进在于:
[0020]所述步骤(3)中获得的集群运行效率指标包括:单节点CPU利用率、集群CPU利用率、集群在用节点CPU利用率、集群节点可用率、集群节点使用率。
[0021]本专利技术的进一步改进在于:
[0022]所述步骤(3)中的根据采集到的高性能计算集群的各项资源负载数据获得集群运行效率指标的操作包括:
[0023](31)利用下式获得单节点CPU利用率p:
[0024]p=100

(CPU

idle)
[0025]其中,CPU

idle为单节点中的CPU空闲率;
[0026](32)利用下式获得集群CPU利用率P:
[0027][0028]其中,N为集群中的节点总数;
[0029](33)利用下式获得集群在用节点CPU利用率R:
[0030][0031]其中,M为有程序运行的节点数;
[0032](34)利用下式获得集群节点可用率K:
[0033][0034]其中,F为故障节点数;
[0035](35)利用下式获得集群节点使用率U:
[0036][0037]其中,E为该套集群中的空节点数。
[0038]本专利技术的第二个方面,提供了一种高性能计算集群运行效率评价系统,所述系统包括:
[0039]数据采集模块:用于采集高性能计算集群的各项资源负载数据;
[0040]流式数据处理模块:与所述数据采集模块连接,用于将数据采集模块采集到的各项资源负载数据及各种处理后的数据写入不同的数据库;
[0041]集群运行效率指标获取模块:与流式数据处理模块连接,用于根据采集到的高性能计算集群的各项资源负载数据获得集群运行效率指标;
[0042]展示模块:与流式数据处理模块、集群运行效率指标获取模块分别连接,用于将采集到的高性能计算集群的各项资源负载数据进行实时展示,以及将集群运行效率指标进行可视化展示。
[0043]本专利技术的进一步改进在于:
[0044]所述集群运行效率指标获取模块获得的集群运行效率指标包括:单节点CPU利用率、集群CPU利用率、集群在用节点CPU利用率、集群节点可用率、集群节点使用率。
[0045]本专利技术的进一步改进在于:
[0046]所述集群运行效率指标获取模块获得集群运行效率指标的操作包括:
[0047]利用下式获得单节点CPU利用率p:
[0048]p=100

(CPU

idle)
[0049]其中,CPU

id1e为单节点中的CPU空闲率;
[0050]利用下式获得集群CPU利用率P:
[0051][0052]其中,N为集群中的节点总数;
[0053]利用下式获得集群在用节点cpu利用率R:
[0054][0055]其中,M为有程序运行的节点数;
[0056]利用下式获得集群节点可用率K:
[0057][0058]其中,F为故障节点数;
[0059]利用下式获得集群节点使用率U:
[0060][0061]其中,E为该套集群中的空节点数。
[0062]本专利技术的第三个方面,提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可执行的至少一个程序,所述至少一个程序被所述计算机执行时使所述计算机执行上述高性能计算集群运行效率评价方法中的步骤。
[0063]与现有技术相比,本专利技术的有益效果是:
[0064]利用本专利技术能够通过高性能计算集群的各项资源负载数据获得地球物理高性能计算集群的单节点CPU利用率、集群CPU利用率、集群在用节点cpu利用率、集群节点可用率、集群节点使用率,并通过可视化页面直观地展示了各类指标,便于后续本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种高性能计算集群运行效率评价方法,其特征在于:所述方法通过对高性能计算集群的各项资源负载数据进行采集,然后利用高性能计算集群的各项资源负载数据获得集群运行效率指标,并将集群运行效率指标进行展示。2.根据权利要求1所述的高性能计算集群运行效率评价方法,其特征在于:所述方法包括:(1)采集高性能计算集群的各项资源负载数据;(2)将高性能计算集群的各项资源负载数据写入数据库中;(3)根据高性能计算集群的各项资源负载数据获得集群运行效率指标,并将集群运行效率指标写入数据库中;(4)将集群运行效率指标进行可视化展示。3.根据权利要求2所述的高性能计算集群运行效率评价方法,其特征在于:所述高性能计算集群的各项资源负载数据包括CPU、内存、磁盘、网络的负载信息。4.根据权利要求2所述的高性能计算集群运行效率评价方法,其特征在于:所述步骤(2)还包括:将采集到的高性能计算集群的各项资源负载数据进行实时展示。5.根据权利要求2所述的高性能计算集群运行效率评价方法,其特征在于:所述步骤(3)中获得的集群运行效率指标包括:单节点CPU利用率、集群CPU利用率、集群在用节点CPU利用率、集群节点可用率、集群节点使用率。6.根据权利要求5所述的高性能计算集群运行效率评价方法,其特征在于:所述步骤(3)中的根据采集到的高性能计算集群的各项资源负载数据获得集群运行效率指标的操作包括:(31)利用下式获得单节点CPU利用率p:p=100

(CPU

idle)其中,CPU

idle为单节点中的CPU空闲率;(32)利用下式获得集群CPU利用率P:其中,N为集群中的节点总数;(33)利用下式获得集群在用节点CPU利用率R:其中,M为有程序运行的节点数;(34)利用下式获得集群节点可用率K:其中,F为故障节点数;(35)利用下式获得集群节点使用率U:<...

【专利技术属性】
技术研发人员:葛鑫李敏张萌
申请(专利权)人:中国石油化工股份有限公司石油物探技术研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1