本发明专利技术公开了一种降低高性能计算集群内存功耗的方法及装置,该方法包括:实时监测高性能计算集群的运行状况;对高性能计算集群正在运行的作业类型进行分析,确定高性能计算集群正在运行的作业的内存容错机制;获取所述内存容错机制的容错级别,依据所述容错级别对高性能计算集群的内存功耗进行分配。该方法实现降低内存功耗,在保持集群性能不变的前提下提高能耗比。
【技术实现步骤摘要】
本专利技术涉及高性能计算
,特别是涉及一种降低高性能计算集群内存功耗的方法及装置。
技术介绍
目前,随着高性能计算集群的规模不断增大,功耗日益增高,运行期间的能源消耗费用,甚至超过了集群的建设费用,因此很多厂商都在研发更高效的散热技术。但当代采用的散热技术如无革命性的技术创新已几乎没有提高余地,同时代价也比较高昂。与此同时,多数高性能计算集群采用的内存默认开启了ECC容错机制,比如64位的数据位就需要8位的容错校验位,因此内存的容错机制提高了内存功耗,而某些高性能计算应用程序无需容错,或者仅仅需要简单的容错即可满足用户要求,这样就造成了功耗的浪费。
技术实现思路
本专利技术的目的是提供一种降低高性能计算集群内存功耗的方法及装置,以实现降低内存功耗,在保持集群性能不变的前提下提高能耗比。为解决上述技术问题,本专利技术提供一种降低高性能计算集群内存功耗的方法,该方法包括:实时监测高性能计算集群的运行状况;对高性能计算集群正在运行的作业类型进行分析,确定高性能计算集群正在运行的作业的内存容错机制;获取所述内存容错机制的容错级别,依据所述容错级别对高性能计算集群的内存功耗进行分配。优选的,所述内存容错机制包括:无需容错机制、奇偶校验机制或者ECC校验机制。优选的,所述实时监测高性能计算集群的运行状况之前,还包括:在高性能计算应用程序开始运行后,获取高性能计算集群的当前作业的提交脚本,并在提交脚本中设定关键字,利用关键字设定高性能计算集群的当前作业的内存容错机制。优选的,所述获取所述内存容错机制的容错级别,依据所述容错级别对高性能计算集群的内存功耗进行分配,包括:接收高性能计算集群的当前作业的提交脚本;通过关键字搜索和分析,获取高性能计算集群的当前作业的内存容错机制;依据所述内存容错机制确定所述内存容错机制的容错级别,依据所述容错级别对高性能计算集群的内存功耗进行分配。本专利技术还提供一种降低高性能计算集群内存功耗的装置,该装置包括:监测模块,用于实时监测高性能计算集群的运行状况;分析模块,用于对高性能计算集群正在运行的作业类型进行分析,确定高性能计算集群正在运行的作业的内存容错机制;分配模块,用于获取所述内存容错机制的容错级别,依据所述容错级别对高性能计算集群的内存功耗进行分配。优选的,所述内存容错机制包括:无需容错机制、奇偶校验机制或者ECC校验机制。优选的,所述装置还包括:设定模块,用于在高性能计算应用程序开始运行后,获取高性能计算集群的当前作业的提交脚本,并在提交脚本中设定关键字,利用关键字设定高性能计算集群的当前作业的内存容错机制。优选的,所述分配模块包括:接收单元,用于接收高性能计算集群的当前作业的提交脚本;搜索单元,用于通过关键字搜索和分析,获取高性能计算集群的当前作业的内存容错机制;分配单元,用于依据所述内存容错机制确定所述内存容错机制的容错级别,依据所述容错级别对高性能计算集群的内存功耗进行分配。本专利技术所提供的一种降低高性能计算集群内存功耗的方法及装置,实时监测高性能计算集群的运行状况;对高性能计算集群正在运行的作业类型进行分析,确定高性能计算集群正在运行的作业的内存容错机制;获取所述内存容错机制的容错级别,依据所述容错级别对高性能计算集群的内存功耗进行分配。可见,通过对高性能计算集群作业实时监控、分析,确定高性能计算集群目前运行的作业类型的内存容错机制,并根据内存容错机制的容错级别来对高性能计算集群的内存功耗进行分配,从而依据容错级别来调整内存功耗,降低内存功耗,在保持集群性能不变的前提下提高能耗比。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。图1为本专利技术所提供的一种降低高性能计算集群内存功耗的方法的流程图;图2为本专利技术所提供一种降低高性能计算集群内存功耗的装置的结构示意图。具体实施方式本专利技术的核心是提供一种降低高性能计算集群内存功耗的方法及装置,以实现降低内存功耗,在保持集群性能不变的前提下提高能耗比。为了使本
的人员更好地理解本专利技术方案,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。请参考图1,图1为本专利技术所提供的方一种降低高性能计算集群内存功耗的方法的流程图,该方法包括:S11:实时监测高性能计算集群的运行状况;S12:对高性能计算集群正在运行的作业类型进行分析,确定高性能计算集群正在运行的作业的内存容错机制;S13:获取内存容错机制的容错级别,依据容错级别对高性能计算集群的内存功耗进行分配。其中,内存容错机制包括:无需容错机制、奇偶校验机制或者ECC校验机制。本专利技术所提供的一种降低高性能计算集群内存功耗的方法,实时监测高性能计算集群的运行状况;对高性能计算集群正在运行的作业类型进行分析,确定高性能计算集群正在运行的作业的内存容错机制;获取内存容错机制的容错级别,依据容错级别对高性能计算集群的内存功耗进行分配。可见,该方法通过对高性能计算集群作业实时监控、分析,确定高性能计算集群目前运行的作业类型的内存容错机制,并根据内存容错机制的容错级别来对高性能计算集群的内存功耗进行分配,从而依据容错级别来调整内存功耗,降低内存功耗,在保持集群性能不变的前提下提高能耗比。优选的,实时监测高性能计算集群的运行状况之前,在高性能计算应用程序开始运行后,获取高性能计算集群的当前作业的提交脚本,并在提交脚本中设定关键字,利用关键字设定高性能计算集群的当前作业的内存容错机制。基于步骤S13,该步骤优选采用以下步骤实现:S1:接收高性能计算集群的当前作业的提交脚本;S2:通过关键字搜索和分析,获取高性能计算集群的当前作业的内存容错机制;S3:依据内存容错机制确定内存容错机制的容错级别本文档来自技高网...
【技术保护点】
一种降低高性能计算集群内存功耗的方法,其特征在于,包括:实时监测高性能计算集群的运行状况;对高性能计算集群正在运行的作业类型进行分析,确定高性能计算集群正在运行的作业的内存容错机制;获取所述内存容错机制的容错级别,依据所述容错级别对高性能计算集群的内存功耗进行分配。
【技术特征摘要】
1.一种降低高性能计算集群内存功耗的方法,其特征在于,包
括:
实时监测高性能计算集群的运行状况;
对高性能计算集群正在运行的作业类型进行分析,确定高性能计
算集群正在运行的作业的内存容错机制;
获取所述内存容错机制的容错级别,依据所述容错级别对高性能
计算集群的内存功耗进行分配。
2.如权利要求1所述的方法,其特征在于,所述内存容错机制
包括:无需容错机制、奇偶校验机制或者ECC校验机制。
3.如权利要求1所述的方法,其特征在于,所述实时监测高性
能计算集群的运行状况之前,还包括:
在高性能计算应用程序开始运行后,获取高性能计算集群的当前
作业的提交脚本,并在提交脚本中设定关键字,利用关键字设定高性
能计算集群的当前作业的内存容错机制。
4.如权利要求3所述的方法,其特征在于,所述获取所述内存
容错机制的容错级别,依据所述容错级别对高性能计算集群的内存功
耗进行分配,包括:
接收高性能计算集群的当前作业的提交脚本;
通过关键字搜索和分析,获取高性能计算集群的当前作业的内存
容错机制;
依据所述内存容错机制确定所述内存容错机制的容错级别,依据
所述容错级别对高性能计算集群的内存功耗...
【专利技术属性】
技术研发人员:王渭巍,
申请(专利权)人:浪潮北京电子信息产业有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。