System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 对GPU服务器进行精准功耗封顶管理的方法及系统技术方案_技高网

对GPU服务器进行精准功耗封顶管理的方法及系统技术方案

技术编号:42409743 阅读:4 留言:0更新日期:2024-08-16 16:28
本发明专利技术提出一种对GPU服务器进行精准功耗封顶管理的方法及系统,应用于BMC控制处理器,该方法包括:实时侦测服务器的整机总功耗,并判断是否对服务器设置有功耗封顶,若设置有功耗封顶,则获取功耗封顶值,并根据功耗封顶值判断服务器的整机总功耗是否已超过预设的功耗封顶值,若服务器的整机总功耗已超过预设的功耗封顶值,则根据服务器的整机总功耗值计算出GPU卡所需的降频量,并生成PWM信号发送给GPU设备,以通知GPU设备根据PWM信号对GPU卡进行精准降频。本发明专利技术能够在功耗超标时迅速计算出降频量,并通过PWM信号指导GPU设备进行精准降频操作,解决GPU服务器的使用中功耗封顶技术难点,确保服务器高效能运行的同时稳定性。

【技术实现步骤摘要】

本专利技术涉及gpu服务器功耗管理,特别涉及一种对gpu服务器进行精准功耗封顶管理的方法及系统。


技术介绍

1、随着大数据和人工智能技术的广泛应用,gpu服务器逐渐崭露头角。这种服务器通过安装多张gpu卡来增强性能及算力,使得gpu卡的功耗远超过cpu的功耗。

2、在传统的服务器架构中,cpu是功耗的主要来源,传统技术在对服务器进行功耗管理时,主要关注cpu的功耗控制,这在一定程度上确实能够降低整机的功耗。然而,在gpu服务器日益普及的今天,这种管理策略暴露出明显的不足。由于gpu卡的功耗远大于cpu,仅仅降低cpu的功耗并不能有效地实现整机的功耗封顶。事实上,对于gpu服务器而言,其功耗大多集中在gpu卡上,单纯降低cpu功耗对于整机的功耗控制效果微乎其微。

3、此外,传统技术缺乏对gpu卡功耗的精准管理,无法根据服务器的实时功耗状况动态调整gpu卡的工作频率。这导致在服务器功耗接近或超过封顶值时,无法有效地降低gpu卡的功耗,从而无法保障服务器的稳定运行和高效能耗。


技术实现思路

1、基于此,本专利技术的目的是提出一种对gpu服务器进行精准功耗封顶管理的方法及系统,以解决上述提到的问题。

2、根据本专利技术提出的对gpu服务器进行精准功耗封顶管理的方法,应用于bmc控制处理器,所述方法包括:

3、实时侦测当前运行的服务器的整机总功耗,并判断是否对服务器设置有功耗封顶;

4、若设置有功耗封顶,则获取功耗封顶值,并根据功耗封顶值判断当前运行的服务器的整机总功耗是否已超过预设的功耗封顶值;

5、若当前运行的服务器的整机总功耗已超过预设的功耗封顶值,则根据当前运行的服务器的整机总功耗值计算出gpu卡所需的降频量,并生成pwm信号发送给gpu设备,以通知gpu设备根据pwm信号对gpu卡进行精准降频。

6、进一步地,所述根据功耗封顶值判断当前运行的服务器的整机总功耗是否已超过预设的功耗封顶值的步骤后还包括:

7、若当前运行的服务器的整机总功耗未超过预设的功耗封顶值,则判定不需对gpu卡进行降频,并生成pwm信号发送给gpu设备,以通知gpu设备将gpu卡的工作频率拉满至100%。

8、进一步地,所述根据当前运行的服务器的整机总功耗值及预设的功耗封顶值计算出gpu卡所需的降频量的步骤中:

9、计算公式为:每个gpu卡所需的降频量=(x-y)/(x×n),其中,x为当前运行的服务器的整机总功耗值,y为预设的功耗封顶值,n为所安装的gpu卡的数量。

10、进一步地,本专利技术提出的对gpu服务器进行精准功耗封顶管理的方法,还应用于gpu设备,所述方法包括:

11、持续从bmc控制处理器接收pwm信号;

12、对接收到的pwm信号进行解析,以获取pwm信号值,其中,pwm信号是一个模拟信号;

13、判断解析出的pwm信号值是否等于100%;

14、若pwm信号值不等于100%,则根据pwm信号值计算降频量,并根据计算得到的降频量调整工作频率,进行精准降频,降低功耗。

15、进一步地,所述判断解析出的pwm信号值是否等于100%的步骤后还包括:

16、若pwm信号值等于100%,则不进行降频操作,并判断当前的工作频率是否为最大工作频率;

17、若为最大工作频率,则保持当前的工作频率。

18、进一步地,所述判断当前的工作频率是否为最大工作频率的步骤后还包括:

19、若不是最大工作频率,则将当前的工作频率拉至最大;

20、对接收到的下一个pwm信号进行解析,并获取pwm信号值;

21、判断解析的pwm信号值是否等于100%;

22、若pwm信号值等于100%,则不进行降频操作,保持当前的工作频率。

23、进一步地,所述判断解析的pwm信号值是否等于100%的步骤后还包括:

24、若pwm信号值不等于100%,则根据pwm信号值计算降频量,并根据计算得到的降频量调整工作频率,进行精准降频,降低功耗。

25、进一步地,所述对接收到的pwm信号进行解析,以获取pwm信号值的步骤包括:

26、获取pwm信号的当前电平状态;

27、根据连续采样的pwm信号的电平状态变化,识别出pwm信号的完整周期,其中,一个完整的pwm周期包括高电平时间和低电平时间;

28、对高电平时间占整个周期时间的比例进行计算,以得到占空比;

29、将计算出的占空比转换为具体的数值表示,并定为pwm信号值,用于表示pwm信号的强度或级别。

30、本专利技术还提供一种对gpu服务器进行精准功耗封顶管理的系统,应用于bmc控制处理器,包括:

31、功耗监测模块:用于实时侦测当前运行的服务器的整机总功耗,并判断是否对服务器设置有功耗封顶;

32、第一判断模块:用于若设置有功耗封顶,则获取功耗封顶值,并根据功耗封顶值判断当前运行的服务器的整机总功耗是否已超过预设的功耗封顶值;

33、第一降频模块:用于若当前运行的服务器的整机总功耗已超过预设的功耗封顶值,则根据当前运行的服务器的整机总功耗值计算出gpu卡所需的降频量,并生成pwm信号发送给gpu设备,以通知gpu设备根据pwm信号对gpu卡进行精准降频。

34、本专利技术还提出一种对gpu服务器进行精准功耗封顶管理的设备,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述的对gpu服务器进行精准功耗封顶管理的方法。

35、综上,本专利技术提出了一种对gpu服务器进行精准功耗封顶管理的方法,实时侦测当前运行的服务器的整机总功耗,并判断是否对服务器设置有功耗封顶,一旦确认服务器设置有功耗封顶,并检测到当前整机总功耗超出预设的封顶值,bmc控制处理器将迅速计算出gpu卡所需的降频量,并通过生成pwm信号精准指导gpu设备进行降频操作。这一方法在对服务器功耗的实时动态监控的基础上,确保了gpu设备能够根据实时功耗情况进行快速、精确的响应,解决gpu服务器的使用中功耗封顶技术难点,从而有效防止了功耗超标,保障了服务器的稳定运行和高效能耗管理。通过本专利技术的应用,可以显著提高服务器的能效比,降低运营成本,对于数据中心和云计算等大规模应用场景具有重要意义。

36、本专利技术的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本专利技术的实施例了解到。

本文档来自技高网...

【技术保护点】

1.一种对GPU服务器进行精准功耗封顶管理的方法,应用于BMC控制处理器,其特征在于,所述方法包括:

2.根据权利要求1所述的对GPU服务器进行精准功耗封顶管理的方法,其特征在于,所述根据功耗封顶值判断当前运行的服务器的整机总功耗是否已超过预设的功耗封顶值的步骤后还包括:

3.根据权利要求1所述的对GPU服务器进行精准功耗封顶管理的方法,其特征在于,所述根据当前运行的服务器的整机总功耗值及预设的功耗封顶值计算出GPU卡所需的降频量的步骤中:

4.根据权利要求1所述的对GPU服务器进行精准功耗封顶管理的方法,应用于GPU设备,其特征在于,所述方法包括:

5.根据权利要求4所述的对GPU服务器进行精准功耗封顶管理的方法,其特征在于,所述判断解析出的PWM信号值是否等于100%的步骤后还包括:

6.根据权利要求5所述的对GPU服务器进行精准功耗封顶管理的方法,其特征在于,所述判断当前的工作频率是否为最大工作频率的步骤后还包括:

7.根据权利要求5所述的对GPU服务器进行精准功耗封顶管理的方法,其特征在于,所述判断解析的PWM信号值是否等于100%的步骤后还包括:

8.根据权利要求4所述的对GPU服务器进行精准功耗封顶管理的方法,其特征在于,所述对接收到的PWM信号进行解析,以获取PWM信号值的步骤包括:

9.一种对GPU服务器进行精准功耗封顶管理的系统,应用于BMC控制处理器,其特征在于,包括:

10.一种对GPU服务器进行精准功耗封顶管理的设备,其特征在于,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如权利要求1-8任一项所述的对GPU服务器进行精准功耗封顶管理的方法。

...

【技术特征摘要】

1.一种对gpu服务器进行精准功耗封顶管理的方法,应用于bmc控制处理器,其特征在于,所述方法包括:

2.根据权利要求1所述的对gpu服务器进行精准功耗封顶管理的方法,其特征在于,所述根据功耗封顶值判断当前运行的服务器的整机总功耗是否已超过预设的功耗封顶值的步骤后还包括:

3.根据权利要求1所述的对gpu服务器进行精准功耗封顶管理的方法,其特征在于,所述根据当前运行的服务器的整机总功耗值及预设的功耗封顶值计算出gpu卡所需的降频量的步骤中:

4.根据权利要求1所述的对gpu服务器进行精准功耗封顶管理的方法,应用于gpu设备,其特征在于,所述方法包括:

5.根据权利要求4所述的对gpu服务器进行精准功耗封顶管理的方法,其特征在于,所述判断解析出的pwm信号值是否等于100%的步骤后还包括:

6.根据权利要求...

【专利技术属性】
技术研发人员:姚玲唐斌
申请(专利权)人:深圳市同泰怡信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1