基于热负载均衡的数据中心自适应性耗能管理方法技术

技术编号:10658097 阅读:207 留言:0更新日期:2014-11-19 18:20
本发明专利技术公开一种基于热负载均衡的数据中心自适应性耗能管理方法,在每个采样时间内,采用以下步骤进行耗能管理:1)使用RLS模型估算服务器的功耗;2)在约束条件下对费用函数进行优化求解,得出最优的Up(k);3)从Up(k)中选出第一组输入U(k|k)作为真实的控制量U(k);4)计算需要的活跃服务器个数mj;5)平均分配任务到每个机架。本发明专利技术方法,能够动态地分配服务器任务,使数据中心中服务器和冷却系统的总功率消耗降低。

【技术实现步骤摘要】
基于热负载均衡的数据中心自适应性耗能管理方法
本专利技术涉及网络数据中心的耗能管理,更具体的说,涉及一种基于热负载均衡的数据中心自适应性耗能管理方法。
技术介绍
最近几年,随着云计算的蓬勃发展。网络数据中心,作为其基础设施,承载着大量的计算、存储和应用等任务,需要消耗大量的能量来运行和冷却设备。随着云计算服务发展的越来越迅速,数据中心中的能耗越来越大。数据中心中的服务器,作为处理和存储用户任务请求的所在,需要使用大量的能量,并散发大量能量。而由于电子设备的工作温度限制,需要使用冷却设备对数据中心中服务器产生的大量热能进行冷却。当前,学术界和工业界对于数据中心中能量消耗的问题越来越感兴趣。不过,当前学术界的研究主要专注于1、提高服务器的耗能效率,包括使用虚拟化技术,动态电压、频率切换等。2、解决制冷系统中能量效率问题,主要是计算机房间空调系统(ComputerRoomAirConditioner,CRAC)制冷效率的提高。3、其它提高方式。如通过动态负载来达到降温和计算功率的平衡;通过对IT设备、功率及降温设施的整合管理等。然而,对于如何分配任务给服务器,使得服务器和冷却系统的总功率消耗降低,这个问题,却并没有涉及。
技术实现思路
针对上述现有技术中存在的技术问题,本专利技术提供一种基于热负载均衡的数据中心自适应性耗能管理方法,来动态地分配服务器任务,使数据中心中服务器和冷却系统的总功率消耗降低。考虑到问题可扩展性、实时性和应用性,对数据中心中的制冷系统和服务器模型进行了相应的设计和约束,并设计了一种任务分配算法,能够实时地将任务分配给各服务器。为达到上述目的,本专利技术所采用的技术方案如下:一种基于热负载均衡的数据中心自适应性耗能管理方法,在每个采样时间内,采用以下步骤进行耗能管理:1)使用RLS模型估算服务器的功耗;2)在约束条件下对费用函数进行优化求解,得出最优的Up(k);3)从Up(k)中选出第一组输入U(k|k)作为真实的控制量U(k);4)计算需要的活跃服务器个数mj;5)平均分配任务到每个机架。所述步骤1)的方法是:a)首先建立热量模型、功率消耗模型以及任务模型;b)对数据中心功率控制,对所述功率消耗模型做处理能力、负载、功率输入、总功率的限制;c)基于RLS的热量模型评估。所述步骤a)中,热量模型的建立方法是:根据热力学定理,机架j出口的空气温度与机架j输入空气温度,机架j功率消耗的关系为:根据热力学定理,机架j输入空气温度,同机架j输出空气温度及CRACh输出空气温度的关系为:同理,根据热力学定理,CRACh出口的空气温度,输入空气温度与CRACh功率消耗,机架j出口的空气温度间关系为:功率消耗模型的建立方法是:对于功率消耗模型,由于服务器的功率消耗主要依赖于服务器的两个参数,CPU使用率和频率,假定在每个服务器CPU频率一定的情况下,服务器的功率消耗则主要同CPU使用率相关,同时,假定可以采用开-关服务器以节省服务器能耗的策略,则机架j上功率消耗还和机架j上保持开状态的服务器个数相关,因此,可以对其功率建模为:任务模型的建立方法是:考虑Web服务器架构产生的数据请求,前段Web服务器从客户端接收用户请求后,将这些请求分配到不同机架的服务器上进行处理,其中,总请求数为:根据排队论,对任务请求的平均处理延时为:考虑到实时性,需要对任务的平均处理延迟进行限制,即其最大值在一定范围内:所述步骤b)对功率消耗模型做处理能力、负载、功率输入、总功率的限制的方法是:对于一般的连续系统而言,其状态空间模型为:Y=WX,其中U=[P1,...,PM,P,...,PF]T,对离散系统而言,其状态模型为:X(k)=ΦX(k-1)+GU(k-1),Y(k)=WX(k),其中,是系统的第k个采样周期,该离散系统的模型参数为在该离散系统中,涉及对处理能力、负载、功率输入、总功率限制如下;(1)处理能力限制根据任务模型中对服务延迟的限制,将公式变形为:将其变换为矩阵形式,为其中,Ψ1=(IM×MOM×F),(2)负载限制能够被服务器服务的负载量为:其中,PA是对应于每个请求的平均功率;(3)功率输入限制首先,每个机架的服务器和CRAC的输入功率都是非负的,同时CRAC的输入功率必须是整数级的,可以对其限制为:U≥O(M+F)×1,Pj≤Pmax,Pj∈Z+Pmax是CRAC功率输入的最大允许值,将其变为矩阵形式为:Ψ3U≤[Pmax]F×1,其中,Ψ3=(OF×MIF×F);(4)总功率限制机架服务器和CRAC的总功率需求为:将其变换为矩阵形式为:Ψ4U≤Pd,其中,Ψ4=[1,…,1]1×(M+F).,Pd是总功率需求的上界。所述步骤c)基于RLS的热量模型评估的方法是:使用计算流体力学CFD分析方法,将功率消耗建模为多输入多输出线性模型:其中,基于RLS模型,对系统模型进行重写,将其形式变为:X(k+1)=A(k)φ(k)其中,φ(k)=[UT(k),XT(k)]T,X(k)=[B,A],使用RLS模型,主要用于计算系统矩阵A和B,由于使用的RLS模型,依赖于时间变量,考虑其根据时间的迭代过程为:其中表示模型的估计量,E(k+1)表示估测误差向量,P(k)为协方差矩阵,为遗忘因子,所述步骤2)的方法是:使用模型预测控制MPC控制方法进行控制,MPC控制器通过计算控制输入U(k)来最小化下列费用函数:其中,PY和PU是状态和输入的预测长度范围,X(k+s|k)是之后第s个采样间隔的状态预测,和U(k+s|k)都是类似的,Q(s)和R(s)是用来对时间误差和输入功率的补偿矩阵,其中||x||Q(s)=xTQ(s)x,该费用函数主要为最小化温度追踪误差和功率需求,即:使功率需求较小的同时,使得不同时间间隔间的温度变化较小,因此,需要在每一个时间间隔中,对该费用函数求解最小值,并满足相应约束条件如下:Pj∈Z+,其中:Q=diag[Q(s)],R=dian[R(s)]。所述步骤4)的方法是:在满足处理能力约束的情况下,应尽可能地减少保持开状态的处理器,因此,设定每次保持开状态的处理器个数为:并满足限制:所述步骤5)的方法是:假定每个任务的分配,在各个服务器上是均一的,因此,每个机架上分到的任务数为:并满足约束:本专利技术方法,对于数据中心中服务器和CRAC系统的耗能进行优化管理,在提供数据中心中服务器和CRAC温度较小变动、满足任务处理约束等各项约束的同时,降低总能耗。其有益效果如下:1.当使服务器室温度保持在某一定值附近时,温度变化较已有方法平稳;2.能够有效地对热负载做负载均衡,使得热负载的负载峰值降低;3.在服务器室设定温度变化时,我们能够降低总能耗。在具体实施例中,我们能够达到在提高5摄氏度时,总功率消耗能够降低5%以上,CRAC能够降低15%以上的功率消耗。附图说明通过阅读参照以下附图对非限制性实施例所作的详细描述,本专利技术的其它特征、目的和优点将会变得更明显:图1是本专利技术方法的系统模型图;图2是本专利技术实施例中周围温度同时间的关系;图3是本专利技术实施例中峰值功率开-关服务器方法同MPC方法对比;图4是本专利技术实施例中功率减少同设定温度升高的关系。具体实施方式下面结合具体实施例对本专利技术进行详细说明。以下实施例将有助于本本文档来自技高网...
基于热负载均衡的数据中心自适应性耗能管理方法

【技术保护点】
一种基于热负载均衡的数据中心自适应性耗能管理方法,其特征在于,在每个采样时间内,采用以下步骤进行耗能管理:1)使用RLS模型估算服务器的功耗;2)在约束条件下对费用函数进行优化求解,得出最优的Up(k);3)从Up(k)中选出第一组输入U(k|k)作为真实的控制量U(k);4)计算需要的活跃服务器个数mj;5)平均分配任务到每个机架。

【技术特征摘要】
1.一种基于热负载均衡的数据中心自适应性耗能管理方法,其特征在于,在每个采样时间内,采用以下步骤进行耗能管理:1)使用RLS模型估算服务器的功耗;2)在约束条件下对费用函数进行优化求解,得出最优的Up(k),其中Up(k)是对真实控制量U(k)的p步预测函数;3)从Up(k)中选出第一组输入U(k|k)作为真实的控制量U(k),其中,U(k|k)是对真实控制量U(k)的第一组预测值;4)计算需要的活跃服务器个数mj的方法是:在满足处理能力约束的情况下,应尽可能地减少保持开状态的处理器,因此,设定每次保持开状态的处理器个数为:并满足限制:Dj表示机架j处理延时限制,表示机架j的功率,μj表示机架j上服务处理速度,b0,b1表示功率消耗模型中适应性参数;5)平均分配任务到每个机架。2.根据权利要求1所述的基于热负载均衡的数据中心自适应性耗能管理方法,其特征在于,所述步骤1)的方法是:a)首先建立热量模型、功率消耗模型以及任务模型;b)对数据中心功率控制,对所述功率消耗模型做处理能力、负载、功率输入、总功率的限制;c)基于RLS的热量模型评估。3.根据权利要求2所述的基于热负载均衡的数据中心自适应性耗能管理方法,其特征在于,所述步骤a)中,热量模型的建立方法是:根据热力学定理,机架j出口的空气温度与机架j输入空气温度,机架j功率消耗的关系为:其中,分别表示机架j的空气温度,机架j的周边温度,1/Kj表示机架j温度的时间常数,Cj表示机架j功率消耗同空气温度变化的系数,表示机架j的功率,根据热力学定理,机架j输入空气温度,同机架j输出空气温度及CRACh输出空气温度的关系为:其中,分别表示对于一个机架j,其周边的机架l及CRACh的输出空气温度同周边温度系数,表示机架j的周边温度,和表示机架j或CRACh周边的输出空气温度,Hj,h同理,根据热力学定理,CRACh出口的空气温度,输入空气温度与CRACh功率消耗,机架j出口的空气温度间关系为:其中Gh,g和Hh,j分别表示对于CRACh,其周边的CRACg及机架j的输出空气温度同周边温度系数,表示机架j的周边温度,Bh表示CRACh功率消耗同空气温度变化的系数,P表示CPU功率消耗,1/Ah表示CRACh温度的时间常数,表示CRACh周边温度,F表示CRAC个数,M表示服务器机架数目。功率消耗模型的建立方法是:对于功率消耗模型,由于服务器的功率消耗主要依赖于服务器的两个参数,CPU使用率和频率,假定在每个服务器CPU频率一定的情况下,服务器的功率消耗则主要同CPU使用率相关,同时,假定可以采用开-关服务器以节省服务器能耗的策略,则机架j上功率消耗还和机架j上保持开状态的服务器个数相关,因此,可以对其功率建模为:其中,表示机架j上功率消耗,λ表示每秒负载到达数,mj表示机架j上用来处理客户端请求的开着的服务器个数,b0,b1表示功率消耗模型中适应性参数,任务模型的建立方法是:考虑Web服务器架构产生的数据请求,前段Web服务器从客户端接收用户请求后,将这些请求分配到不同机架的服务器上进行处理,其中,总请求数为:其中,L表示总到达请求数,M表示服务器机架数目,λ表示每秒负载到达数,根据排队论,对任务请求的平均处理延时为:其中,表示机架j处理延时,mj表示机架j上用来处理客户端请求的开着的服务器个数,λ表示每秒负载到达数,μj表示机架j上服务处理速度,考虑到实时性,需要对任务的平均处理延迟进行限制,即其最大值在一定范围内:其中,Dj表示机架j处理延时限制,表示机架j处理延时。4.根据权利要求3所述的基于热负载均衡的数据中心自适应性耗能管理方法,其特征在于,所述步骤b)对功率消耗模型做处理能力、负载、功率输入、总功率的限制的方法是:对于一般的连续系统而言,其状态空间模型为:Y=WX,其中为系统输入,为系统输出,U=[P1,...,PM,P,...,PF]T为系统扰动,A,B,W为系统参数,F表示CRAC个数,对离散系统而言,其状态模型为:X(k)=ΦX(k-1)+GU(k-1),Y(k)=WX(k),其中,是系统的第k个采样周期,该离散系统的模型参数为Ts为一个采样间隔,在该离散系统中,涉及对处理能力、负载、功率输入、总功率限制如下;(1)处理能力限制根据任务模型中对服务延迟的限制,将公式变形为:其中,Dj表示机架j处理延时限制,mj表示机架j上用来处理客户端请求的开着的服务器个数,λ表示每秒负载到达数,μj表示机架j上服务处理速度。Mj表示机架j上服务器个数,将其变换为矩阵形式,为:其中,系统参数Ψ1,约束向量第j个约...

【专利技术属性】
技术研发人员:姚建国周海航管海兵
申请(专利权)人:上海交通大学
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1