本发明专利技术公开了一种云数据中心主机延迟开机的方法、装置和系统,属于云计算系统控制领域,本发明专利技术开启数据中心中第一台主机,然后收集云数据中心负载信息,分析未来新增主机需求量后计算下一次开机控制的等待时间和预期开机数量,最后开启主机。本发明专利技术充分考虑了系统负载的动态波动性,通过跟踪其趋势预测合理的新主机开机数量和时机,兼顾性能和节能性。本发明专利技术能够根据云数据中心中各主机负载的变化趋势,评估未来任务负载对新主机数量的需求程度,并制定可变的控制间隔时间,使系统对平稳和突变的任务负载变化响应及时。
【技术实现步骤摘要】
本专利技术属于云计算系统控制领域,特别是涉及一种云数据中心主机延迟开机的方 法、装置和系统。
技术介绍
云计算是一种基于互联网的计算方式,通过这种方式,共享的软硬件资源和信息 可以按需求提供给计算机和其他设备。相对于传统的软件和计算形态,云计算具有松散耦 合、随需应变、成本可控、资源虚拟、异构协同等显著的优势,使其更适应现今的电子商务、 柔性制造、移动互联网等应用。 云数据中心是指由多个异构的、由网络连接在一起的主机所组成的用于承载提供 在线云服务的企业级应用的分布式计算系统。在云数据中心中,将大量的主机进行集中统 一管理,可以保障主机运行所需要的稳定电源环境,适宜的温湿度控制以及网络带宽条件。 同其他软硬件系统一样,云数据中心中的主机在运行时也消耗电力能源。由于现 今的云计算系统多运用于大规模科学计算、实时金融、在线交易、流媒体多播等高负载和高 复杂度的应用,其主机时常处于超负荷运行的状态,因而能源消耗很大。同时,为了对处于 运行状态的主机进行散热和降温,散热风扇阵列本身还需额外消耗很多电力能源,这进一 步加大了云系统整体的能源消耗,增大了运行成本。值得注意的是,实际的商业云数据中心 都不会长时间的持续运行,而会周期性的进行关闭维护工作,之后选择在访问负载较小的 时间(如深夜、凌晨、节假日最后一天晚上等等)重新开机。传统的开机控制技术,多选择 一次性的将所有主机全部打开并产生电力能源消耗,将导致可用的计算资源远高于低负载 时的任务需求,这显然是不经济的。也有部分系统实现了延迟开机的管理策略,但这些策略 只是机械的设定开机的时间点和数量,没有充分的考虑系统实时的负载变化,容易出现"开 机过多"或者"开机不足"的弊端。另外,现有的方法多预先设定一个固定的间隔时间进行 周期性的开机动作控制。然而,由于系统负载的动态可变性,固定间隔时间的控制策略往往 难以即时的对短时间内负载的突发性变化做出迅速响应 在此背景下,如何动态的跟踪云数据中心启动后的运行负载,设置合理的开机策 略,实现节能性与系统性能的双赢,便成为了研宄的热点和难点。
技术实现思路
有鉴于现有技术的上述缺陷,本专利技术所要解决的技术问题是提供一种能够合理预 测新主机开机数量和时机的云数据中心主机延迟开机方法。 为实现上述目的,本专利技术提供了一种云数据中心主机延迟开机的方法,包括以下 步骤: 步骤一、开启数据中心中第一台主机,此时的时间记为0 ;等待时间t后,执行步骤 二;t为预先给定的默认控制间隔时间,t>0 ; 步骤二、收集云数据中心负载信息; 所述负载信息包括: 当前时间dt; 已开机的主机数量k,k彡1 ; 各已经开机的主机的开机时刻ktpkt2, . . .ktk; 各已开机的主机在时间t内的新增任务数量XSl,xs2, . . .xsk; 各已开机的主机在时间t内的完成任务数量WSl,ws2, . . .wsk; 各已开机的主机在时间t内,出现故障的任务数量gSl,gs2, . . .gsk; 步骤三、分析未来新增主机需求量: 设定已开启的各个主机平均故障率为gli,【主权项】1. 一种云数据中心主机延迟开机的方法,其特征在于包括以下步骤: 步骤一、开启数据中心中第一台主机,此时的时间记为O ;等待时间t后,执行步骤二;t 为预先给定的默认控制间隔时间,t>0 ; 步骤二、收集云数据中心负载信息; 所述负载信息包括: 当前时间dt ; 已开机的主机数量k,k彡1 ; 各已经开机的主机的开机时刻ktp kt2, · . . ktk; 各已开机的主机在时间t内的新增任务数量XS1, xs2, . . . xsk; 各已开机的主机在时间t内的完成任务数量WSl,ws2, . . . wsk; 各已开机的主机在时间t内,出现故障的任务数量gSl,gs2, . . . gsk; 步骤三、分析未来新增主机需求量: 设定已开启的各个主机平均故障率为gli, 计算得到已开启的各个主机平均故 障率; 所述xtgl为上一个阶段计算出的系统故障率,所述系统故障率xtgl的初始值为O ; ^为最近t时间内第i个主机的等效故障率,i为正整数; 然后,将xtgl修改为以下新数值:所述zjsl为云数据中心中主机数量; 设定主机最近平均执行率为zxl,计算导到主机最近平均执行率; 步骤四、计算下一次开机控制的等待时间和预期开机数量; 设定下一次开机控制的等待时间为ddt,计算得到下一次开机控制的等待时间; 设定预期开机数量为kjl,计算得 到预期开机数量;所述Zds为单个主机并行处理任务数的最大值; 步骤五、在剩余的未开启的主机中,随机选择kjl个主机开启,等待ddt时间后,返回执 行步骤二。2. 如权利要求1所述的一种云数据中心主机延迟开机的方法,其特征是:所述步骤二 之后还包括判断已开机的主机数量是否等于云数据中心中主机数量的步骤,当已开机的主 机数量等于云数据中心中主机数量时,停止操作并结束;当已开机的主机数量不等于云数 据中心中主机数量时,执行步骤三。3. -种云数据中心主机延迟开机装置,其特征是:包括主机状态监测模块(3)、控制决 策模块(4)和开机控制模块(5);所述主机状态监测模块(3)的输出端连接所述控制决策 模块(4)的输入端,所述控制决策模块(4)的输出端连接所述开机控制模块(5)的输入端; 所述主机状态监测模块(3)用于获取云数据中心各主机的负载信息; 所述控制决策模块(4)用于分析未来新增主机需求量、计算下一次开机控制的等待时 间和预期开机数量; 所述开机控制模块(5)用于执行开启新主机的操作。4. 如权利要求3所述的一种云数据中心主机延迟开机装置,其特征是:所述控制决 策模块(4)包括开机需求量分析单元(401)、控制时机决策单元(402)和开机数计算单元 (403);所述主机状态监测模块(3)的第一输出端连接所述开机需求量分析单当前第1页1 2 本文档来自技高网...
【技术保护点】
一种云数据中心主机延迟开机的方法,其特征在于包括以下步骤:步骤一、开启数据中心中第一台主机,此时的时间记为0;等待时间t后,执行步骤二;t为预先给定的默认控制间隔时间,t>0;步骤二、收集云数据中心负载信息;所述负载信息包括:当前时间dt;已开机的主机数量k,k≥1;各已经开机的主机的开机时刻kt1,kt2,...ktk;各已开机的主机在时间t内的新增任务数量xs1,xs2,...xsk;各已开机的主机在时间t内的完成任务数量ws1,ws2,...wsk;各已开机的主机在时间t内,出现故障的任务数量gs1,gs2,...gsk;步骤三、分析未来新增主机需求量:设定已开启的各个主机平均故障率为gli,计算gl1=gs1t×tt+dt-kt1+xtgl×dt-kt1t+dt-kt1]]>得到已开启的各个主机平均故障率;所述xtgl为上一个阶段计算出的系统故障率,所述系统故障率xtgl的初始值为0;为最近t时间内第i个主机的等效故障率,i为正整数;然后,将xtgl修改为以下新数值:所述zjsl为云数据中心中主机数量;设定主机最近平均执行率为zxl,计算得到主机最近平均执行率;步骤四、计算下一次开机控制的等待时间和预期开机数量;设定下一次开机控制的等待时间为ddt,计算ddt=tifΣi=1kwsixsi>0.7t×zxl-1max{xsi|0<i≤k}+max{gsi|0<i≤k}elseifmax{xsi|0<i≤k}+max{gsi|0<i≤k}>0a×telse]]>得到下一次开机控制的等待时间;设定预期开机数量为kjl,计算得到预期开机数量;所述zds为单个主机并行处理任务数的最大值;步骤五、在剩余的未开启的主机中,随机选择kjl个主机开启,等待ddt时间后,返回执行步骤二。...
【技术特征摘要】
【专利技术属性】
技术研发人员:夏云霓,郭坤垠,罗辛,朱庆生,
申请(专利权)人:重庆大学,
类型:发明
国别省市:重庆;85
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。