本发明专利技术公布了一种考虑共因故障的云计算系统可靠性建模方法,属于网络可靠性技术领域。本方法包括:确定云计算系统同类单台服务器状态组合并进行化简;采用故障树法计算同类单台服务器简化后状态组合的存在概率;确定云计算系统同类服务器间状态组合并进行化简,计算各状态组合的存在概率;枚举云计算系统不同类服务器状态组合,计算各状态组合的存在概率;根据云计算系统状态空间计算给定需求下的系统可靠度。本发明专利技术方法考虑了由服务器故障引起的运行在其上的所有虚拟机之间的共因故障,采用状态空间建模,并对状态空间进行化简,解决了当系统规模增大时状态空间爆炸的问题,提高了建模效率。
【技术实现步骤摘要】
考虑共因故障的云计算系统可靠性建模方法
本专利技术属于网络可靠性
,具体涉及一种考虑云计算共因故障的可靠性建模方法。
技术介绍
云计算作为一种新的计算模型,将大量计算资源组成数据中心,再以服务的形式提供给用户,带来便利的同时又降低了计算和存储成本,已经得到广泛应用。然而,云计算系统故障频发也让人们关注其可靠性问题,其复杂的结构为云计算可靠性分析带来困难。同时,虚拟化作为云计算系统的关键特征,通过在物理服务器上创建多个虚拟机(VM)实现,一方面实现了云计算基础设施的共享,提高资源利用率,另一方面,当服务器故障时,运行在其中的多个虚拟机存在共因故障,这使得云计算的可靠性建模与传统系统不同。云计算基础设施是指由服务器和虚拟机组成的云计算资源池。云计算系统的共因故障已被认知,例如Thanakornworakij等(参考文献[1]:ThanakornworakijT.,NassarR.F.,LeangsuksunC.,etal.Areliabilitymodelforcloudcomputingforhighperformancecomputingapplications[C]//Euro-Par2012:ParallelProcessingWorkshops.SpringerBerlinHeidelberg,2013:474-483)考虑了硬件故障和软件故障,假设一个应用程序分布在多个服务器的多个虚拟机上,分别考虑硬件和软件的共因故障进行可靠性建模。然而没有考虑由服务器故障引起的运行在其中的多个虚拟机共因故障;又如Qiu等(参考文献[2]:QiuX.,DaiY.,XiangY.,etal.AHierarchicalCorrelationModelforEvaluatingReliability,Performance,andPowerConsumptionofaCloudService[J].)考虑了服务器故障引起的虚拟机共因故障,其可靠性定义为至少一个虚拟机能提供服务的概率,然而事实上,要提供可靠的云服务,需要一定数量的服务器/虚拟机,因此本申请提出一种考虑共因故障的云计算系统状态空间建模方法,并在此基础上在给定需求下对云计算系统进行可靠性建模。
技术实现思路
本专利技术的目的是为了解决云计算的可靠性建模中对由服务器故障引起虚拟机共因故障考虑不周的问题,以服务器和虚拟机为基本元素,分析云计算系统对应给定需求下的状态组合,并给出状态组合化简方法,基于故障树和状态空间模型实现给定需求下考虑共因故障的云计算系统可靠性建模。本专利技术提供的考虑共因故障的云计算系统可靠性建模方法,适用于如下情况:1)云计算系统的基础设施包含n类服务器,第i类服务器的个数为mi个且每个服务器含有pi个核。即云计算系统的服务器个数为个;(2)服务器被划分为多个虚拟机,划分策略为一个核对应一个虚拟机,即服务器的核与虚拟机之间为一对一映射关系;(3)服务器的故障会引起其上所有虚拟机的故障。考虑共因故障的基本参数模型(BasicParameterModel,BPM):同类服务器的故障服从指数分布,第i类服务器的失效率记为λs,i,同类服务器下虚拟机的故障也服从指数分布,第i类服务器下虚拟机的失效率记为λv,i;(4)服务器之间的故障独立。本专利技术提供的考虑共因故障的云计算系统可靠性建模方法,包括如下步骤:步骤一:确定云计算系统同类单台服务器状态组合并进行状态化简;每个虚拟机有故障和正常两种状态,分别用1和0表示。对于第i类单台服务器,虚拟机数目为pi,因此每台服务器包含种状态,每种状态由pi个0或1组成。进行状态化简的原则是:单台服务器内故障虚拟机数目相同,故障虚拟机的序号不同时,计算概率相同,进行化简。第i类单台服务器化简后的状态数xi=pi+1。步骤二:采用故障树法计算同类单台服务器简化后状态组合的存在概率;计算出第i类单台服务器的所有第z种状态的存在概率为Psc,z,z=1,2,…,xi。步骤三:确定云计算系统同类服务器间状态组合并进行状态化简,给出各状态组合的存在概率;第i类单台服务器化简后的状态数为xi,第i类服务器有mi台,第i类服务器的状态由mi台服务器的状态进行组合。第i类服务器的状态化简原则是:将所有服务器状态进行枚举时,对服务器状态排序不同但处于各种状态的服务器数量相同的状态组合,其存在概率相同,进行化简。第i类mi台服务器化简后的状态总数Mi为:第i类服务器的第j种状态组合中,单台服务器的xi种状态存在的个数分别为γ1,γ2,...,γxi,则第i类服务器的第j种状态组合的存在概率其中,Qβ,j为第j种状态组合的重复倍数,Psc,y为单台服务器的所有第y种状态的存在概率。步骤四:枚举云计算系统不同类服务器状态组合,并计算各状态组合的存在概率;n类服务器的状态枚举后的状态组合数为将不同类服务器状态对应的存在概率相乘,得到云计算系统在n类服务器状态枚举后的状态组合的存在概率。步骤五:根据云计算系统状态空间计算给定需求下的系统可靠度。本专利技术的优点与积极效果在于:(1)本专利技术考虑云计算系统中由服务器故障引起的多个虚拟机共因故障,该故障是云计算系统中特殊的共因故障,成为云计算系统可靠性建模的难点,本专利技术采用状态空间建模,解决了其他模型对这种共因故障考虑不周的问题;(2)本专利技术方法对状态空间进行了化简,解决了当系统规模增大时状态空间过大,计算繁琐的问题,提高了建模效率。附图说明图1是本专利技术的考虑共因故障的云计算系统可靠性建模方法的流程示意图;图2是云计算系统结构示意图;图3是单台服务器中虚拟机状态全为0的故障树模型;图4是单台服务器中虚拟机状态全为1的故障树模型;图5是单台服务器中虚拟机状态有0有1的故障树模型;图6是本专利技术实施例中的云计算系统组成结构图。具体实施方式下面将结合附图和实施例对本专利技术作进一步的详细说明。本专利技术提出一种考虑共因故障的云计算系统可靠性建模方法,流程如图1所示,包括如下步骤:步骤一:确定云计算系统同类单台服务器状态组合并给出化简方法;建立云计算系统,如图2所示,云计算操作系统(CloudOS)是云计算系统的核心,接收到来自用户的服务请求后将其转化为多个子任务,通过虚拟机分配器分配到各个虚拟机执行。云计算系统的基础设施包含n类服务器,第i类服务器的个数为mi个且每个服务器上含有pi个核,每个核对应一个虚拟机,其中第i类服务器故障服从失效率为λs,i的指数分布,服务器之间故障独立;第i类服务器下虚拟机的故障服从失效率为λv,i的指数分布。n、mi、pi均为正整数,i=1,2,…,n。每个虚拟机有故障和正常两种状态,分别用1和0表示。对于单台服务器,虚拟机数目为pi,因此每台服务器包含种状态,每种状态由pi个0或1组成,具体状态空间如下:由于状态数目过多,首先对其进行化简,化简原则如下:单台服务器内故障虚拟机数目(即单台服务器状态中1的数目)相同,故障虚拟机的序号不同时,计算概率相同,可化简。将单台服务器状态重复倍数Qα定义为单台服务器中虚拟机状态为1的数目相同时,该服务器的所有状态组合数目。具体地,对第i类服务器的单台服务器状态化简如下:(1)单台服务器中虚拟机状态全为0时,记为状态1,状态数目为1,状态1的重本文档来自技高网...
【技术保护点】
一种考虑共因故障的云计算系统可靠性建模方法,其特征在于,设云计算系统的基础设施包含n类服务器,第i类服务器的个数为mi个且每个服务器含有pi个核,服务器的核与虚拟机之间为一对一映射关系,同类服务器的故障服从指数分布,第i类服务器的故障率记为λs,i,同类服务器下虚拟机的故障服从指数分布,第i类服务器下虚拟机的故障率记为λv,i;服务器之间的故障独立;n、mi、pi均为正整数,i=1,2,…,n;所述的建模方法实现步骤如下:步骤一:确定云计算系统同类单台服务器状态组合并进行状态化简;每个虚拟机有故障和正常两种状态,分别用1和0表示,对于第i类单台服务器,虚拟机数目为pi,因此每台服务器包含种状态,每种状态由pi个0或1组成;进行状态化简的原则是:单台服务器内故障虚拟机数目相同,故障虚拟机的序号不同时,计算概率相同,进行化简;则第i类单台服务器化简后的状态数xi=pi+1;步骤二:采用故障树法计算同类单台服务器简化后状态组合的存在概率;步骤三:确定云计算系统同类服务器间状态组合并进行状态化简,计算各状态组合的存在概率;第i类单台服务器化简后的状态数为xi,第i类服务器有mi台,第i类服务器的状态由mi台服务器的状态进行组合;第i类服务器的状态化简原则是:将所有服务器状态进行枚举时,对服务器状态排序不同但处于各种状态的服务器数量相同的状态组合,其存在概率相同,进行化简;第i类mi台服务器化简后的状态总数Mi为:设第i类服务器的第j种状态组合中,单台服务器的xi种状态存在个数分别为则第i类服务器的第j种状态组合的存在概率其中,Qβ,j为第j种状态组合的重复倍数,Psc,y为单台服务器的所有第y种状态的存在概率;步骤四:枚举云计算系统不同类服务器状态组合,并计算各状态组合的存在概率;n类服务器的状态枚举后的状态组合数为将不同类服务器状态对应的存在概率相乘,得到云计算系统在n类服务器状态枚举后的状态组合的存在概率;步骤五:根据云计算系统状态空间计算给定需求下的系统可靠度。...
【技术特征摘要】
1.一种考虑共因故障的云计算系统可靠性建模方法,其特征在于,设云计算系统的基础设施包含n类服务器,第i类服务器的个数为mi个且每个服务器含有pi个核,服务器的核与虚拟机之间为一对一映射关系,同类服务器的故障服从指数分布,第i类服务器的故障率记为λs,i,同类服务器下虚拟机的故障服从指数分布,第i类服务器下虚拟机的故障率记为λv,i;服务器之间的故障独立;n、mi、pi均为正整数,i=1,2,…,n;所述的建模方法实现步骤如下:步骤一:确定云计算系统同类单台服务器状态组合并进行状态化简;每个虚拟机有故障和正常两种状态,分别用1和0表示,对于第i类单台服务器,虚拟机数目为pi,因此每台服务器包含种状态,每种状态由pi个0或1组成;进行状态化简的原则是:单台服务器内故障虚拟机数目相同,故障虚拟机的序号不同时,计算概率相同,进行化简;则第i类单台服务器化简后的状态数xi=pi+1;步骤二:采用故障树法计算同类单台服务器简化后状态组合的存在概率;步骤三:确定云计算系统同类服务器间状态组合并进行状态化简,计算各状态组合的存在概率;第i类单台服务器化简后的状态数为xi,第i类服务器有mi台,第i类服务器的状态由mi台服务器的状态进行组合;第i类服务器的状态化简原则是:将所有服务器状态进行枚举时,对服务器状态排序不同但处于各种状态的服务器数量相同的状态组合,其存在概率相同,进行化简;第i类mi台服务器化简后的状态总数Mi为:设第i类服务器的第j种状态组合中,单台服务器的xi种状态存在个数分别为γ1,γ2,...,γxi,则第i类服务器的第j种状态组合的存在概率其中,Qβ,j为第j种状态组合的重复倍数,Psc,y为单台服务器的所有第y种状态的存在概率;步骤四:枚举云计算系统不同类服务器状态组合,并计算各状态组合的存在概率;n类服务器的状态枚举后的状态组合数为将不同类服务器状态对应的存在概率相乘,得到云计算系统在n类服务器状态枚举后的状态组合的存在概率;步骤五:根据云计算系统状态空间计算给定需求下的系统可靠度;所述的步骤五中,设云计算系统中有不小于g个虚拟机正常工作时认为云计算系统可靠...
【专利技术属性】
技术研发人员:李瑞莹,李琼,黄宁,
申请(专利权)人:北京航空航天大学,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。