本发明专利技术公布了一种考虑云计算共因故障和虚拟机故障迁移的可靠性建模方法,属于网络可靠性技术领域。本方法包括:建立云计算系统并进行资源分配;对云计算系统进行状态空间划分,并计算各状态存在概率;确定云计算系统可靠性建模方式;正常工作的虚拟机数量满足需求的概率计算;分状态计算各状态的迁移失败概率;计算给定需求下考虑共因和虚拟机故障迁移的云计算系统可靠度。本发明专利技术方法考虑了云计算系统中由服务器故障引起的多个虚拟机共因故障和虚拟机迁移的容错策略,基于状态空间模型,解决了其他模型对这种共因故障和虚拟机故障迁移考虑不周的问题;并对状态空间进行化简,提高了建模效率。
【技术实现步骤摘要】
本专利技术属于网络可靠性
,具体涉及一种考虑云计算共因故障和虚拟机故障迁移的可靠性建模方法。
技术介绍
云计算作为一种新的计算模型,由于其高可用性和高可扩展性等优点,已经得到广泛应用。然而,云计算系统故障频发也让人们关注其可靠性问题。虚拟化是云计算系统的关键特征,其通过在物理服务器上创建多个虚拟机(VM)实现,实现了云计算基础设施的共享、提高了资源利用率,由于服务器故障会造成运行在其中的多个虚拟机共同故障,因此,云计算系统的可靠性建模需要考虑共因故障。同时,为了提高系统的可用性,使系统运行过程中有故障发生的情况下仍能保证不间断的服务,云计算系统使用了虚拟机故障迁移技术,即当源主机上的虚拟机发生故障时,通过虚拟机迁移技术将运行在其中的任务迁移到其他正常的目的主机继续执行。虚拟机迁移作为云计算系统特有的一种容错方式,通过故障后任务的迁移实现将故障影响最小化,而虚拟机的迁移又存在迁移失败的可能,成为云计算系统的可靠性建模的难点,但鲜有文献针对虚拟机迁移对云计算系统可靠性的影响进行研究。有一些学者对云计算系统的可靠性建模进行了研究。在云计算基础设施层的可靠性方面,Qiu等(参考文献[1]:Qiu X,Dai Y,Xiang Y,et al.A Hierarchical Correlation Model for Evaluating Reliability,Performance,and Power Consumption of a Cloud Service[J].IEEE Transactions on Systems,Man,and Cybernetics:Systems,2016,46(3):401-412.)考虑了服务器故障引起的虚拟机共因故障,其可靠性定义为至少一个虚拟机能提供服务的概率,然而事实上,要提供可靠的云服务,需要一定数量的服务器/虚拟机,同时,在其可靠性建模中没有云计算的容错特征。在云计算服务可靠性方面,谭峰(参考文献[2]:谭峰.云计算可靠性评估与任务调度方法研究[D].电子科技大学,2012.)对云服务可靠性即云计算系统对用户请求能否在规定时间内给出响应的概率进行建模,考虑了云计算系统中计算节点和通信链路采用容错机制带来的影响,建立了云服务可靠性模型,然而其没有考虑云计算系统的虚拟化特征,也没有针对具体的容错方法进行建模。
技术实现思路
本专利技术的目的是为了解决云计算的可靠性建模中对虚拟机故障迁移考虑不周的问题,在考虑共因故障的云计算系统可靠性模型的基础上,针对虚拟机迁移的容错策略,实现给定需求下考虑共因和虚拟机故障迁移的云计算系统可靠性建模。本专利技术提供的考虑共因和虚拟机故障迁移的云计算系统可靠性建模方法,适用于如下情况:(1)服务器被划分为多个虚拟机,划分策略为一个核对应一个虚拟机,即服务器的核与虚拟机之间为一对一映射关系。(2)服务器的故障会引起其上所有虚拟机的故障,服务器和不同服务器的虚拟机之间故障独立。(3)使用以负载均衡为目标的云计算资源分配策略,即在资源分配时将队列中等待执行的任务优先分配给负载较轻的服务器节点。(4)当执行任务的虚拟机节点故障时,将运行在其中的任务迁移到其他正常服务器上(包括服务器正常和其上运行的虚拟机全部正常)继续运行;如服务器上已有虚拟机出现故障,则不会选择迁移到该服务器上的其他虚拟机。(5)迁移策略如下:将故障虚拟机迁移到其他服务器上的虚拟机。每个虚拟机迁移次数不限,直到没有剩余空间供继续迁移。本专利技术的考虑共因和虚拟机故障迁移的云计算系统可靠性建模方法,实现步骤为:步骤一,建立云计算系统,使用以负载均衡为目标的云计算资源分配策略;设云计算系统中包含n类服务器,第i类服务器的个数为mi个且每个服务器含有pi个核,每个核对应一个虚拟机;其中,第i类服务器故障服从失效率为λS(i)的指数分布,服务器之间故障独立,第i类服务器下虚拟机的故障服从失效率为λV(i)的指数分布,n、mi、pi均为正整数,i=1,2,…,n。假设完成任务需要z个虚拟机,使用上述分配策略将任务分配给云计算系统中的z个虚拟机。步骤二:对云计算系统进行状态空间划分,并计算各状态存在概率;设Pα(i,q)表示第i类单台服务器第q种状态的存在概率,单台服务器状态划分为三类:单台服务器中虚拟机全部不可用、单台服务器中虚拟机全部可用、单台服务器中有j个可用虚拟机,1≤j≤pi-1;第i类服务器的状态由mi台服务器的状态组合而成,设第i类服务器在第l种状态组合对应的存在概率为Pi,l;在分别得到n类服务器的状态组合及其存在概率后,枚举整个云计算系统的状态,将不同类服务器状态对应的存在概率相乘,得到云计算系统在n类服务器状态枚举后的状态组合存在概率;设云计算系统的第k种状态组合的存在概率为P(k);步骤三:确定云计算系统可靠性建模方式;云计算系统在给定工作时间内可靠需要满足两个条件:(1)正常工作的虚拟机数目不小于z;(2)执行工作的虚拟机若出现故障,能成功迁移;云计算系统可靠度R=Pr{正常工作的虚拟机数量满足需求本文档来自技高网...
【技术保护点】
一种考虑共因和虚拟机故障迁移的云计算系统可靠性建模方法,其特征在于,实现步骤如下:步骤一:建立云计算系统,使用以负载均衡为目标的云计算资源分配策略;设云计算系统中包含n类服务器,第i类服务器的个数为mi个且每个服务器含有pi个核,每个核对应一个虚拟机;其中,第i类服务器故障服从失效率为λS(i)的指数分布,服务器之间故障独立,第i类服务器下虚拟机的故障服从失效率为λV(i)的指数分布,n、mi、pi均为正整数,i=1,2,…,n;设完成任务需要z个虚拟机,并以负载均衡为目标分配资源;步骤二:对云计算系统进行状态空间划分,并计算各状态存在概率;虚拟机的故障和正常两种状态,分别用1和0表示;设Pα(i,q)表示第i类单台服务器第q种状态的存在概率,单台服务器状态划分为三类:单台服务器中虚拟机全部不可用、单台服务器中虚拟机全部可用、单台服务器中有j个可用虚拟机,1≤j≤pi‑1;第i类服务器的状态由mi台服务器的状态组合而成,设第i类服务器在第l种状态组合对应的存在概率为Pi,l;在分别得到n类服务器的状态组合及其存在概率后,枚举整个云计算系统的状态,将不同类服务器状态对应的存在概率相乘,得到云计算系统在n类服务器状态枚举后的状态组合存在概率;设云计算系统状态k的存在概率为P(k),简写形式为Pk;步骤三:确定云计算系统可靠性建模方式;云计算系统在给定工作时间内可靠需要满足两个条件:(1)正常工作的虚拟机数目不小于z;(2)执行工作的虚拟机若出现故障,能成功迁移;云计算系统可靠度R=Pr{正常工作的虚拟机数量满足需求}‑Pr{正常虚拟机数量满足需求但需要迁移且无法迁移成功};步骤四:确定正常工作的虚拟机数量满足需求的概率RCCF;其中,Ak为判别变量,步骤五:计算云计算系统中正常虚拟机数目大于等于z、需要迁移且迁移失败的概率;对于正常虚拟机数目大于等于z的状态,设状态k中需要迁移的虚拟机数目为Xk,供迁移的位置数为Yk;Xk的取值范围为则通过迁移不能满足使用要求的概率其中,f为虚拟机迁移成功概率;步骤六:计算给定需求下考虑共因和虚拟机故障迁移的云计算系统可靠度R;R=RCCF-Σk=1MP(k)Q(k)]]>其中,M为云计算系统对应的状态空间模型中正常工作的虚拟机数目满足要求,但分配到任务的虚拟机存在故障而需要迁移的状态数目;M=Σj=0Σipimi-zCΣipimij-2Σipimi-z.]]>...
【技术特征摘要】
1.一种考虑共因和虚拟机故障迁移的云计算系统可靠性建模方法,其特征在于,实现步骤如下:步骤一:建立云计算系统,使用以负载均衡为目标的云计算资源分配策略;设云计算系统中包含n类服务器,第i类服务器的个数为mi个且每个服务器含有pi个核,每个核对应一个虚拟机;其中,第i类服务器故障服从失效率为λS(i)的指数分布,服务器之间故障独立,第i类服务器下虚拟机的故障服从失效率为λV(i)的指数分布,n、mi、pi均为正整数,i=1,2,…,n;设完成任务需要z个虚拟机,并以负载均衡为目标分配资源;步骤二:对云计算系统进行状态空间划分,并计算各状态存在概率;虚拟机的故障和正常两种状态,分别用1和0表示;设Pα(i,q)表示第i类单台服务器第q种状态的存在概率,单台服务器状...
【专利技术属性】
技术研发人员:李瑞莹,李琼,
申请(专利权)人:北京航空航天大学,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。