当前位置: 首页 > 专利查询>东南大学专利>正文

基于概率图模型的服务组件可靠性在线时间序列预测方法技术

技术编号:8907030 阅读:458 留言:0更新日期:2013-07-11 04:42
本发明专利技术公开了一种基于概率图模型的服务组件可靠性在线时间序列预测方法,包括如下步骤:(1)motifs发现过程;(2)使用发现的motifs标注服务组件的各个历史参数;(3)通过DBNs模型学习构建CPT;(4)DBNs模型推理并开展基于系统实时参数的在线预测。本发明专利技术提供的基于概率图模型的服务组件可靠性在线时间序列预测方法,能够有效解决面向服务的组件级系统在线可靠性时间序列预测的问题,对服务计算领域软件质量保障问题提供一种有效的解决方案,为我国开展大规模复杂软件系统的应用提供支撑,解决了自主计算领域有关Self-*的相关研究中最为核心的一个问题。

【技术实现步骤摘要】

本专利技术涉及一种利用计算机对面向服务的系统中成员系统(组件级)的可靠性开展在线时间序列预测的方法,尤其涉及一种。
技术介绍
目前尚未发现利用计算机来开展面向服务的计算(Service-OrientedComputing,简称SOC)系统中面向成员系统(组件级)可靠性的在线时间序列预测方法,但存在一些面向传统计算机系统的在线错误预测的方法及面向SOC系统的可靠性预测方法,比如:(I)在线错误预测方法,如基于条件概率的贝叶斯预测、非参数方法预测、曲线拟合方法、sem1-Markov模型、神经网络模型、SVM模型、组件交互图模型、协同过滤技术等,这些模型或方法只能建模错误的发生,在时间上满足泊松分布的错误事件,对SOC系统中由于网络、吞吐量及系统的工作状态等原因所造成的随机波动环境下不确定性错误事件的可靠性预测问题尚缺乏足够的支持;(2)服务计算领域有关可靠性预测的方法,其目的大多集中于容错计算,主要关注的是对错误发生后的组件选择问题,这使得该领域的可靠性预测研究主要集中于对历史平均可靠性的预测,或预测下一个时刻(错误发生的临近时刻)的可靠性,相关预测技术不能完全支持本专利技术所提出的面向SOC的“在线”时间序列可靠性的预测问题。“前摄”错误管理(Proactive Fault Management)是提高计算机系统可靠性,保障系统持续有效运行的一种手段。基于IBM所提出的自主计算的理念,面向服务的系统运行时“前摄”错误管理其核心问题是如何有效的预测系统的可靠性并在此基础上实现组合系统运行时面向系统可靠性的自优化。自主计算中有关self-*(configuration, healing,optimization, or protection)的研究对服务计算领域现有的可靠性预测问题提出新的挑战:服务计算领域现有的有关可靠性预测方面的研究对有效的预测时间问题都没有展开讨论。为支持self-*的研究,可靠性的预测必须是一种在线(on-line)的预测,需要预测未来(near future)的可靠性。在SOC系统中,不同的用户对成员系统的调用时间具有不确定性。
技术实现思路
专利技术目的:为了克服现有技术中存在的不足,本专利技术提供面向SOC系统中不确定性错误事件的成员系统可靠性在线时间序列预测方法,从提高预测方法的可操作性的角度,基于概率图模型,通过分析系统历史的可靠性、吞吐量及响应时间这三组数据,预测前导时间之后的一个有效时间序列周期内系统的可靠性,相比现有的SOC成员系统可靠性预测结果更为精确,更能适应SOC动态、不确定性的应用环境技术方案:为实现上述目的,本专利技术采用的技术方案为:在SOC系统中,用户的行为具有涌现性(emergent behavior),成员系统(服务端)及用户(客户端)的网络状况具有不确定性,成员系统的运行状态(通常由服务端的软、硬件环境决定)同样具有很大的不确定性;这些因素导致SOC的各成员系统其错误的发生在时间上不具备明显的规律性。这些问题导致软件工程领域传统的在线错误预测机理或方法很难适应面向不确定性错误事件的SOC成员系统可靠性在线时间序列预测需求;另一方面,为保障系统的运行质量,使得面向服务的系统能够持续有效的运行,要求所面临的错误预测问题需要预测系统未来的可靠性,且在时间上应保证系统能及时修改服务组合的工作流,并顺利执行完毕;而用户占用每一个成员系统的时间同样具有不确定性,因此同时要求在线预测问题需要能够预测SOC成员系统在有效的未来时间区间内多个时间片上的可靠性时间序列。针对上述问题,本专利技术对概率图模型开展研究,这一模型将图结构和概率模型有机的结合,不仅可以有效的解决现实世界中大量的不确定性问题,而且可以有效的提高人工智能模型的泛化能力。本专利技术对系统历史的响应时间RT、吞吐量T和可靠性R三组参数开展分析,寻找这些参数中的motifs,在此基础上采用概率图模型中的动态贝叶斯网络(Dynamic Bayesian networks, DBNs)模型构建面向成员系统可靠性预测的DBNs模型,以相应的motifs作为DBNs网络节点的参数,并对这些参数开展学习以构建DBNs模型中各节点条件依赖关系的条件概率表(Conditional probability table, CPT),在此基础上开展模型的推理,根据实时采集的系统吞吐量T、响应时间RT参数,预测未来的可靠性R时间序列。具体的,,包括如下步骤:(l)motifs发现过程:寻找历史参数中响应时间RT、吞吐量T和可靠性R三组参数中的 motifs ;记响应时间 RT 的 motifs 为 RT_motifs(i)、i=l, 2,..., nRT,吞吐量 T 的 motifs为 T_motifs(j)、j=l, 2,..., ητ,可靠性 R 的 motifs 为 R_motifs(k)、k=l, 2,..., nE ;其中,motifs表示系统历史参数时间序列数据中出现次数大于某一阈值的系统参数的特征子序列,采用基于时间序列数据相似度(如欧式距离)的方法确定motifs ;(2)使用发现的motifs标注服务组件的各个历史参数:首先将历史参数的每个时间序列分别以与该时间序列包含的特征子序列相似度最大的motifs进行标注,具体为将响应时间RT的每个时间序列分别以与该时间序列包含的特征子序列相似度最大的motifs进行标注,将吞吐量T的每个时间序列分别以与该时间序列包含的特征子序列相似度最大的motifs进行标注,将可靠性R的每个时间序列分别以与该时间序列包含的特征子序列相似度最大的motifs进行标注;然后通过历史参数的标注结果统计历史参数的变化规律;(3)通过DBNs模型学习构建CPT:基于历史参数的变化规律,构建面向成员系统可靠性R预测的DBNs模型,以相应参数的motifs标注作为DBNs网络中节点的参数,并对网络节点参数开展学习以构建DBNs模型中各节点的条件概率表CPT ;(4) DBNs模型推理并开展基于系统实时参数的在线预测:根据实时采集的响应时间RT和吞吐量T,通过CPT计算子节点的概率分布,实现对未来可靠性R时间序列的预测。优选的,所述步骤(I)中,基于k-means方法计算时间序列数据的相似度,通过相似度的方法确定motifs的出现。有益效果:本专利技术提供的,能够有效解决面向服务的组件级系统在线可靠性时间序列预测的问题,对服务计算领域软件质量保障问题提供一种有效的解决方案,为我国开展大规模复杂软件系统的应用提供支撑,解决了自主计算领域有关Self-* (configuration、healing、optimization、或protection)的相关研究中最为核心的一个问题。附图说明图1为传统的动态贝叶斯网络模型;图2为基于概率图模型的服务组件可靠性在线时间序列预测框架。具体实施例方式下面结合附图对本专利技术作更进一步的说明。概率图模型(probabilistic graphical models)可以模拟不同物理区域之间的相关性或依赖关系,反映所收集的现实世界中不确定信息和需要的目标信息之间的关系。这类模型将图和概率结合,可将变量子集(甚至一个变量)的局部分布,根据变量之间内在的结构,转变为对变量集合整体的联合本文档来自技高网
...

【技术保护点】
基于概率图模型的服务组件可靠性在线时间序列预测方法,其特征在于:包括如下步骤:(1)motifs发现过程:寻找历史参数中响应时间RT、吞吐量T和可靠性R三组参数中的motifs;记响应时间RT的motifs为RT_motifs(i)、i=1,2,...,nRT,吞吐量T的motifs为T_motifs(j)、j=1,2,...,nT,可靠性R的motifs为R_motifs(k)、k=1,2,...,nR;其中,motifs表示系统历史参数时间序列数据中出现次数大于某一阈值的系统参数的特征子序列,采用基于时间序列数据相似度的方法确定motifs;(2)使用发现的motifs标注服务组件的各个历史参数:首先将历史参数的每个时间序列分别以与该时间序列包含的特征子序列相似度最大的motifs进行标注,具体为将响应时间RT的每个时间序列分别以与该时间序列包含的特征子序列相似度最大的motifs进行标注,将吞吐量T的每个时间序列分别以与该时间序列包含的特征子序列相似度最大的motifs进行标注,将可靠性R的每个时间序列分别以与该时间序列包含的特征子序列相似度最大的motifs进行标注;然后通过历史参数的标注结果统计历史参数的变化规律;(3)通过DBNs模型学习构建CPT:基于历史参数的变化规律,构建面向成员系统可靠性R预测的DBNs模型,以相应参数的motifs标注作为DBNs网络中节点的参数,并对网络节点参数开展学习以构建DBNs模型中各节点的条件概率表CPT;(4)DBNs模型推理并开展基于系统实时参数的在线预测:根据实时采集的响应时间RT和吞吐量T,通过CPT计算子节点的概率分布,实现对未来可靠性R时间序列的预测。...

【技术特征摘要】

【专利技术属性】
技术研发人员:王红兵王磊
申请(专利权)人:东南大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1