当前位置: 首页 > 专利查询>河海大学专利>正文

基于加权朴素贝叶斯分类器的软件服务质量监控方法及系统技术方案

技术编号:10531366 阅读:150 留言:0更新日期:2014-10-15 12:09
本发明专利技术公开了一种基于加权朴素贝叶斯分类器的软件服务质量的监控方法及监控系统,方法通过构造的加权朴素贝叶斯分类器判断软件的QoS属于满足标准类、不满足标准类还是无法判断,训练时设定影响因子组合,影响因子即非软件本身对QoS的影响,计算影响因子组合权值以及先验知识,监控时由分类器得到监控结果,分析、存储并返回评价给数据服务端。系统包括:控制器,采集不同的服务质量声明,向观察器发布不同服务质量所需的数据标准指令,传递需与数据集匹配的QoS标准给训练器,控制采集周期以及频率;数据库汇总分析器的监控结果;服务能力评价模块向数据服务设备返回软件的监控结果和评价结果;还包括观察器、训练器、优化样本集和分析器。

【技术实现步骤摘要】
基于加权朴素贝叶斯分类器的软件服务质量监控方法及系统
本专利技术涉及一种基于加权朴素贝叶斯分类器的软件服务质量监控方法及系统,尤其涉及对运行时QoS需求指标动态加权的监控,属于信息

技术介绍
Web服务技术适应于任何类型的Web环境,包括互联网、Intranet以及Extranet,实现了企业与企业、企业与消费者之间的通信。从Web服务的关键技术来看,Web服务仍具有很大的研究空间和挑战,其中用户需求中最重要的问题之一就是服务质量(QualityofService)问题,QoS的好坏是Web服务在商业应用中能否取得成功的关键。在面向服务(Service-OrientedArchitecture)应用十分广泛的今天,软件系统能够动态将一些松耦合并且具有统一接口定义方式的组件(也就是Service)组合构建起来的,然而在复杂多变的Web环境中,对于第三方服务的依赖会带来许多不确定问题,无法满足QoS需求。因此需要采用运行时监控技术对其进行监控以保证软件执行的正确性。QoS的关键指标如可用性、吞吐量、时延、时延变化(包括抖动和漂移)和丢失等通常用概率来表示不确定性,当前最科学的表示方法是采用模糊语言,来表示系统的可靠运行需要监控诊断的特征量估计值,例如“患者通过网络急救中心呼叫得到应答的时间小于30秒的概率为80%”等。当前的概率监控方法采用假设检验来进行统计,也有基于贝叶斯因子的监控方法,前者只使用单一概率值评估,实际可执行性差,后者的监控结果出错率有待降低,更重要的是,现有的方法都忽略了环境对监控结果的影响,不同的环境会影响我们的概率监控结果,这些环境包括用户的位置,网络,服务器的CPU,RAM,I/O等,例如用户在不同地区使用同一服务时可能体验不同的QoS。因此,现有的概率监控技术已经无法满足概率监控的需要。
技术实现思路
专利技术目的:针对现有技术中存在的问题与不足,提供一种新的监控方法以及监控系统,结合监控环境对监控结果的影响,判断系统运行时行为是否满足系统的QoS属性,使动态QoS监控系统更加敏感,监控结果更加精确,为自适应,用户选择服务提供决策依据,从而保证软件系统的安全可靠。技术方案:一种基于加权朴素贝叶斯推断的软件服务质量监控方法,包括如下步骤:1)根据QoS标准Θ,设定满足QoS标准的类别c0和不满足QoS标准的类别c1;2)训练已搜集到的样本集,获得不同影响因子组合权值wR以及先验知识pli;3)读取运行时的带监控的观测变量组合作为单次样本对单次监控样本进行预处理,样本预处理为对样本进行缺失值填充以及离散化;4)根据样本影响因子R调用权值表得到R的权值;5)统计二项分布成功率的贝叶斯估计值并判别本次样本使样本集的成功率分布于c0还是c1;6)更新样本先验概率p(ci);7)调用朴素贝叶斯分类器xk∈{0,1}得出结果,其中Ci,i∈(0,1);调用加权朴素贝叶斯公式如下:由加权朴素贝叶斯分类器以及HaroldJeffrey的T解释得到TWiRp(X|Ci)P(Ci)},其中对于所述HaroldJeffrey对T解释:支持类C0和支持类C1的比值T,T的取值以及样本集对分类的影响表1:表1T值的意义8)定期连续读取变量组合作为样本,对样本进行预处理并存入样本集xk∈{0,1},m表示样本总数,重复步骤3)~8);所述的影响因子权值,包括三个方面的参数,分别是用户参数,服务端参数,网络环境参数,用户参数包括地点,客户端属性等,服务端参数以云端为例,包括云环境提供的虚拟机的内存大小和计算单元个数,网络环境参数包括带宽和负载,由于影响因子互相不独立,为了减少误差,将上诉参数划分不同的组合,例如影响因子描述如下“中国的用户在PC端调用服务,此时带宽为1Kbit/s,负载为150,所调用服务在云端的服务器参数为虚拟机内存为3.05G”,根据tf*idf算法可知,影响因子对分类的影响与影响因子R在Ci中出现的概率成正比,和影响因子在全部样本中出现的概率成反比,故表示影响因子为R且使整个样本集的成功率落在区域Ci的单个样本个数,Nci表示样本落在区域Ci的样本总个数,N表示样本总个数,nR表示影响因子为R的样本的总个数;所述的朴素贝叶斯分类器,具体为:1)计算先验知识pli,其中pli为经过在不同环境下进行训练的P(xk=1,ci)/P(ci)的平均值;2)计算二项分布概率3)计算P(ci)=nci/N;4)计算影响因子组合权值5)构造朴素贝叶斯分类器表示样本xk的权值,所述的分析结果,具体为选取阀值Thres,T默认为Θ/(1-Θ),类别后验概率较大与较小的比值大于T,说明样本属于后验概率较大的类,否则属于无法判断的区域。为了实现上述目的,本专利技术还提供该方法采用的监控系统,所述系统包括:控制器,用于采集运行时软件的不同服务质量声明,产生不同服务质量所需的数据集标准,指示观察器搜集所需的对应数据集,指导分析器匹配QoS标准和数据集,并控制采集周期和频率;数据库汇总分析器结果数据,并将数据交给服务能力评价模块进行分析,最终得到可以用自然语言向数据服务设备反馈的软件监控结果和评价结果;观察器,用于从数据服务设备端收集所需的服务数据以及影响因子定位,对数据进行补全和离散化;训练器,将不同的影响因子组合作为监控的外部影响,在该影响下得到样本集分析,得到影响因子组合权值wT以及先验知识pli;分析器,根据样本信息调用先验信息以及影响因子权值表,根据朴素贝叶斯分类模块得到监控结果,存入监控结果数据库。所述控制器包括:QoS信息采集模块,用于采集运行时软件的服务声明标准,作为监控标准,产生不同搜集任务指示数据收集端收集对应数据集;计时器,控制监控任务下观察器采用周期性以及一定频率采集监控对象数据;QoS适配生成模块,根据QoS标准生成需匹配的服务标准给对应的训练器;评估软件QoS属性模块,综合评估软件服务能力,向数据服务设备返回自然语言描述的软件服务质量评价;监控结果数据库,汇总不同QoS的监控结果,传递给评估软件QoS属性模块;所述观察器包括:数据收集器:用于从数据服务设备端采集训练数据和监控数据,训练数据的影响因子已知,监控数据的影响因子需要影响因子定位模块确定;数据预处理模块:将影响因子进行缺失补全,对训练数据离散化期望得到更准确的结果;影响因子定位模块:定位每一次监控的影响因子;所述分析器包括:信息匹配模块:根据控制器提供的QoS适配标准以及经过预处理分类的数据进行匹配,存入样本信息库中,并用来计算监控结果;样本数据库:存放经过预处理的样本;权值获取模块:根据样本的影响因子组合查找影响因子权值表获取权值;朴素贝叶斯分类模块:根据样本影响因子R调用影响因子权值表得到影响因子组合权值wR,样本满足QoS属性则xi=1,调用加权朴素贝叶斯分类器进行监控,将结果存入监控结果数据库中。所述训练器包括:影响因子训练声明模块,提供影响因子组合;训练信息采集模块,向影响因子参数设置端发送参数设置值,指导数据采集端收集不同的QoS标准的数据集;伯努利后验信息统计模块,统计每个样本加入样本集后对样本集成功率改变后的值,并比较其与QoS标准的关系;影响因子权值计算模块,根据tf*idf算法得到影响因子组合对分类的权值本文档来自技高网
...

【技术保护点】
一种基于加权朴素贝叶斯分类器的软件服务质量动态监控方法,其特征在于,所述方法包括以下步骤: 1)根据QoS标准Θ,设定满足QoS标准的类别C0和不满足QoS标准的类别C1; 2)训练样本,获得不同影响因子组合权值wR以及先验知识pli; 3)读取运行时的观测变量组合作为样本对样本进行补全和离散化预处理;4)根据样本影响因子R调用权值表得到样本xk的权值5)统计二项分布成功率的贝叶斯估计值并判别本次样本使样本集的成功率分布Ci,i∈(0,1); 6)更新样本先验概率p(Ci); 7)调用加权朴素贝叶斯分类器得出结果,调用加权朴素贝叶斯公式如下: 8)定期连续读取变量组合作为样本,对样本进行预处理并存入样本集xk∈{0,1},m表示样本总数,重复步骤3)~8)。

【技术特征摘要】
1.一种基于加权朴素贝叶斯分类器的软件服务质量动态监控方法,其特征在于,所述方法包括以下步骤:1)根据QoS标准Θ,设定满足QoS标准的类别C0和不满足QoS标准的类别C1;2)训练样本,获得不同影响因子组合权值wR以及先验知识pli;3)读取运行时的观测变量组合作为样本对样本进行补全和离散化预处理;4)根据样本影响因子R调用权值表得到样本xk的权值5)统计二项分布成功率的贝叶斯估计值并判别本次样本使样本集的成功率分布Ci,i∈(0,1);6)更新样本先验概率p(Ci);7)调用加权朴素贝叶斯分类器得出结果,调用加权朴素贝叶斯公式如下:8)定期连续读取变量组合作为样本,对样本进行预处理并存入样本集xk∈{0,1},m表示样本总数,重复步骤3)~8)。2.如权利要求1所述的基于加权朴素贝叶斯分类器的软件服务质量动态监控方法,其特征在于,对于所述步骤2)和步骤5):引入二项分布的自然共轭先验分布,即贝塔分布,根据二项分布可靠性分析得到二项分布可靠性为a、b分别为伯努利参数,这里设定其分别为1,其中m为样本总数;β>Θ,代表本次样本的加入使样本集的二项分布成功率满足QoS标准Θ,即成功率落在C0区域,反之为C1,代表本次样本的加入使样本集的成功率不满足QoS标准,Θ表示监控的要求。3.如权利要求1所述的基于加权朴素贝叶斯分类器的软件服务质量动态监控方法,其特征在于,对于所述步骤2):根据tf*idf算法可知,影响因子对分类的权值与影响因子T在Ci中出现的概率成正比,和影响因子在全部样本中出现的概率成反比,故表示影响因子为R且使整个样本集的成功率落在区域Ci的单个样本个数,Nci表示样本落在区域Ci的样本总个数,N表示样本总个数,nR表示影响因子为R的样本的总个数。4.如权利要求1所述的基于加权朴素贝叶斯分类器的软件服务质量动态监控方法,其特征在于,对于所述步骤2):我们用pli表示P(xk=1|Ci),样本xi的先验概率为其中pli为经过在不同环境下进行训练的P(xk=1,Ci)/P(Ci)的平均值。5.如权利要求1所述的基于加权朴素贝叶斯分类器的软件服务质量动态监控方法,其特征在于,对于所述步骤7):由加权朴素贝叶斯分类器以及HaroldJeffrey的T解释得到其中6.一种基于加权朴素贝叶斯分类器的软件服务质量动态监控系统,其特征在于,包括:a)控制器:用于采集运行时软件的不同服务质量声明,产生不同服务质量所需的数据集标准,指示观察器搜集所需的对应数据集,指导分析器匹配QoS标准和数据集,并控制采集周期和频率,数据库汇总分析器结果数据,并将数据交给服务能力评价模块进行分析,最终得到可以用自然语言向数据服务设备反馈的软件监控结果和评价结果;b)观察器:用于从数据...

【专利技术属性】
技术研发人员:张鹏程庄媛冯钧朱跃龙万定生刘宗磊周宇鹏肖艳
申请(专利权)人:河海大学
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1