The invention relates to a weighted entropy judgment method and system of reliable distributed cluster, distributed cluster belongs to the reliability, through pre for different severity of log events were weighted, and then use the sliding window statistics in this period is not the same type of cluster nodes in the system log number, and then calculate each node error rate. According to the reliability calculation of the error rate of entropy weighted cluster, the final judgment of the stability of cluster size according to the fluctuation. Through this method to quantify the reliability of the system, can not only through simple deployment can quantify the reliability of the whole cluster determination, but also the stability of cluster real-time monitoring, timely understanding of the cluster when the cluster environment changes, the reliability was fluctuated seriously can take appropriate measures to deal with timely.
【技术实现步骤摘要】
一种通过加权熵判断分布式集群可靠度的方法和系统
本专利技术涉及分布式集群可靠性领域,特别涉及一种通过加权熵判断分布式集群可靠度的方法和系统。
技术介绍
集群技术,顾名思义,它将多个系统连接到一起,使多台服务器能够像一台机器那样工作或者看起来好像一台机器。由于单台机器的处理能力有限,此技术能把有限的资源整合成一个庞大的资源,从而应对更大计算或存储性能的需求,进而提高系统稳定性和网络中心的数据处理能力及服务能力。鉴于该优势,集群技术大行其道,常用的工具如Hadoop、spark、flink等便是集群技术的典型应用。现有的海量数据分析都是基于大量节点组成的集群来解决的,且随着人工智能、机器学习等技术的持续更新发展,集群越来越发挥其不可替代的作用。总体来说,集群具有以下特点:高可伸缩性:服务器集群具有很强的可伸缩性。随着需求和负荷的增长,可以向集群系统添加更多的服务器。在这样的配置中,可以有多台服务器执行相同的应用和数据库操作;高可用性:服务器集群具有防止系统发生故障或从故障中自动恢复的能力。通过把故障服务器上的应用程序转移到备份服务器上运行,集群系统能够把正常运行时间提高到大于99.9%,大大减少服务器和应用程序的停机时间;高可管理性:系统管理员可以从远程管理一个、甚至一组集群,就好象在单机系统中一样。基于以上种种优势,集群被广泛的部署应用,大型企业集群的节点数量已成百上千,更有甚者部署上万也不足为奇。但随着规模的不断增大,各种问题接踵而至,节点的可靠性便为一个急需解决的问题。集群可以建立在很多廉价的硬件设备上,因此任何时候都很容易出现故障,可靠性无法保证,如果 ...
【技术保护点】
一种通过加权熵判断分布式集群可靠度的方法,其特征在于,包括:步骤1、根据预先设定的日志事件等级,为分布式集群中各节点的日志事件赋予权值;步骤2、通过用户设置的滑动窗口,获取该滑动窗口内该分布式集群各节点的系统日志,并统计该系统日志内各日志事件等级对应的日志事件数目,通过依次对该日志事件数目进行归一化操作,得到各日志事件等级的归一化值;步骤3、根据该归一化值和该权值,计算当前该滑动窗口中各节点错误率;步骤4、根据该节点错误率,通过加权熵算法,计算当前该滑动窗口内该分布式集群的可靠性加权熵;步骤5、随着滑动窗口的移动,统计预设时间内各滑动窗口的该可靠性加权熵的波动值,并通过比较该波动值与预先设定的波动阈值,判定该分布式集群的可靠度。
【技术特征摘要】
1.一种通过加权熵判断分布式集群可靠度的方法,其特征在于,包括:步骤1、根据预先设定的日志事件等级,为分布式集群中各节点的日志事件赋予权值;步骤2、通过用户设置的滑动窗口,获取该滑动窗口内该分布式集群各节点的系统日志,并统计该系统日志内各日志事件等级对应的日志事件数目,通过依次对该日志事件数目进行归一化操作,得到各日志事件等级的归一化值;步骤3、根据该归一化值和该权值,计算当前该滑动窗口中各节点错误率;步骤4、根据该节点错误率,通过加权熵算法,计算当前该滑动窗口内该分布式集群的可靠性加权熵;步骤5、随着滑动窗口的移动,统计预设时间内各滑动窗口的该可靠性加权熵的波动值,并通过比较该波动值与预先设定的波动阈值,判定该分布式集群的可靠度。2.如权利要求1所述的通过加权熵判断分布式集群可靠度的方法,其特征在于,步骤2中该归一化操作包括:其中Nij代表节点i下j事件的归一化后的该归一化值,x代表该日志事件数目,max代表各日志事件数目中的最大值。3.如权利要求1所述的通过加权熵判断分布式集群可靠度的方法,其特征在于,步骤3中该节点错误率的计算方法包括:其中weight为该权值,t为该滑动窗口的时间长度值,Nij代表节点i下j事件等级的该归一化值,ratioi代表该节点错误率,m代表预先设定的该日志事件等级的数目。4.如权利要求1所述的通过加权熵判断分布式集群可靠度的方法,其特征在于,步骤4中该可靠性加权熵的计算方法包括:其中Ri为步骤3计算的该节点错误率,n表示集群中节点的个数,H(u)表示该可靠性加权熵。5.如权利要求1所述的通过加权熵判断分布式集群可靠度的方法,其特征在于,步骤5中该波动值的计算方法包括:统计该预设时间内各滑动窗口的该可靠性加权熵的均值,并对每个该均值求方差,将该方差作为该波动值。6.一种通过加权熵判断分布式集群可靠度的系...
【专利技术属性】
技术研发人员:任睿,田帅,王磊,詹剑锋,
申请(专利权)人:中国科学院计算技术研究所,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。