一种云数据中心状态监控方法技术

技术编号:10092550 阅读:191 留言:0更新日期:2014-05-28 16:17
本发明专利技术公开了一种云数据中心状态监控方法,属于云计算技术领域。本发明专利技术方法首先根据监控对象的不同,预先设定监控对象的整体阈值和监控节点的本地阈值,再为监控节点设置可容忍的累计越界量;当监控节点局部发生状态越界时,监控节点对本地越界值进行积累,直到积累值达到可容忍累计越界量时,向汇聚节点发送本地连续越界的加权平均越界强度等相关数据;汇聚节点以历史轮询的数据为依据,对系统的整体状态进行预测,得到系统空闲值;若接收到的加权平均越界强度超过预测的空闲值,则发起全局轮询,根据轮询结果预测未来的系统使用值,并决定是否触发报警。本发明专利技术可以很好的降低状态监控所需的通信消耗,进而从总体上降低云数据中心的资源消耗。

【技术实现步骤摘要】
【专利摘要】本专利技术公开了,属于云计算
。本专利技术方法首先根据监控对象的不同,预先设定监控对象的整体阈值和监控节点的本地阈值,再为监控节点设置可容忍的累计越界量;当监控节点局部发生状态越界时,监控节点对本地越界值进行积累,直到积累值达到可容忍累计越界量时,向汇聚节点发送本地连续越界的加权平均越界强度等相关数据;汇聚节点以历史轮询的数据为依据,对系统的整体状态进行预测,得到系统空闲值;若接收到的加权平均越界强度超过预测的空闲值,则发起全局轮询,根据轮询结果预测未来的系统使用值,并决定是否触发报警。本专利技术可以很好的降低状态监控所需的通信消耗,进而从总体上降低云数据中心的资源消耗。【专利说明】
本专利技术涉及,属于云计算

技术介绍
数据中心(Data Center)产生自20世纪60年代,是一个能够围绕某些特定的业务进行存储、管理、数据与信息分发等操作的集中式存储库。由于现代信息技术产业的发展,几乎每一个组织都有一个数据中心。数据中心先后经历了四个主要阶段的演化,即数据存储中心、数据处理中心、信息中心和具有云计算特点的云数据中心。进入21世纪以来,数据中心规模进一步扩大,服务器数量迅速增长。虚拟化技术的成熟应用和云计算技术的迅速发展使数据中心进入了新的发展阶段,数据中心进入到云数据中心时代。云数据中心承担着核心运营支持、信息资源服务、核心计算、数据存储和备份等功能。虚拟化是云数据中心的最主要特点,虚拟机是实现云数据中心虚拟化特性非常重要的方式。以往对数据中心的监控大多集中在数据中心物理环境的监控,如对数据中心温度的监控、对服务器是否正常运转的监控等,监控的水平始终停留在物理水平。随着云数据中心虚拟机的出现,诸如虚拟机计算资源、网络资源等虚拟机级别的监控就显得尤为重要。数据中心的监控从对物理机的监控转变为对物理机、虚拟机的双重监控。在云数据中心里,相对于服务器的数量而言,虚拟机的数量将会更加庞大。云数据中心监控产生的信息量比以往更大,所以努力减少云数据中心监控产生的通信消耗十分必要。对云数据中心进行监控,往往不需要整个系统具体资源的具体使用情况,而只需要了解各个资源的当前使用状态是否在预定的可接受范围内,即只需要进行状态监控。于是,状态监控成为云数据中心监控的一个重要监控方式。在分布式环境下,状态监控的运用十分广泛,例如:监控数据中心里某个机构的子网络访问Internet的整体流量是否超过某个预定的阈值;对达到同一子网不同主机的SYN包进行计数检测拒绝服务(Denial ofService, DoS)攻击。在分布式系统中,进行状态监控的监控节点对本节点的运行状态进行数据采集,在监控到本地状态越界时,可以向担当全局掌控角色的汇聚节点发送本地越界消息。汇聚节点可以发起全局轮询,将系统当前状态值“拉”到本地进行汇总计算,并与系统整体阈值进行对比,如果系统整体越界,就发起报警。传统的状态监控方式,在监控节点与汇聚节点都采用“即时报告”的方式,即监控节点监控到本地越界时立即向汇聚节点发送越界报告信息,轮询节点接收到监控节点的越界报告后,立即对所有监控节点进行全局轮询,获取这些监控节点的当前属性值。例如:数据中心中某机构的子网络的某个监控节点报告本地流量超出预定阈值,轮询节点接收到报警后,对该机构所有监控节点的流量使用情况进行轮询,若总体使用情况超出预定的阈值,产生报警,通知系统的管理人员采取相应措施。即时状态监控方式实现简单且一般不会遗漏报警。但是在实际运用中,监控节点的监控值出现短时间异常是常有的事情,例如,大批量新建虚拟机而产生的CPU短时间的利用率过高、网络波动导致的瞬间网络延迟过高等。对于这样的瞬间异常情况进行全局轮询,往往是没有必要的。而且,监控节点向汇聚节点发送越界报告、汇聚节点对所有监控节点进行全局轮询,都会产生大量的通信消耗。所以应当尽量减少不必要的越界报告和全局轮询。
技术实现思路
本专利技术所要解决的技术问题在于克服现有技术采用即时全局轮询模式所带来的通信消耗大的不足,提供,能够有效降低云数据中心状态监控所需的通信消耗。本专利技术具体采用以下技术方案:,所述云数据中心包括汇聚节点和多个监控节点,各监控节点对本地性能参数进行监控,汇聚节点根据监控节点的监控数据对云数据中心整体状态进行监控;监控节点定期采集本地性能参数并将所得到的本地性能参数监控值与预设的本地性能参数阈值进行比较,当本地性能参数监控值连续超越本地性能参数阈值,且连续超越量的累计值大于预设的可容忍累计越界量阈值Hi时,监控节点将连续超越量的累计值从(W-1)Hi至WHi的起止时刻、时间消耗、加权平均越界强度报告至汇聚节点,w=l, 2,3,...,其中,监控节点i在t时刻的连续超越量的累计值Si (t)计算公式如下: 【权利要求】1.,所述云数据中心包括汇聚节点和多个监控节点,各监控节点对本地性能参数进行监控,汇聚节点根据监控节点的监控数据对云数据中心整体状态进行监控;其特征在于,监控节点定期采集本地性能参数并将所得到的本地性能参数监控值与预设的本地性能参数阈值进行比较,当本地性能参数监控值连续超越本地性能参数阈值,且连续超越量的累计值大于预设的可容忍累计越界量阈值Hi时,监控节点将连续超越量的累计值从至WZZi的起止时刻、时间消耗、加权平均越界强度报告至汇聚节点 2.如权利要求1所述云数据中心状态监控方法,其特征在于,所述预设条件为: umir— 其中,τ为预设的整体监控阈值,Kedktimi为未来一段时间所有监控节点本地性能参数监控值之和的预测值。3.如权利要求2所述云数据中心状态监控方法,其特征在于,所述未来一段时间所有监控节点本地性能参数监控值之和的预测值利用指数平滑法得到,并在每次全局轮询后进行更新。·【文档编号】G06F9/455GK103825779SQ201410060472【公开日】2014年5月28日 申请日期:2014年2月21日 优先权日:2014年2月21日 【专利技术者】付雄, 杨孝果, 朱鑫鑫, 王汝传, 季一木, 韩志杰, 张琳 申请人:南京邮电大学本文档来自技高网
...

【技术保护点】
一种云数据中心状态监控方法,所述云数据中心包括汇聚节点和多个监控节点,各监控节点对本地性能参数进行监控,汇聚节点根据监控节点的监控数据对云数据中心整体状态进行监控;其特征在于,监控节点定期采集本地性能参数并将所得到的本地性能参数监控值与预设的本地性能参数阈值进行比较,当本地性能参数监控值连续超越本地性能参数阈值,且连续超越量的累计值大于预设的可容忍累计越界量阈值时,监控节点将连续超越量的累计值从至的起止时刻、时间消耗、加权平均越界强度报告至汇聚节点,,其中,监控节点i在t时刻的连续超越量的累计值计算公式如下:式中,表示监控节点i在x时刻所采集的本地性能参数监控值,表示监控节点i的本地性能参数监控值连续超越本地性能参数阈值的起始时刻,表示监控节点i的本地性能参数阈值,为监控节点采集本地性能参数的频率;监控节点i的连续超越量的累计值从至的加权平均越界强度按照下式计算:式中,为监控节点i的连续超越量的累计值从至的时间消耗,、分别为监控节点i的连续超越量的累计值超越第个和超越第()个的时刻,、分别表示监控节点i的连续超越量的累计值超越第x个和第(x‑1)个时的值;汇聚节点根据各监控节点报告的数据,按下式计算时间区间中云数据中心的整体越界强度:式中,n为云数据中心中的监控节点总数;若对于任意时间点,云数据中心的整体越界强度满足预设条件,则汇聚节点发起全局轮询,通知所有监控节点将其当前最新的本地性能参数监控值发送至汇聚节点;汇聚节点判断所有监控节点当前最新的本地性能参数监控值之和是否超越预设的整体监控阈值,如是,则汇聚节点触发全局报警;如否,则表明云数据中心处于正常状态。...

【技术特征摘要】

【专利技术属性】
技术研发人员:付雄杨孝果朱鑫鑫王汝传季一木韩志杰张琳
申请(专利权)人:南京邮电大学
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1