【技术实现步骤摘要】
一种集群网络的监控方法和装置
本专利技术涉及事件检测
,尤其涉及一种集群网络的监控方法和装置。
技术介绍
集群是指在多台计算机之上运行、之间通过某种通信方式相互通信从而将集群内所有存储空间资源整合、虚拟化并对外提供文件访问服务的文件系统。集群环境部署一般是大规模的,每个集群环境的节点个数从一台到上百台机器不等,集群中各节点的通信主要靠网络连接,因此节点之间的网络状况就尤为重要,及时发现集群中出现的网络异常并告知用户对集群的安全保障至关重要。现有技术中,可以由每个节点周期性向其他节点发起网络请求,以确认当前节点与其他节点的网络是否正常,以得到当前节点和其他节点的运行状态。但是,现有技术中,仅仅能够获知节点在当前检测周期内是否正常运行,但是并不知道节点每个时刻的运行状态。例如,节点在第一时刻发生断网,此时正好处于不检测周期内,因此,无法对该节点的运行状态进行检测,该节点在第二时刻断网恢复,这样,在进行下一周期检测时,会检测到该节点的运行状态为正常,对于用户而言,并不知道该节点发生过断网。因此,现有技术中对集群中各节点的检测结果可靠性较差。
技术实现思路
有鉴于此,本专利技术的目的在于提出一种集群网络的监控方法和装置,以解决现有技术中对集群中各节点的检测结果可靠性较差的问题。基于上述目的,本专利技术提供了一种集群网络的监控方法,包括:监测集群网络中与本地节点连通的节点数目;若所述节点数目为1,生成所述本地节点的断网异常信息;若所述节点 ...
【技术保护点】
1.一种集群网络的监控方法,其特征在于,包括:/n监测集群网络中与本地节点连通的节点数目;/n若所述节点数目为1,生成所述本地节点的断网异常信息;/n若所述节点数目大于1,且所述当前节点数目小于或等于P/2,生成所述集群网络的分区异常信息;/n若所述节点数目大于P/2,且所述当前节点数目小于P,生成所述集群网络的全网异常信息;/n其中,所述P为集群网络中总节点数目。/n
【技术特征摘要】
1.一种集群网络的监控方法,其特征在于,包括:
监测集群网络中与本地节点连通的节点数目;
若所述节点数目为1,生成所述本地节点的断网异常信息;
若所述节点数目大于1,且所述当前节点数目小于或等于P/2,生成所述集群网络的分区异常信息;
若所述节点数目大于P/2,且所述当前节点数目小于P,生成所述集群网络的全网异常信息;
其中,所述P为集群网络中总节点数目。
2.根据权利要求1所述的集群网络节点的监控方法,其特征在于,生成所述本地节点的断网异常信息,包括:
检测本地节点是否存在网络分区文件;
若本地节点存在网络分区文件,将当前检测时间作为所述网络分区文件的结束时间,对所述网络分区文件更新,得到更新网络分区文件,并生成网络分区内断网异常信息;
若本地节点不存在网络分区文件,生成无网络分区断网异常信息。
3.根据权利要求2所述的集群网络节点的监控方法,其特征在于,还包括:
判断是否存在本地报警文件;
若存在,将所述网络分区内断网异常信息或无网络分区断网异常信息写入所述本地报警文件中;
若不存在,初始化所述本地报警文件,并记录所述网络分区内断网异常信息或无网络分区断网异常信息。
4.根据权利要求3所述的集群网络节点的监控方法,其特征在于,所述分区异常信息包括分区记录信息;
所述生成所述集群网络的分区异常信息,包括:
判断本地节点是否为记录分区信息的节点;
若本地节点为记录分区信息的节点,检测是否存在所述网络分区文件;
若不存在所述网络分区文件,创建所述网络分区文件,生成所述当前连通节点对应的分区记录信息写入所述网络分区文件;
若存在所述网络分区文件,判断所述当前连通节点与所述网络分区文件的已分区节点是否一致;若所述当前连通节点与所述已分区节点一致,对所述网络分区文件的时间进行更新;若所述当前连通节点与所述已分区节点不一致,生成所述当前连通节点对应的分区记录信息写入所述网络分区文件。
5.根据权利要求4所述的集群网络节点的监控方法,其特征在于,所述对所述网络分区文件的时间进行更新之前,还包括:
计算所述当前检测时间与所述网络分区文件的记录时间的差值;
判断所述差值是否大于预设阈值;
若所述差值大于预设阈值,将所述分区记录信息写入所述网络分区文件;
对应地,所述对所述网络分区文件的时间进行更新,包括:
若所述差值小于或等于预设阈值,利用所述当前检测时间对所述网络分区文件的记录时间进行更新。
6.根据权利要求4所述的集群网络节点的监控方法,其特征在...
【专利技术属性】
技术研发人员:王晓强,王世伟,
申请(专利权)人:山东鲸鲨信息技术有限公司,
类型:发明
国别省市:山东;37
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。