一种分布式元数据集群告警系统及方法技术方案

技术编号:16783346 阅读:34 留言:0更新日期:2017-12-13 02:03
本发明专利技术公开了一种分布式元数据集群告警系统,通过告警模块在主元数据服务节点出现异常时,向界面模块上报第一告警信息;接收备份元数据服务节点的状态信息,根据状态信息,判断备份元数据服务节点是否异常;当判断出备份元数据服务节点异常,且满足预设告警条件时,向界面模块上报第二告警信息;界面模块显示第一告警信息和第二告警信息。这样,不仅对主元数据服务节点进行监控告警,也对备份元数据服务节点进行监控告警,以能及时了解到备份元数据服务节点的状态,进而提高了系统的稳定性和可用性。此外,本发明专利技术还公开了一种分布式元数据集群告警方法,同样具有上述有益效果。

【技术实现步骤摘要】
一种分布式元数据集群告警系统及方法
本专利技术涉及分布式元数据集群
,特别涉及一种分布式元数据集群告警系统及方法。
技术介绍
目前,元数据集群通常是主备模式激活active-备份standby构造,即元数据集群中存在激活的元数据服务节点和备份的元数据服务节点。这样,当某个激活的元数据服务故障时,某一备份元数据服务将启动接替流程,接替故障的元数据服务业务,以对外继续提供服务。而元数据集群的告警一般只针对激活的元数据服务,即当激活的元数据服务节点发生故障时,进行告警显示,而备份的元数据服务节点发生故障时,不进行告警显示。备份的元数据服务可以很好地保证系统的稳定性和可用性。在需要起用备份的元数据服务时,如果该备份的元数据服务节点是故障的节点,则不能顺利切换,进入影响系统的稳定性和可用性。因此,及时了解到备份的元数据服务节点的故障信息是十分必要的。
技术实现思路
本专利技术的目的是提供一种分布式元数据集群告警系统及方法,以解决现有分布式元数据集群中没有对备份元数据服务节点进行监控告警进而导致系统的稳定性和可用性较低。为解决上述技术问题,本专利技术提供如下技术方案:一种分布式元数据集群告警系统,包括告警模块,与所述告警模块通信相连的界面模块,以及与所述告警模块通信相连的主元数据服务节点和备份元数据服务节点;所述告警模块用于当所述主元数据服务节点出现异常时,向所述界面模块上报第一告警信息;接收所述备份元数据服务节点的状态信息,根据所述状态信息,判断所述备份元数据服务节点是否异常;当判断出所述备份元数据服务节点异常,且满足预设告警条件时,向所述界面模块上报第二告警信息;所述界面模块用于显示所述第一告警信息和所述第二告警信息。可选地,所述告警模块包括阈值告警子模块,用于当判断出异常备份元数据服务节点个数大于或等于预设阈值时,向所述界面模块上报所述第二报警信息。可选地,所述告警模块还包括开启关闭子模块,用于根据所接收的备份元数据服务节点告警功能开启指令或关闭指令,开启或关闭所述备份元数据服务节点告警功能。可选地,所述告警模块包括判断子模块,用于根据所述备份元数据服务节点周期性发送的心跳信息,判断所述备份元数据服务节点是否出现异常。可选地,所述界面模块还包括集群元数据服务显示子模块,用于显示集群内所有主元数据服务节点和备份元数据服务节点的实时状态。一种分布式元数据集群告警方法,应用于分布式元数据集群告警系统;所述分布式元数据集群告警系统包括告警模块,与所述告警模块通信相连的界面模块,以及与所述告警模块通信相连的主元数据服务节点和备份元数据服务节点;所述告警模块当所述主元数据服务节点出现异常时,上报第一告警信息至所述界面模块;接收所述备份元数据服务节点的状态信息,根据所述状态信息,判断所述备份元数据服务节点是否异常;当判断出所述备份元数据服务节点异常,且满足预设告警条件时,上报第二告警信息至所述界面模块;所述界面模块显示所接收到的所述第一告警信息和所述第二告警信息。可选地,所述当判断出所述备份元数据服务节点异常,且满足预设告警条件时,上报第二告警信息至所述界面模块,包括:当判断出所述备份元数据服务节点异常,且异常备份元数据服务节点大于或等于预设阈值时,上报所述第二报警信息至所述界面模块。可选地,该方法还包括:根据所接收的备份元数据服务节点告警功能开启指令或关闭指令,开启或关闭所述备份元数据服务节点告警功能。可选地,所述接收所述备份元数据服务节点的状态信息,根据所述状态信息,判断所述备份元数据服务节点是否异常,包括:接收所述备份元数据服务节点周期性发送的心跳信息;根据所述心跳信息,判断所述备份元数据服务节点是否出现异常。可选地,在所述界面模块显示所接收到的所述第一告警信息和所述第二告警信息之后,还包括:显示集群内所有主元数据服务节点和备份元数据服务节点的实时状态。本专利技术所提供的一种分布式元数据集群告警系统及方法,通过告警模块在主元数据服务节点出现异常时,向界面模块上报第一告警信息;接收备份元数据服务节点的状态信息,根据状态信息,判断备份元数据服务节点是否异常;当判断出备份元数据服务节点异常,且满足预设告警条件时,向界面模块上报第二告警信息;界面模块显示第一告警信息和第二告警信息。这样,不仅对主元数据服务节点进行监控告警,也对备份元数据服务节点进行监控告警,以能及时了解到备份元数据服务节点的状态,进而提高了系统的稳定性和可用性。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。图1为本专利技术实施例提供的分布式元数据集群告警系统的一种系统结构示意框图;图2为本专利技术实施例提供的分布式元数据集群告警方法的一种流程示意图。具体实施方式为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。请参考图1,图1为本专利技术实施例提供的分布式元数据集群告警系统的一种系统结构示意框图,该系统可以包括告警模块11,与告警模块通信相连的界面模块12,以及与告警模块通信相连的主元数据服务节点13和备份元数据服务节点14。告警模块11用于当主元数据服务节点出现异常时,向界面模块上报第一告警信息;接收备份元数据服务节点的状态信息,根据状态信息,判断备份元数据服务节点是否异常;当判断出备份元数据服务节点异常,且满足预设告警条件时,向界面模块上报第二告警信息;界面模块12用于显示第一告警信息和第二告警信息。可以理解,上述主元数据服务节点指的是已激活的元数据服务节点,该节点正在对外提供元数据服务。上述备份元数据服务节点指的是没有激活的元数据服务节点,该节点没有对外提供元数据服务。上述界面模块可以将所接收到的告警信息进行显示告警,以使用户可以了解到相应的告警信息。当然,该界面模块可以只显示告警模块上报的告警信息,也能实现本专利技术实施例的目的。除此之外,为了更好地使用户了解各个元数据服务节点的状态,还可以显示集群内所有节点的状态信息,故在一些具体实施方式中,该界面模块还可以包括界面模块还包括集群元数据服务显示子模块,用于显示集群内所有主元数据服务节点和备份元数据服务节点的实时状态。上述状态信息可以是具体为备份元数据服务节点发送的心跳信息,即备份元数据服务节点可以周期性向告警模块发送告警信息;也可以是具体为其它类型的状态信息,只要其能表征备份元数据服务节点是否发生故障即可。当状态信息具体为心跳信息时,告警模块可以根据所接收到的心跳信息,对备份元数据服务节点是否发生故障进行判断,故在一些具体实施方式中,上述告警模块可以包括判断子模块,用于根据备份元数据服务节点周期性发送的心跳信息,判断备份元数据服务节点是否出现异常。更具体地,可以更加心跳信息的心跳时间来判断相应的备份元数据服务节点是否还在集群中,进而判断出该备份元数据服本文档来自技高网...
一种分布式元数据集群告警系统及方法

【技术保护点】
一种分布式元数据集群告警系统,其特征在于,包括告警模块,与所述告警模块通信相连的界面模块,以及与所述告警模块通信相连的主元数据服务节点和备份元数据服务节点;所述告警模块用于当所述主元数据服务节点出现异常时,向所述界面模块上报第一告警信息;接收所述备份元数据服务节点的状态信息,根据所述状态信息,判断所述备份元数据服务节点是否异常;当判断出所述备份元数据服务节点异常,且满足预设告警条件时,向所述界面模块上报第二告警信息;所述界面模块用于显示所述第一告警信息和所述第二告警信息。

【技术特征摘要】
1.一种分布式元数据集群告警系统,其特征在于,包括告警模块,与所述告警模块通信相连的界面模块,以及与所述告警模块通信相连的主元数据服务节点和备份元数据服务节点;所述告警模块用于当所述主元数据服务节点出现异常时,向所述界面模块上报第一告警信息;接收所述备份元数据服务节点的状态信息,根据所述状态信息,判断所述备份元数据服务节点是否异常;当判断出所述备份元数据服务节点异常,且满足预设告警条件时,向所述界面模块上报第二告警信息;所述界面模块用于显示所述第一告警信息和所述第二告警信息。2.如权利要求1所述的系统,其特征在于,所述告警模块包括阈值告警子模块,用于当判断出异常备份元数据服务节点个数大于或等于预设阈值时,向所述界面模块上报所述第二报警信息。3.如权利要求1所述的系统,其特征在于,所述告警模块还包括开启关闭子模块,用于根据所接收的备份元数据服务节点告警功能开启指令或关闭指令,开启或关闭所述备份元数据服务节点告警功能。4.如权利要求1至3任一项所述的系统,其特征在于,所述告警模块包括判断子模块,用于根据所述备份元数据服务节点周期性发送的心跳信息,判断所述备份元数据服务节点是否出现异常。5.如权利要求4所述的系统,其特征在于,所述界面模块还包括集群元数据服务显示子模块,用于显示集群内所有主元数据服务节点和备份元数据服务节点的实时状态。6.一种分布式元数据集群告警方法,其特征在于,应用于分布式元数据集群告警系统;所述分布式元数据集群告警系统包括告警模块,与...

【专利技术属性】
技术研发人员:程瑶
申请(专利权)人:郑州云海信息技术有限公司
类型:发明
国别省市:河南,41

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1