一种服务可用性监控系统、方法、装置及设备制造方法及图纸

技术编号:19780693 阅读:40 留言:0更新日期:2018-12-15 11:58
本发明专利技术实施例提供了一种服务可用性监控系统、方法、装置及设备,其中,该系统包括:配置管理数据库CMDB、拨测任务分发中心、拨测点以及监控平台;CMDB,用于保存服务集群对应的服务集群元数据;拨测任务分发中心,用于根据服务集群元数据和拨测点信息,分配拨测任务;将拨测任务下发至拨测点;并接收针对拨测任务的拨测结果;将拨测结果进行聚合得到可用性评价值;拨测点,用于接收拨测任务;确定拨测任务中包括的服务集群对应的拨测代码;根据拨测代码对服务集群进行拨测,得到拨测结果;将拨测结果返回至拨测任务分发中心;监控平台,用于接收并根据可用性评价值进行报警。如此,能够降低对服务可用性监控的复杂度。

【技术实现步骤摘要】
一种服务可用性监控系统、方法、装置及设备
本专利技术涉及计算机
,特别是涉及一种服务可用性监控系统、方法、装置及设备。
技术介绍
服务可用性非常重要,被称为“服务生命线”。为了保证服务的稳定性,服务提供方监控服务的可用性,并在出现问题时,及时报警。如此,使得在服务出现问题时,能够及时发现问题并进行处理。现有技术中,针对不同类型的服务,采用不同的拨测框架监控服务可用性。如检测浏览器提供的服务是否可用,是通过检测浏览器是否能够打开网页来确定,当浏览器能够打开网页时,确定服务可用;当浏览器不能够打开网页时,确定服务不可用;而检测聊天软件的通话服务是否可用,是通过向后端服务器发送信息,检测是否能够接收到反馈信息,当能够接收到反馈信息时,确定服务可用;而当无法接收反馈信息时,确定服务不可用,等等。然而,专利技术人在实现本专利技术的过程中发现,现有技术至少存在如下问题:目前,服务提供方一般会提供多种不同类型的服务,且服务提供方在提供的服务有可能是变化的。例如,时段1提供的服务包括服务1和服务2;而在时段2时,提供的服务包括服务1、服务2和服务3。如此,针对时段1中服务1和服务2的拨测框架无法实现对服务3可用性的监控。如此,即需要先增加针对服务3的拨测框架的部署,然后才能对时段2中包括的所有服务的服务可用性进行监控。而在已有的拨测框架基础上重新部署非常麻烦,如此使得对服务可用性的监控过程复杂。
技术实现思路
本专利技术实施例的目的在于提供一种服务可用性监控系统、方法、装置及设备,以降低对服务可用性监控的复杂度。具体技术方案如下:第一方面,本专利技术实施例提供了一种服务可用性监控系统,包括:配置管理数据库CMDB、拨测任务分发中心、拨测点以及监控平台;所述CMDB,用于保存服务集群对应的服务集群元数据;所述拨测任务分发中心,用于获取服务集群对应的所述服务集群元数据;确定拨测点信息;根据所述服务集群元数据和拨测点信息,分配拨测任务;将所述拨测任务下发至拨测点;并接收所述拨测点返回的针对所述拨测任务的拨测结果;将所述拨测结果进行聚合得到可用性评价值,并将所述可用性评价值发送至监控平台;所述拨测点,用于接收所述拨测任务分发中心下发的拨测任务;确定所述拨测任务中包括的服务集群对应的拨测代码;根据所述拨测代码对所述服务集群进行拨测,得到拨测结果;将所述拨测结果返回至所述拨测任务分发中心;所述监控平台,用于接收所述拨测任务分发中心发送的所述可用性评价值,并根据所述可用性评价值进行报警。可选的,所述拨测任务分发中心,具体用于确定拨测点的总数、各个拨测点对应的数据中心属性以及各个拨测点的负载情况;并根据所述服务集群元数据、所述拨测点的总数、各个拨测点对应的所述数据中心属性、以及各个拨测点的所述负载情况,分配拨测任务。可选的,所述拨测点,具体用于通过持续集成/持续发布CI/CD与各个拨测代码实时联动,确定所述拨测任务中包括的服务集群对应的拨测代码,其中,所述各个拨测代码被托管至代码管理系统GitLab中。可选的,所述监控平台,用于接收所述拨测任务分发中心发送的多个所述可用性评价值,并在多个所述可用性评价值满足预设规则时进行报警。第二方面,本专利技术实施例提供了一种服务可用性监控方法,应用于拨测任务分发中心,包括:获取服务集群对应的服务集群元数据;确定拨测点信息;根据所述服务集群元数据和拨测点信息,分配拨测任务;将所述拨测任务下发至拨测点;并接收所述拨测点返回的针对所述拨测任务的拨测结果;将所述拨测结果进行聚合得到可用性评价值,并将所述可用性评价值发送至监控平台。可选的,所述拨测点信息包括拨测点的总数、各个拨测点对应的数据中心属性以及各个拨测点的负载情况;所述根据所述服务集群元数据和拨测点信息,分配拨测任务,包括:根据所述服务集群元数据、所述拨测点的总数、各个拨测点对应的所述数据中心属性、以及各个拨测点的所述负载情况,分配拨测任务。第三方面,本专利技术实施例提供了一种服务可用性监控方法,应用于拨测点,包括:接收拨测任务分发中心下发的拨测任务;确定所述拨测任务中包括的服务集群对应的拨测代码;根据所述拨测代码对所述服务集群进行拨测,得到拨测结果;将所述拨测结果返回至所述拨测任务分发中心,以使所述拨测任务分发中心将所述拨测结果进行聚合得到可用性评价值,并将所述可用性评价值发送至监控平台。可选的,所述确定所述拨测任务中包括的服务集群对应的拨测代码,包括:通过持续集成/持续发布CI/CD与各个拨测代码实时联动,确定所述拨测任务中包括的服务集群对应的拨测代码,其中,所述各个拨测代码被托管至代码管理系统GitLab中。第四方面,本专利技术实施例提供了一种服务可用性监控方法,应用于监控平台,包括:接收拨测任务分发中心发送的可用性评价值;根据所述可用性评价值进行报警。可选的,所述接收拨测任务分发中心发送的可用性评价值,包括:接收所述拨测任务分发中心发送的多个所述可用性评价值;所述根据所述可用性评价值进行报警,包括:在多个所述可用性评价值满足预设规则时进行报警。第五方面,本专利技术实施例提供了一种服务可用性监控装置,应用于拨测任务分发中心,包括:获取模块,用于获取服务集群对应的服务集群元数据;确定模块,用于确定拨测点信息;分配模块,用于根据所述服务集群元数据和拨测点信息,分配拨测任务;下发模块,用于将所述拨测任务下发至拨测点;接收模块,用于接收所述拨测点返回的针对所述拨测任务的拨测结果;聚合模块,用于将所述拨测结果进行聚合得到可用性评价值;发送模块,用于将所述可用性评价值发送至监控平台。可选的,所述拨测点信息包括拨测点的总数、各个拨测点对应的数据中心属性以及各个拨测点的负载情况;所述分配模块,具体用于根据所述服务集群元数据、所述拨测点的总数、各个拨测点对应的所述数据中心属性、以及各个拨测点的所述负载情况,分配拨测任务。第六方面,本专利技术实施例提供了一种服务可用性监控装置,应用于拨测点,包括:接收模块,用于接收拨测任务分发中心下发的拨测任务;第一确定模块,用于确定所述拨测任务中包括的服务集群对应的拨测代码;第二确定模块,用于根据所述拨测代码对所述服务集群进行拨测,得到拨测结果;返回结果模块,用于将所述拨测结果返回至所述拨测任务分发中心,以使所述拨测任务分发中心将所述拨测结果进行聚合得到可用性评价值,并将所述可用性评价值发送至监控平台。可选的,所述第一确定模块,具体用于通过持续集成/持续发布CI/CD与各个拨测代码实时联动,确定所述拨测任务中包括的服务集群对应的拨测代码,其中,所述各个拨测代码被托管至代码管理系统GitLab中。第七方面,本专利技术实施例提供了一种服务可用性监控装置,应用于监控平台,包括:接收模块,用于接收拨测任务分发中心发送的可用性评价值;报警模块,用于根据所述可用性评价值进行报警。可选的,所述接收模块,具体用于接收所述拨测任务分发中心发送的多个所述可用性评价值;所述报警模块,具体用于在多个所述可用性评价值满足预设规则时进行报警。第八方面,本专利技术实施例提供了一种拨测任务分发设备,包括处理器、通信接口、存储器和通信总线,其中,所述处理器,所述通信接口,所述存储器通过所述通信总线完成相互间的通信;所述存储器,用于存放计算机程序;所述处理器,用于执行所述存储器上所存放的程序本文档来自技高网...

【技术保护点】
1.一种服务可用性监控系统,其特征在于,包括:配置管理数据库CMDB、拨测任务分发中心、拨测点以及监控平台;所述CMDB,用于保存服务集群对应的服务集群元数据;所述拨测任务分发中心,用于获取服务集群对应的所述服务集群元数据;确定拨测点信息;根据所述服务集群元数据和拨测点信息,分配拨测任务;将所述拨测任务下发至拨测点;并接收所述拨测点返回的针对所述拨测任务的拨测结果;将所述拨测结果进行聚合得到可用性评价值,并将所述可用性评价值发送至监控平台;所述拨测点,用于接收所述拨测任务分发中心下发的拨测任务;确定所述拨测任务中包括的服务集群对应的拨测代码;根据所述拨测代码对所述服务集群进行拨测,得到拨测结果;将所述拨测结果返回至所述拨测任务分发中心;所述监控平台,用于接收所述拨测任务分发中心发送的所述可用性评价值,并根据所述可用性评价值进行报警。

【技术特征摘要】
1.一种服务可用性监控系统,其特征在于,包括:配置管理数据库CMDB、拨测任务分发中心、拨测点以及监控平台;所述CMDB,用于保存服务集群对应的服务集群元数据;所述拨测任务分发中心,用于获取服务集群对应的所述服务集群元数据;确定拨测点信息;根据所述服务集群元数据和拨测点信息,分配拨测任务;将所述拨测任务下发至拨测点;并接收所述拨测点返回的针对所述拨测任务的拨测结果;将所述拨测结果进行聚合得到可用性评价值,并将所述可用性评价值发送至监控平台;所述拨测点,用于接收所述拨测任务分发中心下发的拨测任务;确定所述拨测任务中包括的服务集群对应的拨测代码;根据所述拨测代码对所述服务集群进行拨测,得到拨测结果;将所述拨测结果返回至所述拨测任务分发中心;所述监控平台,用于接收所述拨测任务分发中心发送的所述可用性评价值,并根据所述可用性评价值进行报警。2.根据权利要求1所述的监控系统,其特征在于,所述拨测任务分发中心,具体用于确定拨测点的总数、各个拨测点对应的数据中心属性以及各个拨测点的负载情况;并根据所述服务集群元数据、所述拨测点的总数、各个拨测点对应的所述数据中心属性、以及各个拨测点的所述负载情况,分配拨测任务。3.根据权利要求1所述的监控系统,其特征在于,所述拨测点,具体用于通过持续集成/持续发布CI/CD与各个拨测代码实时联动,确定所述拨测任务中包括的服务集群对应的拨测代码,其中,所述各个拨测代码被托管至代码管理系统GitLab中。4.根据权利要求1所述的监控系统,其特征在于,所述监控平台,用于接收所述拨测任务分发中心发送的多个所述可用性评价值,并在多个所述可用性评价值满足预设规则时进行报警。5.一种服务可用性监控方法,其特征在于,应用于拨测任务分发中心,包括:获取服务集群对应的服务集群元数据;确定拨测点信息;根据所述服务集群元数据和拨测点信息,分配拨测任务;将所述拨测任务下发至拨测点;并接收所述拨测点返回的针对所述拨测任务的拨测结果;将所述拨测结果进行聚合得到可用性评价值,并将所述可用性评价值发送至监控平台。6.根据权利要求5所述的方法,其特征在于,所述拨测点信息包括拨测点的总数、各个拨测点对应的数据中心属性以及各个拨测点的负载情况;所述根据所述服务集群元数据和拨测点信息,分配拨测任务,包括:根据所述服务集群元数据、所述拨测点的总数、各个拨测点对应的所述数据中心属性、以及各个拨测点的所述负载情况,分配拨测任务。7.一种服务可用性监控方法,其特征在于,应用于拨测点,包括:接收拨测任务分发中心下发的拨测任务;确定所述拨测任务中包括的服务集群对应的拨测代码;根据所述拨测代码对所述服务集群进行拨测,得到拨测结果;将所述拨测结果返回至所述拨测任务分发中心,以使所述拨测任务分发中心将所述拨测结果进行聚合得到可用性评价值,并将所述可用性评价值发送至监控平台。8.根据权利要求7所述的方法,其特征在于,所述确定所述拨测任务中包括的服务集群对应的拨测代码,包括:通过持续集成/持续发布CI/CD与各个拨测代码实时联动,确定所述拨测任务中包括的服务集群对应的拨测代码,其中,所述各个拨测代码被托管至代码管理系统GitLab中。9.一种服务可用性监控方法,其特征在于,应用于监控平台,包括:接收拨测任务分发中心发送的可用性评价值;根据所述...

【专利技术属性】
技术研发人员:冯浩
申请(专利权)人:北京奇艺世纪科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1