【技术实现步骤摘要】
一种服务可用性监控系统、方法、装置及设备
本专利技术涉及计算机
,特别是涉及一种服务可用性监控系统、方法、装置及设备。
技术介绍
服务可用性非常重要,被称为“服务生命线”。为了保证服务的稳定性,服务提供方监控服务的可用性,并在出现问题时,及时报警。如此,使得在服务出现问题时,能够及时发现问题并进行处理。现有技术中,针对不同类型的服务,采用不同的拨测框架监控服务可用性。如检测浏览器提供的服务是否可用,是通过检测浏览器是否能够打开网页来确定,当浏览器能够打开网页时,确定服务可用;当浏览器不能够打开网页时,确定服务不可用;而检测聊天软件的通话服务是否可用,是通过向后端服务器发送信息,检测是否能够接收到反馈信息,当能够接收到反馈信息时,确定服务可用;而当无法接收反馈信息时,确定服务不可用,等等。然而,专利技术人在实现本专利技术的过程中发现,现有技术至少存在如下问题:目前,服务提供方一般会提供多种不同类型的服务,且服务提供方在提供的服务有可能是变化的。例如,时段1提供的服务包括服务1和服务2;而在时段2时,提供的服务包括服务1、服务2和服务3。如此,针对时段1中服务1和服务2的拨测框架无法实现对服务3可用性的监控。如此,即需要先增加针对服务3的拨测框架的部署,然后才能对时段2中包括的所有服务的服务可用性进行监控。而在已有的拨测框架基础上重新部署非常麻烦,如此使得对服务可用性的监控过程复杂。
技术实现思路
本专利技术实施例的目的在于提供一种服务可用性监控系统、方法、装置及设备,以降低对服务可用性监控的复杂度。具体技术方案如下:第一方面,本专利技术实施例提供了一种服务 ...
【技术保护点】
1.一种服务可用性监控系统,其特征在于,包括:配置管理数据库CMDB、拨测任务分发中心、拨测点以及监控平台;所述CMDB,用于保存服务集群对应的服务集群元数据;所述拨测任务分发中心,用于获取服务集群对应的所述服务集群元数据;确定拨测点信息;根据所述服务集群元数据和拨测点信息,分配拨测任务;将所述拨测任务下发至拨测点;并接收所述拨测点返回的针对所述拨测任务的拨测结果;将所述拨测结果进行聚合得到可用性评价值,并将所述可用性评价值发送至监控平台;所述拨测点,用于接收所述拨测任务分发中心下发的拨测任务;确定所述拨测任务中包括的服务集群对应的拨测代码;根据所述拨测代码对所述服务集群进行拨测,得到拨测结果;将所述拨测结果返回至所述拨测任务分发中心;所述监控平台,用于接收所述拨测任务分发中心发送的所述可用性评价值,并根据所述可用性评价值进行报警。
【技术特征摘要】
1.一种服务可用性监控系统,其特征在于,包括:配置管理数据库CMDB、拨测任务分发中心、拨测点以及监控平台;所述CMDB,用于保存服务集群对应的服务集群元数据;所述拨测任务分发中心,用于获取服务集群对应的所述服务集群元数据;确定拨测点信息;根据所述服务集群元数据和拨测点信息,分配拨测任务;将所述拨测任务下发至拨测点;并接收所述拨测点返回的针对所述拨测任务的拨测结果;将所述拨测结果进行聚合得到可用性评价值,并将所述可用性评价值发送至监控平台;所述拨测点,用于接收所述拨测任务分发中心下发的拨测任务;确定所述拨测任务中包括的服务集群对应的拨测代码;根据所述拨测代码对所述服务集群进行拨测,得到拨测结果;将所述拨测结果返回至所述拨测任务分发中心;所述监控平台,用于接收所述拨测任务分发中心发送的所述可用性评价值,并根据所述可用性评价值进行报警。2.根据权利要求1所述的监控系统,其特征在于,所述拨测任务分发中心,具体用于确定拨测点的总数、各个拨测点对应的数据中心属性以及各个拨测点的负载情况;并根据所述服务集群元数据、所述拨测点的总数、各个拨测点对应的所述数据中心属性、以及各个拨测点的所述负载情况,分配拨测任务。3.根据权利要求1所述的监控系统,其特征在于,所述拨测点,具体用于通过持续集成/持续发布CI/CD与各个拨测代码实时联动,确定所述拨测任务中包括的服务集群对应的拨测代码,其中,所述各个拨测代码被托管至代码管理系统GitLab中。4.根据权利要求1所述的监控系统,其特征在于,所述监控平台,用于接收所述拨测任务分发中心发送的多个所述可用性评价值,并在多个所述可用性评价值满足预设规则时进行报警。5.一种服务可用性监控方法,其特征在于,应用于拨测任务分发中心,包括:获取服务集群对应的服务集群元数据;确定拨测点信息;根据所述服务集群元数据和拨测点信息,分配拨测任务;将所述拨测任务下发至拨测点;并接收所述拨测点返回的针对所述拨测任务的拨测结果;将所述拨测结果进行聚合得到可用性评价值,并将所述可用性评价值发送至监控平台。6.根据权利要求5所述的方法,其特征在于,所述拨测点信息包括拨测点的总数、各个拨测点对应的数据中心属性以及各个拨测点的负载情况;所述根据所述服务集群元数据和拨测点信息,分配拨测任务,包括:根据所述服务集群元数据、所述拨测点的总数、各个拨测点对应的所述数据中心属性、以及各个拨测点的所述负载情况,分配拨测任务。7.一种服务可用性监控方法,其特征在于,应用于拨测点,包括:接收拨测任务分发中心下发的拨测任务;确定所述拨测任务中包括的服务集群对应的拨测代码;根据所述拨测代码对所述服务集群进行拨测,得到拨测结果;将所述拨测结果返回至所述拨测任务分发中心,以使所述拨测任务分发中心将所述拨测结果进行聚合得到可用性评价值,并将所述可用性评价值发送至监控平台。8.根据权利要求7所述的方法,其特征在于,所述确定所述拨测任务中包括的服务集群对应的拨测代码,包括:通过持续集成/持续发布CI/CD与各个拨测代码实时联动,确定所述拨测任务中包括的服务集群对应的拨测代码,其中,所述各个拨测代码被托管至代码管理系统GitLab中。9.一种服务可用性监控方法,其特征在于,应用于监控平台,包括:接收拨测任务分发中心发送的可用性评价值;根据所述...
【专利技术属性】
技术研发人员:冯浩,
申请(专利权)人:北京奇艺世纪科技有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。