一种服务监控方法、装置、电子设备及存储介质制造方法及图纸

技术编号:30684716 阅读:25 留言:0更新日期:2021-11-06 09:16
本申请提供了一种服务监控方法、装置、电子设备及存储介质,涉及通信技术领域。方法包括:每隔时间间隔,获取目标服务在时间窗口内的服务数据;根据服务数据,计算燃烧率;在计算获得的燃烧率达到燃烧率阈值的持续时长阈值,超过预设时长的情况下,执行预先设置的告警操作。因此,本申请的实施例中,降低了很多无效的告警;有效地提高了精确率,使得用户能够重视每次告警信息,而不是疲于应对无效的告警。而不是疲于应对无效的告警。而不是疲于应对无效的告警。

【技术实现步骤摘要】
一种服务监控方法、装置、电子设备及存储介质


[0001]本专利技术涉及通信
,特别是涉及一种服务监控方法、装置、电子设备及存储介质。

技术介绍

[0002]在线服务系统已经成为人们生活不可缺少的部分。但是由于这些服务系统的规模庞大、结构复杂,在实际运行中,会不可避免的出现故障,服务监测系统会发布告警,提醒接警人处理。
[0003]现有的服务监控方法是根据1分钟窗口内的数据计算错误率,然后根据阈值进行判断是否应该告警。这种方式监测频率过于频繁,而且会产生很多告警,而其中某些问题事件可能属于可以忽略的波动,并不需要去做处理。从而使得频繁的报警信息淹没接警人的邮箱,使其疲于应对,耽误了处理正在告警的问题。
[0004]由此可见,目前服务监控方法产生的无效告警很多,精确率较低。

技术实现思路

[0005]本申请实施例提供一种服务监控方法、装置、电子设备及存储介质,以降低很多无效的告警,从而提高告警精确率,使得用户能够重视每次告警信息,而不是疲于应对无效的告警。
[0006]为了解决上述技术问题,本申请是这样实现的:
[0007]第一方面,本申请实施例提供了一种服务监控方法,所述方法包括:
[0008]每隔预设时间间隔,获取目标服务在时间窗口内的服务数据;
[0009]根据所述服务数据,计算燃烧率;
[0010]在计算获得的燃烧率达到燃烧率阈值的持续时长,超过持续时长阈值的情况下,执行预先设置的告警操作。
[0011]第二方面,本申请实施例提供了一种服务监控装置,所述装置包括:
[0012]数据获取模块,用于每隔预设时间间隔,获取目标服务在时间窗口内的服务数据;
[0013]数据计算模块,用于根据所述服务数据,计算燃烧率;
[0014]告警模块,用于在计算获得的燃烧率达到燃烧率阈值的持续时长,超过持续时长阈值的情况下,执行预先设置的告警操作。
[0015]第三方面,本申请实施例另外提供了一种电子设备,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如前第一方面所述的服务监控方法的步骤。
[0016]第四方面,本申请实施例另外提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如前第一方面所述的服务监控方法的步骤。
[0017]在本申请实施例中,每隔时间间隔,获取目标服务在时间窗口内的服务数据;根据
服务数据,计算燃烧率;在计算获得的燃烧率达到燃烧率阈值的持续时长阈值,超过预设时长的情况下,执行预先设置的告警操作。其中,燃烧率表示错误预算的消耗程度,能够更加直观的体现出目标服务的问题事件的出现情况,因此,基于燃烧率可以针对问题事件给出更加准确的告警。并且本申请实施例,在计算获得的燃烧率达到燃烧率阈值的持续时长达到持续时长阈值时,才会执行告警操作,从而可以规避燃烧率的偶然波动,进而不会频繁告警。因此,本申请的实施例,可以提高告警的准确率,减少无效的告警,使得用户能够重视每次告警信息,而不是疲于应对无效的告警。
[0018]上述说明仅是本申请技术方案的概述,为了能够更清楚了解本申请的技术手段,而可依照说明书的内容予以实施,并且为了让本申请的上述和其它目的、特征和优点能够更明显易懂,以下特举本申请的具体实施方式。
附图说明
[0019]为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0020]图1是本申请实施例提供的一种服务监控方法的步骤流程图;
[0021]图2是本申请实施例提供的一种服务监控装置的结构框图。
具体实施方式
[0022]下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
[0023]本申请实施例的服务监控方法可以运行于终端设备或者是服务器。其中,终端设备可以为本地终端设备。当该方法运行于为服务器时,可以为云展示。
[0024]在一可选的实施方式中,云展示是指以云计算为基础的信息展示方式。在云展示的运行模式下,信息处理程序的运行主体和信息画面呈现主体是分离的,显示切换方法的储存与运行是在云展示服务器上完成的,云展示客户端的作用为数据的接收、发送以及信息画面的呈现,举例而言,云展示客户端可以是靠近用户侧的具有数据传输功能的显示设备,如,移动终端、电视机、计算机、掌上电脑等;但是进行信息数据处理的终端设备为云端的云展示服务器。在进行浏览时,用户操作云展示客户端向云展示服务器发送操作指令,云展示服务器根据操作指令展示信息,将数据进行编码压缩,通过网络返回云展示客户端,最后,通过云展示客户端进行解码并输出展示内容。
[0025]在另一可选的实施方式中,终端设备可以为本地终端设备。本地终端设备存储有应用程序并用于呈现应用界面。本地终端设备用于通过图形用户界面与用户进行交互,即,常规的通过电子设备下载安装应用程序并运行。该本地终端设备将图形用户界面提供给用户的方式可以包括多种,例如,可以渲染显示在终端的显示屏上,或者,通过全息投影提供给用户。举例而言,本地终端设备可以包括显示屏和处理器,该显示屏用于呈现图形用户界
面,该图形用户界面包括应用画面,该处理器用于运行该应用程序、生成图形用户界面以及控制图形用户界面在显示屏上的显示。
[0026]本申请提供了一种服务监控方法、装置、电子设备及存储介质,可以降低很多无效的告警,从而提高告警精确率,使得用户能够重视每次告警信息,而不是疲于应对无效的告警持续时长。
[0027]其中,为了便于理解本申请实施例提供的服务监控方法,首先对如下概念进行解释:
[0028]服务质量指标(Service Level Indicator,SLI),是指服务质量的指标,通常将SLI视为两个数字的比率,良好事件数/事件总数(例如,成功的超文本传输协议(http)请求数/总http请求数、100ms内完成的远程过程调用协议(rpc)调用数/rpc调用总数)。
[0029]服务质量目标(Service Level Objective,SLO),是服务在某个特定度量维度上在有效窗口内的目标,例如在30天内http请求成功的目标是99.9%。即SLO是SLI的目标。其中,SLO的有效窗口是指实现SLO所需的时间。
[0030]错误预算:是指用100%减去SLO的百分数值,也就是在一段时间(例如30天)内理论上允许的错误量。
[0031]错误率:问题事件占所有事件的比例。<本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种服务监控方法,其特征在于,包括:每隔预设时间间隔,获取目标服务在时间窗口内的服务数据;根据所述服务数据,计算燃烧率;在计算获得的燃烧率达到燃烧率阈值的持续时长,超过持续时长阈值的情况下,执行预先设置的告警操作。2.根据权利要求1所述的服务监控方法,其特征在于,所述服务数据包括:所述目标服务的事件总数和问题事件的数量;所述根据所述服务数据,计算燃烧率,包括:计算所述问题事件的数量与所述事件总数的比值,作为错误率;计算所述错误率与预先确定的错误预算之比,作为燃烧率。3.根据权利要求1所述的服务监控方法,其特征在于,所述时间窗口包括至少两个窗口;所述根据所述服务数据,计算燃烧率,包括:根据每个时间窗口内的服务数据,分别计算每个时间窗口的燃烧率;所述在计算获得的燃烧率达到燃烧率阈值的持续时长阈值,超过持续时长阈值的情况下,执行预先设置的告警操作,包括:在计算获得的每个时间窗口的燃烧率,达到燃烧率阈值的持续时长阈值,均超过持续时长阈值的情况下,执行预先设置的告警操作。4.根据权利要求1所述的服务监控方法,其特征在于,所述时间窗口包括第一类窗口和第二类窗口,其中,第一类窗口和第二类窗口的时长差值的绝对值,大于第二预设时长。5.根据权利要求1所述的服务监控方法,其特征在于,预先存储有多组配置,一组配置包括至少两个时间窗口、一个燃烧率阈值、一个持续时长阈值和一种告警操作;所述在计算获得的每个时间窗口的燃烧率,达到燃烧率阈值的持续时长阈值,均超过持续时长阈值的情况下,执行预先设置的告警操作,包括:在第i组配置中的时间窗口的燃烧率达到所述第i组配置中的燃烧率阈值的持续时长,均超过...

【专利技术属性】
技术研发人员:孙斌史忠伟
申请(专利权)人:五八有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1