报警信息的处理方法、装置及设备制造方法及图纸

技术编号:37573635 阅读:23 留言:0更新日期:2023-05-15 07:51
本申请公开了一种报警信息的处理方法、装置及设备,涉及信息处理技术领域,能够将拥有相同原因的报错汇总到一个报错集合中,对监控系统起到降噪的作用,从而减少报警信息中报错的数量。其中方法包括:接收监控客户端上报的至少一个报警信息,该报警信息中包括多次报错,根据所述至少一个报警信息,获取多次报错对应的链路追踪标识,利用链路追踪标识查询报错对应的链路拓扑关系和报错对应的异常日志信息,响应于报警信息的处理,利用报错对应的链路拓扑关系和报错对应的异常日志信息,对多次报错进行聚合处理,以使得报警信息中的报错划分到不同报错类型的报错集合中。划分到不同报错类型的报错集合中。划分到不同报错类型的报错集合中。

【技术实现步骤摘要】
报警信息的处理方法、装置及设备


[0001]本申请涉及信息处理
,尤其是涉及到一种报警信息的处理方法、装置及设备。

技术介绍

[0002]随着互联网行业的不断发展,电子商务的应用场景日趋丰富,以用户为中心,对电子商务中的基本要素进行链路重构会演变出多种形态的部署模式。
[0003]相关技术在部署模式演变成分布式和微服务的场景下,往往会构造出更长的链路和上下游关系,一旦监控系统检测到异常,该异常就会关联到多个报错,此时监控系统会统计报错数量,当报错数量超过阈值就会生成报警信息,进而产生大量的报警信息。然而,大量的报警信息中可能会记录相同报错,使得相同报错需要经过重复的筛查处理,从而分散排查问题的注意力,将问题复杂化,影响报警信息的处理效率。

技术实现思路

[0004]有鉴于此,本申请提供了一种报警信息的处理方法、装置及设备,主要目的在于解决现有技术中大量的报警数据中可能会记录相同报错,使得相同报错需要经过重复的筛查处理,影响报警信息的处理效率的问题。
[0005]根据本申请的第一个方面,提供了一种报警信息的处理方法,应用于服务端,该方法包括:
[0006]接收监控客户端上报的至少一个报警信息,所述报警信息中包括多次报错;
[0007]根据所述至少一个报警信息,获取多次报错对应的链路追踪标识,利用所述链路追踪标识查询报错对应的链路拓扑关系和报错对应的异常日志信息;
[0008]响应于报警信息的处理,利用所述报错对应的链路拓扑关系和报错对应的异常日志信息,对所述多次报错进行聚合处理,以使得报警信息中的报错划分到不同报错类型的报错集合中。
[0009]进一步地,所述根据所述至少一个报警信息,获取多次报错对应的链路追踪标识,利用所述链路追踪标识查询报错对应的链路拓扑关系和报错对应的异常日志信息,包括:
[0010]根据所述至少一个报警信息,从所述多次报错对应请求调用的关联日志中获取多次报错对应的链路追踪标识;
[0011]利用所述链路追踪标识从排查类日志数据源中查询报错对应的链路拓扑关系和报错对应的异常日志信息。
[0012]进一步地,所述响应于报警信息的处理,利用所述报错对应的链路拓扑关系和报错对应的异常日志信息,对所述多次报错进行聚合处理,以使得报警信息中的报错划分到不同报错类型的报错集合中,包括:
[0013]响应于报警信息的处理,利用所述报错对应的链路拓扑关系对多次报错进行第一次聚合处理,以使得报警信息中具有相同拓扑结构的报错划分到一个报错类型的报错集合
中;
[0014]利用所述报错对应的异常日志信息对所述具有相同拓扑结构的报错进行第二次聚合处理,以使得报警信息中具有相同原因的报错划分到一个报错类型的报错集合中。
[0015]进一步地,所述利用所述报错对应的链路拓扑关系对多次报错进行第一次聚合处理,以使得报警信息中具有相同拓扑结构的报错划分到一个报错类型的报错集合中,包括:
[0016]利用所述报错对应的链路拓扑关系,追踪报错对应请求调用的链路信息,所述链路信息中至少记录有请求调用的服务顺序;
[0017]根据所述请求调用的服务顺序,将具有相同服务顺序的报错进行第一次聚合处理,以使得报警信息中具有相同拓扑结构的报错划分到一个报错类型的报错集合中。
[0018]进一步地,所述利用所述报错对应的异常日志信息对所述具有相同拓扑结构的报错进行第二次聚合处理,以使得报警信息中具有相同原因的报错划分到一个报错类型的报错集合中,包括:
[0019]利用所述报错对应的异常日志信息,对异常日志信息进行特征值计算,得到报错中异常日志对应的特征字符串;
[0020]比对所述报错中异常日志对应的字符串是否一致;
[0021]若一致,则对所述具有相同拓扑结构的报错进行第二次聚合处理,以使得报警信息中具有相同原因的报错划分到一个报错类型的报错集合中。
[0022]进一步地,所述利用所述报错对应的异常日志信息,对异常日志信息进行特征值计算,得到异常日志对应的特征字符串,包括:
[0023]利用所述报错对应的异常日志信息,获取所述异常日志中以栈的形式记录的错误详情信息;
[0024]对所述错误详情信息删除敏感信息之后,确定所述异常日志信息中所述错误详情信息发生的特征行;
[0025]将所述错误详情信息发生的特征行以栈的形式进行字符串转换,得到异常日志对应的特征字符串。
[0026]根据本申请的第二个方面,提供了一种报警信息的处理方法,应用于监控客户端,该方法包括:
[0027]在分布式系统中部署多个监控点,汇总所述监控点发生的报错;
[0028]当统计得到监控点发生的报错次数大于设定数量时,生成监控点的报警信息,一个监控点对应生成一个报警信息,所述报警信息中包括多次报错;
[0029]将所述监控点的报警信息上报至服务端,以使得所述服务端利用所述报警信息中报错对应的链路拓扑关系和报错对应的异常日志信息,对所述多次报错进行聚合处理,得到不同报错类型的报错集合。
[0030]进一步地,所述在分布式系统中部署多个监控点,汇总所述监控点发生的报错,包括:
[0031]在分布式系统中部署多个监控点,获取分布式系统中监控点对应形成的链路信息;
[0032]根据所述链路信息确定监控点关联的应用资源,当所述应用资源产生异常时,触发监控点发生报错,所述报错记录在监控类日志中;
[0033]扫描所述监控类日志,汇总所述监控点发生的报错。
[0034]进一步地,所述方法还包括:
[0035]接收不同报错类型的报错集合,分析所述报错集合对应的异常调用原因,根据所述异常调用原因在请求调用的链路信息中定位出异常环节。
[0036]根据本申请的第三个方面,提供了一种报警信息的处理装置,该装置包括:
[0037]接收单元,用于接收监控客户端上报的至少一个报警信息,所述报警信息中包括多次报错;
[0038]查询单元,用于根据所述至少一个报警信息,获取多次报错对应的链路追踪标识,利用所述链路追踪标识查询报错对应的链路拓扑关系和报错对应的异常日志信息;
[0039]聚合单元,用于响应于报警信息的处理,利用所述报错对应的链路拓扑关系和报错对应的异常日志信息,对所述多次报错进行聚合处理,以使得报警信息中的报错划分到不同报错类型的报错集合中。
[0040]进一步地,所述查询单元,具体用于根据所述至少一个报警信息,从所述多次报错对应请求调用的关联日志中获取多次报错对应的链路追踪标识;利用所述链路追踪标识从排查类日志数据源中查询报错对应的链路拓扑关系和报错对应的异常日志信息。
[0041]进一步地,所述聚合单元包括:
[0042]第一聚合模块,用于响应于报警信息的处理,利用所述报错对应的链路拓扑关系对多次报错进行第一次聚合处理,以使得报警信息中具有相同拓扑结构的报错划分到一个报错类型的报错集合本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种报警信息的处理方法,其特征在于,包括:接收监控客户端上报的至少一个报警信息,所述报警信息中包括多次报错;根据所述至少一个报警信息,获取多次报错对应的链路追踪标识,利用所述链路追踪标识查询报错对应的链路拓扑关系和报错对应的异常日志信息;响应于报警信息的处理,利用所述报错对应的链路拓扑关系和报错对应的异常日志信息,对所述多次报错进行聚合处理,以使得报警信息中的报错划分到不同报错类型的报错集合中。2.根据权利要求1所述的方法,其特征在于,所述根据所述至少一个报警信息,获取多次报错对应的链路追踪标识,利用所述链路追踪标识查询报错对应的链路拓扑关系和报错对应的异常日志信息,包括:根据所述至少一个报警信息,从所述多次报错对应请求调用的关联日志中获取多次报错对应的链路追踪标识;利用所述链路追踪标识从排查类日志数据源中查询报错对应的链路拓扑关系和报错对应的异常日志信息。3.根据权利要求1所述的方法,其特征在于,所述响应于报警信息的处理,利用所述报错对应的链路拓扑关系和报错对应的异常日志信息,对所述多次报错进行聚合处理,以使得报警信息中的报错划分到不同报错类型的报错集合中,包括:响应于报警信息的处理,利用所述报错对应的链路拓扑关系对多次报错进行第一次聚合处理,以使得报警信息中具有相同拓扑结构的报错划分到一个报错类型的报错集合中;利用所述报错对应的异常日志信息对所述具有相同拓扑结构的报错进行第二次聚合处理,以使得报警信息中具有相同原因的报错划分到一个报错类型的报错集合中。4.根据权利要求3所述的方法,其特征在于,所述利用所述报错对应的链路拓扑关系对多次报错进行第一次聚合处理,以使得报警信息中具有相同拓扑结构的报错划分到一个报错类型的报错集合中,包括:利用所述报错对应的链路拓扑关系,追踪报错对应请求调用的链路信息,所述链路信息中至少记录有请求调用的服务顺序;根据所述请求调用的服务顺序,将具有相同服务顺序的报错进行第一次聚合处理,以使得报警信息中具有相同拓扑结构的报错划分到一个报错类型的报错集合中。5.根据权利要求3所述的方法,其特征在于,所述利用所述报错对应的异常日志信息对所述具有相同拓扑结构的报错进行第二次聚合处理,以使得报警信息中具有相同原因的报错划分到一个报错类型的报错集合中,包括:利用所述报错对应的异常日志信息,对异常日志信息进行特征值计算,得到报错中异常日志对应的特征字符串;比对所述报错中异常日志对应的字符串是否一致;若一致,则对所述具有相同拓扑结构的报错进行第二次聚合处理,以使得报警...

【专利技术属性】
技术研发人员:王宇
申请(专利权)人:拉扎斯网络科技上海有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1