Kubernetes集群告警根因分析方法及装置制造方法及图纸

技术编号:33128461 阅读:17 留言:0更新日期:2022-04-17 00:41
本发明专利技术提供一种Kubernetes集群告警根因分析方法及装置,其中,该方法包括:基于Kubernetes集群第一目标时间段的告警消息和/或日志,获取Kubernetes集群第一目标时间段的告警信息;基于预设的告警根因分析规则,对Kubernetes集群第一目标时间段的告警信息进行告警根因分析,获取第一目标时间段的告警信息对应的第一根因故障。本发明专利技术提供的Kubernetes集群告警根因分析方法及装置,能快速分析出各个告警之间的关联关系能快速定位出告警产生的根本故障点,能提高Kubernetes集群告警根因分析的效率,能最大限度压缩集群运维人员消耗时间,能降低集群环境人工监测成本。本。本。

【技术实现步骤摘要】
Kubernetes集群告警根因分析方法及装置


[0001]本专利技术涉及计算机
,尤其涉及一种Kubernetes集群告警根因分析方法及装置。

技术介绍

[0002]Kubernetes集群用于管理云平台中多个主机上的容器化的应用,是一个开源的平台,可以实现容器集群的自动化部署、自动扩缩容、维护等功能。Kubernetes集群可以包括多个Kubernetes节点,每个节点可以运行一个或多个pod。
[0003]Kubernetes集群可以快速部署应用,快速扩展应用,无缝对接新的应用功能,节省资源,以及优化硬件资源的使用。
[0004]Kubernetes集群的主要功能包括:多个pod协同工作;挂载存储系统;对应用进行健康检测;复制应用实例;Pod自动伸缩/扩展;注册与发现;负载均衡;滚动更新;资源监控;日志访问;调试应用程序;以及提供认证和授权等。
[0005]目前,Kubernetes集群的运维主要基于人工分析,出现告警后需有人工进行排查故障和查看日志等操作,从而确定根因告警。因此,现有技术存在效率低等不足。

技术实现思路

[0006]本专利技术提供一种Kubernetes集群告警根因分析方法及装置,用以解决现有技术中的效率低的缺陷,实现对Kubernetes集群进行高效、自动化的告警根因分析。
[0007]本专利技术提供一种Kubernetes集群告警根因分析方法,包括:
[0008]基于Kubernetes集群第一目标时间段的告警消息和/或日志,获取所述Kubernetes集群所述第一目标时间段的告警信息;
[0009]基于预设的告警根因分析规则,对所述Kubernetes集群所述第一目标时间段的告警信息进行告警根因分析,获取所述第一目标时间段的告警信息对应的第一根因故障。
[0010]根据本专利技术提供的一种Kubernetes集群告警根因分析方法,基于Kubernetes集群第一目标时间段的告警消息,获取所述Kubernetes集群所述第一目标时间段的告警信息,具体包括:
[0011]基于Prometheus监控所述Kubernetes集群,获取所述Kubernetes集群第一目标时间段的告警消息;
[0012]对所述Kubernetes集群所述第一目标时间段的告警消息进行解析,获取所述Kubernetes集群所述第一目标时间段的第一告警信息。
[0013]根据本专利技术提供的一种Kubernetes集群告警根因分析方法,基于Kubernetes集群第一目标时间段的日志,获取所述Kubernetes集群所述第一目标时间段的告警信息,具体包括:
[0014]基于EFK日志系统和/或kube

eventer,获取所述Kubernetes集群第一目标时间段的日志;
[0015]对所述Kubernetes集群所述第一目标时间段的日志进行解析,获取所述Kubernetes集群所述第一目标时间段的第二告警信息。
[0016]根据本专利技术提供的一种Kubernetes集群告警根因分析方法,基于Kubernetes集群第一目标时间段的告警消息和/或日志,获取所述Kubernetes集群所述第一目标时间段的告警信息之后,还包括:
[0017]获取所述Kubernetes集群第二目标时间段的历史告警信息;
[0018]基于所述告警根因分析规则,对所述Kubernetes集群所述第一目标时间段的告警信息和所述第二目标时间段的历史告警信息进行告警根因分析,获取所述第一目标时间段的告警信息对应的第二根因故障。
[0019]根据本专利技术提供的一种Kubernetes集群告警根因分析方法,所述基于Prometheus监控所述Kubernetes集群,获取所述Kubernetes集群第一目标时间段的告警消息,具体包括:
[0020]基于各预设的各告警规则对所述Kubernetes集群进行监控,获取所述Kubernetes集群第一目标时间段的告警消息;
[0021]其中,所述告警规则,是多条promQL表达式嵌套构建的。
[0022]根据本专利技术提供的一种Kubernetes集群告警根因分析方法,所述基于预设的告警根因分析规则,对所述Kubernetes集群所述第一目标时间段的告警信息进行告警根因分析,获取所述第一目标时间段的告警信息对应的第一根因故障之后,还包括:
[0023]向客户端发送取所述Kubernetes集群所述第一目标时间段的告警信息和所述第一目标时间段的告警信息对应的第一根因故障,以使得客户端基于所述Kubernetes集群的拓扑图,标注产生告警的Kubernetes节点和pod。
[0024]本专利技术还提供一种Kubernetes集群告警根因分析装置,包括:
[0025]信息获取模块,用于基于Kubernetes集群第一目标时间段的告警消息和/或日志,获取所述Kubernetes集群所述第一目标时间段的告警信息;
[0026]告警分析模块,用于基于预设的告警根因分析规则,对所述Kubernetes集群所述第一目标时间段的告警信息进行告警根因分析,获取所述第一目标时间段的告警信息对应的第一根因故障。
[0027]本专利技术还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述Kubernetes集群告警根因分析方法的步骤。
[0028]本专利技术还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述Kubernetes集群告警根因分析方法的步骤。
[0029]本专利技术还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述任一种所述Kubernetes集群告警根因分析方法的步骤。
[0030]本专利技术提供的Kubernetes集群告警根因分析方法及装置,基于Kubernetes集群第一目标时间段的告警消息和/或日志,获取Kubernetes集群第一目标时间段的告警信息,基于预设的告警根因分析规则,对Kubernetes集群第一目标时间段的告警信息进行告警根因分析,获取第一目标时间段的告警信息对应的第一根因故障,能快速分析出各个告警之间的关联关系,能够完整收集集群环境的各种告警信息,能快速定位出告警产生的根本故障
点,能提高Kubernetes集群告警根因分析的效率,能最大限度压缩集群运维人员消耗时间,能降低集群环境人工监测成本,从而能更迅速地恢复集群正常状态,能降低集群异常对业务造成的影响,运维侧不用再过分关注集群运行状态,能大幅提升运维侧故障排查效率,提升集群监控效率,迅速提升故障解决率,能最大限度缩短业务中断时间,能促进运维侧向更加智能高效化方向发展。
附图说明
[0031]为了更清楚地说明本专利技术或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种Kubernetes集群告警根因分析方法,其特征在于,包括:基于Kubernetes集群第一目标时间段的告警消息和/或日志,获取所述Kubernetes集群所述第一目标时间段的告警信息;基于预设的告警根因分析规则,对所述Kubernetes集群所述第一目标时间段的告警信息进行告警根因分析,获取所述第一目标时间段的告警信息对应的第一根因故障。2.根据权利要求1所述的Kubernetes集群告警根因分析方法,其特征在于,基于Kubernetes集群第一目标时间段的告警消息,获取所述Kubernetes集群所述第一目标时间段的告警信息,具体包括:基于Prometheus监控所述Kubernetes集群,获取所述Kubernetes集群第一目标时间段的告警消息;对所述Kubernetes集群所述第一目标时间段的告警消息进行解析,获取所述Kubernetes集群所述第一目标时间段的第一告警信息。3.根据权利要求1所述的Kubernetes集群告警根因分析方法,其特征在于,基于Kubernetes集群第一目标时间段的日志,获取所述Kubernetes集群所述第一目标时间段的告警信息,具体包括:基于EFK日志系统和/或kube

eventer,获取所述Kubernetes集群第一目标时间段的日志;对所述Kubernetes集群所述第一目标时间段的日志进行解析,获取所述Kubernetes集群所述第一目标时间段的第二告警信息。4.根据权利要求1所述的Kubernetes集群告警根因分析方法,其特征在于,基于Kubernetes集群第一目标时间段的告警消息和/或日志,获取所述Kubernetes集群所述第一目标时间段的告警信息之后,还包括:获取所述Kubernetes集群第二目标时间段的历史告警信息;基于所述告警根因分析规则,对所述Kubernetes集群所述第一目标时间段的告警信息和所述第二目标时间段的历史告警信息进行告警根因分析,获取所述第一目标时间段的告警信息对应的第二根因故障。5.根据权利要求2所述的Kubernete...

【专利技术属性】
技术研发人员:杨启航
申请(专利权)人:山东浪潮科学研究院有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1