System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于分布式云平台的告警处理方法技术_技高网

一种基于分布式云平台的告警处理方法技术

技术编号:43140298 阅读:7 留言:0更新日期:2024-10-29 17:44
本发明专利技术公开一种基于分布式云平台的告警处理方法,涉及云平台告警技术领域;包括步骤1:采集数据,步骤2:建立分布式云平台的中心端告警数据仓库,将各个分布式节点的采集的数据汇聚至中心端告警数据仓库,包括:步骤21:通过中心端告警数据仓库采用多层数据建模方式进行数据存储与查询分析,步骤22:通过数据建模第二层根据历史数据进行数据的聚合及关联,形成告警事件,步骤23:通过数据建模第三层进行数据查询分析,步骤24:通过数据建模第四层建立告警自动处理规则,根据告警自动处理规则通过告警收敛方式和告警汇聚方式实现告警自动转工单处理。

【技术实现步骤摘要】

本专利技术公开一种方法,涉及云平台告警,具体地说一种基于分布式云平台的告警处理方法


技术介绍

1、分布式云平台是云计算技术的一种高级形式,它通过将计算资源、存储和网络设施分布在不同的地理位置,构建了一个跨地域的资源池。这种架构不仅提供了更高的资源可用性和服务可靠性,而且还能够根据用户的需求,动态地调整资源分配,实现真正的按需服务。

2、在分布式云平台中,系统监控和日志管理是不可或缺的技术。通过部署各种监控工具,如性能监控、日志收集和分析系统,运维团队能够实时地跟踪系统的状态和性能指标,及时发现和诊断问题。这些监控工具通常具有高度的自动化和智能化,能够自动地收集、分析和报告系统数据,为运维决策提供数据支持。

3、而云平台告警处理方面也存在一些缺点,告警规则复杂性,定义告警规则需要考虑多种因素,如业务需求、系统特点等,规则定义的复杂性可能导致告警的误报或漏报。监控工具部署困难,在分布式云平台中部署监控工具需要考虑网络延迟、数据传输安全等问题,部署过程可能较为复杂。告警事件处理难度,由于分布式云平台中的系统复杂性,告警事件的处理可能涉及到多个组件和团队,处理难度较大。


技术实现思路

1、本专利技术针对现有技术的问题,提供一种基于分布式云平台的告警处理方法,使用pull或者push对云平台及其组件进行监控数据采集,并使用时序数据库对监控指标和告警数据进行存储,通过网络链路在中心端进行汇聚,并通过告警规则实现告警自动转发及处理,以提高分布式云平台的运维效率和系统稳定性,确保用户服务的连续性和质量。

2、本专利技术提出的具体方案是:

3、本专利技术提供一种基于分布式云平台的告警处理方法,包括:

4、步骤1:采集数据,所述数据包括系统监控指标、日志和事件,

5、步骤2:建立分布式云平台的中心端告警数据仓库,将各个分布式节点的采集的数据汇聚至中心端告警数据仓库,包括:

6、步骤21:通过中心端告警数据仓库采用多层数据建模方式进行数据存储与查询分析,其中通过数据建模第一层实时存储数据,清洗数据并形成标准化数据,

7、步骤22:通过数据建模第二层根据历史数据进行数据的聚合及关联,形成告警事件,

8、步骤23:通过数据建模第三层进行数据查询分析,基于业务需求创建定制化视图,识别异常模式下数据,并进行告警趋势分析,

9、步骤24:通过数据建模第四层建立告警自动处理规则,根据告警自动处理规则通过告警收敛方式和告警汇聚方式实现告警自动转工单处理,

10、通过告警收敛方式根据告警事件和告警趋势分析告警数据,减少告警信息数量,通过告警汇聚方式统一汇总告警信息,

11、当告警被触发时,根据告警自动处理规则预定义的规则自动生成工单,并将工单分发给相应运维人员,同时获取运维人员根据工单进行问题处理的反馈。

12、进一步,所述的一种基于分布式云平台的告警处理方法中步骤1中系统监控指标包括cpu利用率、内存使用率、磁盘i/o监控指标和网络流量指标,日志包括系统日志、应用日志和审计日志,事件包括分布式云平台中各种组件和服务产生的各种事件。

13、进一步,所述的一种基于分布式云平台的告警处理方法中步骤23中进行告警趋势分析,包括:通过数据建模第三层基于历史告警数据分析历史告警数据的趋势,预测未来的告警情况,其中通过数据建模第三层进行时间序列分析,预测未来一段时间内可能出现的告警数量和类型,或者利用关联规则挖掘方法,发现不同告警之间的关联关系,预测某一告警可能引发的其他告警。

14、进一步,所述的一种基于分布式云平台的告警处理方法中步骤23中基于业务需求创建定制化视图,将视图以多种维度进行呈现,其中呈现维度包括时序数据维度、地图视图维度、业务类型维度、告警级别维度和处理状态维度,通过时序数据维度监控告警趋势,通过地图视图维度监控告警分布,通过业务类型维度识别业务影响,通过告警级别维度优先处理关键告警,通过处理状态维度监控处理进度。

15、本专利技术提供一种基于分布式云平台的告警处理装置,包括采集模块和告警数据仓库管理模块,

16、采集模块采集数据,所述数据包括系统监控指标、日志和事件,

17、告警数据仓库管理模块建立分布式云平台的中心端告警数据仓库,将各个分布式节点的采集的数据汇聚至中心端告警数据仓库,包括:

18、步骤21:通过中心端告警数据仓库采用多层数据建模方式进行数据存储与查询分析,其中通过数据建模第一层实时存储数据,清洗数据并形成标准化数据,

19、步骤22:通过数据建模第二层根据历史数据进行数据的聚合及关联,形成告警事件,

20、步骤23:通过数据建模第三层进行数据查询分析,基于业务需求创建定制化视图,识别异常模式下数据,并进行告警趋势分析,

21、步骤24:通过数据建模第四层建立告警自动处理规则,根据告警自动处理规则通过告警收敛方式和告警汇聚方式实现告警自动转工单处理,

22、通过告警收敛方式根据告警事件和告警趋势分析告警数据,减少告警信息数量,通过告警汇聚方式统一汇总告警信息,

23、当告警被触发时,根据告警自动处理规则预定义的规则自动生成工单,并将工单分发给相应运维人员,同时获取运维人员根据工单进行问题处理的反馈。

24、进一步,所述的一种基于分布式云平台的告警处理装置中采集模块采集数据时,系统监控指标包括cpu利用率、内存使用率、磁盘i/o监控指标和网络流量指标,日志包括系统日志、应用日志和审计日志,事件包括分布式云平台中各种组件和服务产生的各种事件。

25、进一步,所述的一种基于分布式云平台的告警处理装置中告警数据仓库管理模块执行步骤23,进行告警趋势分析,包括:通过数据建模第三层基于历史告警数据分析历史告警数据的趋势,预测未来的告警情况,其中通过数据建模第三层进行时间序列分析,预测未来一段时间内可能出现的告警数量和类型,或者利用关联规则挖掘方法,发现不同告警之间的关联关系,预测某一告警可能引发的其他告警。

26、进一步,所述的一种基于分布式云平台的告警处理装置中告警数据仓库管理模块执行步骤23时,基于业务需求创建定制化视图,将视图以多种维度进行呈现,其中呈现维度包括时序数据维度、地图视图维度、业务类型维度、告警级别维度和处理状态维度,通过时序数据维度监控告警趋势,通过地图视图维度监控告警分布,通过业务类型维度识别业务影响,通过告警级别维度优先处理关键告警,通过处理状态维度监控处理进度。

27、本专利技术具有以下显著的有益效果:

28、(1)通过网络链路汇聚分布式云平台的告警数据到中心端告警数据仓库,实现了对告警数据的集中管理和实时监控。多层数据建模技术进一步提高了数据的处理效率和准确性。告警自动处理规则的建立,通过告警收敛和告警汇聚,减少了告警数量,提高了运维团队的处理效率。告警自动转工单功能实现了告警处理的闭环本文档来自技高网...

【技术保护点】

1.一种基于分布式云平台的告警处理方法,其特征是包括:

2.根据权利要求1所述的一种基于分布式云平台的告警处理方法,其特征是步骤1中系统监控指标包括CPU利用率、内存使用率、磁盘I/O监控指标和网络流量指标,日志包括系统日志、应用日志和审计日志,事件包括分布式云平台中各种组件和服务产生的各种事件。

3.根据权利要求1所述的一种基于分布式云平台的告警处理方法,其特征是步骤23中进行告警趋势分析,包括:通过数据建模第三层基于历史告警数据分析历史告警数据的趋势,预测未来的告警情况,其中通过数据建模第三层进行时间序列分析,预测未来一段时间内可能出现的告警数量和类型,或者利用关联规则挖掘方法,发现不同告警之间的关联关系,预测某一告警可能引发的其他告警。

4.根据权利要求1所述的一种基于分布式云平台的告警处理方法,其特征是步骤23中基于业务需求创建定制化视图,将视图以多种维度进行呈现,其中呈现维度包括时序数据维度、地图视图维度、业务类型维度、告警级别维度和处理状态维度,通过时序数据维度监控告警趋势,通过地图视图维度监控告警分布,通过业务类型维度识别业务影响,通过告警级别维度优先处理关键告警,通过处理状态维度监控处理进度。

5.一种基于分布式云平台的告警处理装置,其特征是包括采集模块和告警数据仓库管理模块,

6.根据权利要求5所述的一种基于分布式云平台的告警处理装置,其特征是采集模块采集数据时,系统监控指标包括CPU利用率、内存使用率、磁盘I/O监控指标和网络流量指标,日志包括系统日志、应用日志和审计日志,事件包括分布式云平台中各种组件和服务产生的各种事件。

7.根据权利要求5所述的一种基于分布式云平台的告警处理装置,其特征是告警数据仓库管理模块执行步骤23,进行告警趋势分析,包括:通过数据建模第三层基于历史告警数据分析历史告警数据的趋势,预测未来的告警情况,其中通过数据建模第三层进行时间序列分析,预测未来一段时间内可能出现的告警数量和类型,或者利用关联规则挖掘方法,发现不同告警之间的关联关系,预测某一告警可能引发的其他告警。

8.根据权利要求5所述的一种基于分布式云平台的告警处理装置,其特征是告警数据仓库管理模块执行步骤23时,基于业务需求创建定制化视图,将视图以多种维度进行呈现,其中呈现维度包括时序数据维度、地图视图维度、业务类型维度、告警级别维度和处理状态维度,通过时序数据维度监控告警趋势,通过地图视图维度监控告警分布,通过业务类型维度识别业务影响,通过告警级别维度优先处理关键告警,通过处理状态维度监控处理进度。

...

【技术特征摘要】

1.一种基于分布式云平台的告警处理方法,其特征是包括:

2.根据权利要求1所述的一种基于分布式云平台的告警处理方法,其特征是步骤1中系统监控指标包括cpu利用率、内存使用率、磁盘i/o监控指标和网络流量指标,日志包括系统日志、应用日志和审计日志,事件包括分布式云平台中各种组件和服务产生的各种事件。

3.根据权利要求1所述的一种基于分布式云平台的告警处理方法,其特征是步骤23中进行告警趋势分析,包括:通过数据建模第三层基于历史告警数据分析历史告警数据的趋势,预测未来的告警情况,其中通过数据建模第三层进行时间序列分析,预测未来一段时间内可能出现的告警数量和类型,或者利用关联规则挖掘方法,发现不同告警之间的关联关系,预测某一告警可能引发的其他告警。

4.根据权利要求1所述的一种基于分布式云平台的告警处理方法,其特征是步骤23中基于业务需求创建定制化视图,将视图以多种维度进行呈现,其中呈现维度包括时序数据维度、地图视图维度、业务类型维度、告警级别维度和处理状态维度,通过时序数据维度监控告警趋势,通过地图视图维度监控告警分布,通过业务类型维度识别业务影响,通过告警级别维度优先处理关键告警,通过处理状态维度监控处理进度。

5.一种基于分布式云平台的告警处理装置,...

【专利技术属性】
技术研发人员:马顺安李昌浩李腾飞张目飞陈尧
申请(专利权)人:浪潮云信息技术股份公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1