System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于国产操作系统的混沌工程及其方法技术方案_技高网

一种基于国产操作系统的混沌工程及其方法技术方案

技术编号:43706048 阅读:16 留言:0更新日期:2024-12-18 21:18
本申请涉及一种基于国产操作系统的混沌工程及其方法,该混沌工程包括:风险感知与监控告警模块、故障注入与实验方案设计模块、实验执行与结果分析模块、故障恢复与复盘分析模块、协同模块、安全性保障模块和管理平台模块,其中,风险感知与监控告警模块:建立监控指标体系并告警;故障注入与实验方案设计模块:建立故障类型库并设计实验方案;实验执行与结果分析模块:执行实验方案并观测系统状态和指标变化;故障恢复与复盘分析模块:提供故障恢复功能和可视化界面;协同模块:触发混沌工程实验,反馈实验结果,优化策略和阈值;安全性保障模块:设置不同角色、不同操作和不同资源的权限;管理平台模块:进行实验管理、资源管理和数据管理。

【技术实现步骤摘要】

本申请涉及混沌工程,尤其涉及一种基于国产操作系统的混沌工程及其方法


技术介绍

1、混沌工程是一门新兴的技术学科,是一套通过在系统基础设施上进行实验,主动找出系统中脆弱环节的方法学。通过实验性的方法,去发现系统中潜在的、可以导致灾难的或让用户受损的薄弱环节,并推动研发自主地进行问题修复、代码优化,最终建设成为真正意义的韧性架构,增加用户抵御突发事件的能力与信心。国产操作系统故障处理是一个涉及多个方面的复杂过程。在故障发生时,首先需要进行故障识别,通过监控系统实时采集系统状态和指标数据,记录故障影响和系统响应情况。然后,进行故障定位,分析故障原因,确定故障的具体位置。接下来,进行故障恢复,根据预设的故障恢复预案,进行自动化、半自动化或手动恢复操作,确保系统尽快恢复正常运行。同时,需要进行故障分析,总结故障原因和处理经验,为后续的系统改进提供依据。此外,还需要进行故障报告,记录故障处理过程和结果,为后续的故障处理提供参考。故障处理完成后,需要进行故障总结,对故障处理过程进行反思和总结,找出不足之处,为后续的故障处理提供改进措施。

2、传统的国产操作系统故障处理依赖于历史数据和经验,往往无法及时预测和应对新的故障类型,同时在进行处理的过程中恢复过程耗时较长,且容易出错。


技术实现思路

1、为解决上述问题,本专利技术提供了一种基于国产操作系统的混沌工程及其方法。

2、第一方面,本申请提供一种基于国产操作系统的混沌工程,采用如下的技术方案:

3、一种基于国产操作系统的混沌工程,包括:风险感知与监控告警模块、故障注入与实验方案设计模块、实验执行与结果分析模块、故障恢复与复盘分析模块、协同模块、安全性保障模块和管理平台模块,其中,

4、风险感知与监控告警模块:针对国产操作系统,建立监控指标体系并进行告警,监控指标涵盖系统资源、进程、服务以及内核参数关键指标;

5、故障注入与实验方案设计模块:建立故障类型库,涵盖系统、进程、网络以及存储维度,并为目标系统设计实验方案;

6、实验执行与结果分析模块:在目标系统上执行实验方案,注入预设的故障,通过风险感知与监控告警模块,实时观测系统状态和指标变化,记录故障影响和系统响应情况;

7、故障恢复与复盘分析模块:包括故障恢复工具以及复盘分析工具,其中故障恢复工具提供给故障恢复功能,用于恢复系统状态,复盘分析工具提供可视化界面,以便用户进行复盘总结;

8、协同模块:当监控系统检测到异常指标时,自动触发混沌工程实验,将实验结果反馈给监控系统,优化告警策略和指标阈值;

9、安全性保障模块:设置不同角色、不同操作以及不同资源的权限;

10、管理平台模块:用于进行实验管理、资源管理以及数据管理。

11、在一种可能实现的方式中,所述风险感知与监控告警模块针对国产操作系统建立监控指标体系并进行告警包括:

12、基于阈值告警:设置阈值,当指标超过阈值时触发告警;

13、基于趋势告警:监测指标变化趋势,当指标出现异常波动时触发告警;

14、基于关联告警:分析指标之间的关联关系,当多个指标同时出现异常时触发告警;

15、基于基线告警:建立系统基线,当系统状态偏离基线时触发告警;

16、告警通知:支持多种告警通知方式,包括短信、邮件、微信、钉钉,确保及时通知相关人员;

17、告警可视化:提供告警信息可视化界面。

18、在一种可能实现的方式中,所述故障注入与实验方案设计模块为目标系统设计实验方案,包括:

19、需求分析:与业务团队沟通,了解业务需求和系统架构,确定业务场景和测试目标的系统组件和功能;

20、故障类型选择:根据业务场景和测试目标,选择合适的故障类型,包括系统故障、进程故障、网络故障、存储故障;

21、实验方案设计:使用实验方案设计工具,为测试目标设计实验方案,包括设置实验目标、故障类型、故障参数、预期结果;

22、实验方案评审:由相关人员对实验方案进行评审,确保实验方案的科学性和可行性;

23、实验方案发布:将实验方案发布到实验编排引擎,准备执行实验。

24、在一种可能实现的方式中,所述实验执行与结果分析模块在目标系统上执行实验方案,注入预设的故障,通过风险感知与监控告警模块,实时观测系统状态和指标变化,记录故障影响和系统响应情况,包括:

25、s1:实验执行:实验编排引擎根据实验方案,在目标系统上注入预设的故障;

26、s2:结果观测:监控系统实时采集系统状态和指标数据,并将数据发送到结果分析工具;

27、s3:结果分析:结果分析工具对实验结果进行分析,评估系统韧性,找出薄弱环节和潜在风险;

28、s4:结果可视化:结果分析工具将分析结果进行可视化;

29、s5:异常检测:利用机器学习技术,对实验结果进行异常检测。

30、在一种可能实现的方式中,故障恢复工具提供给故障恢复功能,包括:

31、自动化恢复:通过脚本或自动化工具,自动执行恢复操作,包括重启系统、重启服务以及重启进程;

32、半自动化恢复:由运维人员手动执行部分恢复操作,包括重启服务以及重启进程;

33、手动恢复:由运维人员手动执行全部恢复操作。

34、在一种可能实现的方式中,复盘分析工具提供可视化界面,用户根据可视化界面对实验过程和实验结果进行复盘分析,总结经验教训,优化实验方案和故障处理流程,包括:

35、实验过程回顾:回顾实验过程,分析实验步骤是否合理、实验操作是否规范;

36、实验结果分析:分析实验结果,评估系统韧性,找出薄弱环节和潜在风险;

37、改进措施制定:制定改进措施,包括优化系统架构、优化系统配置以及优化故障处理流程。

38、在一种可能实现的方式中,协同模块优化告警策略和指标阈值,包括:

39、调整告警阈值:根据实验结果,调整告警阈值,避免误报和漏报。

40、增加告警规则:根据实验结果,增加新的告警规则,包括增加关联告警规则、增加趋势告警规则等。

41、修改告警级别:根据实验结果,修改告警级别,包括将低级别告警升级为高级别告警。

42、在一种可能实现的方式中,安全性保障模块:设置不同角色、不同操作以及不同资源的权限,包括:

43、角色权限:设置不同角色的权限,包括管理员、运维人员、开发人员,不同角色拥有不同的操作权限;

44、操作权限:设置不同操作的权限,包括创建实验、执行实验、查看结果,不同操作拥有不同的权限;

45、资源权限:设置不同资源的权限,包括目标系统、故障注入工具,不同资源拥有不同的权限。

46、在一种可能实现的方式中,管理平台模块:用于进行实验管理、资源管理以及数据管本文档来自技高网...

【技术保护点】

1.一种基于国产操作系统的混沌工程,其特征在于,所述混沌工程包括:风险感知与监控告警模块、故障注入与实验方案设计模块、实验执行与结果分析模块、故障恢复与复盘分析模块、协同模块、安全性保障模块和管理平台模块,其中,

2.根据权利要求1所述的一种基于国产操作系统的混沌工程,其特征在于,所述风险感知与监控告警模块针对国产操作系统建立监控指标体系并进行告警包括:

3.根据权利要求1所述的一种基于国产操作系统的混沌工程,其特征在于,所述故障注入与实验方案设计模块为目标系统设计实验方案,包括:

4.根据权利要求1所述的一种基于国产操作系统的混沌工程,其特征在于,所述实验执行与结果分析模块在目标系统上执行实验方案,注入预设的故障,通过风险感知与监控告警模块,实时观测系统状态和指标变化,记录故障影响和系统响应情况,包括:

5.根据权利要求1所述的一种基于国产操作系统的混沌工程,其特征在于,故障恢复工具提供给故障恢复功能,包括:

6.根据权利要求1所述的一种基于国产操作系统的混沌工程,其特征在于,复盘分析工具提供可视化界面,用户根据可视化界面对实验过程和实验结果进行复盘分析,总结经验教训,优化实验方案和故障处理流程,包括:

7.根据权利要求1所述的一种基于国产操作系统的混沌工程,其特征在于,协同模块优化告警策略和指标阈值,包括:

8.根据权利要求1所述的一种基于国产操作系统的混沌工程,其特征在于,安全性保障模块:设置不同角色、不同操作以及不同资源的权限,包括:

9.根据权利要求1所述的一种基于国产操作系统的混沌工程,其特征在于,管理平台模块:用于进行实验管理、资源管理以及数据管理,包括:

10.一种基于国产操作系统的混沌工程方法,其特征在于,包括:

...

【技术特征摘要】

1.一种基于国产操作系统的混沌工程,其特征在于,所述混沌工程包括:风险感知与监控告警模块、故障注入与实验方案设计模块、实验执行与结果分析模块、故障恢复与复盘分析模块、协同模块、安全性保障模块和管理平台模块,其中,

2.根据权利要求1所述的一种基于国产操作系统的混沌工程,其特征在于,所述风险感知与监控告警模块针对国产操作系统建立监控指标体系并进行告警包括:

3.根据权利要求1所述的一种基于国产操作系统的混沌工程,其特征在于,所述故障注入与实验方案设计模块为目标系统设计实验方案,包括:

4.根据权利要求1所述的一种基于国产操作系统的混沌工程,其特征在于,所述实验执行与结果分析模块在目标系统上执行实验方案,注入预设的故障,通过风险感知与监控告警模块,实时观测系统状态和指标变化,记录故障影响和系统响应情况,包括:

5.根据权利要求1...

【专利技术属性】
技术研发人员:高巍方亮亮吴旭梅俊杰
申请(专利权)人:先进操作系统创新中心天津有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1