System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及信息系统应急处置、信息技术安全及数据处理,尤其涉及一种基于故障关联分析的应急预案生成方法及系统。
技术介绍
1、应急处置是指在面对突发事件或异常情况时,为了快速恢复系统的稳定性和正常运行而进行的紧急应对和处理。随着企业信息化程度的提高和业务连续性需求的增长,应急处置在应用运维工作中的重要性愈发凸显。在面对技术复杂性的增加、法规遵从与风险管理的要求、数据安全与隐私保护的关注,以及市场竞争与用户体验的需求时,应用运维团队需要采取有效的应急处置措施,以确保业务的连续性和稳定性。然而,在实际工作中,应急处置仍存在一些不足之处,如预案不完善、缺乏专业人员以及对事件的应对不足等。
2、为了解决这些问题,现有技术为了优化应急过程中问题的定位和处置流程进行了多种不同尝试。例如,公告号cn115860725a、名称为“系统应急处理的方法、装置、电子设备及存储介质”的中国专利申请提供了一种高效的应急处理系统及方法,包括由系统实时接收异常告警信息,并基于这些告警信息进行深入的异常指标分析,从而精确地定位问题所在,所生成的定位信息不仅包括问题类型、问题编码,还涉及问题源的精准识别以及相关系统的编码,基于精确的问题定位信息,系统会在预先存储在应急方案库中自动筛选出相应的应急方案迅速执行应急处理,并实时反馈处理结果,对于未成功解决的问题,由系统再次根据问题定位信息从应急方案库中筛选合适的方案,直至找到有效的解决方案,确保问题得到解决为止。公告号cn116089230a、名称为“一种安全事件告警应急处理方法及系统”的中国专利申请提供
3、虽然现有技术在应急过程中问题的定位和处置流程能够实现一定的优化效果,但是在实际应用中仍然存在一些不足。对于涉及大量信息的接收、分析和处理的现有技术,其信息处理的复杂性较高,由于系统故障可能涉及多个应用、集群或上下游系统,这使得问题定位和原因分析变得更为复杂,导致需要投入更多的时间和资源来定位问题的根本原因,明显影响应急处理的效率;另一方面,对于需要快速响应的应急情况,如服务中断、安全攻击等,此类方法执行步骤和环节可能导致响应时间过长,无法满足应急处置的时效性要求。对于使用预案库的现有技术,由于预案库中的方案通常是基于已知的异常情况和历史数据制定的,对于那些没有明显先例或不属于已有分类的未知事件,系统可能无法准确识别和应对,例如新型攻击手段、系统内部未知的故障模式等,使得系统容易因未知事件造成识别与应急响应触发的明显延迟,进而导致事件处理时间延长、影响扩大,甚至可能对业务连续性和数据安全造成威胁。
技术实现思路
1、为解决现有技术的不足,本专利技术提出一种基于故障关联分析的应急预案生成方法及系统,通过综合分析系统的历史运行数据、潜在的安全隐患和系统架构之间的关联关系高效定位问题并进行预案选择,减少选定应急预案的时间,提高应急处置的整体效率和效果,确保业务的连续性和稳定性,帮助应用运维团队更好地应对突发事件,降低对业务的影响。
2、为实现以上目的,本专利技术所采用的技术方案包括:
3、一种基于故障关联分析的应急预案生成方法,其特征在于,包括:
4、s1、配置应急处理操作项;
5、s2、获取系统架构信息,依据系统架构信息提取系统组件和各系统组件之间的组件依赖项;
6、s3、分别识别系统组件和组件依赖项中的关键节点和潜在故障点,判断潜在故障点是否为关键节点,当判断潜在故障点为关键节点时,将潜在故障点标记为第一节点;
7、s4、当判断潜在故障点不为关键节点时,进一步判断潜在故障点对系统可用性影响是否超过预设第一阈值;当判断潜在故障点对系统可用性影响超过预设第一阈值时,将潜在故障点标记为第二节点;当判断潜在故障点对系统可用性影响未超过预设第一阈值时,将潜在故障点标记为第三节点;
8、s5、使用应急处理操作项对第一节点、第二节点和第三节点分别匹配建立故障处理模型,所述故障处理模型包括一个或多个应急处理操作项的顺序或异步执行流程;
9、s6、提取匹配应急场景的输入参数,组合故障处理模型和输入参数生成对应应急场景的处置方案。
10、进一步地,所述应急处理操作项包括重启操作、隔离操作、切换操作、回退操作和扩容操作。
11、进一步地,所述组件依赖项包括不同系统组件之间的单向关联依赖关系或双向关联依赖关系,和/或,系统组件之间的交互方式。
12、进一步地,所述步骤s4还包括:
13、当判断潜在故障点对系统可用性影响超过预设第一阈值时,进一步判断潜在故障点对系统可用性影响是否超过预设第二阈值,所述第二阈值对应的系统可用性影响级别高于所述第一阈值;
14、当判断潜在故障点对系统可用性影响超过预设第二阈值时,将潜在故障点标记为第一节点;
15、当判断潜在故障点对系统可用性影响未超过预设第二阈值时,将潜在故障点标记为第二节点。
16、进一步地,所述提取匹配应急场景的输入参数包括:
17、检索配置管理数据库提取应景场景所需的输入参数,所述输入参数包括系统名称、节点名称和ip地址。
18、进一步地,所述方法还包括:
19、将处置方案转换为可执行脚本;
20、对所述可执行脚本添加对应各应急场景的场景分类标签;
21、依据场景分类标签组合多个可执行脚本生成执行集合。
22、本专利技术还涉及一种基于故障关联分析的应急预案生成系统,其特征在于,包括:
23、操作项管理模块,用于配置应急处理操作项;
24、节点管理模块,用于识别系统组件和组件依赖项中的关键节点和潜在故障点,判断潜在故障点是否为关键节点,以及判断潜在故障点对系统可用性影响是否超过预设第一阈值,将潜在故障点标记为第一节点、第二节点或第三节点;
25、模型建立模块,用于使用应急处理操作项对第一节点、第二节点和第三节点分别匹配建立故障处理模型;
26、处置方案生成模块,用于提取匹配应急场景的输入参数,组合故障处理模型和输入参数生成对应应急场景的处置方案。
27、本专利技术还涉及一种计算机可读存储介质,其特征在于,所述存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述的方法。
28、本专利技术还涉及一种电子设备,其特征在于,包括处理器和存储器;
29、所述存储器,用于存储应急处理操作项、系统架构信息和故障处理模型;
30、所述处理器,用于通过调用应急处理操作项、系统架构信息和故障处理模型,执行上述的方法。
3本文档来自技高网...
【技术保护点】
1.一种基于故障关联分析的应急预案生成方法,其特征在于,包括:
2.如权利要求1所述的方法,其特征在于,所述应急处理操作项包括重启操作、隔离操作、切换操作、回退操作和扩容操作。
3.如权利要求1所述的方法,其特征在于,所述组件依赖项包括不同系统组件之间的单向关联依赖关系或双向关联依赖关系,和/或,系统组件之间的交互方式。
4.如权利要求1所述的方法,其特征在于,所述步骤S4还包括:
5.如权利要求1所述的方法,其特征在于,所述提取匹配应急场景的输入参数包括:
6.如权利要求1所述的方法,其特征在于,所述方法还包括:
7.一种基于故障关联分析的应急预案生成系统,其特征在于,包括:
8.一种计算机可读存储介质,其特征在于,所述存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法。
9.一种电子设备,其特征在于,包括处理器和存储器;
10.一种计算机程序产品,包括计算机程序和/或指令,其特征在于,该计算机程序和/或指令被处理器执行时实现权利
...【技术特征摘要】
1.一种基于故障关联分析的应急预案生成方法,其特征在于,包括:
2.如权利要求1所述的方法,其特征在于,所述应急处理操作项包括重启操作、隔离操作、切换操作、回退操作和扩容操作。
3.如权利要求1所述的方法,其特征在于,所述组件依赖项包括不同系统组件之间的单向关联依赖关系或双向关联依赖关系,和/或,系统组件之间的交互方式。
4.如权利要求1所述的方法,其特征在于,所述步骤s4还包括:
5.如权利要求1所述的方法,其特征在于,所述提取匹配应急场景的输入参数包括:
【专利技术属性】
技术研发人员:管蕾,任俏,周洪恩,
申请(专利权)人:中信银行股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。