System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于Oracle数据库的报警分类方法技术_技高网

一种基于Oracle数据库的报警分类方法技术

技术编号:40239771 阅读:12 留言:0更新日期:2024-02-02 22:38
本发明专利技术提供一种基于Oracle数据库的报警分类方法,具体包括:S1:获取原历史报警日志和报警处理方案;S2:计算特征相关性矩阵,确定分类算法;S3:利用S1中报警处理方案设置报警类别得到样本数据集;S4:基于随机森林算法筛选出重要特征;S5:以重要特征为自变量、报警类别为因变量构建分类预测模型并对实时数据进行分类预测;S6:根据S42所述报警分类预测结果将不可忽略报警分配给对应的报警处理人员进行解决。本发明专利技术充分利用了历史报警日志处理方案对日志进行标签分类,结合分类算法构建分类模型,不需要再消耗大量人工手动判断报警类别,大大提高了报警问题解决的效率和有效性。

【技术实现步骤摘要】

本专利技术涉及数据库运维智能化报警,具体涉及一种基于oracle数据库的报警分类方法。


技术介绍

1、告警日志是数据库健康状态异常展示的重要指标,通过告警日志再结合其他监控数据,运维人员就能判断出数据库的健康情况。但是对于数据库维护来说,不是每一条告警日志都需要被处理,相同的告警在不同的时间点处理结果可能会截然不同。

2、oracle数据库报警分类,如何识别oracle报警重要性,并将可忽略报警忽略,是数据库运维智能化过程中极具挑战也是不可忽缺的环节。目前业界关于数据库报警分类的研究,大多聚焦于报警文本本身,通过各种手段,包括关联分析、知识图谱等技术构建报警关联上下文,为处理报警提供参考。

3、其中以《计算机系统应用》2019年第28卷第7期名称为“基于深度学习的oracle数据库性能预测与故障检测研究”和《吉林大学学报(工学版)》2019年第4期名称为“基于深度学习的oracle数据库异常检测及预警方法研究”为代表,这些算法或学术论文主要存在的如下几个问题:1)仅依托报警文本分析和系统资源数据作分析,未考虑到数据库本身监控数据;2)部分算法偏向于应用历史已标注数据,未考虑到现有工业应用场景中大量无标签数据,且没有对应处理方案;3)部分算法偏向于进行问题关联分析与问题定位,而未考虑减轻人工工作量,提高工作效率。


技术实现思路

1、针对报警日志作为数据库健康状态异常展示指标,现有技术对其分类和处理上仅对日志内容做关联分析,没有对日志本身的紧急处理程度进行判断,导致过多依赖人工,效率慢等问题,本专利技术提供了一种基于oracle数据库的报警分类方法,基于oracle数据库报警情况历史记录,和历史报警处理结果构建数据库报警分类模型,利用随机森林算法选择适当的特征,通过对逻辑回归模型训练得到报警分类预测模型,对报警日志做可忽略和不可忽略的信息分类,大大提高了运营人员处理报警日志信息效率和解决报警问题的有效性。

2、具体方案如下所述:

3、一种基于oracle数据库的报警分类方法,

4、s1:数据获取:从oracle数据库获取n个历史报警日志构成原始数据集x(x1,x2,x3...xn),从监控平台的报警监控数据中获取所述n个历史报警日志的报警时间戳,利用所述报警时间戳在itsm工单平台上获取所述n个历史报警日志对应的n个报警处理方案;

5、s2:计算特征相关性矩阵,确定分类算法方案:从s1所述原始数据集中提取特征集a(a1,a2,a3,...,am)并计算所述特征集a中任意两个元素之间的相关系数ρij(i,j=1,2,...,m),并以所述相关系数ρij为元素构成m阶特征相关性矩阵r;利用所述m阶特征相关性矩阵r确定分类算法方案,所述分类算法方案为:利用随机森林进行特征筛选,再通过逻辑回归进行分析分类预测;

6、s3:设置报警类别得到样本数据集:利用s1所述报警处理方案中的文本内容为所述原始数据集中的n个历史报警日志设置对应的报警类别得到报警类别集y(y1,y2,y3,...yn),所述报警类别包括可忽略报警日志和不可忽略报警日志;将s1所述原始数据集x和所述报警类别集y一一配对得到样本数据集d{(x1,y1),(x2,y2),(x3,y3)...(xn,yn)};

7、s4:基于随机森林算法进行特征选择:利用s3所述样本数据集和s2所述特征集构建随机森林模型,并利用所述随机森林模型中各特征的特征重要性排序筛选出重要特征;

8、s41:构建随机森林模型:将s3所述样本数据集d{(x1,y1),(x2,y2),(x3,y3)...(xn,yn)}和s2所述特征集a(a1,a2,a3,...,am)输入到随机森林算法中进行训练得到由i棵决策树构成的随机森林模型;

9、s42:筛选重要特征:利用各决策树中的各节点在进行分裂前后的基尼指数变化量得到所述各决策树中各节点处的特征所对应的特征重要性,将所述各决策树中所有特征的特征重要性取平均值得到随机森林模型中的特征重要性排序,利用所述特征重要性排序筛选出重要特征;

10、s5:构建报警分类预测模型并进行预测:基于逻辑回归算法,利用s3所述样本数据集,将s42所述重要特征作为特征变量即自变量,将s3所述报警类别作为目标变量即因变量构建报警分类预测模型并进行分类预测;

11、s6:根据s42所述报警分类预测结果对报警日志进行处理:将所述报警分类预测结果中的不可忽略报警作为待处理报警日志传输到应急处理团队,所述应急处理团队根据责任矩阵将所述待处理报警日志分配给报警处理人员进行处理,所述责任矩阵包括对常见报警任务的分类以及不同报警分类任务所对应的报警处理人员。

12、优选的,所述特征集a中任意两个元素之间的相关系数ρij(i,j=1,2,...,m)的计算过程为:

13、

14、其中,ai,aj为特征集a(a1,a2,a3,...,am)中的任意两个元素,m为特征总个数。

15、优选的,利用报警处理方案中的文本内容设置报警类别的过程为:通过机器文本匹配的方式,获取每个报警处理方案的文本内容中的告警处理结果关键字即“可忽略”关键字和“不可忽略”关键字,分别将对应的历史报警日志标记为可忽略报警日志和不可忽略报警日志。

16、优选的,s41所述随机森林的训练过程为:

17、s411:在所述样本数据集d中随机采取n个样本作为第一棵决策树的输入样本,所述决策树由节点和节后分裂后的叶节点构成;

18、s412:随机从所述样本特征集a中选取m个特征并从所述m个特征中选出一个最优特征作为当前节点的分裂特征,利用所述分裂特征将当前节点分裂为两个叶节点;

19、s413:重复s412步骤继续分裂,直至不能分裂为止,完成对单棵决策树的训练;

20、s414:继续从所述样本数据集d中随机采取n个样本,重复步骤s412和s413,直至形成i棵决策树即构成随机森林模型。

21、优选的,s42所述利用各决策树中的各节点在进行分裂前后的基尼系数变化量得到所述各决策树中各节点处的特征所对应的特征重要性的过程为:

22、

23、其中,k为在单棵决策树上单个特征分裂的次数,gi节点分裂前的基尼系数,gil为节点分裂后左分支的基尼系数,gir为节点分裂后右分支的基尼系数;

24、优选的,s42所述筛出来的重要特征分别为:i/o类system i/o、用户i/o类user i/o、应用类application、cpu状态类cpu+cpu_wait。

25、优选的,s5所述构建报警分类预测模型并进行分类预测的过程为:

26、s51:训练阶段:将s3所述样本数据集分为训练数据集和测试数据集;并将所述训练数据集中的数据输入到所述逻辑回归算法中,利用所述训练数据集中已知的报警日志分类结果即各报警日志所对应的报警类别对所述逻辑本文档来自技高网...

【技术保护点】

1.一种基于Oracle数据库的报警分类方法,其特征在于,

2.由权利要求1所述的一种基于Oracle数据库的报警分类方法,其特征在于,计算所述特征集A中任意两个元素之间的相关系数ρij(i,j=1,2,...,M)的过程为:

3.由权利要求1所述的一种基于Oracle数据库的报警分类方法,其特征在于,利用报警处理方案中的文本内容设置报警类别的过程为:通过机器文本匹配的方式,获取每个报警处理方案的文本内容中的告警处理结果关键字即“可忽略”关键字和“不可忽略”关键字,分别将对应的历史报警日志标记为可忽略报警日志和不可忽略报警日志。

4.由权利要求1所述的一种基于Oracle数据库的报警分类方法,其特征在于,S41所述随机森林的训练过程为:

5.由权利要求1所述的一种基于Oracle数据库的报警分类方法,其特征在于,S42所述利用各决策树中的各节点在进行分裂前后的基尼系数变化量得到所述各决策树中各节点处的特征所对应的特征重要性的过程为:

6.由权利要求1所述的一种基于Oracle数据库的报警分类方法,其特征在于,S42所述筛出来的重要特征分别为:I/O类System I/O、用户I/O类User I/O、应用类Application、CPU状态类CPU+CPU_Wait。

7.由权利要求1所述的一种基于Oracle数据库的报警分类方法,其特征在于,S5所述构建报警分类预测模型并进行分类预测的过程为:

8.由权利要求7所述的一种基于Oracle数据库的报警分类方法,其特征在于,S51所述将样本数据集分为训练集和测试集的过程为:基于十折交叉验证法将所述样本数据集分为10个小数据集,选其中9个作为训练集,剩下1个作为测试集。

9.由权利要求6所述的一种基于Oracle数据库的报警分类方法,其特征在于,S51所述逻辑回归模型中的回归公式为:

10.由权利要求7所述的一种基于Oracle数据库的报警分类方法,其特征在于,S51所述对所述逻辑回归模型中的回归公式的参数进行训练使用的方法为:通过网格搜索法调整参数。

11.由权利要求1所述的一种基于Oracle数据库的报警分类方法,其特征在于,S5所述预测过程还包括:构建API服务,通过访问API获取报警分类预测结果并将所述报警分类预测结果写入日志平台。

...

【技术特征摘要】

1.一种基于oracle数据库的报警分类方法,其特征在于,

2.由权利要求1所述的一种基于oracle数据库的报警分类方法,其特征在于,计算所述特征集a中任意两个元素之间的相关系数ρij(i,j=1,2,...,m)的过程为:

3.由权利要求1所述的一种基于oracle数据库的报警分类方法,其特征在于,利用报警处理方案中的文本内容设置报警类别的过程为:通过机器文本匹配的方式,获取每个报警处理方案的文本内容中的告警处理结果关键字即“可忽略”关键字和“不可忽略”关键字,分别将对应的历史报警日志标记为可忽略报警日志和不可忽略报警日志。

4.由权利要求1所述的一种基于oracle数据库的报警分类方法,其特征在于,s41所述随机森林的训练过程为:

5.由权利要求1所述的一种基于oracle数据库的报警分类方法,其特征在于,s42所述利用各决策树中的各节点在进行分裂前后的基尼系数变化量得到所述各决策树中各节点处的特征所对应的特征重要性的过程为:

6.由权利要求1所述的一种基于oracle数据库的报警分类方法,其特征在于,s42所述筛出来的重要特征分别为:i/...

【专利技术属性】
技术研发人员:付正岳兴宇
申请(专利权)人:上海中远海运资讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1