【技术实现步骤摘要】
系统异常检测方法、装置、设备及存储介质
本专利技术涉及人工智能决策,尤其涉及一种系统异常检测方法、装置、设备及存储介质。
技术介绍
随着系统规模的变大、复杂度的提高、监控覆盖的完善,监控数据量越来越大,运维人员无法从海量监控数据中发现质量问题。智能化的异常检测就是要通过AI算法,自动、实时、准确地从监控数据中发现异常,为后续的诊断、自愈提供基础。异常检测是AIOps(AlgorithmicITOperations,智能运营)系统中的一项非常基础但是十分重要的功能,主要是通过算法和模型去自动的挖掘发现KPI时间序列数据中的异常行为,为后续的报警,自动止损,根因分析等提供必要的决策依据。但是在实际的应用场景下,由于正常数据一般占总数据量的很大比例,而异常点的数据十分稀少,给异常检测带来了极大的困难。在检测模型的训练阶段,为了保证模型训练样本的正负均衡,传统的解决思路主要是:在模型检测的过程中对正常样本欠采样(丢弃一部分数据)和异常样本过采样(重复一部分数据),前者会丢失大量样本信息,造成模型过拟合,泛化能力不佳;对于后者,简单的随机抽样,也会使模型产生过拟合风险。故无论是本身异常点的数据量稀少,还是用于异常点的数据检测模型的准确构建难度大,都使得智能运营系统中的数据检测难度增加。
技术实现思路
本专利技术的主要目的在于解决智能运营系统的异常检测难度大的问题。本专利技术第一方面提供了一种系统异常检测方法,包括:获取待检测系统的标记日志、无标记日志,并对所述无标记日志进行扩充,得到 ...
【技术保护点】
1.一种系统异常检测方法,其特征在于,所述系统异常检测方法包括:/n获取待检测系统的标记日志、无标记日志,并对所述无标记日志进行扩充,得到扩充日志;/n将所述标记日志、所述无标记日志、所述扩充日志分别输入三个相同的异常等级训练模型中进行训练,对应输出所述标记日志的各异常等级的第一概率分布、所述无标记日志的各异常等级的第二概率分布、所述扩充日志的各异常等级的第三概率分布,其中,所述三个相同的异常等级训练模型组成异常等级训练模型集;/n计算所述第一概率分布与所述标记日志的预设异常等级之间的交叉熵损失,以及计算所述第二概率分布与所述第三概率分布之间的一致性损失;/n根据所述一致性损失预测所述无标记日志与所述扩充日志的异常等级,以及根据所述交叉熵损失对所述异常等级训练模型集进行迭代,直到所述异常等级训练模型集收敛,得到日志异常检测模型;/n获取当前系统的待检测日志,并将所述待检测日志输入所述日志异常检测模型进行检测,输出所述待检测日志对应的异常等级,并将待检测日志对应的异常等级作为当前系统运行状态的分析结果。/n
【技术特征摘要】
1.一种系统异常检测方法,其特征在于,所述系统异常检测方法包括:
获取待检测系统的标记日志、无标记日志,并对所述无标记日志进行扩充,得到扩充日志;
将所述标记日志、所述无标记日志、所述扩充日志分别输入三个相同的异常等级训练模型中进行训练,对应输出所述标记日志的各异常等级的第一概率分布、所述无标记日志的各异常等级的第二概率分布、所述扩充日志的各异常等级的第三概率分布,其中,所述三个相同的异常等级训练模型组成异常等级训练模型集;
计算所述第一概率分布与所述标记日志的预设异常等级之间的交叉熵损失,以及计算所述第二概率分布与所述第三概率分布之间的一致性损失;
根据所述一致性损失预测所述无标记日志与所述扩充日志的异常等级,以及根据所述交叉熵损失对所述异常等级训练模型集进行迭代,直到所述异常等级训练模型集收敛,得到日志异常检测模型;
获取当前系统的待检测日志,并将所述待检测日志输入所述日志异常检测模型进行检测,输出所述待检测日志对应的异常等级,并将待检测日志对应的异常等级作为当前系统运行状态的分析结果。
2.根据权利要求1所述的系统异常检测方法,其特征在于,所述对所述无标记日志进行扩充,得到扩充日志包括:
解析所述无标记日志,得到多个带有不同语义的日志字段;
根据预置语义结构先验知识和所述日志字段的出现频率,从所述日志字段中筛选与异常等级相关的关键字段;
获取所述关键字段对应的一个或多个同义字段,并以所述同义字段替换对应的关键字段;
根据随机字段处理策略,对所述同义字段与除所述关键字段外的其他日志字段进行拼接,得到多个对应的扩充日志,其中,所述随机字段处理策略包括对所述其他日志字段进行替换、删除、插入或交换。
3.根据权利要求1所述的系统异常检测方法,其特征在于,所述将所述标记日志、所述无标记日志、所述扩充日志分别输入三个相同的异常等级训练模型中进行训练,对应输出所述标记日志的各异常等级的第一概率分布、所述无标记日志的各异常等级的第二概率分布、所述扩充日志的各异常等级的第三概率分布包括:
将所述标记日志、所述无标记日志、所述扩充日志中的各日志数据的长度统一调整为预设长度,并构建对应的数据向量;
根据所述数据向量的长度,确定所述数据向量的特征维度,并根据所述特征维度对所述数据向量进行语义特征提取,得到初始语义特征;
对所述初始语义特征进行突出特征的筛选及组合,得到最终语义特征,并根据所述最终语义特征计算所述标记日志、所述无标记日志与所述扩充日志的异常等级的概率分布并输出。
4.根据权利要求1-3任一项所述的系统异常检测方法,其特征在于,所述计算所述第一概率分布与所述标记日志的预设异常等级之间的交叉熵损失包括:
根据所述第一概率分布与所述标记日志的预设异常等级标记,计算各标记日志的异常等级的正确预测概率;
根据预置模型训练参数与所述正确预测概率,计算所述第一概率分布的交叉熵损失,以用于衡量分类模型对所述标记日志的异常等级预测与所述标记日志的真实异常等级之间的差异。
5.根据权利要求4所述的系统异常检测方法,其特征在于,所述根据所述交叉熵损失对所述异常等级训练模型集进行迭代,直到所述异常等级训练模型集收敛,得到日志异常检测模型包括:
根据所述交叉熵损失确定各标记日志对应的正确预测概率,并判断是否存在大于预设概率阈值的正确预测概率;
若是,则删除大于所述概率阈值的正确预测概率对应的第一概率分布,并继续对所述日志异常...
【专利技术属性】
技术研发人员:邓悦,郑立颖,徐亮,
申请(专利权)人:平安科技深圳有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。