基于因果语义关系传递的图卷积网络根因识别方法技术

技术编号:27686540 阅读:11 留言:0更新日期:2021-03-17 04:00
本发明专利技术公开了一种基于因果语义关系传递的图卷积网络根因识别方法,解决了大规模复杂通信网络的故障快速准确定位问题。在知识图谱嵌入模型的启发下,假设根因识别问题中的切片样本内告警和根因告警存在因果关系,并且因果关联网络同构,即:因果关系向量r、样本序列在因果关系空间表示x

【技术实现步骤摘要】
基于因果语义关系传递的图卷积网络根因识别方法
本专利技术属于智能运维(AIOPS)领域,具体涉及一种基于因果语义关系传递的图卷积网络根因识别方法。
技术介绍
随着通信相关技术的不断发展和应用领域的不断扩展,通信在生产生活中的角色越来越重要,用户对于故障的响应速度需求也不断提升。在通信系统的运维领域,为保障设备的正常运转和服务的正常进行,设备或服务发生故障时会触发系统告警用于定位故障,并且单个故障可能导致关联故障,每个故障都可能触发多个告警。此外,存在对服务质量(业务)无显著影响或者系统自动修复的故障,此类故障也会触发告警,且告警可能与业务相关告警时间重合,但该类故障无需人工解决。因此单次故障所处时段会存在大量告警,并且其中包含根本原因对应的告警,识别该告警可以快速定位故障并且后续进行针对性修复,这对于提升故障响应速度和提高服务体验具有重要意义。但是,告警之间存在复杂因果关联关系,并且单个时段存在大量告警,这使得识别根因告警成为一项困难且耗时繁重的任务。目前,学术界对于故障定位和根因分析任务的研究主要集中在因果关系和解释,运用条件独立测试、隐马尔科夫模型等侧重统计学的方法解决,获得完整的因果关联图。在现实场景中,除响应的准确率外,响应时间也是重要因素,但是因果推断方法的时间复杂度普遍较高;并且,根因识别任务无需确定完整的因果关联图,只需根据推测的根因告警信息即可进行故障修复。工业界完成根因识别任务的主要技术为专家系统,依赖于专家的经验和技术,但难以及时进行更新迭代,难以满足用户对识别准确率的要求。由于近年来数据存储和计算成本呈指数级下降,告警数据的存储和分析处理难度降低,鉴于上述情况,基于数据驱动的机器学习方法开始融入根因识别的方法之中,使提高根因识别的准确率、故障处理的响应速度和提升方案的更新能力成为可能。
技术实现思路
针对上述问题,本专利技术提供了一种使用时序信息的平移向量进行语义因果关系传递的图卷积网络根因识别方法,该方法可以学习告警之间的因果关联关系,构建因果关系表示,从而精准有效地在海量告警中捕捉根因告警。为达到上述目的,本专利技术采用如下技术方案来实现的:基于因果语义关系传递的图卷积网络根因识别方法,该方法在知识图谱嵌入模型的启发下,基于因果语义关系传递的图卷积网络根因识别方法假设根因识别问题中的切片样本内告警和根因告警存在因果关系,并且因果关联网络同构,即:因果关系向量r、样本序列在因果关系空间表示xseq以及序列的根因告警在因果关系空间表示构成三元组满足关系结合概率统计知识、基于均值聚合器的GraphSAGE图卷积网络模型以及语义关系传递模块搭建基于因果语义关系传递的图卷积网络根因识别方法。本专利技术进一步的改进在于,具体包括以下步骤:1)数据特征选取及预处理:选取告警细节属性作为输入数据在时间顺序下进行语义分析,基于GloVe模型提取告警细节的词向量表示;2)全局因果关联先验邻接矩阵生成:将训练集作为先验信息,计算两个告警xi,xj在同一样本中出现时告警xi为根因告警的频率,生成全局因果关联先验邻接矩阵;3)因果关联邻接矩阵生成:采取的因果关联邻接矩阵生成方法考虑语义和概率两个部分,使用全连接神经网络和激活函数进一步提取告警在关系层面的特征,结合范数获取语义邻接矩阵;将全局因果关联先验邻接矩阵作为概率邻接矩阵和权重矩阵,联合语义邻接矩阵生成因果关联邻接矩阵;4)序列特征表示和告警特征表示学习:由于单个切片样本内告警存在时序关系,因此首先使用双向LSTM网络即BiLSTM学习告警的时序特征表示;此外,考虑告警之间存在的因果图结构,将步骤3)中生成的因果关联邻接矩阵作为告警因果关联的网络拓扑结构,选取深层均值聚合器的GraphSAGE图卷积网络模型分别学习各个告警的特征表示;5)因果语义关系传递模块:将样本序列和样本中各告警的特征表示投影到低维因果关系空间,在假设因果关系r、样本序列在因果关系空间表示xpool以及序列的根因告警在因果关系空间表示构成三元组满足关系的前提下,运用BiLSTM模型、概率加权策略以及拼接策略得到最终的因果关系向量表达式,预测序列中各个告警为根因告警的概率,完成根因告警的识别。本专利技术进一步的改进在于,步骤1)的具体操作为:告警数据中的告警细节属性对应时段内包含专家知识的故障或异常的语言描述,语义信息含有告警之间关系的隐式信息;选取告警细节属性作为输入数据在时间顺序下进行语义分析,将告警细节作为词表示模型中的分词,切片样本内告警细节组成的序列集合构成词表示模型的语料库,基于GloVe模型提取告警细节的词向量表示。本专利技术进一步的改进在于,步骤2)的具体操作为:基于训练集先验信息,采用确定概率的频率方法,获取告警之间的因果频率,生成全局因果关联先验邻接矩阵。本专利技术进一步的改进在于,步骤3)的具体操作为:因果关联邻接矩阵作为图卷积网络的输入数据之一,为模型提供图中节点之间的邻接信息;因果邻接矩阵生成考虑语义和概率两个部分,语义部分结合全连接层和激活函数学习告警的加权词向量表示,获取向量之间的2-范数,表示告警之间的相似关系,近似语义因果关联关系,生成语义邻接矩阵;概率部分则采用步骤2)中的全局因果关联先验邻接矩阵,作为因果关联邻接矩阵的权重矩阵;因果关联邻接矩阵则由语义邻接矩阵和概率邻接矩阵联合生成。本专利技术进一步的改进在于,步骤5)的具体操作为:知识图谱嵌入模型的启发下,假设根因识别问题中的切片样本内告警和根因告警存在因果关系,并且因果关联网络同构,即:因果关系向量r、样本序列在因果关系空间表示xseq以及序列的根因告警在因果关系空间表示构成三元组满足关系首先,为获取序列和根因告警的特征表示,将步骤4)中生成的因果关联邻接矩阵作为告警因果关联的网络拓扑结构,选取深层均值聚合器的GraphSAGE图卷积网络模型进行学习;为统一特征表示向量所属空间,样本序列特征表示向量和样本中各个告警的特征表示向量分别通过全连接层和激活层投影到低维因果关系空间;之后考虑不同三元组因果关系表示的特殊性,因果关系与序列相关,根据样本序列在因果关系空间表示xseq、样本序列表示及根因概率向量P,运用BiLSTM模型、概率加权策略以及拼接策略得到最终的因果关系向量表达式:其中,为切片序列的矩阵表示,为切片序列中第i个告警的向量表示;P=[P1…Pl]为告警的根因概率向量,Pi表示训练集统计的告警i在切片样本中为根因告警的频率;l为告警切片中的告警数量,[;]为concatenate操作,·为Hadamard乘法;最终采用2-范数对比序列根因告警预测值xseq+r与根因告警在因果关系空间表示作为当前方法的输出,预测序列中各个告警为根因告警的概率。本专利技术至少具有如下有益的技术效果:本专利技术提供一种基于因果语义关系传递的图卷积网络根因识别方法,该方法提出告警的因果关系模拟,提升了方法的可解释性,提升了海量告警中识别根因告警、捕捉根本问题本文档来自技高网
...

【技术保护点】
1.基于因果语义关系传递的图卷积网络根因识别方法,其特征在于,该方法在知识图谱嵌入模型的启发下,基于因果语义关系传递的图卷积网络根因识别方法假设根因识别问题中的切片样本内告警和根因告警存在因果关系,并且因果关联网络同构,即:因果关系向量r、样本序列在因果关系空间表示x

【技术特征摘要】
1.基于因果语义关系传递的图卷积网络根因识别方法,其特征在于,该方法在知识图谱嵌入模型的启发下,基于因果语义关系传递的图卷积网络根因识别方法假设根因识别问题中的切片样本内告警和根因告警存在因果关系,并且因果关联网络同构,即:因果关系向量r、样本序列在因果关系空间表示xseq以及序列的根因告警在因果关系空间表示构成三元组满足关系结合概率统计知识、基于均值聚合器的GraphSAGE图卷积网络模型以及语义关系传递模块搭建基于因果语义关系传递的图卷积网络根因识别方法。


2.根据权利要求1所述的基于因果语义关系传递的图卷积网络根因识别方法,其特征在于,具体包括以下步骤:
1)数据特征选取及预处理:
选取告警细节属性作为输入数据在时间顺序下进行语义分析,基于GloVe模型提取告警细节的词向量表示;
2)全局因果关联先验邻接矩阵生成:
将训练集作为先验信息,计算两个告警xi,xj在同一样本中出现时告警xi为根因告警的频率,生成全局因果关联先验邻接矩阵;
3)因果关联邻接矩阵生成:
采取的因果关联邻接矩阵生成方法考虑语义和概率两个部分,使用全连接神经网络和激活函数进一步提取告警在关系层面的特征,结合范数获取语义邻接矩阵;将全局因果关联先验邻接矩阵作为概率邻接矩阵和权重矩阵,联合语义邻接矩阵生成因果关联邻接矩阵;
4)序列特征表示和告警特征表示学习:
由于单个切片样本内告警存在时序关系,因此首先使用双向LSTM网络即BiLSTM学习告警的时序特征表示;此外,考虑告警之间存在的因果图结构,将步骤3)中生成的因果关联邻接矩阵作为告警因果关联的网络拓扑结构,选取深层均值聚合器的GraphSAGE图卷积网络模型分别学习各个告警的特征表示;
5)因果语义关系传递模块:
将样本序列和样本中各告警的特征表示投影到低维因果关系空间,在假设因果关系r、样本序列在因果关系空间表示xpool以及序列的根因告警在因果关系空间表示构成三元组满足关系的前提下,运用BiLSTM模型、概率加权策略以及拼接策略得到最终的因果关系向量表达式,预测序列中各个告警为根因告警的概率,完成根因告警的识别。


3.根据权利要求2所述的基于因果语义关系传递的图卷积网络根因识别方法,其特征在于,步骤1)的具体操作为:告警数据中的告警细节属性对应时段内包含专家知识的故障或异常的语言描述,语义信息含有告警之间关系的隐式信息;选取告警细节属性作为输入数据在时间顺序下进行语义分析,将告警细节作为词表示...

【专利技术属性】
技术研发人员:高炅杨煜乾杨树森
申请(专利权)人:西安交通大学
类型:发明
国别省市:陕西;61

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1