一种告警信息提取方法、设备和计算机可读存储介质技术

技术编号:38237677 阅读:16 留言:0更新日期:2023-07-25 18:02
本申请实施例公开了一种告警信息提取方法,所述方法包括:确定样本告警文本的样本多值信息元的第一模式串;其中,样本多值信息元包括键信息项和由多个键值对组合的值信息项;第一模式串用于表征样本多值信息元中的值信息项的整体结构;对第一模式串进行聚类得到模式集合,并确定模式集合的集合特征;其中,集合特征能够标识模式集合;基于模式集合的集合特征和模式集合的第一模式串,生成特征模式库;对待处理的告警文本和特征模式库进行分析处理,得到待处理的告警文本的目标多值信息元。本申请实施例还公开了一种告警信息提取设备和计算机可读存储介质。和计算机可读存储介质。和计算机可读存储介质。

【技术实现步骤摘要】
一种告警信息提取方法、设备和计算机可读存储介质


[0001]本申请涉及通信
,尤其涉及一种告警信息提取方法、设备和计算机可读存储介质。

技术介绍

[0002]网管故障管理系统中,需要对接收到的大量告警文本进行快速且有效地处理。因为告警文本中包括多个键值对,键值对由一个键信息项和一个值信息项构成,且不同设备产生的告警文本的格式不同、告警文本中所包含的键信息项也不同,如何有效提取不同告警文本中的信息是至关重要的。目前,通过构建存储有键信息项和数据类型之间的关联关系的数据类型表,在获取到一个实时告警数据后根据该数据类型表中的键信息项提取这个实时告警数据中的键值对,并根据该数据类型表中的数据类型对提取的键值对进行校验,校验通过后记录提取的键值对,以此来获取实时告警数据中的数据。然而,上述方法主要是对由单个信息项组成的值信息项进行提取,在对由多个键值对组成的值信息项进行提取时,所提取的告警信息会出错。

技术实现思路

[0003]为解决上述技术问题,本申请实施例期望提供一种告警信息提取方法、设备和计算机可读存储介质,解决了相关技术中的在对由多个键值对组成的值信息项进行提取时所提取的告警信息会出错的问题,提高了信息提取的准确率和效率。
[0004]本申请的技术方案是这样实现的:
[0005]一种告警信息提取方法,所述方法包括:
[0006]确定样本告警文本的样本多值信息元的第一模式串;其中,所述样本多值信息元包括键信息项和由多个键值对组合的值信息项;所述第一模式串用于表征所述样本多值信息元中的值信息项的整体结构;
[0007]对所述第一模式串进行聚类得到模式集合,并确定所述模式集合的集合特征;其中,所述集合特征能够标识所述模式集合;
[0008]基于所述模式集合的集合特征和所述模式集合的第一模式串,生成特征模式库;
[0009]对待处理的告警文本和所述特征模式库进行分析处理,得到所述待处理的告警文本的目标多值信息元。
[0010]上述方案中,所述确定样本告警文本的样本多值信息元的第一模式串,包括:
[0011]确定所述样本多值信息元的键值间分隔符和键值对间分隔符;其中,所述键值间分隔符是键信息项和值信息项之间的分隔符,所述键值对间分隔符是键值对之间的分隔符;
[0012]基于所述键值间分隔符、所述键值对间分隔符和所述样本多值信息元的键信息项,确定所述第一模式串。
[0013]上述方案中,所述基于所述键值间分隔符、所述键值对间分隔符和所述样本多值
信息元的键信息项,确定所述第一模式串,包括:
[0014]从所述键值间分隔符中依次确定符号不重复的分隔符得到第一符号;
[0015]从所述键值对间分隔符中依次确定符号不重复的分隔符得到第二符号;
[0016]基于所述第一符号、所述第二符号和所述样本多值信息元的键信息项,获取所述样本多值信息元的第二模式串;
[0017]基于所述第二模式串和模式串之间的关联关系,得到所述第一模式串。
[0018]上述方案中,所述基于所述第一符号、所述第二符号和所述样本多值信息元的键信息项,获取所述样本多值信息元的第二模式串,包括:
[0019]基于所述第一符号、所述第二符号和键值对的结构,构建匹配模式;
[0020]基于所述匹配模式和所述样本多值信息元的键信息项,获取所述第二模式串。
[0021]上述方案中,所述基于所述匹配模式和所述样本多值信息元的键信息项,确定所述第二模式串,包括:
[0022]基于所述匹配模式,从所述样本多值信息元的值信息项中提取键值对作为目标键值对;
[0023]在所述目标键值对与所述样本多值信息元的值信息项中的键值对相同的情况下,基于所述匹配模式和所述样本多值信息元的键信息项确定所述第二模式串。
[0024]上述方案中,所述对所述第一模式串进行聚类得到模式集合,包括:
[0025]基于所述第一模式串,构建所述样本多值信息元的模式树;
[0026]基于所述模式树的节点的信息,获取所述第一模式串的相似性;
[0027]基于所述第一模式串的相似性对所述第一模式串进行聚类,得到所述模式集合。
[0028]上述方案中,所述确定所述模式集合的集合特征,包括:
[0029]确定所述模式集合中的键信息项;
[0030]将能够标识所述模式集合的键信息项确定为所述模式集合的集合特征。
[0031]上述方案中,所述基于所述模式集合的集合特征和所述模式集合的第一模式串,生成特征模式库,包括:
[0032]基于所述模式集合的集合特征和所述模式集合的第一模式串之间的对应关系,生成所述特征模式库。
[0033]上述方案中,所述对待处理的告警文本和所述特征模式库进行分析处理,得到所述待处理的告警文本的目标多值信息元,包括:
[0034]将所述待处理的告警文本与所述特征模式库的集合特征进行特征匹配;
[0035]将匹配成功的特征模式库的集合特征作为目标集合特征,并将所述待处理的告警文本与所述目标集合特征对应的模式集合的第一模式串进行模式匹配;
[0036]在模式匹配成功的情况下,基于匹配成功的所述目标集合特征对应的模式集合的第一模式串进行提取,得到所述待处理的告警文本的目标多值信息元。
[0037]上述方案中,所述方法还包括:
[0038]在特征匹配失败的情况下,获取所述待处理的告警文本的目标多值信息元的第三模式串;其中,所述第三模式串用于表征所述待处理的告警文本中的值信息项的整体结构;
[0039]将所述目标多值信息元的第三模式串添加到目标模式集合;
[0040]确定所述目标模式集合的集合特征;
[0041]基于所述目标模式集合的集合特征和所述目标模式集合的第三模式串,更新所述特征模式库。
[0042]上述方案中,所述方法还包括:
[0043]在模式匹配失败的情况下,获取所述待处理的告警文本的目标多值信息元的第三模式串;
[0044]将所述第三模式串添加到所述目标集合特征对应的模式集合。
[0045]一种告警信息提取设备,所述设备包括:处理器、存储器和通信总线;
[0046]所述通信总线用于实现处理器和存储器之间的通信连接;
[0047]所述处理器用于执行存储器中的告警信息提取程序,以实现上述所述的告警信息提取方法的步骤。
[0048]一种计算机可读存储介质,所述计算机可读存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现上述所述的告警信息提取方法的步骤。
[0049]本申请的实施例所提供的告警信息提取方法、设备和计算机可读存储介质,可以确定样本告警文本的样本多值信息元的第一模式串,对第一模式串进行聚类得到模式集合,并确定该模式集合的集合特征,基于该模式集合的集合特征和该模式集合的第一模式串,生成特征模式库,如此可以基于本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种告警信息提取方法,其特征在于,所述方法包括:确定样本告警文本的样本多值信息元的第一模式串;其中,所述样本多值信息元包括键信息项和由多个键值对组合的值信息项;所述第一模式串用于表征所述样本多值信息元中的值信息项的整体结构;对所述第一模式串进行聚类得到模式集合,并确定所述模式集合的集合特征;其中,所述集合特征能够标识所述模式集合;基于所述模式集合的集合特征和所述模式集合的第一模式串,生成特征模式库;对待处理的告警文本和所述特征模式库进行分析处理,得到所述待处理的告警文本的目标多值信息元。2.根据权利要求1所述的方法,其特征在于,所述确定样本告警文本的样本多值信息元的第一模式串,包括:确定所述样本多值信息元的键值间分隔符和键值对间分隔符;其中,所述键值间分隔符是键信息项和值信息项之间的分隔符,所述键值对间分隔符是键值对之间的分隔符;基于所述键值间分隔符、所述键值对间分隔符和所述样本多值信息元的键信息项,确定所述第一模式串。3.根据权利要求2所述的方法,其特征在于,所述基于所述键值间分隔符、所述键值对间分隔符和所述样本多值信息元的键信息项,确定所述第一模式串,包括:从所述键值间分隔符中依次确定符号不重复的分隔符得到第一符号;从所述键值对间分隔符中依次确定符号不重复的分隔符得到第二符号;基于所述第一符号、所述第二符号和所述样本多值信息元的键信息项,获取所述样本多值信息元的第二模式串;基于所述第二模式串和模式串之间的关联关系,得到所述第一模式串。4.根据权利要求3所述的方法,其特征在于,所述基于所述第一符号、所述第二符号和所述样本多值信息元的键信息项,获取所述样本多值信息元的第二模式串,包括:基于所述第一符号、所述第二符号和键值对的结构,构建匹配模式;基于所述匹配模式和所述样本多值信息元的键信息项,确定所述第二模式串。5.根据权利要求4所述的方法,其特征在于,所述基于所述匹配模式和所述样本多值信息元的键信息项,确定所述第二模式串,包括:基于所述匹配模式,从所述样本多值信息元的值信息项中提取键值对作为目标键值对;在所述目标键值对与所述样本多值信息元的值信息项中的键值对相同的情况下,基于所述匹配模式和所述样本多值信息元的键信息项确定所述第二模式串。6.根据权利要求1所述的方法,其特征在于,所述对所述第一模式串进行聚类得到模式集合,包括:基于所述第一模式串,构建所述样本多值信息元的模式...

【专利技术属性】
技术研发人员:王叶茂李冬领罗川
申请(专利权)人:中国移动通信集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1