运维知识的挖掘方法、装置、设备、存储介质和程序产品制造方法及图纸

技术编号:32835509 阅读:17 留言:0更新日期:2022-03-26 20:55
本公开提供了一种运维知识的挖掘方法,可以应用于人工智能技术领域。该运维知识的挖掘方法包括:获取至少一个工单的文本数据;通过第一神经网络模型对文本数据进行命名实体识别,以确定出至少一个实体;对确定出的实体进行实体对齐;通过第二神经网络模型对文本数据进行分类,以确定出文本数据的工单类型;根据工单类型和经过实体对齐的实体,生成运维知识。本公开还提供了一种运维知识的挖掘装置、设备、存储介质和程序产品。存储介质和程序产品。存储介质和程序产品。

【技术实现步骤摘要】
运维知识的挖掘方法、装置、设备、存储介质和程序产品


[0001]本公开涉及人工智能
,具体地涉及一种运维知识的挖掘方法、装置、设备、存储介质和程序产品。

技术介绍

[0002]近年来,随着企业信息化程度的提高,IT系统的规模越来越大,涉及到的技术越来越丰富,IT系统在线上运行中出现了故障后,问题定位、根因分析和故障处置往往是人工完成,处置及时性和有效性严重依赖于运维人员的个体技能和经验。
[0003]目前,可以通过运维知识(Operations Knowledge)辅助工作人员快速处置故障,运维知识是用于IT运维管理的一种特殊的数据集,是求解运维问题所需领域知识的集合,但是,运维知识往往也需要人工挖掘,成本较高,因此,如何利用现有资源自动地挖掘运维知识成为了一项亟待解决的技术问题。

技术实现思路

[0004]鉴于上述问题,本公开提供了一种运维知识的挖掘方法、装置、设备、存储介质和程序产品。
[0005]根据本公开的第一个方面,提供了一种运维知识的挖掘方法,包括:
[0006]获取至少一个工单的文本数据;
[0007]通过第一神经网络模型对所述文本数据进行命名实体识别,以确定出至少一个实体;
[0008]对确定出的所述实体进行实体对齐;
[0009]通过第二神经网络模型对所述文本数据进行分类,以确定出所述文本数据的工单类型;
[0010]根据所述工单类型和经过实体对齐的所述实体,生成运维知识。
[0011]根据本公开的实施例,所述通过第一神经网络模型对所述文本数据集进行命名实体识别,以确定出至少一个实体,包括:
[0012]对所述文本数据进行预处理,以得到目标词集;
[0013]从所述目标词集中提取出至少一个目标词,以得到待识别序列;
[0014]根据预设的实体类型,为待识别序列中的每个词分配实体标签;
[0015]根据所述待识别序列中每个词的实体标签以及与每个词相邻的至少一个词的实体标签对待识别序列进行命名实体识别,以确定出至少一个实体。
[0016]根据本公开的实施例,所述根据所述工单类型和经过实体对齐的所述实体,生成运维知识,包括:对于每个实体,
[0017]由该实体、该实体的实体类型和所述工单类型构成一条信息,以作为所述运维知识。
[0018]根据本公开的实施例,其中,所述目标词集包括至少一个词的词向量,所述词向量
的维度设置在150至350之间。
[0019]根据本公开的实施例,所述第一神经网络模型包括:多层双向长短期记忆网络层、Relu激活函数和条件随机场网络层。
[0020]根据本公开的实施例,所述双向长短期记忆网络层的层数设置在10层至35层之间。
[0021]根据本公开的实施例,对至少一层所述双向长短期记忆网络层输出的特征进行正则化操作;
[0022]其中,所述正则化操作的权重设置在0.3至0.9之间。
[0023]根据本公开的实施例,所述通过第二神经网络模型对所述文本数据进行分类,以确定出所述文本数据的工单类型,包括:
[0024]获取所述文本数据的语句向量;
[0025]根据获取到的语句向量,通过多项逻辑回归算法,确定所述文本数据的工单类型;和/或,
[0026]获取所述文本数据的文档向量;
[0027]根据获取到的文档向量,通过多项逻辑回归算法,确定所述文本数据的工单类型。
[0028]根据本公开的实施例,所述对确定出的所述实体进行实体对齐,包括:
[0029]根据预设的映射规则表,将确定出的所述实体中属于同一现实对象的实体统一为一个实体。
[0030]本公开的第二方面提供了一种运维知识的挖掘装置,包括:
[0031]获取模块,用于获取至少一个工单的文本数据;
[0032]第一处理模块,用于通过第一神经网络模型对所述文本数据进行命名实体识别,以确定出至少一个实体;
[0033]第二处理模块,用于对确定出的所述实体进行实体对齐;
[0034]第三处理模块,用于通过第二神经网络模型对所述文本数据进行分类,以确定出所述文本数据的工单类型;
[0035]生成模块,用于根据所述工单类型和经过实体对齐的所述实体,生成运维知识。
[0036]本公开的第三方面提供了一种电子设备,包括:一个或多个处理器;存储器,用于存储一个或多个程序,其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得一个或多个处理器执行上述的运维知识的挖掘方法。
[0037]本公开的第四方面还提供了一种计算机可读存储介质,其上存储有可执行指令,该指令被处理器执行时使处理器执行上述
……
方法。
[0038]本公开的第五方面还提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述的运维知识的挖掘方法。
[0039]上述一个或多个实施例具有如下优点或益效果:
[0040]本公开能够利用运维过程中产生的工单进行运维知识的挖掘,相较于传统的技术方案中采用人工挖掘运维知识的方案而言,具有成本低、效率高的特点。并且,本公开通过对文本数据进行分类以及实体识别,能够从非结构化的文本数据中挖掘出运维知识,同时,在进行命名实体识别后还通过实体对齐使得识别出的实体标准化,从而消除了歧义,进而实现了较高的数据可读性。
附图说明
[0041]通过以下参照附图对本公开实施例的描述,本公开的上述内容以及其他目的、特征和优点将更为清楚,在附图中:
[0042]图1示意性示出了根据本公开实施例的运维知识的挖掘方法、装置、设备、存储介质和程序产品的应用场景图;
[0043]图2示意性示出了根据本公开实施例的运维知识的挖掘方法的流程图;
[0044]图3示意性示出了根据本公开实施例的进行实体识别的流程图;
[0045]图4示意性示出了根据本公开实施例的实体对齐的流程图;
[0046]图5示意性示出了根据本公开实施例的确定工单分类的流程图之一;
[0047]图6示意性示出了根据本公开实施例的确定工单分类的流程图之二;
[0048]图7示意性示出了根据本公开实施例的运维知识的挖掘装置的结构框图;
[0049]图8示意性示出了根据本公开实施例的适于实现运维知识的挖掘方法的电子设备的方框图。
具体实施方式
[0050]以下,将参照附图来描述本公开的实施例。但是应该理解,这些描述只是示例性的,而并非要限制本公开的范围。在下面的详细描述中,为便于解释,阐述了许多具体的细节以提供对本公开实施例的全面理解。然而,明显地,一个或多个实施例在没有这些具体细节的情况下也可以被实施。此外,在以下说明中,省略了对公知结构和技术的描述,以避免不必要地混淆本公开的概念。
[0051]在此使用的术语仅仅是为了描述具体实施例,而并非意在限制本公开。在此使用的术语“包括”、“包含本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种运维知识的挖掘方法,其特征在于,包括:获取至少一个工单的文本数据;通过第一神经网络模型对所述文本数据进行命名实体识别,以确定出至少一个实体;对确定出的所述实体进行实体对齐;通过第二神经网络模型对所述文本数据进行分类,以确定出所述文本数据的工单类型;根据所述工单类型和经过实体对齐的所述实体,生成运维知识。2.根据权利要求1所述的挖掘方法,其特征在于,所述通过第一神经网络模型对所述文本数据集进行命名实体识别,以确定出至少一个实体,包括:对所述文本数据进行预处理,以得到目标词集;从所述目标词集中提取出至少一个目标词,以得到待识别序列;根据预设的实体类型,为待识别序列中的每个词分配实体标签;根据所述待识别序列中每个词的实体标签以及与每个词相邻的至少一个词的实体标签对待识别序列进行命名实体识别,以确定出至少一个实体。3.根据权利要求2所述的挖掘方法,其特征在于,所述根据所述工单类型和经过实体对齐的所述实体,生成运维知识,包括:对于每个实体,由该实体、该实体的实体类型和所述工单类型构成一条信息,以作为所述运维知识。4.根据权利要求2所述的挖掘方法,其特征在于,其中,所述目标词集包括至少一个词的词向量,所述词向量的维度设置在150至350之间。5.根据权利要求1所述的挖掘方法,其特征在于,所述第一神经网络模型包括:多层双向长短期记忆网络层、Relu激活函数和条件随机场网络层。6.根据权利要求5所述的挖掘方法,其特征在于,所述双向长短期记忆网络层的层数设置在10层至35层之间。7.根据权利要求5所述的挖掘方法,其特征在于,对至少一层所述双向长短期记忆网络层输出的特征进行正则化操作;其中,所述正则化操作的权重设置在0.3至0.9之间...

【专利技术属性】
技术研发人员:高阳金勇吴泽君雷发林简拥军周明宏苑志云梁晓冬刘威
申请(专利权)人:建信金融科技有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1