知识图谱处理方法技术

技术编号:39598044 阅读:19 留言:0更新日期:2023-12-03 19:57
本申请提供知识图谱处理方法

【技术实现步骤摘要】
知识图谱处理方法、电子设备和存储介质


[0001]本申请涉及互联网
,具体而言,涉及知识图谱处理方法

电子设备和存储介质


技术介绍

[0002]知识图谱
(Knowledge Graph)
通常能够应用于智能客服

搜索引擎优化等领域,比如在智能客服领域中,当接收到用户的问题之后,将该问题与知识图谱中节点的内容进行匹配,来获取该问题的答案

但知识图谱目前在这些领域中的应用,由于知识图谱中节点的内容较多,导致与知识图谱中节点的内容进行匹配时,匹配效率通常较低


技术实现思路

[0003]本申请实施例的目的在于提供知识图谱处理方法

电子设备和存储介质,用于解决现有技术中的问题

[0004]本申请实施例第一方面提供了一种知识图谱处理方法,包括:
[0005]获取知识图谱中目标节点的文本内容;
[0006]利用关键词标注模型对所述文本内容进行关键词标注;
[0007]将关键词标注所得到的关键词与所述目标节点进行关联

[0008]于一实施例中,在将关键词标注所得到的关键词与所述目标节点进行关联之前,所述方法还包括:
[0009]将关键词标注所得到的关键词与所述文本内容进行比对;
[0010]根据比对结果,对关键词标注所得到的关键词进行修正;以及,
[0011]将关键词标注所得到的关键词与所述目标节点进行关联,具体包括:
[0012]将修正后的关键词与所述目标节点进行关联

[0013]于一实施例中,所述方法还包括:
[0014]利用训练样本,预先训练生成所述关键词标注模型

[0015]于一实施例中,所述方法还包括:
[0016]通过
F1
分数评估所生成的关键词标注模型而的性能,其中,所述
F1
分数通过所生成的关键词标注模型的准确率和召回率计算得到

[0017]于一实施例中,通过如下公式计算得到所述
F1
分数:
[0018]F1

n*(a*b)/(a+b)+c

[0019]其中,
a
为所生成的关键词标注模型的准确率;
b
为所生成的关键词标注模型的召回率;
n

c
分别为预设常数;
F1
为计算得到的
F1
分数

[0020]于一实施例中,所述方法还包括:
[0021]采集原始语料数据,所述原始预料数据携带实体

实体间关系和实体属性;
[0022]通过特征工程提取所述原始语料数据中的关键特征;
[0023]利用所提取的关键特征生成所述训练样本

[0024]于一实施例中,通过特征工程提取所述原始语料数据中的关键特征,具体包括:
[0025]对所述原始语料数据进行预处理,以得到多个特征;
[0026]利用特征筛选算法计算出各个特征的评分;
[0027]针对各个特征,将评分高于阈值的特征作为所筛选出的关键特征

[0028]于一实施例中,在将关键词标注所得到的关键词与所述目标节点进行关联之后,所述方法还包括:
[0029]获取用户的问题;
[0030]将所述问题与标注所得到的关键词进行匹配;
[0031]在匹配成功的情况下,向所述用户反馈所关联的所述目标节点的文本内容

[0032]本申请实施例第三方面提供了一种电子设备,包括:
[0033]存储器,用以存储计算机程序;
[0034]处理器,用以执行本申请方法实施例中任一项所述的方法

[0035]本申请实施例第四方面提供了一种存储介质,包括:程序,当其在电子设备上运行时,使得电子设备可执行本申请方法实施例中任一项所述的方法

[0036]采用本申请实施例所提供的方法,包括先获取知识图谱中目标节点的文本内容,然后利用关键词标注模型对该文本内容进行关键词标注,然后将关键词标注所得到的关键词与目标节点进行关联

由于该关键词是从知识图谱中目标节点的文本内容,进行关键词标注所得到,因此能够直接将用户的问题与关键词进行匹配,此时由于该关键词标注所得到的关键词的文本长度,小于目标节点的文本内容,因此能够提高匹配效率

附图说明
[0037]为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图

[0038]图1为本申请一实施例提供的电子设备的具体结构示意图;
[0039]图2为本申请一实施例提供的,电子设备与用户终端的交互示意图;
[0040]图3为本申请一实施例提供的,知识图谱处理方法的具体流程示意图;
[0041]图4为本申请一实施例提供的,知识图谱处理装置的具体结构示意图

具体实施方式
[0042]下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行描述

在本申请的描述中,诸如“第一”、“第二”、“第三”等术语仅用于区分描述,而不能理解为指示或暗示相对重要性或先后顺序

[0043]如前所述,知识图谱
(Knowledge Graph)
通常能够应用于智能客服

搜索引擎优化等领域,比如在智能客服领域中,当接收到用户的问题之后,将该问题与知识图谱中节点的内容进行匹配,来获取该问题的答案

但知识图谱目前在这些领域中的应用,由于知识图谱中节点的内容较多,比如每个节点中通常可以包括该节点所对应实体

实体间关系以及实体属性的描述语句,该描述语句虽然以相对简洁的语句来描述出了实体

实体间关系以及
实体属性,但内容仍然较多,导致用户的问题与知识图谱中节点的内容进行匹配时,匹配效率通常较低,进而使得,在需要以极快速度向用户反馈答案的场景下难以适用

[0044]基于此,本申请实施例提供了一种知识图谱处理方法

装置

电子设备和存储介质,能够用于对知识图谱进行处理,进能够在知识图谱的应用时,为提高匹配效率提供了基础

如图1所示为本实施例所提供的一种电子设备1,该电子设备1包括:至少一个处理器
11
和存储器
12
,图1中以一个处理器为例
。本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种知识图谱处理方法,其特征在于,包括:获取知识图谱中目标节点的文本内容;利用关键词标注模型对所述文本内容进行关键词标注;将关键词标注所得到的关键词与所述目标节点进行关联
。2.
根据权利要求1所述的方法,其特征在于,在将关键词标注所得到的关键词与所述目标节点进行关联之前,所述方法还包括:将关键词标注所得到的关键词与所述文本内容进行比对;根据比对结果,对关键词标注所得到的关键词进行修正;以及,将关键词标注所得到的关键词与所述目标节点进行关联,具体包括:将修正后的关键词与所述目标节点进行关联
。3.
根据权利要求1所述的方法,其特征在于,所述方法还包括:利用训练样本,预先训练生成所述关键词标注模型
。4.
根据权利要求3所述的方法,其特征在于,所述方法还包括:通过
F1
分数评估所生成的关键词标注模型而的性能,其中,所述
F1
分数通过所生成的关键词标注模型的准确率和召回率计算得到
。5.
根据权利要求4所述的方法,其特征在于,通过如下公式计算得到所述
F1
分数:
F1

n*(a*b)/(a+b)+c
;其中,
a
为所生成的关键词标注模型的准确率;
b
为所生成的关键词标注模型的召...

【专利技术属性】
技术研发人员:夏凌莉虞力管宏伟
申请(专利权)人:成都新致云服信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1