【技术实现步骤摘要】
一种电力标准知识图谱构建方法、知识问答系统及装置
[0001]本专利技术涉及电力
,特别是一种电力标准知识图谱构建方法、知识问答系统及装置。
技术介绍
[0002]知识图谱是通过将应用数学、图形学、信息可视化技术、信息科学等学科的理论与方法与计量学引文分析、共现分析等方法结合,并利用可视化的图谱形象地展示学科的核心结构、发展历史、前沿领域以及整体知识架构达到多学科融合目的的现代理论。能够把复杂的知识领域通过数据挖掘、信息处理、知识计量和图形绘制而显示出来,揭示知识领域的动态发展规律,为学科研究提供切实的、有价值的参考。
[0003]基于知识图谱的应用有很多,例如智能问答、个性化推荐、知识推理、可视化等。知识问答系统与搜索引擎类似,也是一种信息检索的工具,但不同的是,知识问答系统可在语义层面理解、处理自然语言问题,并直接返回问题的答案,实现语义检索。若将知识图谱作为问答系统的知识来源,便构成了基于知识库的知识问答系统,其可接受自然语言形态的问题,通过语义分析理解问题的含义,然后在知识库中查询并返回问题的答案。
[0004]现有的电力行业的相关知识,通常还是依赖于搜索引擎,未见在此垂直领域的智能问答系统。究其原因,是由于构建电力标准知识图谱过程中,相关知识抽取难度较高,导致知识图谱构建困难。
技术实现思路
[0005]本部分的目的在于概述本专利技术的实施例的一些方面以及简要介绍一些较佳实施例。在本部分以及本申请的说明书摘要和专利技术名称中可能会做些简化或省略以避免使本部分、说明书摘要 ...
【技术保护点】
【技术特征摘要】
1.一种电力标准知识图谱构建方法,其特征在于:包括,通过采集的电力标准数据,构建电力标准知识图谱的本体结构,所述本体结构包含实体、属性及实体间关系;获取包含电力标准知识的基础数据,并对基础数据进行知识抽取,抽取出实体、属性及实体间关系;基于抽取的知识进行知识融合,并对融合后的知识进行存储,构建电力标准知识图谱。2.如权利要求1所述的电力标准知识图谱构建方法,其特征在于:所述获取包含电力标准知识的基础数据,并对基础数据进行知识抽取包括,对所述基础数据进行预处理,得到多个文本信息,或者得到多个文本信息和至少一个图像信息;针对每个文本信息,将该文本信息分词后输入至Bert子模型,得到对应的向量序列,然后将所述向量序列输入至BGRU子模型中,输出用于揭示该文本信息中各个单词对应各个标签分值的状态矩阵,再将所述状态矩阵输入至CRF子模型,计算最优标签序列,实现对实体的提取和属性的提取;针对每个图像信息,将该图像信息输入至外部调用的公式识别子工具中,得到转换的文本信息,对转换的文本信息进行处理,得到至少一个公式文本,将每个公式文本一同输入至WordBert子模型,得到对应的向量序列,然后将所述向量序列输入至BGRU子模型中,输出用于揭示该转换的文本信息中各个公式文本对应各个标签分值的状态矩阵,再将所述状态矩阵输入至CRF子模型,计算最优标签序列,实现对属性的提取;将抽取实体和属性的向量序列处理后再输入至关系抽取子模型,实现对实体间关系的抽取。3.如权利要求2所述的电力标准知识图谱构建方法,其特征在于:所述针对每个文本信息的知识提取方法包括,将文本信息进行分词后得到长度为n的分词文本w;将分词文本w=([CLS],w1,w2,
…
,w
n
,[SEP])输入至Bert子模型,得到分词文本w对应的向量序列l=(l0,l1,l2,
…
,l
n
,l
n+1
),l
i
∈R
n
×
L
,其中,i∈[0,n+1],向量序列l=(l0,l1,l2,
…
,l
n
,l
n+1
)为Bert子模型的最后一层中分词文本w对应的隐藏状态,[CLS]为起始符,[SEP]为结束符,L为Bert子模型的隐藏状态维数;将向量序列l=(l0,l1,l2,
…
,l
n
,l
n+1
)中各个词向量序列l
i
作为BGRU子模型中各个时间步的输入;将BGRU子模型中正向GRU输出的隐状态序列和反向GRU输出的隐状态序列进行计算,得到向量序列l对应的隐状态序列h
n+1
,h
n+1
∈R
n
×
H
,H为BGRU子模型的隐藏状态维数;将隐状态序列h
n+1
从H维映射到k维,k为标签数;计算每个分词分类到k个标签的标签分值,得到状态矩阵E=(e0,e1,e2,
…
,e
n
,e
n+1
),其中e
i
∈R
k
,是一个列向量;将所述状态矩阵输入至CRF子模型,计算最优标签序列。4.如权利要求3所述的电力标准知识图谱构建方法,其特征在于:所述将所述状态矩阵输入至CRF子模型,计算最优标签序列包括,
将状态矩阵E=(e0,e1,e2,
…
,e
n
,e
n+1
)输入至CRF子模型中;基于CRF子模型中引入的约束矩阵F和输入的状态矩阵E,计算每个标签序列的总分值:其中,F∈R
(k+2)
×
(k+2)
,表示标签序列的总分值,α为调节因子,表示状态矩阵E中第i个分词分类到第j个标签的概率,表示由标签序列中第j个标签转移至第j+1个标签的概率;基于每个标签序列的总分值计算最优标签序列计算最优标签序列其中,为所有可能的标签序列的集合。5.如权利要求4所述的电力标准知识图谱构建方法,其特征在于:所述针对每个图像信息的知识提取方法包括,对转换的文本信息进行识别,确定出其中是否存在目标...
【专利技术属性】
技术研发人员:周育忠,林正平,王冕,涂亮,杨宇亮,
申请(专利权)人:贵州电网有限责任公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。