一种面向变压器及断路器设备标准知识图谱构建方法技术

技术编号:38213003 阅读:12 留言:0更新日期:2023-07-25 11:21
本发明专利技术公开了一种面向变压器及断路器设备标准知识图谱构建方法包括:选取变压器及断路器设备标准数据作为种子数据,通过对知识库进行对齐获取大量训练数据并构建数据集;对数据集进行知识抽取,抽取出实体、属性及实体间关系;基于抽取的知识进行知识融合,并对知识融合后的知识进行分类存储,并构建变压器及断路器设备标准知识图谱;本发明专利技术提供的方法能够提升知识抽取的准确率,较高质量地构建了电力变压器运维知识图谱,进而实现了基于知识图谱的智能辅助决策,对推动电力系统数字化转型具有重要意义。有重要意义。有重要意义。

【技术实现步骤摘要】
一种面向变压器及断路器设备标准知识图谱构建方法


[0001]本专利技术涉及知识图谱构建
,具体为一种面向变压器及断路器设备标准知识图谱构建方法。

技术介绍

[0002]变压器作为电力系统中的核心设备,快速准确地掌握变压器信息,提升变压器检修维护效率和水平,是保证用户用电质量的重要基础。
[0003]然而目前,电力变压器运维主要依赖传统经验,导致运维措施的可解释性较弱,且电力变压器结构复杂,对运维技术人员专业技术水平要求较高,使得运维策略制定难度较大。
[0004]知识图谱本质上是一个语义网,可以对多源异构数据进行知识提取,且可以推理得到和实体之间更丰富的的语义关联,故将知识图谱与智能运维相结合,使用“知识

数据”联合驱动的方式进行变压器的智能运维具有广阔的应用前景。

技术实现思路

[0005]本部分的目的在于概述本专利技术的实施例的一些方面以及简要介绍一些较佳实施例。在本部分以及本申请的说明书摘要和专利技术名称中可能会做些简化或省略以避免使本部分、说明书摘要和专利技术名称的目的模糊,而这种简化或省略不能用于限制本专利技术的范围。
[0006]鉴于上述存在的问题,提出了本专利技术。
[0007]本专利技术实施例的第一方面,提供一种面向变压器及断路器设备标准知识图谱构建方法,包括:选取变压器及断路器设备标准数据作为种子数据,通过对知识库进行对齐获取大量训练数据并构建数据集;对所述数据集进行知识抽取,抽取出实体、属性及实体间关系;基于抽取的知识进行知识融合,并对所述知识融合后的知识进行分类存储,并构建变压器及断路器设备标准知识图谱。
[0008]作为本专利技术所述的面向变压器及断路器设备标准知识图谱构建方法的一种优选方案,其中:所述数据集的构建包括,
[0009]选取变压器及断路器设备标准数据作为种子数据,所述变压器及断路器设备标准数据的三元组格式与构建数据集需要的格式存在较大偏差,在构建数据集前需进行预处理;
[0010]通过对知识库进行对齐获取大量训练数据并构建数据集;
[0011]若第i个句子包含多个实体,则令所有实体两两组合形成实体对,并将所述实体对输入所述变压器及断路器设备标准数据进行匹配,若所述实体对并无关系,则标记为null,作为负样本。
[0012]作为本专利技术所述的面向变压器及断路器设备标准知识图谱构建方法的一种优选方案,其中:所述知识抽取的过程包括,
[0013]对所述数据集进行预处理得到多个文本信息,针对每个文本信息将所述文本信息
分词后输入至Bert子模型,得到对应的向量序列,然后将所述向量序列输入至BGRU子模型中,输出用于揭示文本信息中各个单词对应各个标签分值的状态矩阵,再将所述状态矩阵输入至CRF子模型,计算最优标签序列,实现对实体的提取和属性的提取;
[0014]将抽取实体和属性的向量序列处理后再输入至关系抽取子模型,实现对实体间关系的抽取。
[0015]作为本专利技术所述的面向变压器及断路器设备标准知识图谱构建方法的一种优选方案,其中:所述向量序列的获取包括,
[0016]对所述数据集进行预处理得到多个文本信息,将所述文本信息进行分词后得到长度为n的分词文本;
[0017]将所述分词文本w=([CLS],w1,w2,

,w
n
,[SEP])输入至Bert子模型,得到对应的向量序列L=(l0,l1,l2,

,l
n
,l
n+1
),l
i
∈R
n
×
L
,其中,[CLS]表示起始符,w
n
表示第n个分词文本,[SEP]表示结束符,l
n
表示第n个向量序列,L表示Bert子模型的隐藏状态维数。
[0018]作为本专利技术所述的面向变压器及断路器设备标准知识图谱构建方法的一种优选方案,其中:所述状态矩阵的获取包括,
[0019]将所述向量序列中各个词向量序列作为BGRU子模型中各个时间步的输入;
[0020]通过将所述BGRU子模型中正向GRU输出的隐状态序列和反向GRU输出的隐状态序列进行计算,得到所述向量序列对应的隐状态序列h
n+1
,h
n+1
∈R
n
×
H
,H为BGRU子模型的隐藏状态维数;
[0021]将所述隐状态序列h
n+1
从H维映射到k维,并计算每个分词分类到k个标签的标签分值,得到状态矩阵E=(e0,e1,e2,

,e
n
,e
n+1
),其中e
i
∈R
k
表示一个列向量。
[0022]作为本专利技术所述的面向变压器及断路器设备标准知识图谱构建方法的一种优选方案,其中:所述最优标签序列的计算包括,
[0023]将所述状态矩阵输入至CRF子模型,基于所述CRF子模型中引入的约束矩阵和输入的状态矩阵,计算每个标签序列的总分值;
[0024]基于所述每个标签序列的总分值计算最优标签序列具体的计算如下:
[0025][0026]其中,表示每个标签序列的总分值,表示所有可能的标签序列的集合。
[0027]作为本专利技术所述的面向变压器及断路器设备标准知识图谱构建方法的一种优选方案,其中:所述变压器及断路器设备标准知识图谱的构建包括,
[0028]基于抽取的知识进行知识融合,将融合后的数据导入Neo4j图数据库中进行分类与存储,并构建变压器及断路器设备标准知识图谱。
[0029]本专利技术实施例的第二方面,提供一种面向变压器及断路器设备标准知识图谱构建系统,包括:
[0030]数据获取单元,用于选取变压器及断路器设备标准数据作为种子数据,通过对知识库进行对齐获取大量训练数据并构建数据集;
[0031]知识抽取单元,用于对所述数据集进行知识抽取,抽取出实体、属性及实体间关系;
[0032]知识图谱构建单元,用于基于抽取的知识进行知识融合,并对所述知识融合后的知识进行分类存储,并构建变压器及断路器设备标准知识图谱。
[0033]本专利技术实施例的第三方面,提供一种设备,所述设备包括,
[0034]处理器;
[0035]用于存储处理器可执行指令的存储器;
[0036]所述处理器被配置为调用所述存储器存储的指令,以执行本专利技术任一实施例所述的方法。
[0037]本专利技术实施例的第四方面,提供一种计算机可读存储介质,其上存储有计算机程序指令,包括:
[0038]所述计算机程序指令被处理器执行时实现如本专利技术任一实施例所述的方法。
[0039]本专利技术的有益效果:本专利技术提供一种面向变压器及断路器设备标准知识图谱构建方法,通过对数据集进行知识抽取,抽取出实体、属性及实体间关系,基于抽取的知识进行知识融合,并对知识融合后的知本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种面向变压器及断路器设备标准知识图谱构建方法,其特征在于,包括:选取变压器及断路器设备标准数据作为种子数据,通过对知识库进行对齐获取大量训练数据并构建数据集;对所述数据集进行知识抽取,抽取出实体、属性及实体间关系;基于抽取的知识进行知识融合,并对所述知识融合后的知识进行分类存储,并构建变压器及断路器设备标准知识图谱。2.如权利要求1所述的面向变压器及断路器设备标准知识图谱构建方法,其特征在于:所述数据集的构建包括,选取变压器及断路器设备标准数据作为种子数据,所述变压器及断路器设备标准数据的三元组格式与构建数据集需要的格式存在较大偏差,在构建数据集前需进行预处理;通过对知识库进行对齐获取大量训练数据并构建数据集;若第i个句子包含多个实体,则令所有实体两两组合形成实体对,并将所述实体对输入所述变压器及断路器设备标准数据进行匹配,若所述实体对并无关系,则标记为null,作为负样本。3.如权利要求2所述的面向变压器及断路器设备标准知识图谱构建方法,其特征在于:所述知识抽取的过程包括,对所述数据集进行预处理得到多个文本信息,针对每个文本信息将所述文本信息分词后输入至Bert子模型,得到对应的向量序列,然后将所述向量序列输入至BGRU子模型中,输出用于揭示文本信息中各个单词对应各个标签分值的状态矩阵,再将所述状态矩阵输入至CRF子模型,计算最优标签序列,实现对实体的提取和属性的提取;将抽取实体和属性的向量序列处理后再输入至关系抽取子模型,实现对实体间关系的抽取。4.如权利要求3所述的面向变压器及断路器设备标准知识图谱构建方法,其特征在于:所述向量序列的获取包括,对所述数据集进行预处理得到多个文本信息,将所述文本信息进行分词后得到长度为n的分词文本;将所述分词文本w=([CLS],w1,w2,

,w
n
,[SEP])输入至Bert子模型,得到对应的向量序列l=(l0,l1,l2,

,l
n
,l
n+1
),l
i
∈R
n
×
L
,其中,[CLS]表示起始符,w
n
表示第n个分词文本,[SEP]表示结束符,l
n
表示第n个向量序列,L表示Bert子模型的隐藏状态维数。5.如权利要求4所述的面向...

【专利技术属性】
技术研发人员:周育忠林正平宋禹飞黄军凯
申请(专利权)人:贵州电网有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1