本发明专利技术涉及大数据互联技术领域,特别是一种基于图论的电力设备标准规范知识图谱构建方法,包括利用结构化、非结构化与半结构化数据上传到预定图谱区域;通过完善的数据描述规范进行图谱定义;配置行业词典,预置数百个专家标注的电力设备专有名词;基于schema即开始进行文本的知识抽取;将抽取的文本知识形成图谱,可以进行图谱可视化浏览与编辑。本发明专利技术多渠道收集电力行业标准,应用数字标准治理工具,实现标准数据结构化、碎片化、指标化、知识元化;通过统一的服务中台及智能服务平台,实现标准管理科学化、应需化;按照标准全生命周期管理要求及资产全生命周期管理要求,实现标准应用智能化、场景化,服务于电网实际业务管理需求。理需求。理需求。
【技术实现步骤摘要】
一种基于图论的电力设备标准规范知识图谱构建方法
[0001]本专利技术涉及大数据互联
,特别是一种基于图论的电力设备标准规范知识图谱构建方法。
技术介绍
[0002]电力系统涉及海量的专业设备和错综复杂的关系网络,每天产生TB级以上的各类数据。随着电力系统的数字化转型升级以及各种创新管理模式的推广应用,数据增长速率还在日益增大。
[0003]主要体现在以下几个方面:1)电力系统的规模增大,动态特性日趋复杂,调度控制方法也越发复杂;2)电力系统中的测控和通信装置不断升级,同步相量测量装置大量接入,数据的分辨率、精度和传输带宽增加;3)光伏、海上风电等新装置接入电网,在改变电网特性的同是也增加了新的知识;4)电力市场化改革不断推进,电力系统的业务链条逐步细化,新的业务不断扩展。
技术实现思路
[0004]本部分的目的在于概述本专利技术的实施例的一些方面以及简要介绍一些较佳实施例。在本部分以及本申请的说明书摘要和专利技术名称中可能会做些简化或省略以避免使本部分、说明书摘要和专利技术名称的目的模糊,而这种简化或省略不能用于限制本专利技术的范围。
[0005]鉴于上述和/或现有的一种基于图论的电力设备标准规范知识图谱构建方法中存在的问题,提出了本专利技术。
[0006]因此,本专利技术所要解决的问题在于如何提供一种对于电力设备的有效知识图谱建设,实现快速寻找电力设备资源、快速寻找电力设备位置的页面设计。
[0007]为解决上述技术问题,本专利技术提供如下技术方案:一种基于图论的电力设备标准规范知识图谱构建方法,其包括:
[0008]利用结构化、非结构化与半结构化数据上传到预定图谱区域;
[0009]通过完善的数据描述规范进行图谱定义;
[0010]配置行业词典,预置数百个专家标注的电力设备专有名词;
[0011]基于schema即开始进行文本的知识抽取;
[0012]将抽取的文本知识形成图谱,可以进行图谱可视化浏览与编辑。
[0013]作为本专利技术所述一种基于图论的电力设备标准规范知识图谱构建方法的一种优选方案,其中:所述非结构化与半结构化数据来源包括word、pdf、excel、数据库与API,支持更新、手动导入;
[0014]所述结构化数据来源包括使用W3C RDF协议定义作为基础协议,采用JSON
‑
LD标准组织描述语言,核心概念包括类目与属性,类目可以继承父类属性;
[0015]文档类数据以知识树进行划分,方便查找和管理。
[0016]作为本专利技术所述一种基于图论的电力设备标准规范知识图谱构建方法的一种优
选方案,其中:所述图谱定义是平台预置了类目及其对应的属性信息。也可自定义添加各类目对应的字段属性信息,或从生产源数据库直连中选入数据快速生成Schema;
[0017]所述Schema是数据描述规范,用于描述、规范化数据的结构。
[0018]作为本专利技术所述一种基于图论的电力设备标准规范知识图谱构建方法的一种优选方案,其中:中文分词的排序利用CRF应用进行序列词位排布;
[0019]先将句子进行原子切分,之后将字与词进行实体标注;
[0020]接着将特征模板进行确定,一般选择为当前位置前后n个位置的词,即:
[0021]F(y
sn
x
sn
)=1or 0
[0022]接着进行CRF模型参数的训练。
[0023]作为本专利技术所述一种基于图论的电力设备标准规范知识图谱构建方法的一种优选方案,其中:特征子空间使用图拉普斯拉约束,对于训练数据集集中的任意两个示例x
i
和x
j
的相似性通过K近邻的方式计算,
[0024][0025]其中σ为示例样本欧拉几得距离均值。
[0026]作为本专利技术所述一种基于图论的电力设备标准规范知识图谱构建方法的一种优选方案,其中:所述高斯伽玛分布中R
x,u
是满足高斯分布的随机变量,P(μ
x,u
)概率为高斯伽玛分布,P(μ,τ)~NG(μ0,λ,α,β),可表示为
[0027][0028]其中μ
x,u
被近似认为是Q(x,u)值,τ表示高斯分布方差的倒数,
[0029]作为本专利技术所述一种基于图论的电力设备标准规范知识图谱构建方法的一种优选方案,其中:在知识图谱查询过程中,识别相关词语为专业词汇并有别名的体现,进行相应查询,并按照语义相关进行排序。
[0030]作为本专利技术所述一种基于图论的电力设备标准规范知识图谱构建方法的一种优选方案,其中:在知识图谱查询过程中对于query中包含的数字、时间类型,如果仅用传统的全文检索只能完全匹配;通过query归一可以识别出query中的数字、时间并进行归一,使理想结果召回;
[0031]所述query指的是自动分词并支持调整的能力。
[0032]一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如上所述方法的步骤。
[0033]一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如上所述方法的步骤。
[0034]本专利技术有益效果为:基于业界领先成熟的人工智能产品和技术,结合专家资源,以点带面,对主网设备标准文档进行数字化加工处理,形成数字化标准,支撑设备标准相关业务的高效开展;
[0035]多渠道收集电力行业标准,应用数字标准治理工具,将标准数字化,构建数字标准知识库,实现标准数据结构化、碎片化、指标化、知识元化;通过统一的服务中台及智能服务
平台,实现标准管理科学化、应需化;按照标准全生命周期管理要求及资产全生命周期管理要求,实现标准应用智能化、场景化,服务于电网实际业务管理需求。
附图说明
[0036]为了更清楚地说明本专利技术实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。其中:
[0037]图1为实施例1中一种基于图论的电力设备标准规范知识图谱构建方法的结构图。
[0038]图2为实施例3中一种基于图论的电力设备标准规范知识图谱构建方法的数据接入图。
[0039]图3为实施例3中一种基于图论的电力设备标准规范知识图谱构建方法的知识定义图。
[0040]图4为实施例3中一种基于图论的电力设备标准规范知识图谱构建方法的知识抽取图。
[0041]图5为实施例3中一种基于图论的电力设备标准规范知识图谱构建方法的知识图谱构建图。
[0042]图6为实施例3中一种基于图论的电力设备标准规范知识图谱构建方法的知识图谱界面图。
[0043]图7为实施例3中一种基于图论的电力设备标准规范知识图谱构建方本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种基于图论的电力设备标准规范知识图谱构建方法,其特征在于:包括利用结构化、非结构化与半结构化数据上传到预定图谱区域;通过完善的数据描述规范进行图谱定义;配置行业词典,预置数百个专家标注的电力设备专有名词;基于schema即开始进行文本的知识抽取;将抽取的文本知识形成图谱,可以进行图谱可视化浏览与编辑。2.如权利要求1所述的一种基于图论的电力设备标准规范知识图谱构建方法,其特征在于:所述非结构化与半结构化数据来源包括word、pdf、excel、数据库与API,支持更新、手动导入;所述结构化数据来源包括使用W3C RDF协议定义作为基础协议,采用JSON
‑
LD标准组织描述语言,核心概念包括类目与属性,类目可以继承父类属性;文档类数据以知识树进行划分,方便查找和管理。3.如权利要求1或2所述的一种基于图论的电力设备标准规范知识图谱构建方法,其特征在于:所述图谱定义是平台预置了类目及其对应的属性信息。也可自定义添加各类目对应的字段属性信息,或从生产源数据库直连中选入数据快速生成Schema;所述Schema是数据描述规范,用于描述、规范化数据的结构。4.如权利要求3所述的一种基于图论的电力设备标准规范知识图谱构建方法,其特征在于:中文分词的排序利用CRF应用进行序列词位排布;先将句子进行原子切分,之后将字与词进行实体标注;接着将特征模板进行确定,一般选择为当前位置前后n个位置的词,即:F(y
sn
x
sn
)=1or 0接着进行CRF模型参数的训练。5.如权利要求1、2和4任一所述的一种基于图论的电力设...
【专利技术属性】
技术研发人员:黄军凯,周育忠,张迅,林正平,
申请(专利权)人:南方电网科学研究院有限责任公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。