电网调控风险预警信息知识图谱设计方法及系统技术方案

技术编号:34881585 阅读:61 留言:0更新日期:2022-09-10 13:38
电网调控风险预警信息知识图谱设计方法及系统,方法包括:采集电网调控的半结构化数据和非结构化数据以构建调度知识库;利用调度知识库设计具有层级性的电网调控风险预警知识图谱;使用电网调控风险预警知识图谱结合专家经验知识,对电网调控风险预警系统进行逻辑层级表达;采集电网调控风险预警通知单,并对电网调控风险预警通知单进行事件抽取,以获取电网调控风险预警实例事件的事理关系和事理元素,并构建电网调控风险预警事件图谱。本发明专利技术通过事件抽取获得了事理关系及事理元素,建立了电网调控风险预警事件图谱,该电网调控风险预警事件图谱融合了多类事件与实体知识,是电网调控风险预警信息知识图谱的特定形态。电网调控风险预警信息知识图谱的特定形态。电网调控风险预警信息知识图谱的特定形态。

【技术实现步骤摘要】
电网调控风险预警信息知识图谱设计方法及系统


[0001]本专利技术涉及电力系统风险检测
,更具体地,涉及电网调控风险预警信息知识图谱设计方法及系统。

技术介绍

[0002]目前,电网调控系统中的故障信息及风险预警信息均以“事件”的形式进行文本记录,并以不同结构形式的文件存储在系统中。实际工作中,现有的调度系统缺乏对风险信息关联性刻画的理解,以及缺乏对预警信息系统化存储、查询和检索的便利性。近些年来,以人工智能为核心的技术驱动下,以描述事件之间的逻辑演化关系的逻辑事理图谱正受到广泛关注,这类图谱一方面关注事件之间的空间语义和时间语义状态的转移,能够表达出一种较相关性语义更强、更为直接的关联性;另一方面,知识承载能力更强。这两方面的特征决定了事理图谱能够支持事件预测、逻辑问答、逻辑检验等多种应用。
[0003]现有技术1(CN111899089A)“基于知识图谱的企业风险预警方法及系统”,获取企业信息的结构化数据和半结构化数据,处理后形成标准化结构数据汇入数据池;获取企业信息的非结构化数据,处理后形成企业关系数据汇入语料库;基于数据池中的标准化结构数据以及语料库中的企业关系数据构建目标企业的知识图谱;利用预先训练的风险识别模型从知识图谱中挖掘出目标企业的风险信息,实现风险预警。而电网调度风险业务有别于通用理解的欺诈类风险,电网调度风险业务主要由一条事件和某个具体情境的方式进行表达,具有层级性的调度风险预警图谱schema不仅要包括本体关系,还应该包括事件层级及相关关系。但以现有技术1为代表,建立知识图谱时只抽取了风险信息中的三元组数据,缺乏对风险事件体系的关系抽取和事件层级构建。
[0004]领域知识图谱在近些年已有一定的研究进展,但受限于当前自然语言处理技术的水平以及对电网调控风险预警业务的理解,现有技术中电网调控在逻辑知识库及图谱的构建和应用上还存在以下不足:
[0005]1)自动抽取准确性不高。目前基于全自动方式构建和提取的事件及事理关系的数据精度不高;其中,以依存句法或正则规则模板抽取的方法虽然能够得到较高的召回率,但错误率较高;以深度学习序列标注方法进行抽取能够保证较高的准确率,但需要大规模的标注语料。
[0006]2)调度事件抽取中的事件元素抽取往往需要提前对元素类别进行预设,对调度业务的理解需要积累比较丰富的专家知识,需要定义比较准确的知识经验。
[0007]3)调度事件性知识和实体性知识的融合及链接的工作还相对空白。将实体性知识链接到事件性知识中的事件当中,可进一步丰富应用功能。

技术实现思路

[0008]为解决现有技术中存在的不足,本专利技术的目的在于,提供电网调控风险预警信息知识图谱设计方法及系统,针对现有技术中缺乏的电网调控风险预警事件及事件的事理关
系结构进行了梳理研究,对电网调控风险预警事件进行分类及结构构建,通过事件抽取获得了事理关系及事理元素,建立了电网调控风险预警事件图谱,该电网调控风险预警事件图谱融合了多类事件与实体知识,是电网调控风险预警信息知识图谱的特定形态。
[0009]本专利技术采用如下的技术方案。
[0010]本专利技术一方面提出一种电网调控风险预警信息知识图谱设计方法,设计方法包括:
[0011]步骤1,采集电网调控的半结构化数据和非结构化数据;利用预处理后的半结构化数据和非结构化数据构建调度知识库;
[0012]步骤2,利用调度知识库设计具有层级性的电网调控风险预警知识图谱;使用电网调控风险预警知识图谱结合专家经验知识,对电网调控风险预警系统进行逻辑层级表达;电网调控风险预警知识图谱包括:电网调控风险预警抽象事件的层级体系,电网调控风险预警抽象事件的论元结构;
[0013]步骤3,采集电网调控风险预警通知单,并对电网调控风险预警通知单进行事件抽取,以获取电网调控风险预警实例事件的事理关系,电网调控风险预警实例事件的事理元素;
[0014]步骤4,利用电网调控风险预警实例事件的事理关系,电网调控风险预警实例事件的事理元素,构建电网调控风险预警事件图谱;其中,电网调控风险预警事件图谱为有向有环图谱,以电网调控风险预警实例事件的事理元素为节点,以电网调控风险预警实例事件的事理关系为有向边。
[0015]步骤1中,电网调控的半结构化数据包括:调度系统数据库数据、固定格式的文本文档;
[0016]电网调控的非结构化数据包括:调度各类无固定格式文档、预案、日志、操作记录、图片;
[0017]对半结构化数据进行的预处理包括:格式转换;
[0018]对非结构化数据进行的预处理包括:标点处理、分词、词频统计及索引库建立。
[0019]步骤1中,调度知识库,用于存储电网调控风险预警概念知识和电网调控风险预警概念知识之间的上下位层级关系;调度知识库包括:名词性实体抽象知识库、性状类抽象知识库以及动作性事件抽象知识库;
[0020]名词性实体抽象知识库中存储存在上下位语义关系的名词;性状类抽象知识库中存储形容词或副词;动作性事件抽象知识库中存储动词;
[0021]其中,电网调控风险预警概念知识是知网中文词库、百科知识库与电网调控领域内文本资料和词表的融合。
[0022]步骤1中,调度知识库的构建包括:
[0023]步骤1.1,从知网中文词库和百科知识库中获取抽象层级;其中,以知网中文词库中的Glossary文件作为概念层级体系文件;
[0024]步骤1.2,通过人工标注,从电网调控的半结构化数据和非结构化数据中获取电网调控领域内文本资料;将文本资料与概念层级体系文件进行融合形成层级分类树,其中设置词频最高的词条作为根节点,将根节点作为实体;
[0025]步骤1.3,利用词向量工具训练电网调控领域内文本资料,得到包含实体的电网调
控领域内词向量文本以及电网调控领域内词表;
[0026]步骤1.4,将电网调控领域内词向量文本中所有的词设置为种子词,对种子词以外的其余电网调控领域内文本资料与种子词进行相似度计算,将相似度大于相似度阈值的词作为同义词,并进行存储;
[0027]步骤1.5,将步骤1.4得到的同义词以及在同义词词林中获取的同义词进行汇总,得到电网调控风险预警概念知识;
[0028]步骤1.6,构建步骤1.2得到的实体与词语上位概念的上下位有向图,基于最短路径算法,以每个实体最短路径的最大值作为实体的上下位抽象路径,以上下位抽象路径表征电网调控风险预警概念知识之间的上下位层级关系。
[0029]步骤2中,调度风险预警事件的层级体系是基于规则组合方式进行构建,规则组合方式是自顶向下方式和自下而上方式的结合;层级体系的构建过程包括:
[0030]步骤2.1,自顶向下的构建调度风险预警事件的层级体系,即基于专家经验知识,根据调度风险预警事件的特征对调度风险预警事件进行归纳、分类和定义,并根据电网调控风险预警的业务场景设计调度风险预警事件的层级体系,具体为:
[0031]步骤2.1.1,从调本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.电网调控风险预警信息知识图谱设计方法,其特征在于,所述设计方法包括:步骤1,采集电网调控的半结构化数据和非结构化数据;利用预处理后的半结构化数据和非结构化数据构建调度知识库;步骤2,利用调度知识库设计具有层级性的电网调控风险预警知识图谱;使用电网调控风险预警知识图谱结合专家经验知识,对电网调控风险预警系统进行逻辑层级表达;电网调控风险预警知识图谱包括:电网调控风险预警抽象事件的层级体系,电网调控风险预警抽象事件的论元结构;步骤3,采集电网调控风险预警通知单,并对电网调控风险预警通知单进行事件抽取,以获取电网调控风险预警实例事件的事理关系,电网调控风险预警实例事件的事理元素;步骤4,利用电网调控风险预警实例事件的事理关系,电网调控风险预警实例事件的事理元素,构建电网调控风险预警事件图谱;其中,电网调控风险预警事件图谱为有向有环图谱,以电网调控风险预警实例事件的事理元素为节点,以电网调控风险预警实例事件的事理关系为有向边。2.根据权利要求1所述的电网调控风险预警信息知识图谱设计方法,其特征在于,步骤1中,电网调控的半结构化数据包括:调度系统数据库数据、固定格式的文本文档;电网调控的非结构化数据包括:调度各类无固定格式文档、预案、日志、操作记录、图片;对半结构化数据进行的预处理包括:格式转换;对非结构化数据进行的预处理包括:标点处理、分词、词频统计及索引库建立。3.根据权利要求1所述的电网调控风险预警信息知识图谱设计方法,其特征在于,步骤1中,调度知识库,用于存储电网调控风险预警概念知识和电网调控风险预警概念知识之间的上下位层级关系;调度知识库包括:名词性实体抽象知识库、性状类抽象知识库以及动作性事件抽象知识库;名词性实体抽象知识库中存储存在上下位语义关系的名词;性状类抽象知识库中存储形容词或副词;动作性事件抽象知识库中存储动词;其中,电网调控风险预警概念知识是知网中文词库、百科知识库与电网调控领域内文本资料和词表的融合。4.根据权利要求3所述的电网调控风险预警信息知识图谱设计方法,其特征在于,步骤1中,调度知识库的构建包括:步骤1.1,从知网中文词库和百科知识库中获取抽象层级;其中,以知网中文词库中的Glossary文件作为概念层级体系文件;步骤1.2,通过人工标注,从电网调控的半结构化数据和非结构化数据中获取电网调控领域内文本资料;将文本资料与概念层级体系文件进行融合形成层级分类树,其中设置词频最高的词条作为根节点,将根节点作为实体;步骤1.3,利用词向量工具训练电网调控领域内文本资料,得到包含实体的电网调控领域内词向量文本以及电网调控领域内词表;步骤1.4,将电网调控领域内词向量文本中所有的词设置为种子词,对种子词以外的其余电网调控领域内文本资料与种子词进行相似度计算,将相似度大于相似度阈值的词作为
同义词,并进行存储;步骤1.5,将步骤1.4得到的同义词以及在同义词词林中获取的同义词进行汇总,得到电网调控风险预警概念知识;步骤1.6,构建步骤1.2得到的实体与词语上位概念的上下位有向图,基于最短路径算法,以每个实体最短路径的最大值作为实体的上下位抽象路径,以上下位抽象路径表征电网调控风险预警概念知识之间的上下位层级关系。5.根据权利要求1所述的电网调控风险预警信息知识图谱设计方法,其特征在于,步骤2中,调度风险预警事件的层级体系是基于规则组合方式进行构建,规则组合方式是自顶向下方式和自下而上方式的结合;层级体系的构建过程包括:步骤2.1,自顶向下的构建调度风险预警事件的层级体系,即基于专家经验知识,根据调度风险预警事件的特征对调度风险预警事件进行归纳、分类和定义,并根据电网调控风险预警的业务场景设计调度风险预警事件的层级体系,具体为:步骤2.1.1,从调度知识库中获取...

【专利技术属性】
技术研发人员:朱红张伟孙昕杰申张亮邓晨郑晓崑柴博韦鸣月胡子健许洪华徐中中
申请(专利权)人:国网智能电网研究院有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1