一种电厂发电设备故障知识图谱的构建方法技术

技术编号:38370491 阅读:14 留言:0更新日期:2023-08-05 17:34
本发明专利技术涉及一种电厂发电设备故障知识图谱的构建方法,包括:获取故障知识信息;对所述故障知识信息进行预处理和结构化处理;根据电厂实际情况,构建“机组

【技术实现步骤摘要】
一种电厂发电设备故障知识图谱的构建方法


[0001]本专利技术涉及发电信息
,更确切地说,它涉及一种电厂发电设备故障知识图谱的构建方法。

技术介绍

[0002]现阶段,随着我国经济的快速发展,火力发电厂的规模也随之扩大,电力设备变得日益规模庞大、结构复杂。火力发电厂设备作为用户终端电力供应的主力军,快速处理设备故障,保持其高效运行是稳定且高质量供电的关键。在实际故障处理过程中,往往需要检修员基于“经验+专业知识”的模式,以故障现象为节点,根据维修规程和工作手册中所提供的故障关系,快速定位故障设备和分析故障原因,保障设备快速投入生产状态。然而,以上维修策略与检修员的专业素养关联较大,其专业知识储备、逻辑处理能力以及信息分析能力都将直接决定设备维护的效果。检修员集中处理和管理多模态故障数据和规程日志,并将上述数据封装成为故障智能搜索应用的故障

设备关系数据库,辅助检修员进行故障定位,并需要提供可能的故障原因和处理方案。在生产的过程中设备产生的故障数据和现有维修规程数据具有类型复杂且数量冗杂的特点,使得上述多源异构的故障数据的集中管理和快速搜索成为两大难题。
[0003]知识图谱作为一个强有力的工具,对于海量数据的整理和归纳有明显的优势,基于强大的语义处理与开放互联能力,知识图谱对专业的电力设备故障诊断领域而言,能够建立较系统完善的知识库,从而更好地提升故障数据的搜索能力;面对知识管理、语义检索、数据分析、决策支持等方面需求,通过发电设备的文本语言解析相关的技术,可以把发电设备知识如维修规程和工作手册等非结构化的数据与知识图谱有机融合,推进面向电力设备维护场景的故障智能搜索方面的应用。

技术实现思路

[0004]本专利技术的目的是克服现有技术中的不足,提出了一种电厂发电设备故障知识图谱的构建方法。
[0005]第一方面,提供了一种电厂发电设备故障知识图谱的构建方法,包括:
[0006]步骤1、获取故障知识信息;所述故障知识信息包括文本格式信息和非文本格式信息;
[0007]步骤2、对所述故障知识信息进行预处理;
[0008]步骤3、对所述故障知识文本信息进行结构化处理,得到“故障

原因

解决方案”三元组向量信息;
[0009]步骤4、根据电厂实际情况,构建“机组

设备

部件”设备树;
[0010]步骤5、采用面向关系数据库的模式匹配方法,将所述三元组向量信息挂载到所述设备树上,形成知识图谱;
[0011]步骤6、基于用户输入的故障信息,搜索知识图谱获得故障原因定位或合理处置方
案的参考。
[0012]作为优选,步骤1中,所述文本格式信息包括Excel格式信息和TXT格式信息;所述非文本格式信息包括PDF格式信息和图片格式信息。
[0013]作为优选,步骤2中,所述文本格式信息通过程序读取的方式导入系统数据库中,所述非文本格式信息通过OCR文本识别及人工校验后导入系统数据库。
[0014]作为优选,步骤3包括:
[0015]步骤3.1、采用深度学习中的Doc2Vec算法计算所有文本信息的语义相似度,将导入的文本信息投影到向量空间并可视化,进行人工信息标注;
[0016]步骤3.2、采用K

means算法根据文本信息相似度进行聚类,形成训练集;
[0017]步骤3.3、将训练集信息进行BIO标注;
[0018]步骤3.4、使用双向LIST循环神经网络进行标注信息接收和处理;
[0019]步骤3.5、通过CRF输出符合标注转移约束条件的、最大可能的预测标注序列;
[0020]步骤3.6、完成一次训练迭代之后将训练结果输入到语料库,进行精确度匹配;
[0021]步骤3.7、不断循环迭代,训练出精确度满足需求的模型;
[0022]步骤3.8、基于训练好的模型预测待标注语料数据的标签,并抽样部分进行人工语料标记检测,保证精确性后获取实体命名标记。
[0023]作为优选,步骤6包括:
[0024]步骤6.1、利用中文自然语言问答技术解析用户搜索目标;
[0025]步骤6.2、基于图数据库查询语言构建目标搜索;
[0026]步骤6.3、匹配故障知识节点后获取最终的搜索结果;
[0027]步骤6.4、以深度优先或广度优先的方式遍历知识网络输出关联节点完成知识图的挖掘。
[0028]第二方面,提供了一种电厂发电设备故障知识图谱的构建装置,用于执行第一方面任一所述的电厂发电设备故障知识图谱的构建方法,包括:
[0029]获取模块,用于获取故障知识信息;所述故障知识信息包括文本格式信息和非文本格式信息;
[0030]预处理模块,用于对所述故障知识文本信息进行预处理,所述文本格式信息通过程序读取的方式导入系统数据库中,所述非文本格式信息通过OCR文本识别及人工校验后导入系统数据库;
[0031]结构化模块,用于对所述故障知识文本信息进行结构化处理,得到“故障

原因

解决方案”三元组向量信息;
[0032]构建模块,用于根据电厂实际情况,构建“机组

设备

部件”设备树;
[0033]挂载模块,用于采用面向关系数据库的模式匹配方法,将所述三元组向量信息挂载到所述设备树上,形成知识图谱;
[0034]搜索模块,用于基于用户输入的故障信息,搜索知识图谱获得故障原因定位或合理处置方案的参考。
[0035]第三方面,提供了一种计算机存储介质,所述计算机存储介质内存储有计算机程序;所述计算机程序在计算机上运行时,使得计算机执行第一方面任一所述的电厂发电设备故障知识图谱的构建方法。
[0036]本专利技术的有益效果是:本专利技术利用知识图谱优越的文本含义分析与信息关联能力,力求于将海量、异构、动态的电厂设备相关大数据进行高效直观地可视化表达与智能化处理。将电厂非结构化知识与知识图谱有机融合,驱动电厂设备数据智能挖掘与应用,实现电力生产安全管理和电力生产效能的高效提升。该方法能够有效地解决难以利用故障数据的困境,为电力设备的故障知识提供新的组织形式,有利于故障知识的采集、积累和故障规律的挖掘和应用,能够进一步带动电力设备的运维迈向信息化和智能化的方向。
附图说明
[0037]图1为本专利技术提供的一种电厂发电设备故障知识图谱的构建方法的流程图;
[0038]图2为文本的预处理过程图;
[0039]图3为文本信息结构化处理流程图;
[0040]图4为设备树的层级结构示意图;
[0041]图5为知识图谱结构示意图;
[0042]图6为故障智能搜索流程图;
[0043]图7为一种电厂发电设备故障知识图谱的构建装置的结构示意图。
具体实施方式
[0044]下面结本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种电厂发电设备故障知识图谱的构建方法,其特征在于,包括:步骤1、获取故障知识信息;所述故障知识信息包括文本格式信息和非文本格式信息;步骤2、对所述故障知识信息进行预处理;步骤3、对所述故障知识文本信息进行结构化处理,得到“故障

原因

解决方案”三元组向量信息;步骤4、根据电厂实际情况,构建“机组

设备

部件”设备树;步骤5、采用面向关系数据库的模式匹配方法,将所述三元组向量信息挂载到所述设备树上,形成知识图谱;步骤6、基于用户输入的故障信息,搜索知识图谱获得故障原因定位或合理处置方案的参考。2.根据权利要求1所述的电厂发电设备故障知识图谱的构建方法,其特征在于,步骤1中,所述文本格式信息包括Excel格式信息和TXT格式信息;所述非文本格式信息包括PDF格式信息和图片格式信息。3.根据权利要求2所述的电厂发电设备故障知识图谱的构建方法,其特征在于,步骤2中,所述文本格式信息通过程序读取的方式导入系统数据库中,所述非文本格式信息通过OCR文本识别及人工校验后导入系统数据库。4.根据权利要求3所述的电厂发电设备故障知识图谱的构建方法,其特征在于,步骤3包括:步骤3.1、采用深度学习中的Doc2Vec算法计算所有文本信息的语义相似度,将导入的文本信息投影到向量空间并可视化,进行人工信息标注;步骤3.2、采用K

means算法根据文本信息相似度进行聚类,形成训练集;步骤3.3、将训练集信息进行BIO标注;步骤3.4、使用双向LIST循环神经网络进行标注信息接收和处理;步骤3.5、通过CRF输出符合标注转移约束条件的、最大可能的预测标注序列;步骤3.6、完成一次训练迭代之后将训练结果输入到语料...

【专利技术属性】
技术研发人员:鲍日明张泽镔封立林李强孔祥民孟瑜炜王豆郭鼎傅骏伟张震伟
申请(专利权)人:浙江浙能数字科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1