面向环氧乙烷衍生品生产过程的知识图谱构建方法技术

技术编号:32640037 阅读:15 留言:0更新日期:2022-03-12 18:15
本发明专利技术属于知识图谱技术领域,提供了面向环氧乙烷衍生品生产过程的知识图谱构建方法。根据数据类型及特点,梳理环氧乙烷衍生品生产过程的数据源,将其划分为结构化、非结构化、其他类型三种数据。采用自顶向下和自底向上相结合的方法构建知识图谱的本体层和数据层。提出一种基于数据驱动的增量式本体建模方法,保证知识图谱的可扩展性。面向结构化知识抽取,采用虚拟知识图谱的方法,保证原始数据存储的安全性,提出一种新的映射机制,实现数据实体化。面向非结构化知识抽取,融合预训练语言模型BERT,基于BERT

【技术实现步骤摘要】
面向环氧乙烷衍生品生产过程的知识图谱构建方法


[0001]本专利技术属于知识图谱(KnowledgeGraph)
,尤其涉及环氧乙烷衍生品生产过程不同数据来源的知识抽取方法,提出一种面向精细化工生产过程的知识图谱构建方法。

技术介绍

[0002]精细化工领域是当今化学工业中最具活力的新兴领域之一。近年来,我国精细化工产业正处于快速发展期,其产品因品种多、规模小、指标要求高等特殊性,使得精细化工生产过程工艺复杂、安全风险高。如何改善精细化工生产的安全风险管控措施是亟待解决的本质安全管理问题,具有重要的理论意义和十分迫切的现实意义。
[0003]环氧乙烷衍生品(EOD)作为精细化工中的重点生产产品,其安全生产数据具有来源多样、结构复杂、相互关联的特点。第一,环氧乙烷衍生精细化学品的安全监控与决策涉及的信息多种多样,包括仪表测量、图像监测、故障库、故障追踪报告、安检报告、安全状态分析等,数据量庞大;第二,数据类型复杂,有结构化、非结构化、半结构化形态,缺乏统一的语义表达,造成对生产安全知识的理解不充分,描述不准确;第三,数据流同时又包括生产、质量、库存、维护、能耗等环节,这些信息往往独立采集和处置,造成了数据分散,使得数据收集工作繁琐、决策效率低下,无法充分利用相关安全生产信息。
[0004]因此,本领域亟需解决对多源的安全生产信息、规则知识、经验知识等进行融合与关联,构建面向设备、过程装置、操作运行的安全生产知识体系,打通精细化工企业所面临的信息孤岛问题,为环氧乙烷衍生品安全生产分析与管控提供全面的数据来源。针对上述问题,本专利技术提出了面向环氧乙烷衍生品生产过程的知识图谱构建方法,接下来详细介绍知识图谱构建的
技术介绍

[0005]知识图谱是大规模语义网络,是构建和挖掘信息关联关系的一种重要技术。相比较传统结构化数据处理工具,知识图谱在非结构化和半结构化数据的特征提取、内容检索、表示推理方面更具优势。相对于传统知识工程方法,知识图谱可以通过自动化构建、众包等形式实现大规模知识库的构建,具有良好的扩展性。
[0006]面向多源异构数据,每一种数据源的知识化都需要综合各种不同的技术的手段。知识图谱构建的基本流程为:首先确定知识表示模型,实现本体(Ontology)层的定义;接着根据数据来源选择不同的知识抽取方法导入知识,对于非结构数据,需要综合命名实体识别(Named Entity Recognition)、关系抽取(Relation Extraction)、事件抽取(Event Extraction)等自然语言处理技术,实现非结构化知识抽取。对于结构化数据,需要定义数据到本体模型之间的语义映射,实现结构化知识抽取。对于半结构化数据,需要通过包装器的方法完成信息的抽取;最后综合利用知识推理、知识融合等技术对构建的知识图谱进行质量提升。
[0007]知识图谱技术与各行业的深度融合和已经成为一个重要趋势。虽然目前精细化工行业已获得和存储了大量工业数据,但是由于缺少智能化手段,这些工业数据没有创造出

1+1>2”的价值。通过知识图谱技术对数据进行提炼、萃取、关联、整合从而形成领域知识,并构建知识引擎从而实现知识应用自动化,已成为行业智能化日渐清晰的一条路径。

技术实现思路

[0008]本专利技术针对在环氧乙烷衍生品生产过程场景下的知识管理任务,提出了一种完整、准确、高效的精细化工领域知识图谱构建技术。
[0009]本专利技术的技术方案:
[0010]面向环氧乙烷衍生品生产过程的知识图谱构建方法,步骤如下:
[0011](1)梳理数据来源
[0012]本专利技术涵盖了环氧乙烷衍生品(EOD)生产过程的以下5种数据:一是EOD流程图和PID图纸,详细描述了EOD工艺流程以及监控样点对应流程中的位置;二是集散控制系统(DCS)中的过程测量数据,即监控样点,用于实时监控生产线的过程变量状态。EOD生产线存在三种类型过程测量数据:压力、温度、流速;三是DCS岗位运行记录表,记录了员工在岗对EOD生产线每一环节的监控及操作行为;四是EOD装置的工艺控制条件,描述了EOD生产线每一个环节、每一个设备的工艺控制范围;五是安全仪表系统(SIS)中的安全联锁规则,用于装置的安全联锁停车;六是危险与可操作性分析(HAZOP)报告,记录了EOD生产过程中异常行为的状态、引发条件、后果、处理方案以及预处理措施等内容;
[0013]针对以上6种数据,面向EOD生产过程的知识图谱的构建过程分为两个部分:本体层构建和数据层获取;采用“自顶向下”与“自底向上”相结合的方法构建本体层以及数据层;
[0014](2)基于本体论的知识建模
[0015]本体层的构建是抽象出EOD领域内的概念层次结构,定义每个概念的相关属性、关系以及公理准则。由于实际工厂中存在大量多模态数据,本专利技术中所涉及的数据源仅仅是EOD生产过程中所产生的一部分数据,因此提出了一种基于数据驱动的增量式本体建模方法来逐步构建本体层,完善概念层定义,保证了知识图谱的可扩展性。同时利用OWL语言对本体层进行知识表示和公理的设计。本专利技术将本体模型定义为:
[0016]O=<C,R,A,E,F>
[0017]其中,O:EOD本体模型;
[0018]C:本体或类,指某一类实体对象或概念的集合;
[0019]R:逻辑关系,指本体之间的语义关系;
[0020]A:属性关系,指本体具有的属性和属性值;
[0021]E:实体,指本体的实例化;
[0022]F:函数或公理,用于表示本体间复杂关系的描述逻辑;
[0023]基于上述本体模型的定义,构建以EOD生产过程为核心的面向设备结构域、装置结构域、系统结构域、风险原因域、风险类别域和维修措施域6个相互关联的域的本体;采用自顶向下的方法进行本体体系划分,并对本体进行属性关系的定义,搭建EOD知识图谱的本体层框架;同时,将EOD装置的工艺控制条件和SIS安全联锁规则以公理的形式表示,进而对相关实体属性进行约束,使得EOD本体模型具备推理机制;
[0024]由于构建知识图谱是一个迭代更新的过程,新知识的融合在填充数据层的同时也
会不断完善本体层框架;因此,通过对多源数据的知识抽取,采用自底向上的方式细化和补全本体层相关概念及属性;
[0025](3)基于DCS数据库的结构化知识抽取
[0026]DCS数据库将关于EOD生产线监控样点的历史数据存储在关系数据库中;对结构化类型数据进行知识抽取时,为了避免数据的重复冗余,采用虚拟知识图谱的方式对DCS数据库中的数据进行虚拟映射,从而支持以访问知识图谱的形式直接访问关系数据库;
[0027]本方法提出了一种新的映射机制实现结构化知识抽取;DCS数据库设计模式是用位号即监控样点作为关系表属性或字段;因此,首先根据关系数据库的设计模式在步骤(2)知识建模的基础上细化本体层相关概念及属性的定义,然后通过映射规则本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种面向环氧乙烷衍生品生产过程的知识图谱构建方法,其特征在于,步骤如下:(1)数据整理环氧乙烷衍生品EOD生产过程包括6类数据:1)EOD流程图和PID控制图,用于描述EOD工艺流程以及监控样点对应流程中的位置;2)集散控制系统DCS中的过程测量数据即监控样点,用于实时监控生产线的过程变量状态;其中EOD生产线存在三种类型过程测量数据:压力、温度、流速;3)DCS岗位运行记录表,用于记录员工在岗对EOD生产线每一环节的监控及操作行为;4)EOD装置的工艺控制条件,用于描述EOD生产线每一个环节、每一个设备的工艺控制范围;5)安全仪表系统SIS中的安全联锁规则,用于装置的安全联锁停车;6)危险与可操作性分析HAZOP报告,用于记录EOD生产过程中异常行为的状态、引发条件、后果、处理方案以及预处理措施;针对以上6种数据,面向EOD生产过程的知识图谱的构建过程分为两个部分:本体层构建和数据层获取;采用“自顶向下”与“自底向上”相结合的方法构建本体层以及数据层;(2)基于本体论的知识建模本体层的构建是抽象出EOD领域内的概念层次结构,定义每个概念的相关属性、关系以及公理准则;综合考虑EOD生产过程的数据类型及特点,提出一种基于数据驱动的增量式本体建模方法来逐步构建本体层,利用OWL语言对本体层进行知识表示和公理的设计;将本体模型定义为:O=<C,R,A,E,F>其中,O:EOD本体模型;C:本体或类,指某一类实体对象或概念的集合;R:逻辑关系,指本体之间的语义关系;A:属性关系,指本体具有的属性和属性值;E:实体,指本体的实例化;F:函数或公理,用于表示本体间复杂关系的描述逻辑;基于上述本体模型的定义,构建以EOD生产过程为核心的面向设备结构域、装置结构域、系统结构域、风险原因域、风险类别域和维修措施域6个相互关联的域的本体;采用自顶向下的方法进行本体体系划分,并对本体进行属性关系的定义,搭建EOD知识图谱的本体层框架;同时,将EOD装置的工艺控制条件和SIS安全联锁规则以公理的形式表示,进而对相关实体属性进行约束,使得EOD本体模型具备推理机制;由于构建知识图谱是一个迭代更新的过程,新知识的融合在填充数据层的同时也会不断完善本体层框架;因此,通过对多源数据的知识抽取,采用自底向上的方式细化和补全本体层相关概念及属性;(3)基于DCS数据库的结构化知识抽取DCS数据库将关于EOD生产线监控样点的历史数据存储在关系数据库中;对结构化类型数据进行知识抽取时,为了避免数据的重复冗余,采用虚拟知识图谱的方式对DCS数据库中的数据进行虚拟映射,从而支持以访问知识图谱的形式直接访问关系数据库;本方法提出了一种新的映射机制实现结构化知识抽取;DCS数据库设计模式是用位号即监控样点作为关系表属性或字段;因此,首先根据关系数据库的设计模式在步骤(2)知识建模的基础上细化本体层相关概念及属性的定义,然后通过映射规则实现三元组映射;基
于将监控样点的每一条历史数据实体化这一目的,设计了一种新的映射规则:将关系表中的属性定义为知识图谱中的本体,包括时间点本体和位号本体;而关系表中的属性值作为知识图谱中的实体存在,每一个位号实体具有时间戳属性,连接对应时间实体;如下:ex:EOD/DCS/{PI

3175}a:监控样点ex:EOD/DCS/{TIME}a:时间点ex:EOD/DCS/{PI

3175}TimeStamp{TIME}其中,ex代表EOD知识图谱的命名空间,将DCS数据库中的属性为PI

3175的每一条属性值作为实体链接到知识图谱监控样点本体上,属性为TIME的每一条属性值作为实体链接到时间点本体上,每一个监控样点实体与对应的时间实体通过TimeStamp对象属性相关联;除了DCS数据库中的生产数据外,DCS岗位运行记录表也是以结构化的形式存储在相应系统平台上,记录了员工在巡检过程中的监控和操作行为,这部分结构化数据通过相同的映射方式实现知识抽取;因此,在本体层定义了员工本体,该员工本...

【专利技术属性】
技术研发人员:段辰明杨鑫朱理徐喜荣魏小鹏尹子涛
申请(专利权)人:大连理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1