基于规则检索和关键词检索的化学事故数据挖掘方法技术

技术编号:22974641 阅读:53 留言:0更新日期:2019-12-31 23:24
本发明专利技术提供了一种基于规则检索和关键词检索的化学事故数据挖掘方法,用户通过登录化学品事故案例库,进行数据预处理,使用逻辑树分析方法,对原始事故文本信息进行规则化处理,形成基础数据库;根据用户需求,使用多个搜索引擎对基础数据库进行检索,检索目标事故,生成事故中间表单;建立一个中间数据库,将事故中间表单存储在中间数据库中,对中间数据库的事故组进行处理和研究;进行统计数据,找出事故新动向和趋势,并完善数据库预设字段。该方法较好地解决了现有化学事故数据库的缺陷和化学事故规律、趋势研究的难点问题,可用于化学事故数据挖掘和事故统计分析,根据客户需求,高效完成各类专题分析报告。

Data mining method of chemical accident based on rule retrieval and keyword retrieval

【技术实现步骤摘要】
基于规则检索和关键词检索的化学事故数据挖掘方法
本专利技术涉及化学事故数据库挖掘领域,具体涉及一种基于规则检索和关键词检索的化学事故数据挖掘方法。
技术介绍
自20世纪70年代以来,世界范围内发生塞维索事故、博帕尔事故等多起重大化学事故,世界各国随后相继建立了化学事故数据库。如美国化学工程师协会过程安全中心的过程安全事故数据库(PSID)、欧盟的重大事故报告系统(MARS)、英国的重大危害事故数据系统(MHIDAS)、荷兰的失效与事故技术信息系统(FACTS)、德国中央重大事故通报系统(ZEMA)和法国的事故信息分析和研究数据库(ARIA),我国的国家安全生产监督管理总局的事故查询系统、化学品登记中心的化学品事故信息网和化学品安全协会的化学事故案例系统。通过研究最新的事故动态趋势,向有关企业发布事故警示和建议措施,并进行专题研究,化工企业可以根据专题研究的结论,制定长期的事故防范策略,对安全管理发挥了很大的作用。但是,目前国内外化学事故数据库存在诸多问题:现有化学品事故案例库不能满足不同用户的个性化需求;事故数据库不具备数据挖掘功能,多依靠人为进行统计分析,制约了对事故信息的挖掘和利用;数据处理耗时长;检索数据无法储存,不能从失败中学习;统计过程中出错率高等问题。
技术实现思路
针对现有的化学事故数据库存在的不能解决个性化需求,不能进行深度挖掘的问题,本专利技术提供了基于规则检索和关键词检索的化学事故数据挖掘方法。本专利技术采用以下的技术方案:一种基于自定义规则检索和关键词检索的化学事故数据挖掘方法,包括以下步骤:步骤1:数据预处理,用户登录化学品事故案例库,使用逻辑树分析方法,对原始事故文本信息进行规则处理,描述化学事故的机理和演变历程,并与事故的文本信息库关联在一起,形成基础数据库;步骤2:数据检索,根据用户需求,使用多个搜索引擎对基础数据库进行检索,检索目标事故,生成事故中间表单;步骤3:数据挖掘,建立一个中间数据库,将步骤2检索出的事故中间表单存储在中间数据库中,对中间数据库的事故组进行处理和研究;步骤4:统计结果输出,统计数据,找出事故新动向和趋势,并完善数据库预设字段。优选地,步骤2中的搜索引擎包括:基础字段检索:根据一个或多个基础字段进行一般检索和高级检索,筛选事故;自定义规则检索:根据用户需求,按照所建立的逻辑规则,使用自定义规则检索,在以逻辑树表述的事故库中,根据所输入词组、句子的相似度筛选出所需的事故组;自定义关键词检索:根据用户需求,使用自定义检索内容,作为关键词,在以文本表述的事故库中,反复筛选,找出所需的事故组。优选地,步骤3具体包括以下子步骤:步骤3.1:对通过预设字段筛选出的事故组,提取特征信息,输入到统计公式编辑器,使用预先编辑的公式,得出常规统计数据;步骤3.2:对通过自定义条件,通过自定义规则检索和关键词检索两种方式,对在文本库和逻辑树库中检索筛选出的事故组进行研究,提取特征字段,归纳关联关系,再运用小样本统计对关联关系进行验证;如果关联关系不成立,则通过总结失败经验,重新确定数据挖掘方向,重新定义检索词,在基础数据库存储的表单或中间数据库存储的事故中间表单中检索,重复步骤1至3的过程,反复迭代,直至找到关联关系;关联关系确定后,即可确定新的统计字段,返回基础数据库,筛选出事故组,提取特征字段,编辑统计公式,得出统计数据。本专利技术具有的有益效果是:本专利技术提供的基于自定义规则检索和关键词检索的化学事故数据挖掘方法,用户通过登录化学品事故案例库,通过数据预处理、数据检索、数据挖掘和统计结果输出,较好地解决了现有化学事故数据库的普遍缺陷和化学事故规律、趋势研究中的难点,可用于化学事故数据挖掘和事故统计分析,高效完成各类专题分析报告。按照本专利技术提出的化学事故数据挖掘方法,利用初步建立的石化企业事故案例库和化学品事故案例库对某公司2011-2017年度发生的集团公司级事故进行了统计分析,找出了该公司管理存在的深层次问题和事故动态趋势,完成多份专题报告,为该公司管理策略的制定提供了技术支持,发挥了决策参谋部的作用,为风险分析技术的应用提供了基础数据。附图说明图1为基于自定义规则检索和关键词检索的化学事故数据挖掘方法的流程图。图2为实施例1中2011年和2012年事故所属板块分布情况图。图3为实施例1中2012年国家经济发展水平与事故起数的关联关系图。具体实施方式下面结合附图和具体实施例对本专利技术的具体实施方式做进一步说明:结合图1,一种基于自定义规则检索和关键词检索的化学事故数据挖掘方法,化学品事故案例库包括数据预处理模块、搜索引擎、数据挖掘模块、数据输出模块,该方法具体包括以下步骤:步骤1:数据预处理,用户登录化学品事故案例库,使用逻辑树分析方法,对原始事故文本信息进行规则处理,描述化学事故的机理和演变历程,并与事故的文本信息库关联在一起,形成基础数据库;步骤2:数据检索,根据用户需求,使用多个搜索引擎对基础数据库进行检索,检索目标事故,生成事故中间表单;搜索引擎包括:基础字段检索:根据一个或多个基础字段进行一般检索和高级检索,筛选事故;自定义规则检索:根据用户需求,按照所建立的逻辑规则,使用自定义规则检索,在以逻辑树表述的事故库中,根据所输入词组、句子的相似度筛选出所需的事故组;自定义关键词检索:根据用户需求,使用自定义检索内容,作为关键词,在以文本表述的事故库中,反复筛选,找出所需的事故组。步骤3:数据挖掘,建立一个中间数据库,将步骤2搜索出的事故中间表单存储在中间数据库中,对中间数据库的事故组进行处理和研究;具体包括以下子步骤:步骤3.1:对通过预设字段筛选出的事故组,提取特征信息,输入到统计公式编辑器,使用预先编辑的公式,得出常规统计数据;步骤3.2:对通过自定义条件,通过自定义规则检索和关键词检索两种方式,对在文本库和逻辑树库中检索筛选出的事故组进行研究,提取特征字段,归纳关联关系,再运用小样本统计对关联关系进行验证;如果关联关系不成立,则通过总结失败经验,重新确定数据挖掘方向,重新定义检索词,在基础数据库存储的表单或中间数据库存储的事故中间表单中检索,重复步骤1至3的过程,反复迭代,直至找到关联关系;关联关系确定后,即可确定新的统计字段,返回基础数据库,筛选出事故组,提取特征字段,编辑统计公式,得出统计数据。步骤4:统计结果输出,统计数据,找出事故新动向和趋势,并完善数据库预设字段。实施例11、一般规律分析。根据一个或多个基础字段进行一般检索和高级检索,筛选事故,获取中间表单,并进行横纵统计。以2011年和2012年事故所属板块分布分析为例说明实现过程。首先,输入横坐标“事故所属板块”,输入纵坐标“事故起数”,再输入“2011年”、“2012年”本文档来自技高网...

【技术保护点】
1.一种基于自定义规则检索和关键词检索的化学事故数据挖掘方法,其特征在于,包括以下步骤:/n步骤1:数据预处理,用户登录化学品事故案例库,使用逻辑树分析方法,对原始事故文本信息进行规则处理,描述化学事故的机理和演变历程,并与事故的文本信息库关联在一起,形成基础数据库;/n步骤2:数据检索,根据用户需求,使用多个搜索引擎对基础数据库进行检索,检索目标事故,生成事故中间表单;/n步骤3:数据挖掘,建立一个中间数据库,将步骤2检索出的事故中间表单存储在中间数据库中,对中间数据库的事故组进行处理和研究;/n步骤4:统计结果输出,统计数据,找出事故新动向和趋势,并完善数据库预设字段。/n

【技术特征摘要】
1.一种基于自定义规则检索和关键词检索的化学事故数据挖掘方法,其特征在于,包括以下步骤:
步骤1:数据预处理,用户登录化学品事故案例库,使用逻辑树分析方法,对原始事故文本信息进行规则处理,描述化学事故的机理和演变历程,并与事故的文本信息库关联在一起,形成基础数据库;
步骤2:数据检索,根据用户需求,使用多个搜索引擎对基础数据库进行检索,检索目标事故,生成事故中间表单;
步骤3:数据挖掘,建立一个中间数据库,将步骤2检索出的事故中间表单存储在中间数据库中,对中间数据库的事故组进行处理和研究;
步骤4:统计结果输出,统计数据,找出事故新动向和趋势,并完善数据库预设字段。


2.根据权利要求1所述的一种基于自定义规则检索和关键词检索的化学事故数据挖掘方法,其特征在于,步骤2中的搜索引擎包括:
基础字段检索:根据一个或多个基础字段进行一般检索和高级检索,筛选事故;
自定义规则检索:根据用户需求,按照所建立的逻辑规则,使用自定义规则检索,在以逻辑树表述的事故库中,根据所输入词...

【专利技术属性】
技术研发人员:王延平姜春明
申请(专利权)人:中国石油化工股份有限公司中国石油化工股份有限公司青岛安全工程研究院
类型:发明
国别省市:山东;37

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1