当前位置: 首页 > 专利查询>刘广泽专利>正文

基于事件文本数据挖掘的地下水水位分析方法与系统技术方案

技术编号:18256449 阅读:99 留言:0更新日期:2018-06-20 08:15
本发明专利技术公开了一种基于事件文本数据挖掘的地下水水位分析方法和系统,所述方法包括:获取与地下水水位变化相关的事件数据;对所述与地下水水位变化相关的文本数据进行标签提取,所述标签包括与地下水水位变化相关的事件标签以及所述事件对应的时间;根据时间标签将事件标签进行排列、对齐;根据事件标签进行地下水位事件影响因素分析。本发明专利技术结合了多个系统中的与地下水水位变化有关的数据,整合了数据资源,且针对这些数据进行了关联分析,有助于找到影响水位的主要事件,并对地下水保护措施的成效进行评估,辅助决策。

Groundwater level analysis method and system based on event text data mining

The present invention discloses a method and system for analysis of groundwater level based on event text data mining. The method includes: obtaining event data related to groundwater level change, extracting text data related to groundwater level changes, which include related to changes in groundwater level. The event label and the time corresponding to the event; arrange and align the event labels according to the time label; analyze the influence factors of the groundwater table events according to the event label. The invention integrates data related to groundwater level changes in multiple systems, integrates data resources, and analyses these data, helps to find the main events that affect the water level, and evaluates the effectiveness of groundwater protection measures and assists decision making.

【技术实现步骤摘要】
基于事件文本数据挖掘的地下水水位分析方法与系统
本专利技术涉及地下水水位分析分析领域,具体涉及一种基于从与地下水水位变化有关的新闻报道、公告等文本描述,及有关水文、气象数据,挖掘文本数据中的事件,进行地下水水位分析的方法和系统。
技术介绍
济南市是著名的泉城,现代地质工作者调查研究认为,济南泉水(地下水)来源于市区南部山区,大气降水渗漏地下,顺岩层倾斜方向北流,至城区遇到侵入岩体阻挡,承压水出露地表,形成泉水。近年来,由于用水量的增加,以及城市建设对地下水系的判断,济南泉水水位变化涨跌不定,每年总有一段时间,泉水水位会下降到危险警戒线。对泉水水位涨落的分析分析和预测一直是一个重要的问题;研究者传统上采用水文地质调查、气象条件分析等手段分析和预测泉水水位。然而,济南泉水水位变化的因素是复杂的,降水、气温、农业生产、地下市政施工等各种影响因素交互作用,都可能影响泉水的正常喷涌;从历史数据的分析看,泉水事件对泉水水位涨落具有规律性地影响。挖掘影响地下水水位变化的关键因素,是本领域技术人员目前面临的核心问题。影响泉水的诸多因素中,以非结构化的文本数据形态的存在比例较大,如新闻报道文本、施工公告文本、气象数据描述等都是以非结构化的文本形式存储,文本信息量较大,人为很难从中提取关键的信息。目前,以互联网为信息获取源,从中进行文本数据分析和挖掘十分常见,对网络产生的大规模真实语料库进行不同深度地加工,形成了一定规模的知识网络。因此,针对地下水位分析的具体情况,如何对上述“事件”文本数据进行分析,挖掘影响水位的关键因素,是本领域技术人员目前面临的技术问题。
技术实现思路
本专利技术的目的是为了克服地下水监控预测中与水位相关的原始数据分散、非结构化数据比例大,难以直观发现规律的问题,提出了一种基于事件文本数据挖掘的地下水水位分析的路线。为实现上述目的,本专利技术采用如下技术方案:一种基于事件文本数据挖掘的地下水水位分析方法,包括以下步骤:获取与地下水水位变化相关的事件数据;对所述与地下水水位变化相关的文本数据进行标签提取,所述标签包括与地下水水位变化相关的事件标签以及所述事件对应的时间;根据时间标签将事件标签进行排列、对齐;根据事件标签进行地下水位事件影响因素分析。进一步地,所述与地下水水位变化相关的数据包括:从网络资源获取的与地下水水位变化相关的事件文本数据,包括农业灌溉数据、地下市政施工数据、违规抽取地下水、地下水回灌的描述性文本数据;水利部门公开发布的地下水水位观测数据;以及气象部门发布的气象观测数据。进一步地,所述标签提取还包括提取描述所述事件程度的权重标签。进一步地,所述地下水位事件影响因素分析包括地下水位事件关联分析、地下水位事件与地下水水位变化关联分析,和基于时间轴的地下水水位事件叠加影响分析。进一步地,所述地下水位事件关联分析包括:对事件描述数据进行标签提取,获取事件标签序列;利用Apriori算法对事件标签系列进行频繁项集的提取。进一步地,所述地下水位事件与地下水水位变化关联分析包括:将水位观测数据转化为水位涨落数据;将水位涨落数据按照时间标签与影响水位事件排列、对齐;采用相关性分析方法分析事件与地下水水位变化的关联;其中,水位涨落数据有以下三种计算方法:当天水位减去前一天水位的水位差;固定时间窗口起始时间的水位差;根据事件持续时间的可变窗口涨跌描述:根据事件类别设定不同的涨跌时间窗口,计算该时间窗口起始时间的水位差。进一步地,所述基于时间轴的地下水水位事件叠加影响分析包括:计算每个事件的事件作用时间窗口,将作用时间窗口重叠的记为叠加事件;对于叠加事件中的每个事件,基于历史数据统计每个事件在不重叠情况下的权重数据和对水位的影响数据;根据权重数据从历史数据中分别匹配各事件对水位的独立影响情况;对各独立影响情况进行叠加计算,并根据实际水位涨落情况进行修正。进一步地,所述方法还包括:对地下水水位分析结果进行可视化,辅助地下水分析和管理决策。根据本专利技术的第二目的,本专利技术还提供了一种基于事件文本数据挖掘的地下水水位分析系统,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现所述的地下水水位分析方法。根据本专利技术的第三目的,本专利技术还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时执行实现所述的基于事件文本数据挖掘的地下水水位分析方法。本专利技术的有益效果1、本专利技术克服了影响地下水位变化的因素复杂,数据分散的问题,将多个系统中的数据进行关联分析,即,将水利部门公开发布的准确的地下水水位观测数据、气象部门公开发布的准确的气象观测数据、以及通过互联网等提取的与水位变化有关的大量文本描述数据综合在一起,共同分析各种事件之间的关联关系,找到影响地下水水位变化的各种潜在因素,并追溯到影响水位变化的核心因素,辅助水利部门和专家进行综合分析。2、本专利技术分析过程中为了处理大量非结构化的文本数据,利用了关键词提取技术,从影响地下水位变化的事件数据中提取关键词,构建水位事件词典,利于进一步建立地下水水位分析知识图谱。3、本专利技术将影响地下水位变化的事件数据文本按照事件发生时间转化为事件序列,分析事件现象特征之间的关联关系,通过挖掘和分析事件之间的共现模式、叠加影响,有助于分析各种事件的相互影响;通过挖掘不同事件与同一时刻及随后某时间窗口水位涨跌的关系,有助于找到影响水位的主要事件,并对地下水保护措施的成效进行评估,辅助决策。附图说明构成本申请的一部分的说明书附图用来提供对本申请的进一步理解,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。图1为本专利技术方法流程示意图。图2为本专利技术系统架构结构图。图3为地下水位影响事件与地下水水位变化可视化示意图。具体实施方式应该指出,以下详细说明都是示例性的,旨在对本申请提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本申请所属
的普通技术人员通常理解的相同含义。需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本申请的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。本专利技术的最佳实施方式是结合地下水水位观测系统、地下水位水位信息管理系统,作为水利管理部门、研究机构的辅助分析工具,通过本系统提供的分析模型和挖掘方法调用接口使用本专利技术系统。实施中,需深入了解地下水水位信息管理系统中的有关地下水水位观测、管理等相关子系统,依托本专利技术的分析流程和方法,对原始数据进行分析,进而发现规律性的知识,辅助地下水水位管理与调控决策。本专利技术的基本思想为:通过公开的信息渠道搜集各种与地下水有关的文本信息,如降水、农业生产、地下市政施工等文本数据,进行文本分析,过滤掉无关信息,提取出与地下水水位变化有密切关系的关键词;同时,与水利部门提供的准确的地下水水位数据相结合,按照时间轴对齐,将这些关键词放置在地下水水位变化的时间轴上,形成一个个影响地下水位变化的“事件”;继而,从海本文档来自技高网
...
基于事件文本数据挖掘的地下水水位分析方法与系统

【技术保护点】
1.一种基于事件文本数据挖掘的地下水水位分析方法,其特征在于,包括以下步骤:获取与地下水水位变化相关的事件数据;对所述与地下水水位变化相关的文本数据进行标签提取,所述标签包括与地下水水位变化相关的事件标签以及所述事件对应的时间;根据时间标签将事件标签进行排列、对齐;根据事件标签进行地下水位事件影响因素分析。

【技术特征摘要】
1.一种基于事件文本数据挖掘的地下水水位分析方法,其特征在于,包括以下步骤:获取与地下水水位变化相关的事件数据;对所述与地下水水位变化相关的文本数据进行标签提取,所述标签包括与地下水水位变化相关的事件标签以及所述事件对应的时间;根据时间标签将事件标签进行排列、对齐;根据事件标签进行地下水位事件影响因素分析。2.如权利要求1所述的一种基于事件文本数据挖掘的地下水水位分析方法,其特征在于,所述与地下水水位变化相关的数据包括:从网络资源获取的与地下水水位变化相关的事件文本数据,包括农业灌溉数据、地下市政施工数据、违规抽取地下水、地下水回灌的描述性文本数据;水利部门公开发布的地下水水位观测数据;以及气象部门发布的气象观测数据。3.如权利要求1所述的一种基于事件文本数据挖掘的地下水水位分析方法,其特征在于,所述标签提取还包括提取描述所述事件程度的权重标签。4.如权利要求1所述的一种基于事件文本数据挖掘的地下水水位分析方法,其特征在于,所述地下水位事件影响因素分析包括地下水位事件关联分析、地下水位事件与地下水水位变化关联分析,和基于时间轴的地下水水位事件叠加影响分析。5.如权利要求4所述的一种基于事件文本数据挖掘的地下水水位分析方法,其特征在于,所述地下水位事件关联分析包括:对事件描述数据进行标签提取,获取事件标签序列;利用Apriori算法对事件标签系列进行频繁项集的提取。6.如权利要求4所述的一种基于事件文本数据挖掘的地下水水位分析方法,其特征在于,所述地下水位事件与地下水水...

【专利技术属性】
技术研发人员:刘广泽杨泊宁刘雨哲刘淑然张艺馨
申请(专利权)人:刘广泽杨泊宁刘雨哲刘淑然张艺馨
类型:发明
国别省市:山东,37

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1