The present invention discloses a method and system for analysis of groundwater level based on event text data mining. The method includes: obtaining event data related to groundwater level change, extracting text data related to groundwater level changes, which include related to changes in groundwater level. The event label and the time corresponding to the event; arrange and align the event labels according to the time label; analyze the influence factors of the groundwater table events according to the event label. The invention integrates data related to groundwater level changes in multiple systems, integrates data resources, and analyses these data, helps to find the main events that affect the water level, and evaluates the effectiveness of groundwater protection measures and assists decision making.
【技术实现步骤摘要】
基于事件文本数据挖掘的地下水水位分析方法与系统
本专利技术涉及地下水水位分析分析领域,具体涉及一种基于从与地下水水位变化有关的新闻报道、公告等文本描述,及有关水文、气象数据,挖掘文本数据中的事件,进行地下水水位分析的方法和系统。
技术介绍
济南市是著名的泉城,现代地质工作者调查研究认为,济南泉水(地下水)来源于市区南部山区,大气降水渗漏地下,顺岩层倾斜方向北流,至城区遇到侵入岩体阻挡,承压水出露地表,形成泉水。近年来,由于用水量的增加,以及城市建设对地下水系的判断,济南泉水水位变化涨跌不定,每年总有一段时间,泉水水位会下降到危险警戒线。对泉水水位涨落的分析分析和预测一直是一个重要的问题;研究者传统上采用水文地质调查、气象条件分析等手段分析和预测泉水水位。然而,济南泉水水位变化的因素是复杂的,降水、气温、农业生产、地下市政施工等各种影响因素交互作用,都可能影响泉水的正常喷涌;从历史数据的分析看,泉水事件对泉水水位涨落具有规律性地影响。挖掘影响地下水水位变化的关键因素,是本领域技术人员目前面临的核心问题。影响泉水的诸多因素中,以非结构化的文本数据形态的存在比例较大,如新闻报道文本、施工公告文本、气象数据描述等都是以非结构化的文本形式存储,文本信息量较大,人为很难从中提取关键的信息。目前,以互联网为信息获取源,从中进行文本数据分析和挖掘十分常见,对网络产生的大规模真实语料库进行不同深度地加工,形成了一定规模的知识网络。因此,针对地下水位分析的具体情况,如何对上述“事件”文本数据进行分析,挖掘影响水位的关键因素,是本领域技术人员目前面临的技术问题。
技术实现思路
本专 ...
【技术保护点】
1.一种基于事件文本数据挖掘的地下水水位分析方法,其特征在于,包括以下步骤:获取与地下水水位变化相关的事件数据;对所述与地下水水位变化相关的文本数据进行标签提取,所述标签包括与地下水水位变化相关的事件标签以及所述事件对应的时间;根据时间标签将事件标签进行排列、对齐;根据事件标签进行地下水位事件影响因素分析。
【技术特征摘要】
1.一种基于事件文本数据挖掘的地下水水位分析方法,其特征在于,包括以下步骤:获取与地下水水位变化相关的事件数据;对所述与地下水水位变化相关的文本数据进行标签提取,所述标签包括与地下水水位变化相关的事件标签以及所述事件对应的时间;根据时间标签将事件标签进行排列、对齐;根据事件标签进行地下水位事件影响因素分析。2.如权利要求1所述的一种基于事件文本数据挖掘的地下水水位分析方法,其特征在于,所述与地下水水位变化相关的数据包括:从网络资源获取的与地下水水位变化相关的事件文本数据,包括农业灌溉数据、地下市政施工数据、违规抽取地下水、地下水回灌的描述性文本数据;水利部门公开发布的地下水水位观测数据;以及气象部门发布的气象观测数据。3.如权利要求1所述的一种基于事件文本数据挖掘的地下水水位分析方法,其特征在于,所述标签提取还包括提取描述所述事件程度的权重标签。4.如权利要求1所述的一种基于事件文本数据挖掘的地下水水位分析方法,其特征在于,所述地下水位事件影响因素分析包括地下水位事件关联分析、地下水位事件与地下水水位变化关联分析,和基于时间轴的地下水水位事件叠加影响分析。5.如权利要求4所述的一种基于事件文本数据挖掘的地下水水位分析方法,其特征在于,所述地下水位事件关联分析包括:对事件描述数据进行标签提取,获取事件标签序列;利用Apriori算法对事件标签系列进行频繁项集的提取。6.如权利要求4所述的一种基于事件文本数据挖掘的地下水水位分析方法,其特征在于,所述地下水位事件与地下水水...
【专利技术属性】
技术研发人员:刘广泽,杨泊宁,刘雨哲,刘淑然,张艺馨,
申请(专利权)人:刘广泽,杨泊宁,刘雨哲,刘淑然,张艺馨,
类型:发明
国别省市:山东,37
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。