【技术实现步骤摘要】
基于大数据和遗传规划的泥石流多因子融合预测系统
[0001]本专利技术涉及泥石流预测
,具体涉及基于大数据和遗传规划的泥石流多因子融合预测系统
。
技术介绍
[0002]泥石流是山区多发频发突发的地质灾害之一,常给人民生命财产安全带来极大威胁,泥石流预警作为泥石流防治的有效手段,一直是研究机构和企业关注的焦点问题
。
多年来,针对降水在泥石流暴发中的触发作用公开了大量研究成果及工程实践经验
。
[0003]有采用线性拟合
、Logistics
回归等方法建立了前期有效雨量
、
小时雨强
、
过程雨量等降雨指标的泥石流灾害临界预警表达式;也有采用人工神经网络建立了泥石流非线性预警模型,但预测精度在很大程度上依赖于使用者的经验与水平,限制了模型推广和应用;且对泥石流进行预测需要获取天气数据,如降雨量
、
土壤含水量等数据来源于全球预报系统,但该网站并未提供数据的直接下载接口,从欧洲航天局网站下载数据高程文件,需要用户登录网站,不方便自动化下载;且对于大数据量的文件的下载,现有系统下载速度不够高效,会对采集的数据的时效性有所影响
。
技术实现思路
[0004]本专利技术的目的是提供基于大数据和遗传规划的泥石流多因子融合预测系统,以解决现有技术中的上述不足之处
。
[0005]为了实现上述目的,本专利技术提供如下技术方案:基于大数据和遗传规划的泥石流多因子融合预测系统,包括大数 ...
【技术保护点】
【技术特征摘要】
1.
基于大数据和遗传规划的泥石流多因子融合预测系统,其特征在于:包括大数据平台和遗传规划模型单元,所述大数据平台包括数据收集单元,其用于针对多种不同数据源,采取不同的采集
、
下载
、
预处理;数据存储单元,其用于采用分布式文件系统
HDFS、
分布式数据库
Hbase
以及数据仓库
Hive
相结合的方式对不同的数据进行储存;
Yarn
分布式管理系统,其用于管理集群利用率
、
资源统一和数据共享;协调单元,其用于进行应用程序协调,封装复杂易出错的关键服务,为用户提供稳定的系统;数据计算分析使用内存计算单元,其用于使用
Spark
的内存计算框架和
Hadoop
的
MapReduce
计算模型进行分析计算;遗传规划模型单元包括样本库模块,其用于以地区为限制,建立历史泥石流样本库,所述样本库样本分为学习样本和测试样本;算法模型模块,其用于以学习样本为基础,根据泥石流影响因子的特征,建立泥石流综合预测模型;验证模块,其用于将测试样本带入建好的模型,得到预测的临界降雨指数,并根据其进行预警
。2.
根据权利要求1所述的基于大数据和遗传规划的泥石流多因子融合预测系统,其特征在于:所述数据收集单元针对不同数据源,采取不同的采集方法,包括采取爬虫
、
程序模拟,针对大数据量文件采集,采用分解方法和并行处理方法进行下载,针对原始数据格式复杂多样,采用不同的预处理方法
。3.
根据权利要求1所述的基于大数据和遗传规划的泥石流多因子融合预测系统,其特征在于:所述分布式文件系统
HDFS
为分布式数据库
HBase
提供底层存储支持,分布式文件系统
HDFS
用于保存顺序读取的海量数据,分布式数据库
HBase
用于存储快速随机访问数据;所述协调单元采用
Zookeeper。4.
根据权利要求1所述的基于大数据和遗传规划的泥石流多因子融合预测系统,其特征在于:所述算法模型模块采用非线性适应度函数,具体是计算预测值与实际值之间误差减去整体预测值与实际值的平均绝对误差,最后得到的值为适应度,计算公式如下:其中...
【专利技术属性】
技术研发人员:孙浪,顾璇,于超,毕致远,张福清,
申请(专利权)人:安徽中科国金智能科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。