当前位置: 首页 > 专利查询>河海大学专利>正文

基于前期气象因子与数据挖掘技术的中长期径流预报方法技术

技术编号:16456774 阅读:87 留言:0更新日期:2017-10-25 21:03
本发明专利技术公开了基于前期气象因子与数据挖掘技术的中长期径流预报方法,方法包括:1,确定影响中长期径流的各类前期初选预报因子,计算所有类别初选预报因子序列与历史预报对象序列的相关系数,再根据逐步回归方法,提取出相关性高、方差贡献大的因子作为最终预报因子;2,构建多种基于数据挖掘技术的预报模型,将历史最终预报因子序列与预报对象序列作为不同预报模型的输入与输出,训练各预报模型;3,依据以上多种预报模型分别进行径流预报,利用最优组合赋权理论,综合集成多模型预报结果。本发明专利技术方法可广泛应用于预见期为旬、月、季、年以及多年尺度的水资源预测。

Mid long term runoff forecasting method based on antecedent meteorological factors and data mining technology

The present invention discloses the mining technology of meteorological factors and data based on the long-term runoff forecast method. The method comprises the following steps: 1, determine the types of pre primary forecasting factors affecting the long-term runoff, correlation calculation all categories of primary predictors and historical sequence forecast object sequence number, then according to the stepwise regression method, extract the high correlation and the variance contribution factor as the final prediction factor; 2, construct a variety of forecasting model based on data mining technology, the history of the final prediction factor sequence and forecast object sequence as the input and output of different forecasting models, the training of the forecasting model; 3, according to above various forecast runoff forecasting model respectively, using the optimal combination weighting theory. Integrated multi model prediction results. The method of the invention can be widely applied to forecast the water resources in the forecast period of ten days, months, seasons, years and years.

【技术实现步骤摘要】
基于前期气象因子与数据挖掘技术的中长期径流预报方法
本专利技术涉及水文预报
,具体涉及一种与前期气象因子耦合的基于数据挖掘技术的中长期径流预报方法。
技术介绍
中长期径流预报是水利水电工程设计、施工和运行管理的重要依据,是实现水资源科学调配、提高水资源利用效率的基础性关键技术,对水资源的调度管理和优化配置具有重要的支撑意义。由于长期的水文要素受到气候、下垫面、人类活动等诸多因素的综合影响和制约,其变化情况错综复杂,且具有较大的时间、空间上的不确定性、不稳定性,故对于一个具体的径流序列,往往从其周期性、趋势性、随机性、区域性、跳跃性等多方面角度出发分析,通过不断尝试、不断验证等步骤,找到适合的预报因子和预报模型。目前,在中长期方面的预报理论与方法上的研究突破较少,且往往缺少物理成因的综合考虑。整体而言,中长期径流预报研究仍处于起步阶段,相对于短期径流预报(实时洪水预报)而言,发展较缓慢,且落后于生产实际的要求。目前,中长期径流预报一般分为预报因子识别、预报模型构建和预报模型应用三个方面。由于其特殊性与困难性,预报方法多以统计方法为主,如时间序列模型、回归分析模型、模糊分析模型、灰色系统模型等。现有的这些方法主要存在着两大问题;(1)预报因子的识别缺乏物理背景,且甄选方法与结果的不确定性较大。(2)预报模型较为单一,预报结果的不稳定性较高。近年来,随着新数学方法的涌现与计算机技术的不断提高,大数据挖掘技术得到了快速发展,并对生产生活产生了深远影响。水文是一个数据驱动型的行业,随着水文数据规模的指数型扩增,其潜在的应用价值不断凸显。如何从水文大数据中挖掘出重要价值,是发展中长期径流预报理论与方法、解决中长期径流预报技术瓶颈的关键与重要课题。
技术实现思路
本专利技术的目的在于克服现有技术中的不足,提供了一种基于前期气象因子与数据挖掘技术的中长期径流预报方法,有效地解决了预报因子与预报模型的不确定性及不稳定性的问题。为解决上述技术问题,本专利技术提供了一种基于前期气象因子与数据挖掘技术的中长期径流预报方法,其特征是,包括以下步骤:步骤S1,确定影响中长期径流的各类前期初选预报因子,计算所有类别初选预报因子序列与历史预报对象序列的皮尔逊相关系数,再根据逐步回归方法,提取出相关性高、方差贡献大的因子作为最终预报因子;步骤S2,构建多种基于数据挖掘技术的预报模型,将历史最终预报因子序列与预报对象序列作为不同预报模型的输入与输出,训练各预报模型;步骤S3,依据以上多种预报模型分别进行径流预报,利用最优组合赋权理论,综合集成多模型预报结果。进一步的,前期初选预报因子包括74项环流指数、北太平洋海温场和500hPa高度场三类数据。进一步的,初选预报因子序列包括不同种类、不同时间提前量、不同经纬度的因子数值。进一步的,步骤S1中,提取最终预报因子的具体过程为:先计算所有类别初选预报因子序列与历史预报对象序列的皮尔逊相关系数,从各类气象因素的所有因子中挑选出与预报对象相关性较高的因子,再根据逐步回归方法,在挑选出的因子中计算影响预报对象序列最大的因子,作为最终预报因子。进一步的,预报模型包括人工神经网络、支持向量机和随机森林三种。进一步的,步骤S3中,获取最终预报结果的过程为:根据各预报模型在各月的模拟及实测系列,通过博弈论最优赋权方法确定各预报模型在集成模型中每月的权重系数;基于各个预报模型在各月的权重,对各模型的模拟值进行加权集成,获得多模型集成的预报值。与现有技术相比,本专利技术所达到的有益效果是:(1)在因子识别阶段,根据影响中长期径流情势的前期气象特征出发,根据预报因子与预报对象之间的物理联系,选择多尺度、多层次的气象要素作为初选预报因子。再根据统计原理,计算、筛选出相关性高、彼此独立性强的气象要素作为最终预报因子。(2)在模型构建阶段,利用目前发展迅速的大数据挖掘技术中的人工神经网络、支持向量机和随机森林三种智能算法模型,通过大量计算、不断分析海量历史气象-水文数据的潜在关系,构建适合旬-月及以上时间尺度的中长期径流预报模型。(3)在结果综合阶段,运用最优组合赋权理论,通过分析不同模型在不同模拟期内的模拟性能从而动态赋权,获得最佳综合预报结果。(4)本专利技术从气象-水文耦合角度出发,提供了一种基于前期气象因子与大数据挖掘技术的中长期径流预报方法,有效解决了目前中长期径流预报中预报时效性不长、预报精度不高等问题,可广泛应用于预见期为旬、月、季、年以及多年尺度的水资源预测中,为实现水资源的科学调配与高效利用提供了科学依据,对水资源的调度管理和优化配置具有重要的支撑意义。附图说明图1是本专利技术方法的流程图。具体实施方式下面结合附图对本专利技术作进一步描述。以下实施例仅用于更加清楚地说明本专利技术的技术方案,而不能以此来限制本专利技术的保护范围。名词解释:前期气象特征指所有的影响径流的因子,气象要素是初选预报因子,气象因子是最终通过某种数学方法计算得到的最终预报因子。中长期径流预报中中长期的定义是旬月及以上的时间尺度。如图1所示,本专利技术的一种基于前期气象因子与数据挖掘技术的中长期径流预报方法,包括以下步骤:步骤S1,确定影响中长期径流的各类前期初选预报因子,计算所有类别初选预报因子序列与历史预报对象序列的皮尔逊相关系数,从各类气象因素的所有因子中挑选出与预报对象相关性较高的因子,再根据逐步回归方法,在挑选出的因子中计算影响预报对象序列最大的因子,作为最终预报因子。根据影响中长期径流情势的前期气象特征(指所有的影响径流的因子)出发,根据我国各个流域的地理位置、水系分布等特征,一般选用74项环流指数、北太平洋海温场和500hPa高度场三类数据作为前期气象要素(也可称为前期初选预报因子)。其中,74项环流指数下载于中国气象数据网,空间网格分辨率依照国家气候中心气候系统诊断预测室数据集格式,时间分辨率为逐小时到逐月不同时间尺度。北太平洋海温场数据下载于美国国家环境预报中心,空间网格分辨率为0.25°×0.25°到5°×5°,时间分辨率为逐小时到逐月不同时间尺度。500hPa高度场数据下载于美国国家环境预报中心,空间网格分辨率为0.25°×0.25°到5°×5°,时间分辨率为逐小时到逐月。根据预报要求的不同步长与时效,选择相应气象要素的不同时间提前量,此不同时间提前量是指,预报对象为要预报今年7月的月平均径流量,若用6月的气象要素数据来预报则时间提前量为一个月,若用5月的气象要素数据来预报则时间提前量为两个月,依次类推。根据预报流域的不同面积与位置,选择相应空间分辨率的网格数据,此选择标准通常依据经验而定,一般来讲,100平方公里的小流域采用1°×1°的数据网格。由于74项环流指数有不同种类、不同时间提前量、不同经纬度的初选预报因子,北太平洋海温场和500hPa高度场数据有不同时间提前量、不同经纬度的初选预报因子。因此预报中长期径流可选择不同种类、不同时间提前量、不同经纬度的因子序列,具有多尺度、多层次特征,可以提高预报的准确性。从三类气象要素中提取最终预报因子的过程为:比如要预报2017.7月的月平均径流,在预报时,是先建立预报对象序列和预报因子序列。预报对象序列就是历史的径流数据,可从水文年鉴、水文测站、水文局获得。如预报对象序列为2000.本文档来自技高网
...
基于前期气象因子与数据挖掘技术的中长期径流预报方法

【技术保护点】
基于前期气象因子与数据挖掘技术的中长期径流预报方法,其特征是,包括以下步骤:步骤S1,确定影响中长期径流的各类前期初选预报因子,计算所有类别初选预报因子序列与历史预报对象序列的皮尔逊相关系数,再根据逐步回归方法,提取出相关性高、方差贡献大的因子作为最终预报因子;步骤S2,构建多种基于数据挖掘技术的预报模型,将历史最终预报因子序列与预报对象序列作为不同预报模型的输入与输出,训练各预报模型;步骤S3,依据以上多种预报模型分别进行径流预报,利用最优组合赋权理论,综合集成多模型预报结果。

【技术特征摘要】
1.基于前期气象因子与数据挖掘技术的中长期径流预报方法,其特征是,包括以下步骤:步骤S1,确定影响中长期径流的各类前期初选预报因子,计算所有类别初选预报因子序列与历史预报对象序列的皮尔逊相关系数,再根据逐步回归方法,提取出相关性高、方差贡献大的因子作为最终预报因子;步骤S2,构建多种基于数据挖掘技术的预报模型,将历史最终预报因子序列与预报对象序列作为不同预报模型的输入与输出,训练各预报模型;步骤S3,依据以上多种预报模型分别进行径流预报,利用最优组合赋权理论,综合集成多模型预报结果。2.根据权利要求1所述的基于前期气象因子与数据挖掘技术的中长期径流预报方法,其特征是,前期初选预报因子包括74项环流指数、北太平洋海温场和500hPa高度场三类数据。3.根据权利要求1所述的基于前期气象因子与数据挖掘技术的中长期径流预报方法,其特征是,初选预报因子序列包括不同种类、不同时间提前量、不同经纬度的...

【专利技术属性】
技术研发人员:梁忠民郦于杰唐甜甜王军杨靖刘甜
申请(专利权)人:河海大学
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1