System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术属于水文技术分析,尤其涉及一种基于机器学习的cmip日尺度降水数据模式集合生成方法。
技术介绍
1、全球变化和气候变化近年来已经成为全世界最关心的话题之一,ipcc第六次评估报告中指出,随着未来全球变暖进一步加剧降水的时空分布格局以及极端降水事件将会发生显著变化。国际耦合模式比较计划(coupled model intercomparison project phase,cmip)是研究未来气候变化的重要工具,然而不同机构模式结果存在较大差异性,在应用中需进行模式集合来订正单个模式的偏差。现有研究多以多模式平均方法进行模式集合,不同模式之间的模拟结果在不同时间不同空间上的模拟效果可能存在较大差异,这一点在降水数据中体现的尤为显著例如部分模式在汛期模拟较好,而在枯水期模拟较差;部分模式在山区模拟较好而在平原区模拟较差。多模式平均方法虽方法简便可以减少部分偏差但不能有效提高集合结果的模拟精度,且未考虑不同模式的空间差异性。同时在日尺度上不同模式的有雨日和有雨日各不相同,模式平均方法将导致每日都存在不同程度降水,不能区分有雨和无雨情况。
技术实现思路
1、本专利技术的目的在于提供一种基于机器学习的cmip日尺度降水数据模式集合生成方法,能够生成相对于多模式平均方法模拟精度更高且具有时空差异性的cmip日尺度降水数据集。
2、为实现上述目的,本专利技术提供如下技术方案:
3、本专利技术公开一种基于机器学习的cmip日尺度降水数据模式集合生成方法,所述方法包
4、步骤1、收集数据:收集研究区域历史cmip多模式日尺度降水数据以及日尺度观测降水数据,并将不同空间分辨率的降水数据插值到统一空间分辨率;
5、步骤2、构建训练样本:根据历史观测降水数据将cmip多模式降水数据进行偏差校正,并对降水数据采样到月尺度;基于月尺度观测降水数据逐栅格提取降水年内分布特征;对于每个栅格,将其视为中心栅格,计算中心栅格与其周边栅格的相关性,筛选相关系数大于0.95的周边栅格;将中心栅格与筛选后周边栅格的cmip多模式月尺度降水数据和降水年内分布特征作为训练样本特征,对应月尺度观测降水数据作为训练样本标签,构建训练样本;
6、步骤3、模型训练:以步骤2构建的训练样本逐栅格训练随机森林回归模型,基于训练后的模型,计算得到未来不同情景下月尺度降水量;以历史日尺度有无雨数据作为训练样本逐栅格训练随机森林分类模型,计算得到未来不同情景下逐日有无雨情况数据;
7、步骤4、生成日尺度降水数据模式集合:基于未来不同情景下逐日有无雨情况数据,计算每个有雨日的月内降水权重;基于未来不同情景下月尺度降水量以及有雨日的月内降水权重,生成未来不同情景下日尺度降水量,进而得到日尺度降水数据模式集合。
8、进一步的是,步骤1中所述收集研究区域的历史cmip多模式日尺度降水数据以及日尺度观测降水数据,并将不同空间分辨率的降水数据插值到统一空间分辨率具体为:收集的数据包括cmip6多模式降水数据以及cn05.1栅格观测降水数据;
9、所述cmip6多模式降水数据从网络上获取,采用双线性插值法将所述cmip6多模式降水数据插值到统一空间分辨率0.25°,双线性插值法的公式为:
10、
11、式中:f(x,y)为待插值坐标点及其对应值;q11(x1,y1),q21(x2,y1),q21(x2,y1),q12(x1,y2)分别为四个已知点坐标及其对应值;
12、所述cn05.1栅格观测降水数据是国家气象信息中心有2400余个国家级台站采用薄盘样条函数法和和角距权重方法分别插值叠加后得到的空间分辨率为0.25°的逐日观测数据。
13、进一步的是,步骤2中所述根据历史观测降水数据将cmip多模式降水数据进行偏差校正具体为:采用转移累积概率分步法来进行偏差校正,假定在历史时段存在一个转移函数t,能够将历史观测降水数据的累积概率分布函数与历史cmip多模式降水数据的累积概率分布函数建立关系,如下式:
14、t(fmh(x))=foh(x) (2)
15、首先定义u=fmh(x),则u的取值范围在[0,1],将x带入方程,则得到转移函数t为:
16、
17、假定该转移函数在未来时段仍然成立,订正后的结果即:
18、t(fmh(x))=fof(x) (4)
19、
20、式中:foh(x)为历史观测降水数据累积概率分布函数;fmh(x)为历史cmip多模式降水数据累积概率分布函数;fof(x)为未来观测降水累积概率分布函数;fcf(x)为偏差校正后未来cmip多模式降水数据累积概率分布函数。
21、进一步的是,步骤2中所述基于月尺度观测降水数据逐栅格提取降水年内分布特征具体为:给定月尺度观测降水数据pm(x,y),其中m表示月份m=1,2,…,12,(x,y)表示栅格位置,对于每个栅格(x,y),计算多年平均逐月降水量以判定降水最大月份,标注年内分布特征;定义特征标注矩阵t(x,y),其大小与栅格数据相同;根据以下规则逐栅格提取并标注降水年内分布特征:将降水最大月份标注特征为4,第二、第三月份标注特征为3,第四、第五月份标注特征为2,其余月份标注特征为0;
22、多年平均逐月降水量计算公式为:
23、
24、式中:表示第n年第m月的降水量;n为观测年数。
25、进一步的是,步骤2中所述计算中心栅格与其周边栅格的相关性具体为:对于每个栅格(x,y),将其视为中心栅格,计算其与周边8个栅格的相关性,相关性计算采用皮尔逊相关系数pcc,计算公式为:
26、
27、式中:x为中心栅格月尺度降水数据;y为周边栅格月尺度降水数据。
28、进一步的是,步骤3中所述以步骤2构建的训练样本逐栅格训练随机森林回归模型,基于训练后的模型,计算得到未来不同情景下月尺度降水量具体为:以步骤2中构建的训练样本,将中心栅格与筛选后周边栅格的cmip多模式月尺度降水数据和降水年内分布特征作为训练样本特征,对应月尺度观测降水数据为训练样本标签,逐栅格训练随机森林回归模型,采用网格搜索算法进行超参数优选;
29、随机森林回归模型为:
30、
31、式中:表示随机森林模型在栅格(x,y)的预测值;fk(x,y;θ)表示第k个决策树模型;θ表示模型参数集;
32、网格搜索算法公式为:
33、
34、式中:θ*为最佳超参数组合;gridnum为栅格总数;表示模型在栅格(x,y)的预测值;pobs(x,y)表示栅格(x,y)的实际观测值;
35、基于训练后的每个栅格的随机森林回归模型,以偏差校正后未来cmip多模式月尺度降水数据和年内分布特征为输入,计算得本文档来自技高网...
【技术保护点】
1.一种基于机器学习的CMIP日尺度降水数据模式集合生成方法,其特征在于,所述方法包括以下步骤:
2.根据权利要求1所述的一种基于机器学习的CMIP日尺度降水数据模式集合生成方法,其特征在于,步骤1中所述收集研究区域的历史CMIP多模式日尺度降水数据以及日尺度观测降水数据,并将不同空间分辨率的降水数据插值到统一空间分辨率具体为:收集的数据包括CMIP6多模式降水数据以及CN05.1栅格观测降水数据;
3.根据权利要求1所述的一种基于机器学习的CMIP日尺度降水数据模式集合生成方法,其特征在于,步骤2中所述根据历史观测降水数据将CMIP多模式降水数据进行偏差校正具体为:采用转移累积概率分步法来进行偏差校正,假定在历史时段存在一个转移函数T,能够将历史观测降水数据的累积概率分布函数与历史CMIP多模式降水数据的累积概率分布函数建立关系,如下式:
4.根据权利要求1所述的一种基于机器学习的CMIP日尺度降水数据模式集合生成方法,其特征在于,步骤2中所述基于月尺度观测降水数据逐栅格提取降水年内分布特征具体为:给定月尺度观测降水数据Pm(x,y),其中m
5.根据权利要求1所述的一种基于机器学习的CMIP日尺度降水数据模式集合生成方法,其特征在于,步骤2中所述计算中心栅格与其周边栅格的相关性具体为:对于每个栅格(x,y),将其视为中心栅格,计算其与周边8个栅格的相关性,相关性计算采用皮尔逊相关系数PCC,计算公式为:
6.根据权利要求1所述的一种基于机器学习的CMIP日尺度降水数据模式集合生成方法,其特征在于,步骤3中所述以步骤2构建的训练样本逐栅格训练随机森林回归模型,基于训练后的模型,计算得到未来不同情景下月尺度降水量具体为:以步骤2中构建的训练样本,将中心栅格与筛选后周边栅格的CMIP多模式月尺度降水数据和降水年内分布特征作为训练样本特征,对应月尺度观测降水数据为训练样本标签,逐栅格训练随机森林回归模型,采用网格搜索算法进行超参数优选;
7.根据权利要求1所述的一种基于机器学习的CMIP日尺度降水数据模式集合生成方法,其特征在于,步骤3中所述以历史日尺度有无雨数据作为训练样本逐栅格训练随机森林分类模型,计算得到未来不同情景下逐日有无雨情况数据具体为:将历史CMIP多模式日尺度降水数据和日尺度观测降水数据二分类为有雨、无雨两种类型,分别标注为0,1;以多模式日尺度降水数据有雨无雨为训练样本特征,以观测降水数据有雨无雨为训练样本标签,逐栅格训练随机森林分类模型,采用网格搜索算法进行超参数优选;
8.根据权利要求1所述的一种基于机器学习的CMIP日尺度降水数据模式集合生成方法,其特征在于,步骤4中所述基于未来不同情景下逐日有无雨情况数据,计算每个有雨日的月内降水权重具体为:基于计算得到的未来不同情景下逐日有无雨情况数据,以多模式平均方法计算有雨日的当日降水量,并计算每个有雨日的月内降水权重;
...【技术特征摘要】
1.一种基于机器学习的cmip日尺度降水数据模式集合生成方法,其特征在于,所述方法包括以下步骤:
2.根据权利要求1所述的一种基于机器学习的cmip日尺度降水数据模式集合生成方法,其特征在于,步骤1中所述收集研究区域的历史cmip多模式日尺度降水数据以及日尺度观测降水数据,并将不同空间分辨率的降水数据插值到统一空间分辨率具体为:收集的数据包括cmip6多模式降水数据以及cn05.1栅格观测降水数据;
3.根据权利要求1所述的一种基于机器学习的cmip日尺度降水数据模式集合生成方法,其特征在于,步骤2中所述根据历史观测降水数据将cmip多模式降水数据进行偏差校正具体为:采用转移累积概率分步法来进行偏差校正,假定在历史时段存在一个转移函数t,能够将历史观测降水数据的累积概率分布函数与历史cmip多模式降水数据的累积概率分布函数建立关系,如下式:
4.根据权利要求1所述的一种基于机器学习的cmip日尺度降水数据模式集合生成方法,其特征在于,步骤2中所述基于月尺度观测降水数据逐栅格提取降水年内分布特征具体为:给定月尺度观测降水数据pm(x,y),其中m表示月份m=1,2,…,12,(x,y)表示栅格位置,对于每个栅格(x,y),计算多年平均逐月降水量以判定降水最大月份,标注年内分布特征;定义特征标注矩阵t(x,y),其大小与栅格数据相同;根据以下规则逐栅格提取并标注降水年内分布特征:将降水最大月份标注特征为4,第二、第三月份标注特征为3,第四、第五月份标注特征为2,其余月份标注特征为0;
5.根据权利要求1所述的一种基于机器学习的cmip日尺度降水数据模式集合生成...
【专利技术属性】
技术研发人员:杜军凯,吕向林,杨成刚,仇亚琴,谢敏,余添,郑炜,郝春沣,贾玲,陈鑫,谈幸燕,刘海滢,董颢,
申请(专利权)人:中国水利水电科学研究院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。