一种基于随机森林的冰雹气候特征预测方法技术

技术编号:30830934 阅读:58 留言:0更新日期:2021-11-18 12:44
本发明专利技术公开了一种基于随机森林的冰雹气候特征预测方法,属于气候预测技术领域。一种基于随机森林的冰雹气候特征预测方法,包括冰雹观测数据准备,整理月降雹次数数据集T和三个冰雹尺寸等级月降雹次数占比数据集A、B、C;选取6个CMIP6气候模式与数据集T同时间段的6个模式历史预报数据平均作为数据集CF6,4个气候模式历史数据的平均作为测试集CF4,以未来80年6个气候模式预报数据的平均作为预测数据集CA6;使用随机森林算法建立以数据集T为目标,以数据集CF6为输入的模型MT;使用随机森林算法建立分别以数据集A、B、C为目标,以数据集CF6为输入的模型MA、MB、MC;测试模型效果,并利用数据集CA6预测未来80年的降雹次数与冰雹尺寸变化。寸变化。寸变化。

【技术实现步骤摘要】
一种基于随机森林的冰雹气候特征预测方法


[0001]本专利技术涉及气候预测
,尤其涉及一种基于随机森林的冰雹气候特征预测方法。

技术介绍

[0002]冰雹是强对流系统引起的极端天气之一,常伴随有强风暴、短时强降水、剧烈降温等天气现象,由于其空间尺度小、突发性强、破坏力大,对其定点定时定量的预报难度极大,容易使当地的农业和经济遭受巨大损失。目前国内外对于冰雹的研究多集中于典型雹灾个例研究、冰雹预报预警、冰雹气候特征统计分析等方面,对于冰雹气候特征的未来预测较少且有待更新。因此,有必要进一步研究未来几十年冰雹气候特征可能的演变情况,为冰雹的短时临近预报提供更大的预报背景,更好地开展冰雹的预报预警工作。
[0003]政府间气候变化专门委员会(Intergovernmental Panel on Climate Change,IPCC)第四次评估报告指出,近几十年来的气候变化导致极端天气事件显著增多,但类似冰雹这种局地性强的事件的变化趋势还不是很清楚。国内外许多气象学者对各地的冰雹气候特征进行过多方面、多角度的统计与分析,冰雹在不同地区、不同时期都呈现不同的时空分布特征和变化趋势。因此,目前还缺少一个可以描述不同地区冰雹气候特征的标准,也无法拟合出一组适用于所有地区的冰雹变化趋势方程。
[0004]目前,对于未来冰雹气候特征预测的研究较少,主要使用两种传统方法:一是基于各气象要素与降雹频率之间的相关关系建立的经验模型,该方法具有显著的物理意义,但局限于某一类大尺度背景下的冰雹事件,模型对于其他类型的冰雹事件不具备较好的复现能力;二是基于数值预报气候模型,利用数值预报数据驱动冰雹物理模型HAILCAST,从而预报未来长期的冰雹发生频率和冰雹尺寸的时空变化,但该方法计算成本较高、耗时较大、参数设置非常复杂,且预测结果很大程度上依赖于数值预报数据的好坏。
[0005]自1956年机器学习的概念在达特茅斯会议上被首次提出后,它就成为数学、计算机科学、神经科学等多学科的活跃研究方向,其算法也被广泛应用到大气、海洋等众多学科领域。目前,机器学习在天气、气候预报中的应用非常普遍,印度学者使用深度神经网络自动识别可预测印度均质区域降雨量的气候因子,建立一个集合回归树模型用于不同区域的季风预报,与当前最先进的预测模型相比具有较强的竞争力。韩国学者基于深度学习方法构建的卷积神经网络模型可以提前7~21个月有效预测ENSO事件,并且预测准确率达到80%左右,高于当前大部分动力气候预测模型。可见机器学习有着良好的学习能力和非线性表达能力,在气候预测领域有着较好的应用前景。
[0006]为了解决传统方法在大尺度背景和数值预报模型上的局限性,亟需将机器学习运用于冰雹气候特征的未来预测,将机器学习与传统方法相结合,提供更加准确的未来降雹次数和冰雹尺寸的变化趋势,为冰雹的气候预测提供新的思路。

技术实现思路

[0007]本专利技术的目的是为了解决现有上述
技术介绍
中提及的问题而提出的一种基于随机森林的冰雹气候特征预测方法。
[0008]为了实现上述目的,本专利技术采用了如下技术方案:
[0009]一种基于随机森林的冰雹气候特征预测方法,包括一下步骤:
[0010]S1、冰雹观测数据准备;整理历史观测月降雹次数得到的数据集T,将冰雹尺寸按照冰雹直径大小分为SA、SB、SC三个等级,将每个等级降雹次数与年总降雹次数相除,得到数据集A、B、C;
[0011]S2、气候模式数据的准备;将CMIP6与数据集T同时段的6个气候模式历史预报数据的平均作为数据集CF6,4个数据的平均作为测试集CF4,选用未来80年6个气候模式预报数据的平均作为数据集CA6;
[0012]S3、使用随机森林算法建立以数据集T为目标,获得以数据集CF6为输入的模型MT;
[0013]S4、使用随机森林算法建立分别以数据集A、B、C为目标,获得以数据集CF6为输入的模型MA、MB、MC;
[0014]S5、测试模型效果;并利用数据集CA6预测未来80年的降雹次数与冰雹尺寸变化。
[0015]优选的,步骤S1具体包括:
[0016]S101、准备1955~2014年历史观测冰雹数据,剔除异常记录;
[0017]S102、计算月降雹次数,得到为期60年逐月的数据集T;
[0018]S103、将降雹尺寸按照冰雹直径大小分为SA、SB、SC三个等级,直径小于等于1英寸的冰雹为SA,直径大于1英寸且小于等于2.5英寸的冰雹为SB,直径大于2.5英寸的冰雹为SC;
[0019]S104、将每个等级冰雹的月降雹次数与年总降雹次数相除,得到每个等级冰雹的月降雹次数占比,作为数据集A、B、C。
[0020]优选的,步骤S2中具体包括:
[0021]S201、选择具有代表性、预报效果较好的6个CMIP6气候模式,与数据集T同时间段的6个气候模式历史预报数据的平均作为数据集CF6,数据集CF6包括近地面温度、地表温度、850hPa气温、500hPa气温、500hPa位势高度共5项要素;
[0022]S202、另选用1980~2014年间4个CMIP6气候模式的历史预报数据平均作为测试集CF4,要素同CF6,用于步骤S5中验证模型的效果;
[0023]S203、准备未来80年的6个模式预报数据平均作为数据集CA6,要素与数据集CF6相同,数据集CA6包括全球变暖得到控制ssp126、全球变暖以现在的趋势发展ssp245和全球极端变暖ssp585三种未来情景。
[0024]优选的,步骤S3的过程具体包括:
[0025]S301、将数据集T和数据集CF6按时间对应排列,按照8:2的比例随机划分训练集和验证集;
[0026]S303、对随机森林算法参数空间进行搜索,得到验证集上评估出的最优参数,并得到训练好的模型MT。
[0027]优选的,步骤S4的过程具体包括:
[0028]S401、将数据集A和数据集CF6按时间对应排列,并按照8:2的比例随机划分训练集
和验证集;
[0029]S402、对随机森林算法参数空间进行搜索,得到验证集上评估出的最优参数,得到训练好的模型MA。
[0030]S403、对数据集B和C重复以上操作,得到训练好的模型MB、MC。
[0031]优选的,步骤S5具体包括:
[0032]S501、将测试集CF4输入模型MT计算后得到月降雹次数,计算出1980~2014逐年降雹次数,与真实观测的年降雹次数计算相关系数,以测试模型MT的效果;
[0033]S502、将测试集CF4输入模型MA、MB、MC计算后得到SA、SB、SC的月降雹次数占比,计算出1980~2014逐年降雹次数占比,与真实观测的三个等级年降雹次数占比计算相关系数,以测试模型MA、MB、MC的效果;
[0034]S503、将数据集CA6输入模型MT计算后,得到未来80年三种全球变暖情景下的月降雹次数,再通过计算本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于随机森林的冰雹气候特征预测方法,其特征在于;包括以下步骤:S1、冰雹观测数据准备;整理历史观测月降雹次数得到的数据集T,将冰雹尺寸按照冰雹直径大小分为SA、SB、SC三个等级,将每个等级降雹次数与年总降雹次数相除,得到数据集A、B、C;S2、气候模式数据的准备;从历史数据中选取6个CMIP6气候模式与数据集T同时段的6个气候模式历史预报的平均数据作为数据集CF6,另外再选取4个气候模式历史数据作为测试集CF4,选用未来80年6个气候模式预报数据的平均作为数据集CA6;S3、使用随机森林算法建立以数据集T为目标,获得以数据集CF6为输入的模型MT;S4、使用随机森林算法建立分别以数据集A、B、C为目标,获得以数据集CF6为输入的模型MA、MB、MC;S5、测试模型效果;并利用数据集CA6预测未来80年的降雹次数与冰雹尺寸变化。2.根据权利要求1所述的一种基于随机森林的冰雹气候特征预测方法,其特征在于,步骤S1具体包括:S101、准备1955~2014年历史观测冰雹数据,剔除异常记录;S102、计算月降雹次数,得到为期60年逐月的数据集T;S103、将降雹尺寸按照冰雹直径大小分为SA、SB、SC三个等级,直径小于等于1英寸的冰雹为SA,直径大于1英寸且小于等于2.5英寸的冰雹为SB,直径大于2.5英寸的冰雹为SC;S104、将每个等级冰雹的月降雹次数与年总降雹次数相除,得到每个等级冰雹的月降雹次数占比,作为数据集A、B、C。3.根据权利要求2所述的一种基于随机森林的冰雹气候特征预测方法,其特征在于,步骤S2中具体包括:S201、选择具有代表性、预报效果较好的6个CMIP6气候模式,与数据集T同时间段的6个气候模式历史预报的平均数据作为数据集CF6,数据集CF6包括近地面温度、地表温度、850hPa气温、500hPa气温、500hPa位势高度共5项要素;S202、另选用1980~2014年间4个CMIP6气候模式的历史预报平均数据作为测试集CF4,要素与数据集CF6相同,用于步骤S5中验证模型的效果;S203、...

【专利技术属性】
技术研发人员:王丹妮梁逸爽王明清
申请(专利权)人:无锡九方科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1