一种基于机器学习的海雾预测方法技术

技术编号:38940149 阅读:29 留言:0更新日期:2023-09-25 09:39
本发明专利技术涉及气象领域,提供了一种基于机器学习的海雾预测方法。目的在于解决影响因子选取的问题以及融合多模型进行联合决策,达到提高准确率的目的。主要方案包括获取目标区域的海雾初步数据集,利用主成分分析法展开分析初步数据集,将原本的特征数据进行优化选取得到优化数据集;将优化数据集分为训练集数据和测试集数据,将得到的训练集数据带入不同的机器学习算法中进行训练,得到训练好的三个模型,即决策树模型、随机森林模型、LGBM模型;定义检验海雾事件类型,并计算对应事件的准确率,将测试数聚集输入训练好的三个模型,得到三个模型的输出海雾事件类型,通过三个模型的输出海雾事件类型进行综合判断,得到最终的海雾事件类型。类型。类型。

【技术实现步骤摘要】
一种基于机器学习的海雾预测方法


[0001]本专利技术涉及气象领域,提供了一种基于机器学习的海雾预测方法。

技术介绍

[0002]海雾是海洋上低层大气中一种水汽凝结现象,由于水滴或冰晶的大量积聚使能见度降低,危害人民的生命财产安全。我国航海运输、渔业捕捞、海洋开发以及军事等活动的日益频繁,准确地预测海雾逐渐成为气象研究人员的重点研究目标。与其他灾害性天气相比,海雾的业务预报水平还远不能满足业务需求。现今在国内外气象部门对海雾的预报方法主要有天气学方法、数值预报方法和机器学习方法。天气学方法依赖于预报员主观经验,预报准确率不能得到保障。数值预报对于大范围海雾预报准确率高,但对于微尺度海雾预报能力差。
[0003]随着社会科技水平的不断进步,大数据时代已经来临。计算机运算能力的提高使得机器学习技术发展迅速,国内外已经运用其 在海雾预报领域,并且都得到诸多研究成果,被专家学者认为是一种行之有效的方法。机器学习方法运用历史数据资料进行统计和分析,建立海雾和气象要素之间的模型,进而预报海雾。在对于我国沿海地区进行海雾预报研究过程中,机器学习方法已经取得了一定成果,常见机器学习建模方法包括逐步回归、支持向量机、决策树、神经网络等,可以用来预测未来是否会有雾。然而,目前沿海地区的海雾客观预报方法可能存在空报和漏报的情况,整体准确率偏低。因此,预报员需要首先综合分析多种客观预报结果,然后对结果展开主观订正,进一步提升对海雾和能见度预测的准确率。机器学习方法是在选择最优影响因子基础上完成的,计算方法易于掌握,占用的计算资源和计算时间也相对很少,因此机器学习方法是目前沿海气象台站预报海雾的主要方法之一。但是影响因子的筛选容易受主观经验的影响。预报因子的选取以及预报量和预报因子之间的经验统计关系的不确定性都是制约预报结果的重要因素。利用机器学习方法进行海雾预测研究,要做好影响因子与结果的相关性研究,这样会大大提高基于机器学习方法的海雾预测的准确性。

技术实现思路

[0004]本专利技术的主要目的在于解决影响因子选取的问题以及融合多模型进行联合决策,达到提高准确率的目的。
[0005]为了实现上述目的本专利技术采用以下技术手段:一种基于机器学习的海雾预测方法,包括以下步骤:步骤1、使用GFS数据以及自动气象站数据进行数据的时空匹配以及异常值处理得到目标区域的海雾初步数据集,初步数据集中GFS数据作为特征数据,自动站数据作为标签数据;步骤2、利用主成分分析法展开分析初步数据集,将原本的特征数据进行优化选取得到优化数据集;
步骤3、优化数据集使用过采样法算法处理,解决海雾类别不平衡问题,将优化数据集分为训练集数据和测试集数据,将得到的训练集数据带入不同的机器学习算法中进行训练,得到训练好的三个模型,即决策树模型、随机森林模型、LGBM模型;步骤4、定义检验海雾事件类型,海雾事件类型包括浓雾、大雾、轻雾和无雾,并计算对应事件的准确率ACC:,其中,H代表的预测海雾等级是定义的海雾事件类型且实际也是定义的海雾事件类型的数量,F代表的预测海雾等级是定义的海雾事件类型且实际不是定义的海雾事件类型的数量,M代表的预测海雾等级不是定义的海雾事件类型且实际是定义的海雾事件类型的数量,C代表的预测海雾等级不是定义的海雾事件类型且实际也不是定义的海雾事件类型的数量;步骤5、将测试数聚集输入训练好的三个模型,得到三个模型的输出海雾事件类型,通过三个模型的输出海雾事件类型进行综合判断,得到最终的海雾事件类型。
[0006]上述技术方案中,时空匹配采用距离就近匹配原则,将自动站数据和最近的GFS格点数据匹配。
[0007]上述技术方案中,步骤2包括以下步骤:步骤2.1、海雾影响因子选取,海雾影响因子分别是对流有效位能(CAPE)、抬升指数(LI)、海平面气压(MSL)、露点温度(TD)、比湿(SH)、总云量(TCDC)、气温(TEMP)、相对湿度(RH)、绝对涡度(ABSV)、垂直速度(DZDT)、位势高度(GH)、U风(U)、V风(V)。
[0008]步骤2.2、对步骤2.1所述的海雾影响因子采用主成分分析海雾影响因子对比各海雾影响因子的贡献,决定输入模型的最终预报因子,实现降维,得到优化特征数据。
[0009]上述技术方案中,步骤5中通过三个模型的输出结果进行综合判断,得到最终结果的具体实现如下:如果三个模型输出的海雾事件类型均不相同,则选取三个模型中准确率ACC值最大的模型输出的海雾事件类型为最终输出结果;如三个模型中有任意两个模型输出的海雾事件类型相同,则以这两个模型输出的海雾事件类型为最终输出结果;如三个模型输出的海雾事件类型均相同,则以这三个模型输出的海雾事件类型为最终输出结果。
[0010]因为本专利技术采用上述技术手段,因此具备以下有益效果:1、本专利技术采用三种模型进行联合判断,对于三个模型输出均不同的情况,采用准确率ACC进行独立判断,对于有2个模型有相同结果的,以相同结果多的为最终结果,这样进一步提高了模型的准确率。
[0011]2、利用机器学习方法预测海雾,首先要解决的关键步骤是清楚影响因子与结果的相关性。然后利用主成分分析法对于初步数据集影响因子进行优化选择,最后得到优化后的数据集,达到了降维的目的并且提高了模型运行速度。
附图说明
[0012]图1为本专利技术结构框图;图2为数据集构建流程。
具体实施方式
[0013]以下将对本专利技术的实施例给出详细的说明。尽管本专利技术将结合一些具体实施方式进行阐述和说明,但需要注意的是本专利技术并不仅仅只局限于这些实施方式。相反,对本专利技术进行的修改或者等同替换,均应涵盖在本专利技术的权利要求范围当中。
[0014]另外,为了更好的说明本专利技术,在下文的具体实施方式中给出了众多的具体细节。本领域技术人员将理解,没有这些具体细节,本专利技术同样可以实施。
[0015]本次研究使用的数据包括2020

2021年琼州海峡地区GFS各类气象数据、地面自动气象站观测数据以及FY

4A数据。使用GFS数据以及自动站数据进行数据的时空匹配以及异常值处理得到2020

2021年琼州海峡海雾初步数据集。初步数据集中GFS数据作为特征数据,自动站数据作为标签数据。其中空间匹配采用距离就近匹配原则,将自动站数据和最近的GFS格点数据匹配。本次预测研究会涉及短期海雾情况,因此时间匹配分别匹配了未来3小时、6小时以及9小时自动站实测气象数据。自动站在2年的运行过程中可能会出现设备损坏的现象导致部分时段的数据缺失,我们一律将同时段的数据不用于初步数据集的创建。最后利用主成分分析法展开分析初步数据集,将原本的特征数据进行优化选取得到优化数据集。图2流程图展示了数据集的构建过程。
[0016]海雾影响因子选取利用机器学习方法预测海雾,首先要解决的关键步骤是清楚影响因子与结果的相关性。通过文献调研表明影响海雾生成与消散的因素很多,主要可分为以下四类:水汽条件、层结稳定度、热力条件和动力条件。考虑到以上影响海雾生成本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于机器学习的海雾预测方法,其特征在于,包括以下步骤:步骤1、使用GFS数据以及自动气象站数据进行数据的时空匹配以及异常值处理得到目标区域的海雾初步数据集,初步数据集中GFS数据作为特征数据,自动站数据作为标签数据;步骤2、利用主成分分析法展开分析初步数据集,将原本的特征数据进行优化选取得到优化数据集;步骤3、优化数据集使用过采样法算法处理,将优化数据集分为训练集数据和测试集数据,将得到的训练集数据带入不同的机器学习算法中进行训练,得到训练好的三个模型,即决策树模型、随机森林模型、LGBM模型;步骤4、定义检验海雾事件类型,海雾事件类型包括浓雾、大雾、轻雾和无雾,并计算对应事件的准确率ACC:其中,H代表的预测海雾等级是定义的海雾事件类型且实际也是定义的海雾事件类型的数量,F代表的预测海雾等级是定义的海雾事件类型且实际不是定义的海雾事件类型的数量,M代表的预测海雾等级不是定义的海雾事件类型且实际是定义的海雾事件类型的数量,C代表的预测海雾等级不是定义的海雾事件类型且实际也不是定义的海雾事件类型的数量;步骤5、将测试数聚集输入训练好的三个模型,得到三个模型的输出海雾事件类型,通过三个模型的输出海雾事件类型进行综合判断,得到最终的海雾事件类...

【专利技术属性】
技术研发人员:苏德斌樊昌元何关兴唐田野
申请(专利权)人:成都信息工程大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1