当前位置: 首页 > 专利查询>浙江大学专利>正文

一种台风降水短临预测模型优化及预测方法技术

技术编号:36982350 阅读:12 留言:0更新日期:2023-03-25 18:01
本发明专利技术公开了一种台风降水短临预测模型优化及预测方法,属于人工智能应用领域。该方法设计了基于Cross

【技术实现步骤摘要】
一种台风降水短临预测模型优化及预测方法


[0001]本专利技术属于人工智能领域,具体涉及一种台风降水短临预测模型优化及预测方法。

技术介绍

[0002]大尺度大气环流、水汽输送以及其他同期天气系统与台风降水存在显著时空关联,表征宏观天气系统的高阶时空特征对构建台风降水长距离时空依赖具有重要意义。然而,基于卷积神经网络的空间编码感受野相对有限,基于循环神经网络的时序编码也存在长期衰减问题,二者皆难以有效建模长距离时空依赖关系。一些研究通过自注意力机制结合位置编码的方式开展长距离时空建模,但在高维时空域中,自注意力机制pixel

to

pixel的建模方式带来巨大计算量的同时也增加了拟合难度。另一方面,自注意力在计算过程中只考虑了pixel间的时空关联,忽略了更高层次时空特征之间的关联。如何以较小的算力为代价提升模型对长距离时空依赖的感知和建模能力,进一步提升优化模型的预测能力是本章的主要目标。

技术实现思路

[0003]本专利技术的目的是克服现有的不足,提供一种台风降水短临预测模型优化及预测方法。
[0004]为实现本专利技术目的,提供的技术方案如下:
[0005]第一方面,本专利技术提供了一种台风降水短临预测模型优化方法,其用于对编码器

解码器结构的台风降水短临预测模型进行优化,优化方法的步骤如下:
[0006]S1:获取待优化的台风降水短临预测模型中编码器和解码器各自的原始特征图,并对原始特征图进行区域划分并获取每个区域特征在高维特征空间的表征,使每个原始特征图分别形成对应的时空语义特征;
[0007]S2:基于S1得到的时空语义特征进一步进行多层语义全时空信息交互,构建从时空语义特征到具有全时空视野的多层语义时空特征,为后续时空注意力的计算提供具有全时空感受野的多尺度时空语义特征;
[0008]S3:基于具有多层级语义全时空视野的多尺度时空语义特征,引入注意力机制构建空间、时间、通道三头注意力模块,开展降水长距离时空注意力计算,计算以块为单元的时空注意力,最终结果经过块解码,通过残差结构与原始特征图进行融合,自适应增强预测时序时空特征表达,提高台风降水短临预测模型的预测准确性。
[0009]基于上述技术方案,各步骤优选采用如下具体方式实现。其中各步骤的优选实现方式在没有冲突的情况下均可进行相应组合,不构成限制。
[0010]作为上述第一方面的优选,所述步骤S1中,所述台风降水短临预测模型包含编码器和解码器;编码器中包含三个级联的block模块,每个block模块为一组级联的Convolution层和ConvLSTM层;解码器同样包含三个级联的block模块,每个block模块为一
组级联的ConvLSTM操作和Deconvolution操作;所述S1中提取编码器中第一个block模块的六个时序特征图和解码器中最后一个block模块的六个预测时序特征图计算时空语义特征,且编码器中提取的时序特征图为Convolution层输出的时序特征编码,用来构建自注意力机制中的键和值,解码器中提取的预测时序特征图为ConvLSTM层输出的预测时序特征,用来构建自注意力机制中的查询。
[0011]作为上述第一方面的优选,所述步骤S1中,针对原始台风降水短临预测模型中编码器和解码器各自的特征图,按照S11~S13进行处理:
[0012]S11:针对每个原始尺寸为c
×
h
×
w的特征图进行区域划分,通过预设的p
×
p块大小(patch size)对空间区域进行规则划分并裁剪,获得h/p
×
w/p个块(patch)区域;
[0013]S12:基于c

个维度为c
×
p
×
p的卷积核对每个块区域进行并行编码,其中c

>c,且为了保证每个块区域提取的模式保持一致,对所有块区域的编码卷积核进行参数共享,得到h/p
×
w/p个维度为c
′×1×
1的块区域特征图后重新组合为c
′×
h/p
×
w/p维度的时空语义特征;
[0014]S14:针对编码器的六个输入时序的特征图和解码器的六个预测时序的特征图,分别按照S11和S12转换得到维度为c
′×
h/p
×
w/p的时空语义特征。
[0015]作为上述第一方面的优选,所述步骤S2的具体方法如下:
[0016]S21:将编码器对应的六个时空语义特征和解码器对应的六个时空语义特征分别串接融合,得到维度为(s
in
×
c

,h/p,w/p)和(s
out
×
c

,h/p,w/p)的两个时空特征CPF
in
和CPF
out
的初始值;
[0017][0018][0019]式中:Concat表示串接融合操作;s
in
和s
out
分别表示编码器和解码器中的输入时序的特征图,均为6;
[0020]S22:采用多层堆叠深度可分离卷积(Depthwise Separable Convolution,DSC),对S21中得到的初始时空特征CPF
in
和CPF
out
分别在空间和特征深度方向进行cross

patch的交叉卷积,第i层堆叠深度可分离卷积的输出特征表示为CPFi;
[0021]S23:经过S22中共n层堆叠深度可分离卷积后得到n+1个特征图CPF
i
,i∈[0,n],分别表示从时空语义特征到具有全局感受野的不同语义层级时空特征,再采用逐像素加和的方式将不同语义层级的时空特征进行加权融合,最终得到多尺度时空语义特征TCPF为:
[0022][0023]其中,λ0,λ1...λ
n
表示n+1个特征图CPF i
的权重,能够通过模型反向传播进行优化。
[0024]S24:将多尺度时空语义特征按S21中采用的串联拼接方式逆向切分,得到分离后的具有全时空视野和各层级语义信息的各个时刻多尺度时空语义特征TCPF
i
,i∈[1,12]表示时刻,前六个时刻i∈[1,6]对应输入序列,后六个时刻i∈[7,12]对应输出序列。
[0025]作为上述第一方面的优选,所述S22中,每层堆叠深度可分离卷积包括Depthwise
卷积与Pointwise卷积两层网络,每层堆叠深度可分离卷积计算过程表示为:
[0026]CPF
i
=DSC(CPF
i
‑1)=PW(DS(CPF
i
‑1))
[0027]其中,CPFi表示第i层堆叠深度可分离卷本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种台风降水短临预测模型优化方法,其特征在于,用于对编码器

解码器结构的台风降水短临预测模型进行优化,优化方法的步骤如下:S1:获取待优化的台风降水短临预测模型中编码器和解码器各自的原始特征图,并对原始特征图进行区域划分并获取每个区域特征在高维特征空间的表征,使每个原始特征图分别形成对应的时空语义特征;S2:基于S1得到的时空语义特征进一步进行多层语义全时空信息交互,构建从时空语义特征到具有全时空视野的多层语义时空特征,为后续时空注意力的计算提供具有全时空感受野的多尺度时空语义特征;S3:基于具有多层级语义全时空视野的多尺度时空语义特征,引入注意力机制构建空间、时间、通道三头注意力模块,开展降水长距离时空注意力计算,计算以块为单元的时空注意力,最终结果经过块解码,通过残差结构与原始特征图进行融合,自适应增强预测时序时空特征表达,提高台风降水短临预测模型的预测准确性。2.根据权利要求1所述的台风降水短临预测模型优化方法,其特征在于:所述步骤S1中,所述台风降水短临预测模型包含编码器和解码器;编码器中包含三个级联的block模块,每个block模块为一组级联的Convolution层和ConvLSTM层;解码器同样包含三个级联的block模块,每个block模块为一组级联的ConvLSTM操作和Deconvolution操作;所述S1中提取编码器中第一个block模块的六个时序特征图和解码器中最后一个block模块的六个预测时序特征图计算时空语义特征,且编码器中提取的时序特征图为Convolution层输出的时序特征编码,用来构建自注意力机制中的键和值,解码器中提取的预测时序特征图为ConvLSTM层输出的预测时序特征,用来构建自注意力机制中的查询。3.根据权利要求1所述的台风降水短临预测模型优化方法,其特征在于:所述步骤S1中,针对原始台风降水短临预测模型中编码器和解码器各自的特征图,按照S11~S13进行处理:S11:针对每个原始尺寸为c
×
h
×
w的特征图进行区域划分,通过预设的p
×
p块大小(patch size)对空间区域进行规则划分并裁剪,获得h/p
×
w/p个块(patch)区域;S12:基于c

个维度为c
×
p
×
p的卷积核对每个块区域进行并行编码,其中c

>c,且为了保证每个块区域提取的模式保持一致,对所有块区域的编码卷积核进行参数共享,得到h/p
×
w/p个维度为c
′×1×
1的块区域特征图后重新组合为c
′×
h/p
×
w/p维度的时空语义特征;S14:针对编码器的六个输入时序的特征图和解码器的六个预测时序的特征图,分别按照S11和S12转换得到维度为c
′×
h/p
×
w/p的时空语义特征。4.根据权利要求1所述的台风降水短临预测模型优化方法,其特征在于:所述步骤S2的具体方法如下:S21:将编码器对应的六个时空语义特征和解码器对应的六个时空语义特征分别串接融合,得到维度为(s
in
×
c

,h/p,w/p)和(s
out
×
c

,h/p,w/p)的两个时空特征CPF
in
和CPF out
的初始值;的初始值;
式中:Concat表示串接融合操作;s
in
和s
out
分别表示编码器和解码器中的输入时序的特征图,均为6;S22:采用多层堆叠深度可分离卷积(Depthwise Separable Convolution,DSC),对S21中得到的初始时空特征CPF in
和CPF out
分别在空间和特征深度方向进行cross

patch的交叉卷积,第i层堆叠深度可分离卷积的输出特征表示为CPFi;S23:经过S22中共n层堆叠深度可分离卷积后得到n+1个特征图CPF i
,i∈[0,n],分别表示从时空语义特征到具有全局感受野的不同语义层级时空特征,再采用逐像素加和的方式将不同语义层级的时空特征进行加权融合,最终得到多尺度时空语义特征TCPF为:其中,λ0,λ1......

【专利技术属性】
技术研发人员:吴森森杨许莹戚劲
申请(专利权)人:浙江大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1