基于Transformer注意力机制的日降水量预测方法技术

技术编号：32832780 阅读：51 留言：0更新日期：2022-03-26 20:48

本发明专利技术公开了一种基于Transformer注意力机制的日降水量预测方法。本发明专利技术首先构造输入序列；其次通过Word2vec算法获取输入序列的每一日降水量的嵌入向量，通过向量转化公式计算出每一日降水量时间排列位置的嵌入向量，由此得到向量表示矩阵。然后将向量表示矩阵传入编码器中，输出编码信息矩阵C，最后将编码器输出的编码信息矩阵C传递到解码器中得到当前日降水量的预测值。本发明专利技术采用了transformer注意力机制模型可以较好的进行并行训练，另外本发明专利技术采用了多头注意力机制结构，可以捕获日降水量数据序列各个数据之间多种维度上的相关注意力分数。意力分数。意力分数。

全部详细技术资料下载

【技术实现步骤摘要】
基于Transformer注意力机制的日降水量预测方法

[0001]本专利技术属于降水量预测
，涉及一种基于Transformer注意力机制的日降水量预测方法。

技术介绍

[0002]降水量预测是现代气候预测工作的核心与难点，降水量预测主要分为两类，一类是利用影响降水的因子，如地区地形、温度、湿度、植被等预测降水量的概率及降水量的多少，这一类主要集中在有台风、冷流等特殊天气时预测降水；另一类是利用以往年份的历史降水量数据，基于降水量时间序列数据的季节性及周期性，对未来年份相同日期在无特殊情况下也就是常规日的降水量进行预测。
[0003]目前对于常规日降水量预测的方法主要有两类方法：一种为基于统计学的方法，例如自回归滑动平均模型，移动平均模型，小波分析等；另一种为基于机器学习的方法，例如循环神经网络，长短时记忆网络等。深度学习中的注意力机制可以看作是神经网络的一个改进，它与人类的注意力机制工作原理基本相似，通过输入变量对权重进行自分配，在众多信息中选择出对当前任务目标更关键的信息。
[0004]谷歌提出的Transformer模型是一种完全基于注意力机制的模型，它摒弃了卷积神经网络和循环神经网络的结构，很好的解决了普通神经网络难以并行化的缺点，并可以实现较快的训练速度。Transformer是一种完全基于注意力机制的模型，其结构主要包括编码器和解码器。编码器由6个编码单元、1个线性层和1个Softmax逻辑回归层；解码器由6个解码单元、1个线性层和1个Softmax逻辑回归层组成。
[00...

【技术保护点】

【技术特征摘要】
1.基于Transformer注意力机制的日降水量预测方法，其特征在于以下步骤：S1、构造输入序列：将某地以往年份的日降水量数据做成输入序列，缺失数据利用以往年份相同日期的降水量数据的3年滑动平均值补齐，按照时间先后顺序排列成时间序列数据作为模型的输入；S2、通过Word2vec算法获取输入序列的每一日降水量的嵌入向量，通过向量转化公式计算出每一日降水量时间排列位置的嵌入向量，将该日降水量的嵌入向量和该日降水量时间排列位置的嵌入向量相加得到输入序列的向量表示矩阵X
n
×
d
，矩阵的每一行是每一日降水量的表示；S3、将得到的序列向量表示矩阵传入编码器中，编码器由六个编码单元组成，经过六个编码单元后再通过线性层和Softmax逻辑回归层得到序列的所有降水量数据的编码信息矩阵C，每个编码器单元输出的矩阵维度与编码器单元的输入矩阵维度一致；S4、将编码器输出的编码信息矩阵C传递到解码器中，解码器也包含六个解码单元，经过六个解码器单元后再通过线性层和Softmax逻辑回归层得到当前日降水量的预测值。2.根据权利要求1所述的基于Transformer注意力机制的日降水量预测方法，其特征在于：所述时间排列位置的嵌入向量PE转化公式为：化公式为：其中position表示该日降水量在序列中的位置，d表示PE的维度，2i表示偶数的维度，2i+1表示奇数的维度。3.根据权利要求1所述的基于Transformer注意力机制的日降水量预测方法，其特征在于：所述编码器单元包括一个多头注意力机制，一个前馈神经网络和两个残差连接及归一化层，其中多头注意力机制是由多个自注意力机制组成。4.根据权利要求3所述的基于Transformer注意力机制的日降水量预测方法，其特征在于：所述编码信息矩阵C的计算过程如下：当编码器收到向量表示矩阵X
n
×
d
后，多头注意力机制中的每一个自注意力机...

【专利技术属性】
技术研发人员：贺治国，马赫，朱业，卢美，季余，韩东睿，
申请(专利权)人：浙江省海洋监测预报中心，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人