协方差分析下大气温度数据缺失值插补方法及其插补装置制造方法及图纸

技术编号:38751359 阅读:12 留言:0更新日期:2023-09-09 11:17
本发明专利技术提供了一种协方差分析下大气温度数据缺失值插补方法,其包括:构建大气温度数据的影响因子,制作大气温度数据集并建立多个台站位置的多元回归模型,遍历寻找大气温度数据缺失数据集,建立大气温度数据序列集,计算温度数据参考序列数据的协方差矩阵,求解方差权重向量,并建立多个台站位置的方差模型,构建基于协方差分析的大气温度数据缺失值插补模型,循环插补大气温度数据缺失值;并基于此提供一种插补装置。本发明专利技术综合多元回归和协方差两大统计模型,引入多个影响因素,充分考虑了时间和空间上的相关性;并将不同台站大气温度数据分为缺失序列、参考序列与测试序列以进行训练、测试与缺失值插补,提升了数据插补的可信度与准确度。可信度与准确度。可信度与准确度。

【技术实现步骤摘要】
协方差分析下大气温度数据缺失值插补方法及其插补装置


[0001]本专利技术属于气象要素缺失值插补
,特别是一种协方差分析下大气温度数据缺失值插补方法及其插补装置。

技术介绍

[0002]为了实时监测大气温度数据,通常设有越来越多的大气温度监测台站,以获得更加准确完整的大气温度数据。完整高精度的温度观测数据是农业气象灾害监测、生态系统模拟重要的输入参数。由于野外气象观测条件的限制,气象观测数据缺失现象是常态,数据插补方法是气象数据应用必要处理步骤。
[0003]现在常用的大气温度数据缺失值的插补方法包括基于回归的方法、地统计方法和机器学习方法。但是在对大气温度数据缺失值进行插补时,上述几种方法的准确度存在明显不足:基于回归的温度数据插补方法可能会产生过拟合问题,地统计方法无法对最小估计误差进行约束,而机器学习方法虽然能够构建新的温度缺失值插补深度学习模型,对缺失的半小时温度观测数据进行高精度插补,但是需要通过大量的大气温度数据进行训练且其缺乏明确的机制含义。
[0004]专利CN113495913A公开了一种空气质量数据缺失值插补方法及装置,其基于第一空气质量数据序列、第二空气质量数据序列和第三空气质量数据序列计算协方差和权重,根据多个第三空气质量数据序列和对应的权重计算第一空气质量数据序列中第一时间点对应的空气质量数据,从而完成空气质量数据缺失值的补充,其主要基于历史数据集通过协方差计算权重的方法进行计算缺失值,不考虑其余影响参数的对插值结果的影响,不能保证插值的准确度。
[0005]因此,为解决此问题,通过引入一种协方差分析下大气温度数据缺失值插补方法,以提高大气温度缺失值插补结果的准确度从而保障气象数据应用的准确完善是十分迫切且必要的。

技术实现思路

[0006]本专利技术针对上述现有技术中的缺陷,提出一种协方差分析下大气温度数据缺失值插补方法及其插补装置。
[0007]本专利技术综合多元回归模型和协方差模型,引入时刻、大气压、最大风速、相对湿度、水汽压、降水量以及参考温度等影响因素,充分考虑了时间和空间上的相关性;并将不同台站大气温度数据分为缺失序列、参考序列与测试序列,提升了所插补数据的可信度与统计检验灵敏度。
[0008]本专利技术提供一种协方差分析下大气温度数据缺失值插补方法,其包括以下步骤:
[0009]S1、构建大气温度数据的影响因子;
[0010]大气温度数据的影响因子根据气候变化理论与传统温度预测量表确定,并从大气温度数据集中选择,包含:时刻x1、大气压x2、最大风速x3、相对湿度x4、水汽压x5、降水量x6以
及参考温度x7共七个影响因子。
[0011]S2、制作大气温度数据集并建立多个台站位置的多元回归模型;
[0012]将上述多个台站位置的多元回归模型用矩阵形式表示如下:
[0013]Y
b
=Xw
ꢀꢀꢀꢀꢀ
(1);
[0014]S3、遍历寻找大气温度数据缺失数据集;
[0015]根据蒙特卡洛法遍历大气温度数据集的全部大气温度数据和台站位置信息,找出大气温度数据集内所有大气温度数据缺失的台站作为待插值台站,提取每个待插值台站的大气温度数据所有缺失的时刻和对应的台站位置信息;
[0016]S4、针对每个待插值台站,建立大气温度数据序列集;
[0017]S41、将每个连续缺失的若干大气温度数据所对应的时刻组合作为温度数据缺失序列,且规定温度数据缺失序列的初始时刻为第一插补点;
[0018]S42、制作温度数据缺失序列数据、温度数据参考序列数据以及温度数据测试序列数据;
[0019]S5、计算温度数据参考序列数据的协方差矩阵;
[0020]计算所有任意两个温度数据参考序列数据的协方差,得到协方差矩阵如下
[0021][0022]其中,y1,y
n
分别表示第1个和第n个台站位置中所有温度组成的单列矩阵;C()表示协方差计算;
[0023]S6、求解方差权重向量,并建立多个台站位置的方差模型;
[0024]S61、求解方差权重向量r;
[0025]S62、通过温度数据参考序列数据的协方差矩阵与方差权重向量,建立多个台站位置的方差模型如下:
[0026]Y
a
=Zr
ꢀꢀꢀꢀ
(3);
[0027]S7、构建基于协方差分析的大气温度数据缺失值插补模型;
[0028]S71、定义并求解误差余项d;
[0029]S72、通过温度数据参考序列数据的多元回归模型与方差模型,建立多个台站位置的大气温度数据缺失值插补模型如下:
[0030]Y=(Xw+Y0(Zr)+d)/2
ꢀꢀꢀ
(4)
[0031]其中,Y0(Zr)表示基于方差模型得到的预测值;
[0032]S8、循环插补大气温度数据缺失值;
[0033]将所有待插值台站的温度数据缺失序列数据代入到上述步骤S72中大气温度数据缺失值插补模型中,重复执行步骤S2至S7,直至所述大气温度数据集中大气温度数据无缺失。
[0034]可优选地,所述步骤S2具体包括以下步骤:
[0035]S21、基于国家地理数据库与温度监测台站实时数据库,获取大气温度数据集,并制作包含时刻x1、大气压x2、最大风速x3、相对湿度x4、水汽压x5、降水量x6与参考温度x7的大气温度数据集以及台站位置信息集;
[0036]S22、建立单个台站位置的多元回归模型的基本形式如下:
[0037]Y
b
=w1x1+w2x2+

+w
j
x
j
ꢀꢀꢀꢀ
(5)
[0038]其中,Y
b
表示预测大气温度;w
j
表示第j个影响因子的回归权重系数;
[0039]S23、针对不同的台站位置,利用MATLAB软件多元回归模块分别对步骤S21中的大气温度数据集进行多元回归处理,得到不同台站位置多元回归模型的初步权重系数w
j

[0040]S24、建立多个台站位置的多元回归模型的基本形式如下:
[0041]Y
ib
=w1x
i1
+w2x
i2
+

+w
j
x
ij
ꢀꢀꢀꢀ
(6)
[0042]其中,Y
ib
表示第i个台站位置样本的预测大气温度;x
ij
表示第i个台站位置样本的第j个影响因子;
[0043]可优选地,所述步骤S42具体包括以下步骤:
[0044]S421、提取所述待插值台站在预设时段内的大气温度数据作为温度数据缺失序列数据,缺失值采用预设时段内的大气温度均值代替;
[0045]S422、将除所述待插值台站以外的所本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种协方差分析下大气温度数据缺失值插补方法,其特征在于,其包括以下步骤:S1、构建大气温度数据的影响因子;大气温度数据的影响因子根据气候变化理论与传统温度预测量表确定,并从大气温度数据集中选择,包含:时刻x1、大气压x2、最大风速x3、相对湿度x4、水汽压x5、降水量x6以及参考温度x7共七个影响因子。S2、制作大气温度数据集并建立多个台站位置的多元回归模型;将上述多个台站位置的多元回归模型用矩阵形式表示如下:Y
b
=Xw
ꢀꢀꢀꢀ
(1);S3、遍历寻找大气温度数据缺失数据集;根据蒙特卡洛法遍历大气温度数据集的全部大气温度数据和台站位置信息,找出大气温度数据集内所有大气温度数据缺失的台站作为待插值台站,提取每个待插值台站的大气温度数据所有缺失的时刻和对应的台站位置信息;S4、针对每个待插值台站,建立大气温度数据序列集;S41、将每个连续缺失的若干大气温度数据所对应的时刻组合作为温度数据缺失序列,且规定温度数据缺失序列的初始时刻为第一插补点;S42、制作温度数据缺失序列数据、温度数据参考序列数据以及温度数据测试序列数据;S5、计算温度数据参考序列数据的协方差矩阵;计算所有任意两个温度数据参考序列数据的协方差,得到协方差矩阵如下其中,y1,y
n
分别表示第1个和第n个台站位置中所有温度组成的单列矩阵;C()表示协方差计算;S6、求解方差权重向量,并建立多个台站位置的方差模型;S61、求解方差权重向量r;S62、通过温度数据参考序列数据的协方差矩阵与方差权重向量,建立多个台站位置的方差模型如下:Y
a
=Zr
ꢀꢀꢀ
(3);S7、构建基于协方差分析的大气温度数据缺失值插补模型;S71、定义并求解误差余项d;S72、通过温度数据参考序列数据的多元回归模型与方差模型,建立多个台站位置的大气温度数据缺失值插补模型如下:Y=(Xw+Y0(Zr)+d)/2
ꢀꢀꢀ
(4)其中,Y0(Zr)表示基于方差模型得到的预测值;S8、循环插补大气温度数据缺失值;将所有待插值台站的温度数据缺失序列数据代入到上述步骤S72中大气温度数据缺失值插补模型中,重复执行步骤S2至S7,直至所述大气温度数据集中大气温度数据无缺失。2.根据权利要求1所述的协方差分析下大气温度数据缺失值插补方法,其特征在于,所
述步骤S2具体包括以下步骤:S21、基于国家地理数据库与温度监测台站实时数据库,获取大气温度数据集,并制作包含时刻x1、大气压x2、最大风速x3、相对湿度x4、水汽压x5、降水量x6与参考温度x7的大气温度数据集以及台站位置信息集;S22、建立单个台站位置的多元回归模型的基本形式如下:Y
b
=w1x1+w2x2+

+w
j
x
j
ꢀꢀꢀꢀ
(5)其中,Y
b
表示预测大气温度;w
j
表示第j个影响因子的回归权重系数;S23、针对不同的台站位置,利用MATLAB软件多元回归模块分别对步骤S21中的大气温度数据集进行多元回归处理,得到不同台站位置多元回归模型的初步权重系数w
j
;S24、建立多个台站位置的多元回归模型的基本形式如下:Y
ib
=w1x
i1
+w2x
i2
+

+w
j
x
ij
ꢀꢀꢀꢀ
(6)其中,Y
ib
表示第i个台站位置样本的预测大气温度;x
ij
...

【专利技术属性】
技术研发人员:殷倩
申请(专利权)人:中国科学院地理科学与资源研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1