一种基于XGboost的声速剖面反演方法及系统技术方案

技术编号:34700826 阅读:11 留言:0更新日期:2022-08-27 16:37
本发明专利技术提供了一种基于XGboost的声速剖面反演方法及系统,属于声速剖面反演技术领域,该方法包括:分别获取遥感数据、Argo数据以及WOA13数据;根据遥感数据得到输入数据,以及根据Argo数据和WOA13数据,计算得到声速基函数系数a0‑

【技术实现步骤摘要】
一种基于XGboost的声速剖面反演方法及系统


[0001]本专利技术属于声速剖面反演
,尤其涉及一种基于XGboost的声速剖面反演方法及系统。

技术介绍

[0002]在海洋里声波与电磁波或光波相比,衰减更小,传播更远,因此声速是研究海洋的重要参数,声速剖面是指声速在深度上的分布。
[0003]21世纪以后,卫星获取大范围海洋参数的能力越来越强,数据总量不断积累;同时,随着算力的提升和机器学习、神经网络等人工智能方法的提出,使声速剖面的反演方法更加多样,反演的精度也有了大幅度地提升。几种具有代表性的方法包括:方法一:基于单经验正交回归的声速剖面反演法:基于大量历史数据,将海面高度、海面温度与声速基函数联系起来,通过单经验正交函数回归模型(Single empirical orthogonal function regression,sEOF

r)进行声速剖面反演。
[0004]方法二:基于神经网络的声速剖面反演方法研究:将声速剖面样本分为不同水层,将不同水层内的梯度作为特征量输入数组,结合海面温度(SST)和海面高度(SSH),通过自组织图(SOM)推导出声速剖面。
[0005]方法三:基于随即森林的声速剖面反演方法研究:将海面高度、海面温度、测量时间、纬度和经度数据用于训练模型,得到基函数系数,再基于基函数系数,反演声速剖面。
[0006]当前的技术基本都是线性的sEOF

r方法,普遍的缺点在于:(1)反演前需要确保反演区域内的基函数一致,一般方法是对反演区域切分,而不同的试验人员对于切分标准往往难以达到统一,可能导致不能复现结果。
[0007](2)参数较少且仅采用简单的线性关系,难以精确描述海洋的复杂环境,反演精度大部分情况都比非线性模型低。

技术实现思路

[0008]针对现有技术中的上述不足,本专利技术提供的一种基于XGboost的声速剖面反演方法及系统,解决了大范围声速剖面的快速获取问题。
[0009]为了达到以上目的,本专利技术采用的技术方案为:本方案提供一种基于XGboost的声速剖面反演方法,包括以下步骤:S1、分别获取遥感数据、Argo数据以及WOA13数据;S2、根据遥感数据得到输入数据,以及根据Argo数据和WOA13数据,计算得到声速基函数系数a0‑
a
n
,并将声速基函数系数a0‑
a
n
作为标签数据;S3、对标签数据和输入数据进行切分,并根据切分结果,利用N阶声速基函数对XGboost模型进行训练;S4、根据训练好的XGboost模型,反演声速剖面。
[0010]本专利技术的有益效果是:本专利技术利用声速基函数对XGboost模型进行训练,并对声速
剖面进行反演,本专利技术反演前不需要切分反演网格以保证基函数一致,直接训练XGboost模型,有效避免结果因为切分网格而造成偏差,确保结果可以被复现,同时,本专利技术基于XGboost模型的非线性反演,符合海洋参数之间的复杂关系,避免了线性拟合的局限和不设解析式对结果的限制,使XGboost模型可以准确地计算参数之间的关系,并且有效的提高反演精度,还可引入更多相关的参数去反演声速剖面,挖掘未知参数与声速的关系。比如位置,时间,热流,风速等。
[0011]进一步地,所述步骤S2包括以下步骤:S201、将遥感数据的经纬度取余弦值得到LAT数据和LON数据,将遥感数据的测量日期转化为序号为1

366的DATE数据,其中,所述遥感数据包括SSTA数据和SSHA数据;S202、将LAT数据、LON数据、SSTA数据、SSHA数据以及DATE数据作为输入数据;S203、根据Argo数据以及WOA13数据,利用声速经验公式计算得到背景轮廓剖面和声速剖面;S204、设声速剖面的样本数量为P,并对声速剖面进行插值处理,得到剖面的离散深度点数Q;S205、将声速剖面表示为矩阵C,并根据矩阵C和背景轮廓剖面得到声速异常矩阵E,其中,矩阵C为Q
×
P阶矩阵;S206、计算声速异常矩阵E的协方差矩阵,并对协方差矩阵进行声速基函数的提取,得到声速基函数阶数N;S207、在第一阶声速基函数前增加一阶全为1的数列K0作为第零阶,并对声速基函数的每一阶模态的基函数系数进行回归分析,得到声速基函数系数a0‑
a
n
;S208、将声速基函数系数a0‑
a
n
作为标签数据。
[0012]上述进一步方案的有益效果是:本专利技术通过引入更多的相关参数,可以使XGboost模型更好的学习各参数间的非线性关系,同时,增加第零阶可以有效模拟海洋噪声,提高反演精度。
[0013]再进一步地,所述声速基函数的提取的表达式如下:其中,表示协方差矩阵,K表示声速基函数矩阵,表示协方差矩阵的特征值。
[0014]再进一步地,所述进行回归分析的表达式如下:其中,c
s
表示样本声速剖面,c0表示背景轮廓剖面,N表示N阶声速基函数,表示每一阶模态的基函数系数,K
n
表示声速基函数,n表示第n阶声速基函数。
[0015]上述进一步方案的有益效果是:本专利技术通过提取到精准的EOF基函数以及每一阶基函数的主成分所占比例,基于此可以更好的确定实验应该选用几阶基函数,同时,通过回归方式,可以计算出声速剖面各阶的基函数系数。
[0016]再进一步地,所述步骤S3包括以下步骤:S301、对标签数据和输入数据进行切分,得到训练输入数据、训练标签数据、测试输入数据和测试标签数据;S302、根据声速基函数阶数N,利用训练输入数据和训练标签数据训练XGboost模型,并将测试输入数据输入至XGboost模型,得到XGboost模型输出数据A0,并重复N+1次,得到声速基函数系数A0‑
A
n
,其中,N表示N阶声速基函数,A0表示输入数据为a0时XGboost模型的输出数据,A
n
表示输入数据为a
n
时XGboost模型的输出数据;S303、将声速基函数系数A0‑
A
n
与测试标签数据进行对比,并对XGboost模型进行评估,完成对XGboost模型的训练。
[0017]再进一步地,所述XGboost模型的损失函数的表达式如下:其中,表示XGboost模型的损失函数,T表示树模型的叶节点总数,G
j
表示泰勒展开的第一次项,H
j
表示泰勒展开的第二次项,a、和均表示超参数,j表示树模型上每个叶子节点的索引。
[0018]上述进一步方案的有益效果是:本专利技术使用XGBoost模型这种非线性模型进行反演计算,符合海洋参数之间的复杂关系,避免了线性拟合的局限和设解析式对结果的限制,利用XGBoost模型的优势,有效的提高反演精度。
[0019]再进一步地,所述步骤S4中反演声速剖面的表达式如下:其中,c
r本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于XGboost的声速剖面反演方法,其特征在于,包括以下步骤:S1、分别获取遥感数据、Argo数据以及WOA13数据;S2、根据遥感数据得到输入数据,以及根据Argo数据和WOA13数据,计算得到声速基函数系数a0‑
a
n
,并将声速基函数系数a0‑
a
n
作为标签数据;S3、对标签数据和输入数据进行切分,并根据切分结果,利用N阶声速基函数对XGboost模型进行训练;S4、根据训练好的XGboost模型,反演声速剖面。2.根据权利要求1所述的基于XGboost的声速剖面反演方法,其特征在于,所述步骤S2包括以下步骤:S201、将遥感数据的经纬度取余弦值得到LAT数据和LON数据,将遥感数据的测量日期转化为序号为1

366的DATE数据,其中,所述遥感数据包括SSTA数据和SSHA数据;S202、将LAT数据、LON数据、SSTA数据、SSHA数据以及DATE数据作为输入数据;S203、根据Argo数据以及WOA13数据,利用声速经验公式计算得到背景轮廓剖面和声速剖面;S204、设声速剖面的样本数量为P,并对声速剖面进行插值处理,得到剖面的离散深度点数Q;S205、将声速剖面表示为矩阵C,并根据矩阵C和背景轮廓剖面得到声速异常矩阵E,其中,矩阵C为Q
×
P阶矩阵;S206、计算声速异常矩阵E的协方差矩阵,并对协方差矩阵进行声速基函数的提取,得到声速基函数阶数N;S207、在第一阶声速基函数前增加一阶全为1的数列K0作为第零阶,并对声速基函数的每一阶模态的基函数系数进行回归分析,得到声速基函数系数a0‑
a
n
;S208、将声速基函数系数a0‑
a
n
作为标签数据。3.根据权利要求2所述的基于XGboost的声速剖面反演方法,其特征在于,所述声速基函数的提取的表达式如下:其中,表示协方差矩阵,K表示声速基函数矩阵,表示协方差矩阵的特征值。4.根据权利要求3所述的基于XGboost的声速剖面反演方法,其特征在于,所述进行回归分析的表达式如下:其中,c
s
表示样本声速剖面,c0表示背景轮廓剖面,N表示N阶声速基函数,表示每一阶模态的基函数系数,K
n
表示声速基函数,n表示第n阶声速基函数。5.根据权利要求4所述的基...

【专利技术属性】
技术研发人员:欧圳翼屈科刘琛
申请(专利权)人:广东海洋大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1