【技术实现步骤摘要】
一种基于多尺度注意力机制的冰下层结构提取方法
[0001]本专利技术属于计算机视觉、模式识别与极地冰川学领域,设计一种基于MsANet网络的冰下层结构提取方法。
技术介绍
[0002]随着人民生活水平的提高与技术的发展,对智能分析、制造的期望和需求愈加强烈。其中主要涉及到的大数据分析与人工智能受到了广泛关注。现在,人工智能与不同领域的结合是一个正在不断探索的、具有重要意义的方向。极地冰川学作为一项地理观测和建模演绎的复杂学科,对人类的生产生活、全球气候研究具有极大的意义。为进一步促进对极地冰川的研究,可以从自动化处理冰盖雷达拓扑序列中开始着手。由于手工处理的冰盖雷达图效率低,且手工设计特征的方法过程复杂、效率差,并不适合处理大型数据集。因此,将对极地冰盖雷达图的分析与人工智能相交融具有非常重要的应用意义,诸多国内外极地研究机构都对此方向贡献出诸多的研究投入。在这其中,机器学习是将人工智能变为现实的重要方法,运用机器学习的算法,将收集到的数据加以分析与整理,并建立对应的模型,从而实现自动的分析过程。如果,构建一些能够辅助冰川学家进行冰盖雷达图的分析的系统,实现对冰盖雷达图的自动冰川提取和简单的常规分析,那么在极大方便冰川学家利用提取的极地冰盖数据进行进一步的研究同时,也可以一定程度上避免对极地冰盖下冰层的错误提取的现象。
[0003]极地冰盖下冰层提取主要为极地冰盖的分析、冰川模型的建模进行数据准备。可从提取的冰下层结构直接推导出冰层厚度,再结合之前的冰厚数据,可以进行对冰盖质量变化的估计。利用提取的冰层数据建 ...
【技术保护点】
【技术特征摘要】
1.一种基于多尺度注意力机制的冰下层结构提取方法,其特征在于,提出的网络搭建结构如下:MsANet由三个部分组成:低级特征提取阶段,高级特征提取阶段和分类阶段;低级特征提取阶段的特征在于通过一个卷积层结构和多尺度模块完成对输入冰下层结构的通用低级特征的多尺度表示,以供为后续提取冰层结构的高级特征做准备;高级特征提取阶段利用含有卷积层、注意力模块和多尺度模块的两路分支结构以分别学习冰表面层和冰基岩层独有的可区别特征;分类阶段利用上述提取到的高级特征进行组合分类,以对目标冰层结构的位置进行准确预测提取;在特征提取阶段,除第一个块外,均引入了多尺度模块,以进行对冰层特征的多尺度表示,增强网络对冰层特征的表示能力;在高级特征提取阶段,在卷积层之后引入的注意力多尺度模块,先利用注意力机制捕获冰下层结构的重要特征,然后再送入多尺度模块,增强对重要的冰层特征的多尺度表示,提高对冰下层结构的空间
‑
序列关系的建模能力;其中多尺度模块由三条支路组成,三条支路上分别存在一个不同尺度大小的卷积滤波器,其中卷积核大于3的卷积滤波器进行分解,以减少网络参数量;紧接着,三条支路输出的多尺度特征被级联在一起,以最大程度保留学习的多尺度特征;然后,依次送入瓶颈单元和池化层分别得到对通道间和空间特征的下采样;其中注意力模块分为两个子模块,分别为3D位置注意力模块和3D通道注意力模块;3D位置注意力模块着重关注于冰层特征的空间位置关系,在全局空间中的整合相似特征,而3D通道注意力模块着重关注于冰层特征通道之间的关联,以增强通道下特定语义响应能力;使用MsANet网络实现冰下层结构提取的过程训练时的特征:输入到MsANet的数据是连续的T帧的雷达拓扑图;以实际的第个拓扑切片作为地面真值,将地面真值与网络提取得到的冰层位置输入到损失函数中进行网络参数的优化,并使用了指数型变化的学习率以更好的匹配网络的学习速度。2.根据权利要求1所述的方法,其特征在于,输入数据处理具体为:将连续的T帧的雷达拓扑序列按顺序排列,这里T取5,得到形如1
×5×
64
×
64大小,即通道数
×
切片数
×
雷达切片图的高
×
雷达切片图的宽的数据准备输入网络中。3.根据权利要求1所述的方法,其特征在于,构建MsANet网络具体为:所构造的MsANet网络的各层具体参数如下:
①
块1:3D卷积单元、3D批归一化层、Relu激活函数和混合池化层依次按顺序排列;3D卷积单元:输入尺寸为5
×
64
×
64,输入通道数为1,卷积核为3
×5×
3,步长为1,边缘填充方式为“零填充”,输出尺寸为5
×
64
×
64,输出通道数为16;混合池化层结合了最大池化层和平均池化层,混合池化层的结果为这两个池化层结果之和;混合池化层:输入尺寸5
×
64
×
64,输入通道数为16,池化核为1
×2×
2,边缘填充方式为“零填充”,输出尺寸为5
×
32
×
32,输出通道数为16;
②
块2:3D卷积单元、3D批归一化层、Relu激活函数和多尺度模块依次按顺序排列;3D卷积单元:输入尺寸为5
×
32
×
32,输入通道数为16,卷积核为3
×5×
3,步长为1,边缘填充方式为“零填充”,输出尺寸为5
×
32
×
32,输出通道数为32;多尺度模块:输入尺寸为5
×
32
×
32,输入通道数为32,池化核为1
×2×
2,经过三个支路的多尺度学习和下采样后,输出尺寸为5
×
16
×
16,输出通道数为32;
③
块3a、块3b:从块3开始,分为两个支路a、b以分别学习冰表面层和冰基岩层的特征;在块3中,三组3D卷积操作、注意力模块和多尺度模块依次按顺序排列;3D卷积单元、3D批归一化层、Relu激活函数为一组3D卷积操作;第一组3D卷积操作中的3D卷积单元:输入尺寸为5
×
16
×
16,输入通道数为32,卷积核为3
×5×
3,步长为1,边缘填充方式为“零填充”,输出尺寸为5
×
16
×
16,输出通道数为64;第二、三组3D卷积操作中的3D卷积单元:输入尺寸为5
×
16
×
16,输入通道数为64,卷积核为3
×5×
3,步长为1,边缘填充方式为“零填充”,输出尺寸为5
×
16
×
16,输出通道数为64;注意力模块:输入尺寸为5
×
16
×
16,输入通道数为64,经过3D位置注意力模块和3D通道注意力模块后通过融合,输出尺寸为5
×
16
×
16,输出通道数为64;多尺度模块:输入尺寸为5
×
16
×
16,输入通道数为64,池化核为1
×2×
2,经过三个支路的多尺度学习和下采样后,输出尺寸为5
×8×
8,输出通道数为64;
④
块4a、块4b:在块4中,三组3D卷积操作、注意力模块和多尺度模块依次按顺序排列;3D卷积单元、3D批归一化层、Relu激活函数为一组3D卷积操作;第一组3D卷积操作中的3D卷积单元:输入尺寸为5
×8×
8,输入通道数为64,卷积核为3
×5×
3,步长为1,边缘填充方式为“零填充”,输出尺寸为5
×8×
8,输出通道数为128;第二、三组3D卷积操作中的3D卷积单元:输入尺寸为5
×8×
8,输入通道数为128,卷积核为3
×5×
3,步长为1,边缘填充方式为“零填充”,输出尺寸为5
×8×
8,输出通道数为128;注意力模块:输入尺寸为5
×8×
8,输入通道数为128,经过3D位置注意力模块和3D通道注意力模块后通过融合,输出尺寸为5
×8×
8,输出通道数为128;多尺度模块:输入尺寸为5
×8×
8,输入通道数为128,池化核为5
×2×
2,经过三个支路的多尺度学习和下采样后,输出尺寸为1
×4×
4,输出通道数为128;
⑤
块5a、块5b:3D卷积单元、Relu激活函数、维度重塑和全连接层依次使用;3D卷积单元:输入尺寸为1
×4×
4,输入通道数为128,卷积核为1
×4×
4,步长为1,无边缘填充,输出尺寸为1
×1×
1,输出通道数为256;维度重塑:输入尺寸为1
×1×
1,通道数256,将此4维数据将至1维,得到输出尺寸为256;全连接层:输入尺寸为256,输出尺寸为64。4.根据权利要求1所述的方法,其特征在于,所构造的多尺度模块结构的各层具体参数如下:
①
I1支路:由1个3D卷积单元、3D批归一化层和Relu激活函数组成,输入尺寸为D
×
H
×
W,输入通道数为C,卷积核为1
×1×
1,步长为1,无边缘填充,输出尺寸为D
×
H
×
W,输出通道数C;
②
I2支路:由1个3D卷积单元、3D批归一化层和Relu激活函数组成,输入尺寸为D
×
H
×
W,输入通道数为C,卷积核为3
×3×
3,步长为1,边缘填充方式为“零填充”,输出尺寸为D
×
H
×
W,输出通道数C;
③
I3支路:由两组1个3D卷积单元、3D批归一化层和Relu激活函数组成;第一组3D卷积核:输入尺寸为D
×
H
×
W,输入通道数为C,卷积核分3
×3...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。