当前位置: 首页 > 专利查询>武汉大学专利>正文

一种基于多尺度残差网络模型的高分影像建筑物提取方法技术

技术编号:29527434 阅读:15 留言:0更新日期:2021-08-03 15:13
本发明专利技术公开了一种基于多尺度残差网络模型的高分影像建筑物提取方法。首先,对高分辨率遥感影像中的典型建筑物类型和特征做出分析,基于深度学习网络大量数据需求设计数据增广策略,确定训练样本集和验证样本集的超参数配比;其次,在U‑Net网络对称结构的基础单元中结合密集捷径结构,设计残差映射单元,并对基本单元中卷积层结构安排进行改进,利于模型训练;同时,该改进网络将影像输入阶段设计为特征金字塔输入结构,可在不同尺度上学习影像特征,结合设计的残差跳跃连接方式进行多尺度特征融合,通过多级残差单元运算细化建筑物分割结果,加强了不同网络层之间多级特征的重用性,有效地增强了梯度在网络中的传递,加速模型收敛。

【技术实现步骤摘要】
一种基于多尺度残差网络模型的高分影像建筑物提取方法
本专利技术涉及遥感应用
,尤其是涉及一种基于多尺度残差网络模型的高分影像建筑物提取方法。
技术介绍
建筑物作为构成城市结构的基本要素之一,其智能提取方法对于城市规划、监测以及管理来说是一项至关重要的任务,对于城市发展分析也有着重要的应用价值。相较于中低分辨率遥感影像,利用高分辨遥感影像进行建筑物变化检测的优势在于:图像包含更丰富的地物信息,如人工建筑在中低分辨率遥感影像中表现为点目标,而在高分辨率影像中会变成明显的面目标,这些目标占据了更多的像素;同一类地物的空间结构、纹理等表征信息更加丰富,这些信息能够更好的反映同一类地物的局部特征以及内部细节差异。但高分辨率遥感影像在带来了丰富的细节信息的同时放大了在中低分辨率遥感影像中较细微、可以忽略的干扰信息,形成影响建筑物检测新的干扰因素。虽然影像空间分辨率的提高缓解了低分辨率传感器的混合像元问题,但同一建筑对应的区域内部由于建筑物材料的不同在光谱响应上差异较大。复杂背景下的建筑物目标结构多变,高低错落,往往又易与周边的树木、道路等地物相混淆,“同谱异物,同物异谱”现象显著,加大了建筑物提取难度。建筑物复杂的结构体现出来的高程不连续、影像中相对遮蔽更加严重以及阴影的影响都是对建筑物检测而言更加严峻的挑战。近年来,随着计算机计算能力和深度学习算法的发展,以卷积神经网络为基础的目标检测识别、图像语义分割逐渐超过了传统算法的最好效果,端到端的深度网络训练方法大幅提高了遥感图像中建筑物目标提取的准确率。其中,基于深度编码-解码网络的方法已经在建筑物提取中得到了广泛的应用。这类网络的编码部分主要用于提取深度抽象的特征,常见的编码网络部分大多采用了经典的网络模型,例如VGGNet、ResNet以及DenseNet等,抛弃了全连接层,在这些网络中输入的图像块经过多次池化操作,网络中间的特征图尺寸经过多倍压缩。网络的解码部分主要用于从编码部分获取的特征进行学习,将图像进行恢复,得到建筑物预测标记影像。目前,绝大多数网络都采取了上采样和跳跃连接结构,将底层学习的特征传递到高层,用于解码网络恢复图像中损失的细节信息。但是,简单的将编码器部分提取的特征图直接连接在对称的编码器部分并不能充分利用多层级中的特征信息,建筑物目标的细节位置信息仍然得不到有效恢复。此外,深度模型往往对显存和硬件条件的限制过高,如何提升目标提取的效率,均衡精度与计算代价也是另一个主要问题。
技术实现思路
针对现有技术存在的问题,本专利技术采用多级特征整合与多尺度特征融合的策略,设计了多尺度残差链接网络模型,目的是解决由于深度网络中池化操作造成的建筑物细节信息丢失的问题,利用丰富的多尺度上下文特征信息实现更精细的建筑物分割。同时,本专利技术构建的深度网络模型可减少模型训练参数和内存的要求。本专利技术的技术方案为:一种基于多尺度残差网络模型的高分影像建筑物提取方法,包括以下步骤:步骤一,根据高分辨率遥感影像中典型的建筑物区域,分析不同类型与风格的建筑物影像特征,基于数据增广策略扩充样本,并确定训练集和验证集的超参数配比;步骤二,基于卷积神经网络基本对称结构、密集捷径结构、残差跳跃连接方式与特征金字塔输入结构,设计多尺度残差连接深度网络整体模型结构,包括以下子步骤;步骤2.1,多尺度残差连接深度网络整体包括编码器部分和解码器部分;步骤2.2,编码器部分采取特征金字塔网络输入结构,获得m个不同尺度上的影像,然后将影像经过卷积层的处理,确保下一层的输入与上一层的输出特征图尺寸保持一致,并对上一层尺度下输出的卷积特征图与该层尺度下经过卷积层处理后的影像特征图做合并,作为下一层的输入,然后经过残差映射单元和最大池化层;所述残差映射单元包括两个分支,主分支包括多个卷积层单元,支路分支包括一个卷积层单元,所述卷积层单元包括卷积层、修正线性单元和批标准化层;设输入为x,主分支表示为支路分支表示为则残差映射单元的输出,如公式(2)所示:步骤2.3,解码器部分包括与编码器部分对应的上采样层和残差映射单元;步骤2.4,编码器部分各尺度输出的深度特征图通过残差跳跃连接方式与解码器部分对应尺度下经过上采样层得到的特征图完成合并;步骤2.5,最后将编码器部分的输出经过卷积层的处理,然后通过Sigmoid激活层将二维的特征图转换为分类图;步骤三,利用步骤1中的训练样本集训练多尺度残差连接深度网络,通过验证样本集获得最佳的多尺度残差连接深度网络模型,最终利用最佳模型对测试集进行高分影像建筑物提取。进一步的,所述步骤一的具体实施步骤如下:(1)分析高分辨率遥感影像中典型建筑物区域的不同特点:(a)砖混结构的多层住宅区,为排列整齐的楼房,规划有序,层数多,排列整齐,同一个小区内的建筑物排列一致,建筑物风格一致;(b)建筑物框架结构清晰的高层住宅区、独栋高层办公楼以及商业建筑物屋顶,其街道整齐,临近房屋高大,带有很狭长的阴影,楼间距大,每一栋房屋高度、外观都不相同;(c)远郊的建筑物屋顶分布稀疏,且为低矮的房屋,形状散乱无规则,犬牙交替,相互连接;(d)别墅区排列整齐,都是一栋栋单体建筑,建筑物长宽一致,阴影短小;屋顶形状,外墙材料一致,且每一栋别墅都拥有花园;(2)采取多种数据增广策略扩充训练样本集:(a)输入图像和输出标签图像进行随机裁剪;(b)输入图像和输出标签图像进行随机旋转,tr∈[-5,5];(c)输入图像每个波段乘以一个随机数值n,n∈[0.5,1];(d)输入图像和输出标签图像进行随机水平和垂直翻转;(3)数据分割,将涵盖各种城区、郊区和乡村地区的建筑物实例以及其他的地表物体的数据集分为训练集、验证集以及测试集,确定训练集数据样本:验证集数据样本为5:1,同时将数据样本分割为512×512大小的输入图像,以便后续对模型进行训练和测试模型训练效果。进一步的,所述步骤2.2中,主分支中卷积层的卷积核大小包括3×3和1×1两种,并设置步长参数大小为1,填充参数大小为1,支路分支中卷积层采用了1×1大小的卷积核。进一步的,所述步骤2.2中,采用特征金字塔网络输入结构,将5个不同尺度下的影像作为卷积层输入进行不同尺度上的影像特征学习,分别为512×512×3、256×256×3、128×128×3、64×64×3和32×32×3。本专利技术基于多尺度残差连接深度网络模型,研究高分辨率遥感影像中单体建筑物的提取方法,特点是:(1)由于目前的开源建筑物数据集基本都来自同一传感器或成像时间接近的影像,即测试影像和训练影像的数据分布非常接近,导致深度网络模型鲁棒性较差,通过分析多源多时相数据影像中的建筑物特征,设计数据增广策略,确定深度网络训练中的数据超参数,提升深度卷积神经网络的泛化能力;(2)考虑到UNet和ResNet网络结构的优点,对深度卷积网络卷积层的基本单元结构进行改进,在UNet网络的基本单元结构基本文档来自技高网
...

【技术保护点】
1.一种基于多尺度残差网络模型的高分影像建筑物提取方法,其特征在于,包括以下步骤:/n步骤一,根据高分辨率遥感影像中典型的建筑物区域,分析不同类型与风格的建筑物影像特征,基于数据增广策略扩充样本,并确定训练集和验证集的超参数配比;/n步骤二,基于卷积神经网络基本对称结构、密集捷径结构、残差跳跃连接方式与特征金字塔输入结构,设计多尺度残差连接深度网络整体模型结构,包括以下子步骤;/n步骤2.1,多尺度残差连接深度网络整体包括编码器部分和解码器部分;/n步骤2.2,编码器部分采取特征金字塔网络输入结构,获得m个不同尺度上的影像,然后将影像经过卷积层的处理,确保下一层的输入与上一层的输出特征图尺寸保持一致,并对上一层尺度下输出的卷积特征图与该层尺度下经过卷积层处理后的影像特征图做合并,作为下一层的输入,然后经过残差映射单元和最大池化层;/n所述残差映射单元包括两个分支,主分支包括多个卷积层单元,支路分支包括一个卷积层单元,所述卷积层单元包括卷积层、修正线性单元和批标准化层;设输入为x,主分支表示为

【技术特征摘要】
1.一种基于多尺度残差网络模型的高分影像建筑物提取方法,其特征在于,包括以下步骤:
步骤一,根据高分辨率遥感影像中典型的建筑物区域,分析不同类型与风格的建筑物影像特征,基于数据增广策略扩充样本,并确定训练集和验证集的超参数配比;
步骤二,基于卷积神经网络基本对称结构、密集捷径结构、残差跳跃连接方式与特征金字塔输入结构,设计多尺度残差连接深度网络整体模型结构,包括以下子步骤;
步骤2.1,多尺度残差连接深度网络整体包括编码器部分和解码器部分;
步骤2.2,编码器部分采取特征金字塔网络输入结构,获得m个不同尺度上的影像,然后将影像经过卷积层的处理,确保下一层的输入与上一层的输出特征图尺寸保持一致,并对上一层尺度下输出的卷积特征图与该层尺度下经过卷积层处理后的影像特征图做合并,作为下一层的输入,然后经过残差映射单元和最大池化层;
所述残差映射单元包括两个分支,主分支包括多个卷积层单元,支路分支包括一个卷积层单元,所述卷积层单元包括卷积层、修正线性单元和批标准化层;设输入为x,主分支表示为支路分支表示为则残差映射单元的输出,如公式(2)所示:



步骤2.3,解码器部分包括与编码器部分对应的上采样层和残差映射单元;
步骤2.4,编码器部分各尺度输出的深度特征图通过残差跳跃连接方式与解码器部分对应尺度下经过上采样层得到的特征图完成合并;
步骤2.5,最后将编码器部分的输出经过卷积层的处理,然后通过Sigmoid激活层将二维的特征图转换为分类图;
步骤三,利用步骤1中的训练样本集训练多尺度残差连接深度网络,通过验证样本集获得最佳的多尺度残差连接深度网络模型,最终利用最佳模型对测试集进行高分影像建筑物提取。


2.根据权利要求1所述的一种基于多尺度残差网络模型的高分影像建筑物提取方法,其特征在于:所述步骤一的具体实施步骤如下:
(1)分析高分辨率遥感影像中典型...

【专利技术属性】
技术研发人员:眭海刚杜卓童李强段志强肖昶王海涛王挺程旗冯文卿
申请(专利权)人:武汉大学
类型:发明
国别省市:湖北;42

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1