基于可变形注意力机制的高分辨率遥感影像道路提取方法技术

技术编号：41440253 阅读：19 留言：0更新日期：2024-05-28 20:33

本发明专利技术提出一种基于可变形注意力机制的高分辨率遥感影像道路提取方法，解决了高分辨率遥感领域对复杂道路提取准确率低，使用范围窄的问题。实现步骤为：对现有的高分辨率遥感影像数据集利用滑动窗口、水平翻转与垂直翻转操作进行数据增强；利用四个方向(水平、垂直、左对角线以及右对角线)的一维卷积构成道路增强模块；利用1×1卷积模块约束自注意力机制中可变形偏移量的学习，形成可变形注意力模块，自动适应道路的几何变换；以ResNet50为基础框架的编码器与双线性插值上采样解码器之间，嵌入道路增强模块与可变形注意力模块，提取多尺度道路信息；后处理过程包括中心线提取，中心线断线重连以及生成中心线矢量图。本发明专利技术提高了道路提取的准确率。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及一种高分辨率遥感影像处理技术。特别是涉及一种基于可变形注意力机制的高分辨率遥感影像道路提取方法。

技术介绍

1、为了快速获取大范围区域的最新道路信息，从高分辨率遥感图像中提取道路网络已成为一种很有前途的方法。高分辨率遥感影像可产生海量数据，已成为道路区域提取和地理空间数据库实时更新的主要数据源。虽然深度卷积神经网络在道路语义分割和提取方面具有良好的性能，但道路提取仍然存在困难：道路的类内差异和类间相似性增加了提取的难度，而道路类型多样，城市道路、乡村道路、铁路等存在明显差异，但道路与其他物体(如城市道路、城市建筑)的相似度较高，会导致道路上下文信息缺失。

2、综合国内外研究进展，目前的神经网络模型往往无法捕捉遥感影像中的长距离依赖关系，在很大程度上导致提取效果有限。因此，捕获长距离依赖一直是深度学习领域值得思考的问题。最近的工作主要集中在通过多层卷积堆叠、atrous卷积、特征金字塔和多尺度卷积等方法捕获长距离依赖关系，以扩大感受野。这些方法都有局限性，比如atrous卷积在小物体上性能较差，多层卷积的堆叠会导致计算量激增和提取效率低。此外，对于在有限的计算资源中捕捉高分辨率遥感影像道路的长距离依赖关系，目前研究较少。

3、自注意力机制通过捕获全局信息来获取更大的感受野和上下文信息。从数学的角度来看，自注意力机制通过取输入信号的成对点积来学习权重，然后将所有信号与相应的权重相加。尽管自注意力机制在捕获远程依赖方面有一定的效果，但它的局限性也非常明显。对于遥感影像，空间尺度上的相邻像素总是高度

技术实现思路

1、本专利技术所要解决的技术问题是，提供一种能够满足高分辨率遥感领域对复杂道路提取的准确性、快速性和适用范围广要求的基于可变形注意力机制的高分辨率遥感影像道路提取方法。

2、本专利技术所采用的技术方案是：一种基于可变形注意力机制的高分辨率遥感影像道路提取方法，其特征在于，包括如下步骤：

3、1)对高分辨率遥感影像数据集利用滑动窗口、水平翻转与垂直翻转操作进行数据增强，具体为：

4、在高分辨率遥感图像上，利用固定大小的窗口采样，设置滑动步长；对数据集利用水平与垂直翻转来增强数据的多样性，数据集中图片的翻转概率设置为0到1之间的随机数。

5、2)利用四个方向的一维卷积构成道路增强模块，所述四个方向分别是：水平、垂直、左对角线以及右对角线。

6、3)利用1×1卷积模块约束自注意力机制中可变形偏移量的学习，从而形成可变形注意力模块，自动适应道路的几何变换。

7、4)在以resnet50为基础框架的编码器与双线性插值上采样解码器之间，嵌入道路增强模块与可变形注意力模块，提取多尺度道路信息。

8、5)提取4)中得到的道路网的道路中心线，然后对中心线进行断线检测与重连，提高道路的连通性，并将优化后的道路网进行栅格转矢量，生成矢量道路网。

9、6)根据道路交并比(iou)以及f1分数对模型方法的结果进行评价，并与其他5个先进道路提取模型进行比较，所述5个模型分别是：u-net、deeplabv3、d-linknet、sgcn-net和mdanet，以验证所述方法的先进性。

10、本专利技术的基于可变形注意力机制的高分辨率遥感影像道路提取方法，通过设计一种道路信息增强的可变形注意力机制，以python作为设计语言，以pytorch作为算法设计框架，使高分辨率遥感影像中的复杂道路特征能够更好地被提取，在有限的软件计算资源条件下，实现低计算复杂度下的复杂道路长距离上下文依赖关系的捕获，满足高分辨率遥感领域对卫星影像道路提取的准确性、时效性和适用范围广的要求。

本文档来自技高网...

【技术保护点】

1.一种基于可变形注意力机制的高分辨率遥感影像道路提取方法，其特征在于，包括如下步骤：

2.根据权利要求1所述的基于可变形注意力机制的高分辨率遥感影像道路提取方法，其特征在于，步骤2)中，所述道路增强模块RAM为：

3.根据权利要求1所述的基于可变形注意力机制的高分辨率遥感影像道路提取方法，其特征在于，步骤3)中，所述利用1×1卷积模块约束自注意力机制中可变形偏移量的学习的步骤为：

4.根据权利要求3所述的基于可变形注意力机制的高分辨率遥感影像道路提取方法，其特征在于，步骤S1中包括对每个像素偏移量的采样：

5.根据权利要求3所述的基于可变形注意力机制的高分辨率遥感影像道路提取方法，其特征在于，步骤S2中，所述的可变形注意力模块DAM不仅考虑了空间偏移还考虑了相邻像素之间的相互作用，其中的注意力权重为：

6.根据权利要求3所述的基于可变形注意力机制的高分辨率遥感影像道路提取方法，其特征在于，步骤S3中，为了有选择地聚合道路上下文信息并在全局视图中保留更多的语义信息，通过对所有采样像素IV求和来提取上下文信息。最后，通过公

7.根据权利要求1所述的基于可变形注意力机制的高分辨率遥感影像道路提取方法，其特征在于，步骤4)是以经典残差网络ResNet50为基础框架，将道路增强模块RAM与可变形注意力模块DAM嵌入ResNet50每一层编码器与解码器之间，得到多尺度道路特征。

8.根据权利要求1所述的基于可变形注意力机制的高分辨率遥感影像道路提取方法，其特征在于，步骤5)首先借助形态学细化算法提取道路中心线，然后用张量投票算法进行断线重连来提高道路网连通性，对图中的断线端点进行判断时，将它的领域点编码为二阶对称张量，再将各张量矩阵分解，过程表示成公式(7)：

...

【技术特征摘要】

1.一种基于可变形注意力机制的高分辨率遥感影像道路提取方法，其特征在于，包括如下步骤：

2.根据权利要求1所述的基于可变形注意力机制的高分辨率遥感影像道路提取方法，其特征在于，步骤2)中，所述道路增强模块ram为：

4.根据权利要求3所述的基于可变形注意力机制的高分辨率遥感影像道路提取方法，其特征在于，步骤s1中包括对每个像素偏移量的采样：

5.根据权利要求3所述的基于可变形注意力机制的高分辨率遥感影像道路提取方法，其特征在于，步骤s2中，所述的可变形注意力模块dam不仅考虑了空间偏移还考虑了相邻像素之间的相互作用，其中的注意力权重为：

6.根据权利要求3所述的基于可变形注...

【专利技术属性】
技术研发人员：张广运，戴菱，张荣庭，
申请(专利权)人：南京工业大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人