一种基于空间信息语义分割模型的不透水面提取方法技术

技术编号:38667276 阅读:9 留言:0更新日期:2023-09-02 22:47
本发明专利技术属于自然科学技术领域,公开了一种基于空间信息语义分割模型的不透水面提取方法,包括:步骤1、获取遥感影像,对遥感影像进行预处理得到遥感影像数据集,数据集进行切割得到影像切片数据集,对影像切片数据集进行划分得到遥感影像切片数据集和地面真值标签数据集;步骤2、构建OCR_CLHRnet模型,步骤3、预测不透水面结果,得到语义分割结果;步骤4、将语义分割结果重分类,得到影像切片数据的不透水面分类结果;步骤5、将影像切片数据的不透水面分类结果进行切片的操作进行还原拼接,拼接后即得到区域的不透水面分布结果。本发明专利技术提升模型训练的效率,可以实现大规模、精细化的不透水面监测,提高模型提取不透水面的精度。提高模型提取不透水面的精度。提高模型提取不透水面的精度。

【技术实现步骤摘要】
一种基于空间信息语义分割模型的不透水面提取方法


[0001]本专利技术属于自然科学
,具体的说是一种基于空间信息语义分割模型的不透水面提取方法。

技术介绍

[0002]我们国家正在实施新型城镇化,建设人民城市。建设人民城市需要落实到城市空间布局的各个方面,需要充分考虑城市的密度、温度、精度、广度、绿度。城市不透水面就是一个很好的反映城市化进程的指标,其动态变化可以为城市环境监测、空间规划、城市土地利用分析等提供有效的数据。
[0003]传统的不透水面数据的获取方式主要有4种:从国土调查数据库获取、从规划资料获取、人工解译施工图以及地面勘察测绘。这些方法均存在不能实时获取最新数据,且自动化水平低,不能高效、准确提取信息的问题。而使用载有先进的多谱段遥感设备的卫星,使人们通过对各种现象的表面描述过渡到软件分析和计量探索,使得能够客观、动态地为城市环境系统的监测和管理提供有力的数据基础。
[0004]当前基于遥感图像进行不透水面提取还存在以下问题:(1)如果图像分辨率低于空间分辨率,则很难在图像中检测地物,除非地物具有独特的亮度或颜色或独特的边缘和纹理特征;(2)地物是多样且不断变化的,不同类型的地物相互交错,并表现出接近均匀的光谱特征。此外,相同类型的地物在不同场景中往往呈现出异构的情况,则对于光谱系数的提取存在光谱混淆的可能性;(3)不透水面提取模型精度受限于遥感影像的空间分辨率,而高分辨率遥感影像如亚米级遥感影像成本高昂,且较难获取,且较高精度的深度学习模型计算复杂、运算时间较长,对于计算机硬件性能要求较高;(4)基于语义分割模型进行不透水面提取常出现地物空洞、边界模糊、地物错分等现象,对于不透水面中的建筑物、道路的空间信息表达不充分,且易产生过拟合现象。因此,在中分辨率影像的基础上,研究对城市中的建筑物、道路等具备更精确的解译能力,能够提取较高精度的不透水面信息的模型具有重要意义。

技术实现思路

[0005]针对目前基于遥感影像提取不透水面存在地物混淆、边界模糊等问题,且语义分割模型计算复杂、运算量较大,本专利技术提供了一种基于空间信息语义分割模型的不透水面提取方法,考虑到地物的复杂性和遥感影像中场景的多元性,在OCR语义分割模型的基础上,引入CLHRnet作为主干网络,构建多尺度多维度的全局上下文模型,结合ShuffleNet和坐标注意力机制构建改进的空间信息模块,达到增强地物空间信息的提取能力的同时运算量不需要大幅度提高的目标,通过DropBlock规范卷积网络结构,改善模型过拟合问题,提升模型精度。
[0006]为了达到上述目的,本专利技术是通过以下技术方案实现的:
[0007]本专利技术是一种基于空间信息语义分割模型的不透水面提取方法,该不透水面提取
方法包括如下步骤:
[0008]步骤1、获取遥感影像,对遥感影像进行预处理得到遥感影像数据集,对所述遥感影像数据集进行切割得到影像切片数据集,对所述影像切片数据集进行划分得到遥感影像切片数据集和地面真值标签数据集;
[0009]步骤2、构建OCR_CLHRnet模型,包括CLHRnet模型的搭建和OCR模型的优化,获取高分辨遥感影像,将所述高分辨遥感影像输入构建好的OCR_CLHRnet模型进行训练,得到自训练的预训练模型,在OCR_CLHRnet模型的基础上搭载自训练的预训练模型,输入所述影像切片数据集进行训练,得到最优模型即为不透水面预测模型;
[0010]步骤3、预测不透水面结果:将步骤1得到的得到遥感影像切片数据集和地面真值标签数据集输入到步骤2得到的所述不透水面预测模型,得到语义分割结果;
[0011]步骤4、将步骤3得到的语义分割结果进行重分类,得到不透水面结果,得到影像切片数据的不透水面分类结果;
[0012]步骤5、将步骤4得到的影像切片数据的不透水面分类结果按照步骤1对遥感影像数据集的影像进行切片的操作进行还原拼接,拼接后即得到区域的不透水面分布结果。
[0013]本专利技术的进一步改进在于:步骤2中构建OCR_CLHRnet模型具体包括如下步骤:
[0014]步骤2

1、构建第一阶段空间卷积网络Bottleneck:1
×
1卷积层获取特征,通过2个3
×
3卷积层,接着通过下采样层,最后通过Channel Shuffle层得到初步的第一个阶段的特征信息;
[0015]步骤2

2、在步骤2

1构建的空间卷积网络Bottleneck基础上,重复堆叠Bottleneck,修改通道个数为64,堆叠4个分支进行输出,输出结果为第一阶段的特征信息;
[0016]步骤2

3、构建空间信息模块Basic Block:构建两条分支,第一条分支的操作包括5
×
5深度卷积层、1
×
1卷积层和坐标注意力机制层,第二条分支的操作包括1
×
1卷积层、5
×
5深度卷积层和下采样层,将两个分支进行相加操作,输入Channel Shuffle,完成特征信息的融合;
[0017]步骤2

4、获取不同分辨率上的特征图:由步骤2

3构建的空间信息模块Basic Block作为基础网络,搭建并行网络,重复堆叠空间信息模块Basic Block并改变特征大小,保留多尺度信息,在第二阶段输出8个分支,在第三阶段输出16个分支,在第四阶段输出64个分支,分支数量代表着特征图的解析度,即不同分辨率上的特征信息,获得一种实现多尺度信息融合、高低分辨率信息并行处理、空间信息敏感的语义分割网络结构,即CLHRnet;
[0018]步骤2

5、为充分结合CLHRnet和OCR模型的优势,将步骤2

4搭建的CLHRnet作为主干网络,将第四阶段得到的特征信息输入OCR模型中,所述OCR模型的实现主要包括3个阶段:软对象区域、对象区域表示及最后的对象上下文特征表示,软对象区域的操作包括特征提取和多尺度的特征表示,即基于注意力机制SE(Spatial Excitation)模块提取特征和基于多层金字塔池化ASPP(Atrous Spatial Pyramid Pooling)模块进行多尺度的特征表示,对象区域表示的操作包括特征提取、边框定位、多尺度特征融合、多方向特征编码、上下文特征增强,对象上下文特征表示的操作包括对象特征提取、上下文特征编码、多尺度特征融合、对象分类和识别,当把对象上下文特征表示与网络最深层输入的特征表示拼接之后作为上下文信息增强的特征表示,基于增强后的特征表示预测每个像元的语义类别,即OCR模型计算一组对象区域的特征表达,根据对象区域的特征表达与像元的特征表示之间的相似
度将这些对象区域特征表示传达到每一个像元,在对象上下文特征表示阶段引入DropBlock,即一种结构化的dropout形式,随机地将特征相邻区域中的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于空间信息语义分割模型的不透水面提取方法,其特征在于:所述不透水面提取方法包括如下步骤:步骤1、获取遥感影像,对遥感影像进行预处理得到遥感影像数据集,对所述遥感影像数据集进行切割得到影像切片数据集,对所述影像切片数据集进行划分得到遥感影像切片数据集和地面真值标签数据集;步骤2、构建空间信息语义分割模型(OCR_CLHRnet模型),包括CLHRnet模型的搭建和OCR模型的优化,获取高分辨遥感影像,将所述高分辨遥感影像输入构建好的OCR_CLHRnet模型进行训练,得到自训练的预训练模型,在OCR_CLHRnet模型的基础上搭载自训练的预训练模型,输入所述影像切片数据集进行训练,得到最优模型即为不透水面预测模型;步骤3、预测不透水面结果:将步骤1得到的得到遥感影像切片数据集和地面真值标签数据集输入到步骤2得到的所述不透水面预测模型,得到语义分割结果;步骤4、将步骤3得到的语义分割结果进行重分类,得到不透水面结果,得到影像切片数据的不透水面分类结果;步骤5、将步骤4得到的影像切片数据的不透水面分类结果按照步骤1对遥感影像数据集的影像进行切片的操作进行还原拼接,拼接后即得到区域的不透水面分布结果。2.根据权利要求1所述的一种基于空间信息语义分割模型的不透水面提取方法,其特征在于:步骤2中构建OCR_CLHRnet模型具体包括如下步骤:步骤2

1、构建第一阶段空间卷积网络Bottleneck:1
×
1卷积层获取特征,通过2个3
×
3卷积层,接着通过下采样层,最后通过Channel Shuffle层得到初步的第一个阶段的特征信息;步骤2

2、在步骤2

1构建的空间卷积网络Bottleneck基础上,重复堆叠Bottleneck,修改通道个数为64,堆叠4个分支进行输出,输出结果为第一阶段的特征信息;步骤2

3、构建空间信息模块Basic Block:构建两条分支,第一条分支的操作包括5
×
5深度卷积层、1
×
1卷积层和坐标注意力机制层,第二条分支的操作包括1
×
1卷积层、5
×
5深度卷积层和下采样层,将两个分支进行相加操作,输入Channel Shuffle,完成特征信息的融合;步骤2

4、获取不同分辨率上的特征图:由步骤2

3构建的空间信息模块Basic Block作为基础网络,搭建并行网络,重复堆叠空间信息模块Basic Block并改变特征大小,保留多尺度信息,在第二阶段输出8个分支,在第三阶段输出16个分支,在第四阶段输出64个分支,分支数量代表着特征图的解析度,即不同分辨率上的特征信息,获得一种实现多尺度信息融合、高低分辨率信息并行处理、空间信息敏感的语义分割网络结构,即CLHRnet;步骤2

5、将步骤2

4搭建的CLHRnet作为主干网络,将第四阶段得到的特征信息输入OCR模型中,所述OCR模型的实现主要包括3个阶段:软对象区域、对象区域表示及最后的对象上下文特征表示,软对象区域的操作包括特征提取和多尺度的特征表示,即基于注意力机制SE(Spatial Excitation)模块提取特征和基于多层金字塔池化ASPP(Atrous Spatial Pyramid Pooling)模块进行多尺度的特征表示,对象区域表示的操作包括特征提取、边框定位、多尺度特征融合、多方向特征编码、上下文特征增强,对象上下文特征表示的操作包括对象特征提取、上下文特征编码、多尺度特征融合、对象分类和识别,当把对象上下文特征表示与网络最深层输入的特征表示拼接之后作为上下文信息增强的特征表示,基于增强
后的特征表示预测每个像元的语义类别,即OCR模型计算一组对象区域的特征表达,根据对象区域的特征表达与像元的特征表示之间的相似度将这些对象区域特征表示传达到每一个像元,在对象上下文特征表示阶段引入DropBlock,即一种结构化的dropout形式,随机地将特征相邻区域中的单元进行屏蔽处理;步骤2

6、通过软对象区域的处理后,得到了类别区域特征,进入对象区域表示阶段,对区域进行边框定位以及特征提取;步骤2

7、完成步骤2

6对象区域表示阶段的特征信息提取后,进入最...

【专利技术属性】
技术研发人员:徐颖江畅张荣春
申请(专利权)人:南京邮电大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1