一种基于深度学习的改进型城市街景图像分割方法技术

技术编号：34898530 阅读：12 留言：0更新日期：2022-09-10 13:58

本发明专利技术公开一种基于深度学习的改进型城市街景图像分割方法，包括：基于深度学习的改进型城市街景图像分割模型DEEPLS：使用编码解码的框架和ResNet101作为骨干网络，在ASPP模块中新增一层膨胀率为3的空洞卷积，合并之后的6层用并行的3

全部详细技术资料下载

【技术实现步骤摘要】
一种基于深度学习的改进型城市街景图像分割方法

[0001]本专利技术涉及图像处理
，尤其涉及一种基于深度学习的改进型城市街景图像分割方法。

技术介绍

[0002]城市街景图像分割是将一幅城市街景图像按照一定的标准分割成不同区域的过程。作为计算机视觉领域的一个重要分支，已经取得了一定的进展。城市街景图像分割主要分为传统的城市街景分割方法和基于深度学习的城市街景分割方法。
[0003]传统的城市街景分割方法实现简单计算量小，基于阈值的分割方法，实质是利用城市街景图像的不同灰度阈值将前景物体和背景分离出来，但对于复杂图像，阈值分割效果不佳。基于区域的分割方法，其基本思想是将具有相似特征的像素组合起来形成区域，从而将城市街景图像分割成若干不同区域，但容易造成图像的过度分割。基于边缘检测的分割方法，由于边缘像素点的相邻像素灰度值差别较大或颜色不连续，将边缘像素点连接起来，可以形成边缘轮廓达到分割的目的，但其无法得到较好的区域结构。基于聚类的分割方法是基于事物之间的相似性作为划分标准，即将具有相似特征的像素点聚集在同一区域完成分割，但对噪声和灰度不均匀敏感。随着深度学习的不断发展，传统的语义分割效果明显不如基于深度学习的语义分割效果。
[0004]深度学习的出现为城市街景分割方法带来了新的思路，FCN将全连接层改为全卷积层，全卷积层可以取任意大小的城市街景图像作为输入，并使用上采样来解决卷积核池对图像大小的影响，但训练过程复杂且得到的结果还不够精细。U
‑
Net模型在FCN的基础上增加了跳...

【技术保护点】

【技术特征摘要】
1.一种基于深度学习的改进型城市街景图像分割方法，其特征在于，包括：步骤1，基于深度学习构建改进型城市街景图像分割模型DEEPLS：使用编码解码的框架和ResNet101作为骨干网络，在空洞空间金字塔池化模块中新增一层膨胀率为3的空洞卷积，合并之后的6层用并行的3
×
3卷积处理之后再用1
×
1卷积调整通道数，得到的特征图先2倍上采样，输入到CBAM注意力机制再2倍上采样，最后和经过CBAM注意力机制的浅层特征拼接融合得到预测图；步骤2，基于改进型城市街景图像分割模型DEEPLS对城市街景图像进行分割。2.根据权利要求1所述的一种基于深度学习的改进型城市街景图像分割方法，其特征在于，改进后的空洞空间金字塔池化模块的处理流程如下：首先将经过骨干网络ResNet
‑
101得到通道数为2048的特征图，分别进行1
×
1卷积，空洞率分别为{3,6,12,18}的空洞卷积以及全局平均池化，得到6个通道数为256的特征图，将得到的6个特征图在通道维度上拼接融合后，获得改进后的空洞空间金字塔池化模块产生的特征图。3.根据权利要求1所述的一种基于深度学习的改进型城市街景图像分割方法，其特征在于，所述步骤1还包括：在空洞空间金字塔池化模块后加入双通道以获取城市街景图像细节信息，其中第一通道为一个3
×
3卷积，第二通道为两个3
×
3卷积。4.根据权利要求3所述的一种基于深度学习的改进型城市街景图像分割方法，其特征在于，按照如下方式基于双通道获取图像细节信息：将改进后的空洞空间金字塔池化模块中得到的6层拼接特征图作为输入，分为两个通道进行特征提取，第一通道中的3
×
3卷积将1536通道数直接调整为256，第二通道中的第一个3
×
3卷积将通道数1536调整为512，再送入第二通道中的第二个3
×
3卷积中，继续卷积调整为256，得到的两层特征图...

【专利技术属性】
技术研发人员：于俊洋，李绍华，张莉博，何欣，宋亚林，王龙葛，
申请(专利权)人：河南大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人