一种二维图像语义分割方法技术

技术编号：31237809 阅读：17 留言：0更新日期：2021-12-08 10:23

本发明专利技术公开了一种二维图像语义分割方法，包括：输入二维图像；将二维图像通过主干特征提取网络获得第一特征图、第二特征图和第三特征图；将第二特征图和第三特征图通过金字塔池化操作获得第四特征图和第五特征图；使用特征融合模块将第一特征图、第三特征图、第四特征图和第五特征图进行融合；将融合后的特征通过感受野模块和卷积上采样操作获得最终语义分割结果。本发明专利技术融合了网络的多层特征，特征信息更充分，对网络进行精度补偿，改善目标的边缘分割效果，实现更精细的图像语义分割。实现更精细的图像语义分割。实现更精细的图像语义分割。

全部详细技术资料下载

【技术实现步骤摘要】
一种二维图像语义分割方法

[0001]本专利技术涉及计算机视觉领域，特别涉及一种二维图像语义分割方法。

技术介绍

[0002]语义分割是计算机视觉中一个重要的分支领域，其目的是为图像中的每个像素标记类别标签，对图像进行像素级别的分类，从而表示该像素的语义信息，采用学习到的算法模型预测同分布新图像的每个像素标签，将不同类别的对象分割出来。语义分割作为图像理解、图像生成等计算机视觉研究前沿领域的基础环节，在自动驾驶、遥感图像分析、机器人传感、医疗图像等方面有着广泛的应用，其具有重要的研究意义和应用价值。
[0003]全卷积神经网络FCN是语义分割的开创之作，实现了端到端的像素级别分类，但多次下采样和反卷积操作导致图像部分信息丢失，缺乏空间一致性。全局卷积网络GCN使用大的卷积核连接特征图和每个像素，使像素与特征图的结合更加紧密，主要提升了目标内部的准确率，对边界范围的影响较小。DeepLab系列网络的核心是使用空洞卷积扩大了感受野，但是网络在解码过程中仅融合一个尺度编码特征，导致部分细节信息丢失，最终分割结果不够精细。金字塔场景解析网络PSPNet开创性地引入金字塔池化模块(Pyramid Pooling Module,PPM)，其通过对不同区域的上下文信息进行聚合，提高网络使用全局上下文信息的能力，但其对小目标物体处理得不够理想，边缘分割得不够精准。
[0004]现有的大部分语义分割方法需要解决的关键问题如下：语义标签预测不准确，易混淆类别难以有效区分，图像边缘轮廓细化不佳，分割目标与背景之间的边缘信息...

【技术保护点】

【技术特征摘要】
1.一种二维图像语义分割方法，其特征在于，包含以下步骤：输入二维图像，其包括用于网络训练的图像数据集和待分割图像；将二维图像通过主干特征提取网络获得第一特征图、第二特征图和第三特征图；将第二特征图和第三特征图通过金字塔池化操作获得第四特征图和第五特征图；使用特征融合模块将第一特征图、第三特征图、第四特征图和第五特征图进行融合；将融合后的特征通过感受野模块和卷积上采样操作获得最终语义分割结果。2.根据权利要求1所述的一种二维图像语义分割方法，其特征在于，所述训练过程采用联合损失方式，总损失为交叉熵损失(Cross Entropy Loss)与集合相似度损失(Dice Loss)之和。3.根据权利要求1所述的一种二维图像语义分割方法，其特征在于，所述第一特征图为浅层特征，包含丰富的空间位置信息。所述第二特...

【专利技术属性】
技术研发人员：徐锋，陈国栋，聂瑜，梁志强，陈妍洁，郭中远，张文凯，李瑾，
申请(专利权)人：西南科技大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人