System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于改进Deeplabv3+的高效语义分割方法技术_技高网
当前位置: 首页 > 专利查询>福州大学专利>正文

一种基于改进Deeplabv3+的高效语义分割方法技术

技术编号:44555129 阅读:2 留言:0更新日期:2025-03-11 14:17
本发明专利技术提出一种基于改进Deeplabv3+的高效语义分割方法,包括以下步骤:将输入的图片裁剪为512×512后,输入Mobilenetv2特征提取网络中进行特征提取,获得128×128×24、64×64×32、32×32×96和32×32×320四个不同层级的特征;将前三个层级的特征输入FPN模块中进行特征融合输出浅层特征,将其输入PCSM注意力模块后的输出特征输入解码器中;将最后一层级的特征输入EASPP模块得到深层特征,将其输入PCSM注意力模块后的输出特征输入解码器中;输入解码器的浅层特征经过1×1卷积调整通道数,深层特征经过1×1卷积调整通道数以及上采样后与经过1×1卷积调整通道数的浅层特征进行拼接,再经过3×3卷积和4倍上采样得到最终的预测结果。本发明专利技术实现了对传统的Deeplabv3+的优化。

【技术实现步骤摘要】

本专利技术涉及语义分割,尤其涉及一种基于改进deeplabv3+的高效语义分割方法。


技术介绍

1、语义分割是计算机视觉领域的关键问题,语义分割的作用是将图像中的每个像素点按照该像素点的物体所属于的类别将其标注为不同颜色,从而实现类别的划分。语义分割已大量应用在遥感图像、医学影像、自动驾驶等领域,为各领域提供更多智能化的应用。

2、当前的语义分割方法已有较高的精度,但是仍存在许多问题。首先是卷积神经网络(cnn)的局限性,cnn作为语义分割的基础框架,存在一些问题,如感受野受限,无法充分的捕捉上下文语义信息,导致在特征提取过程中信息丢失,影响最终的分割精度,在小物体、物体边缘分割以及多类别交错的复杂场景中的分割效果不佳。其次是当前的语义分割模型通常模型复杂计算量大,需要较大的显存,限制了它们在资源受限的移动设备、嵌入式设备与工业生产等需要实时处理的应用场景中适用性。现有的技术可能较难满足实时处理的需求,为了在资源受限的设备上部署,需要在保证高精度的情况下更轻量化和高效的模型。

3、鉴于现有技术的不足之处,本专利技术提出一种基于改进deeplabv3+的高效语义分割方法方法。


技术实现思路

1、本专利技术的目的在于提出一种基于改进deeplabv3+的高效语义分割方法,对传统的deeplabv3+进行了优化,使其参数量和计算量大大减少,推理速度实现了显著提升,能够部署在资源有限的设备上并实现实时处理。同时通过fpn模块和easpp模块充分融合了多层级特征以及引入pcsm注意力模块,实现了深层语义信息和浅层语义信息的相互补充,增大了模型的感受野,解决了aspp模块在特征提取过程中信息丢失的问题,使该模型在小物体分割、边缘分割以及多类别交错的复杂场景中的分割精度得到大幅提高。

2、为实现上述目的,本专利技术的技术方案是:一种基于改进deeplabv3+的高效语义分割方法,具体包括以下步骤:

3、s1、将输入的图片裁剪为512×512后,输入mobilenetv2特征提取网络中进行特征提取,获得128×128×24、64×64×32、32×32×96和32×32×320四个不同层级的特征;

4、s2、将mobilenetv2特征提取网络提取的前三个层级128×128×24、64×64×32和32×32×96的特征输入fpn模块中进行特征融合,融合后输出128×128×152的浅层特征,将128×128×152的浅层特征输入pcsm注意力模块后,将pcsm注意力模块输出的特征输入解码器中;

5、s3、将mobilenetv2特征提取网络提取的32×32×320的特征输入easpp模块得到32×32×1792的深层特征,将32×32×1792的深层特征输入pcsm注意力模块后,将pcsm注意力模块的输出特征输入解码器中;

6、s4、将步骤s2输入解码器的特征经过1×1卷积调整通道数,将步骤s3输入解码器的特征经过1×1卷积以及上采样后,与经过1×1卷积调整通道数的步骤s2输入特征进行拼接,再经过3×3卷积和4倍上采样得到最终的预测结果。

7、优选的,所述mobilenetv2特征提取网络应用传统mobilenetv2网络的前8层网络结构配置,其中第7层的步长s由2改为1,所述mobilenetv2特征提取网络的第1层输入特征大小为512×512×3,所述mobilenetv2特征提取网络第3层、第4层、第6层和第8层的输出特征大小分别为128×128×24、64×64×32、32×32×96和32×32×320。

8、优选的,所述fpn模块具体执行以下操作:将mobilenetv2特征提取网络提取的32×32×96的特征经过二倍上采样后与64×64×32的特征拼接输出64×64×128的特征,将64×64×128的特征经过二倍上采样后与128×128×24拼接,最终输出128×128×152的浅层特征。

9、优选的,所述easpp模块包括三大分支,所述三大分支并行工作并输出大小分别为32×32×256、32×32×1280、32×32×256的三部分特征,将三大分支的输出结果在通道维度上进行拼接得到大小为32×32×1792的easpp模块的输出特征;具体如下:

10、第一大分支为1×1卷积层,输入mobilenetv2特征提取网络提取大小为32×32×320的深层特征,经过1×1卷积并调整通道数后直接输出32×32×256的特征;

11、第二大分支包括五层3×3的空洞卷积,五层3×3的空洞卷积的输出结果拼接而成的32×32×1280特征;

12、第三大分支是平均池化层,对输入的32×32×320的深层特征进行平均池化并调整通道数后输出32×32×256的特征;最终将easpp模块的三大分支的输出结果进行拼接得到32×32×1792的特征。

13、优选的,所述五层3×3的空洞卷积的空洞率分别为3、6、12、18、24。

14、优选的,所述easpp模块的五层3×3的空洞卷积中,第一层至第四层的每一层3×3空洞卷积输出两份相同的结果,一份直接输出用于与其他四层3×3空洞卷积的输出结果进行拼接,另一份用作下一层3×3空洞卷积的输入特征拼接,具体如下:

15、将mobilenetv2特征提取网络提取大小为32×32×320的深层特征记为特征一;

16、将特征一输入第一层3×3空洞卷积并输出特征二;

17、将特征一和特征二进行拼接获得特征三,将特征三输入第二层3×3空洞卷积并输出特征四;

18、将特征一和特征三进行拼接获得特征五,将特征五和特征四进行拼接获得特征六,将特征六输入第三层3×3空洞卷积并输出特征七;

19、将特征一和特征五进行拼接获得特征八,将特征八和特征六进行拼接获得特征九,将特征九和特征七进行拼接获得特征十,将特征十输入第四层3×3空洞卷积并输出特征十一;

20、将特征一和特征八进行拼接获得特征十二,将特征十二和特征九进行拼接获得特征十三,将特征十三和特征十进行拼接获得特征十四,将特征十四和特征十一进行拼接获得特征十五,将特征十五输入第五层3×3空洞卷积并输出特征十六;

21、将特征二、特征四、特征七、特征十一、特征十六进行拼接获得第二大分支的输出结果。

22、优选的,所述pcsm模块包括并行连接的通道注意力模块和空间注意力模块;所述pcsm模块具体执行以下操作:

23、所述pcsm模块的输入的h×w×c的特征分别通过通道注意力模块和空间注意力模块生成通道权重和空间权重后,将通道权重和空间权重分别与pcsm模块的输入特征相乘获得大小为h×w×c的空间特征和通道特征,将通道特征、空间特征以及输入特征在通道维度上进行拼接输出h×w×3c的特征,再利用一个1×1卷积调整通道数,输出大小为h×w×c的pcsm模块输出特征,其中,h、w和c分别表示特征的长本文档来自技高网...

【技术保护点】

1.一种基于改进Deeplabv3+的高效语义分割方法,其特征在于,具体包括以下步骤:

2.根据权利要求1所述的一种基于改进Deeplabv3+的高效语义分割方法,其特征在于,所述Mobilenetv2特征提取网络应用传统Mobilenetv2网络的前8层网络结构配置,其中第7层的步长s由2改为1,所述Mobilenetv2特征提取网络的第1层输入特征大小为512×512×3,所述Mobilenetv2特征提取网络第3层、第4层、第6层和第8层的输出特征大小分别为128×128×24、64×64×32、32×32×96和32×32×320。

3.根据权利要求1所述的一种基于改进Deeplabv3+的高效语义分割方法,其特征在于,所述FPN模块具体执行以下操作:将Mobilenetv2特征提取网络提取的32×32×96的特征经过二倍上采样后与64×64×32的特征拼接输出64×64×128的特征,将64×64×128的特征经过二倍上采样后与128×128×24拼接,最终输出128×128×152的浅层特征。

4.根据权利要求1所述的一种基于改进Deeplabv3+的高效语义分割方法,其特征在于,所述EASPP模块包括三大分支,所述三大分支并行工作并输出大小分别为32×32×256、32×32×1280、32×32×256的三部分特征,将三大分支的输出结果在通道维度上进行拼接得到大小为32×32×1792的EASPP模块的输出特征;具体如下:

5.根据权利要求4所述的一种基于改进Deeplabv3+的高效语义分割方法,其特征在于,所述五层3×3的空洞卷积的空洞率分别为3、6、12、18、24。

6.根据权利要求5所述的一种基于改进Deeplabv3+的高效语义分割方法,其特征在于,所述EASPP模块的五层3×3的空洞卷积中,第一层至第四层的每一层3×3空洞卷积输出两份相同的结果,一份直接输出用于与其他四层3×3空洞卷积的输出结果进行拼接,另一份用作下一层3×3空洞卷积的输入特征拼接,具体如下:

7.根据权利要求1所述的一种基于改进Deeplabv3+的高效语义分割方法,其特征在于,所述PCSM模块包括并行连接的通道注意力模块和空间注意力模块;所述PCSM模块具体执行以下操作:

8.根据权利要求7所述的一种基于改进Deeplabv3+的高效语义分割方法,其特征在于,所述通道注意力模块具体执行以下操作:将通道注意力模块的输入特征通过并行连接的平均池化和最大池化处理,分别输出均值特征与最大值特征,将这两个特征输入共享的多层感知机MLP中,再将经过MLP处理的两个特征相加,并利用Sigmoid激活函数生成通道权重。

9.根据权利要求7所述的一种基于改进Deeplabv3+的高效语义分割方法,其特征在于,所述空间注意力模块具体执行以下操作:将空间注意力模块的输入特征通过通道维度的最大池化和平均池化处理,将通道数压缩到1,再将处理后得到的两个1通道特征在通道维度上拼接得到一个2通道的特征;对拼接而成的2通道特征进行一个填充率为3的7×7的卷积操作,将通道数压缩到1,最后利用Sigmoid激活函数生成空间权重。

...

【技术特征摘要】

1.一种基于改进deeplabv3+的高效语义分割方法,其特征在于,具体包括以下步骤:

2.根据权利要求1所述的一种基于改进deeplabv3+的高效语义分割方法,其特征在于,所述mobilenetv2特征提取网络应用传统mobilenetv2网络的前8层网络结构配置,其中第7层的步长s由2改为1,所述mobilenetv2特征提取网络的第1层输入特征大小为512×512×3,所述mobilenetv2特征提取网络第3层、第4层、第6层和第8层的输出特征大小分别为128×128×24、64×64×32、32×32×96和32×32×320。

3.根据权利要求1所述的一种基于改进deeplabv3+的高效语义分割方法,其特征在于,所述fpn模块具体执行以下操作:将mobilenetv2特征提取网络提取的32×32×96的特征经过二倍上采样后与64×64×32的特征拼接输出64×64×128的特征,将64×64×128的特征经过二倍上采样后与128×128×24拼接,最终输出128×128×152的浅层特征。

4.根据权利要求1所述的一种基于改进deeplabv3+的高效语义分割方法,其特征在于,所述easpp模块包括三大分支,所述三大分支并行工作并输出大小分别为32×32×256、32×32×1280、32×32×256的三部分特征,将三大分支的输出结果在通道维度上进行拼接得到大小为32×32×1792的easpp模块的输出特征;具体如下:

5.根据权利要求4所述的一种基于改进deeplabv3+的高...

【专利技术属性】
技术研发人员:于潇雁郑仕敏张晓龙毕建鹏
申请(专利权)人:福州大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1