一种基于生物视觉双通路的边缘检测方法技术

技术编号:38095489 阅读:14 留言:0更新日期:2023-07-06 09:09
本发明专利技术旨在提供一种基于生物视觉双通路的边缘检测方法,包括以下步骤:A、构建双通路边缘检测网络,双通路边缘检测网络具体如下:包括第一通路网络FPN、第二通路网络SPN、解码网络DN;B、原始图像分别输入第一通路网络FPN、第二通路网络SPN中;最终经三个通路融合模块PFM处理得到三个结果分别输入DN中;C、解码网络DN解码后,输出结果即为最终输出轮廓。本发明专利技术能够有效提取边缘特征信息,从而得到更加准确的边缘图。确的边缘图。

【技术实现步骤摘要】
一种基于生物视觉双通路的边缘检测方法


[0001]本专利技术涉及计算机图像处理领域,具体涉及一种基于生物视觉双通路的边缘检测方法。

技术介绍

[0002]边缘检测的目的是提取图像中有意义物体的边缘信息,通常用于多种中、高级计算机视觉任务的预处理阶段,是计算机视觉研究领域中的一个经典问题。由于深度学习迅猛发展,基于卷积神经网络(CNN)的编码

解码边缘检测方法发展迅速。这些方法的大部分采用VGG16或ResNet作为编码器,通过设计解码器取得了不错的性能表现。实验证明,这些模型在伯克利分割数据集(BSDS500)上取得了显著的效果。
[0003]虽然基于CNN的编码

解码边缘检测方法取得了显著效果,但是近几年模型的性能增长缓慢。同时,单纯通过编码

解码器的形式构建边缘检测方法的方式虽然能够提升性能表现,但由于缺乏生物视觉机制的指导增加了更多不可解释性。

技术实现思路

[0004]本专利技术旨在提供一种基于生物视觉双通路的边缘检测方法,该方法能够有效提取边缘特征信息,从而得到更加准确的边缘图。
[0005]本专利技术的技术方案如下:
[0006]所述的基于生物视觉双通路的边缘检测方法,包括以下步骤:
[0007]A、构建双通路边缘检测网络,双通路边缘检测网络具体如下:
[0008]包括第一通路网络FPN、第二通路网络SPN、解码网络DN;
[0009]其中,第一通路网络FPN包括三个依次连接的第一通路模块FPB,三个第一通路模块FPB分别由两个以上依次连接的Swin Transformer Layer组成;
[0010]第二通路网络SPN采用包括三个依次连接的第二通路模块SPB,三个第二通路模块SPB模块均由一个基础的3x3普通卷积和两个带有残差结构的3x3深度可分离卷积层依次连接组成;
[0011]第一通路网络FPN和第二通路网络SPN之间通过三个第二通路注意力模块SPAM和三个通路融合模块PFM进行交互;
[0012]解码网络DN由三个特征融合模块FFM组成;
[0013]B、原始图像分别输入第一通路网络FPN和第二通路网络SPN中;
[0014]在第一通路网络FPN中:
[0015]原始图片先经过Patch Embeding处理,得到图片切成小块,然后对每个小块进行编码映射成高维的向量特征;高维的向量特征与第一个第一通路注意力模块SPAM的输出结果经元素级乘法后输入第一个第一通路模块FPB中;
[0016]第一个第一通路模块FPB的处理结果分为两路输出,第一路与第二个第一通路注意力模块SPAM的处理结果经元素级乘法后输入第二个第一通路模块FPB,第二路输入第一
个通路融合模块PFM中;
[0017]第二个第一通路模块FPB模块的处理结果分为两路输出,第一路与第三个第一通路注意力模块SPAM的输出结果经元素级乘法后输入第三个第一通路模块FPB,第二路输入第二个通路融合模块PFM中;
[0018]第三个第一通路模块FPB模块的处理结果输入第三个通路融合模块PFM中;
[0019]在第二通路网络SPN中:
[0020]原始图片输入第一个第二通路模块SPB中,第一个第二通路模块SPB的处理结果分别输入第一个第二通路注意力模块SPAM、第一个通路融合模块PFM、第二个第二通路模块SPB中;
[0021]第二个第二通路模块SPB模块的处理结果分别输入第二个第二通路注意力模块SPAM、第二个通路融合模块PFM、第三个第二通路模块SPBB模块中;
[0022]第三个第二通路模块SPB模块处理结果分别输入第三个第二通路注意力模块SPAM、第三个通路融合模块PFM中;
[0023]第一个通路融合模块PFM、第二个通路融合模块PFM、第三个通路融合模块PFM的处理结果分别输入解码网络DN中;
[0024]C、DN解码后,输出结果即为最终输出轮廓。
[0025]所述的第一个第一通路模块FPB由2层Swin Transformer Lyer组成,第二个第一通路模块FPB由2层Swin Transformer Lyer组成、第三个第一通路模块FPB分别由18层Swin Transformer Lyer组成。
[0026]所述的带有残差结构的3x3深度可分离卷积层包括依次连接的3x3深度卷积层、分组归一化和GeLU激活函数模块、1x1卷积层;在带有残差结构的3x3深度可分离卷积层中,输入结果依次经过3x3深度卷积层、分组归一化和GeLU激活函数、1x1卷积层处理后,与其自身相加融合得到输出结果。
[0027]所述的第一个第二通路注意力模块SPAM、第二个第二通路注意力模块SPAM、第三个第二通路注意力模块SPAM结构相同,分别包括步长为4卷积核为4
×
4的卷积和Sigmoid激活函数;在第一通路注意力模块SPAM、第二通路注意力模块SPAM、第三通路注意力模块SPAM中,输入结果经4卷积核为4
×
4的卷积处理后,经Sigmoid激活函数激活,最后进行Repeat操作后获得输出结果。
[0028]所述的第一个通路融合模块PFM、第二个通路融合模块PFM、第三个通路融合模块PFM结构相同,分别包括F
1,i
特征通路和F
2,i
特征通路;
[0029]在F
1,i
特征通路中,上一输入结果经过两个依次连接的USM Layer模块处理后,然后经过C Layer模块处理,得到F
1,i
通路结果;
[0030]在F
2,i
特征通路中,下一输入结果经过C Layer模块处理,得到F
2,i
通路结果;
[0031]F
1,i
通路结果和F
2,i
通路结果按通道合并在一起后,经过C Layer模块处理获得输出结果。
[0032]在USM Layer模块中,输入结果依次经过1
×
1卷积后、分组归一化、Gelu函数处理后,得到输出结果。
[0033]在C Layer模块中,输入结果依次经过3
×
3卷积、Pixel shuffle函数、分组归一化处理后,得到输出结果。
[0034]在所述的解码网络DN中,
[0035]第一个通路融合模块PFM和第二个通路融合模块PFM的处理结果输入一个特征融合模块FFM中进行融合处理,得到第一特征融合结果;
[0036]第二个通路融合模块PFM和第三个通路融合模块PFM的处理结果输入一个特征融合模块FFM中进行融合处理,得到第二特征融合结果;
[0037]所述的第一特征融合结果和第二特征融合结果输入第三个特征融合模块FFM中,经第三个特征融合模块FFM进行融合处理后,经1
×
1卷积后,得到解码结果。...

【技术保护点】

【技术特征摘要】
1.一种基于生物视觉双通路的边缘检测方法,其特征在于包括以下步骤:A、构建双通路边缘检测网络,双通路边缘检测网络具体如下:包括第一通路网络FPN、第二通路网络SPN、解码网络DN;其中,第一通路网络FPN包括三个依次连接的第一通路模块FPB,三个第一通路模块FPB分别由两个以上依次连接的Swin Transformer Layer组成;第二通路网络SPN采用包括三个依次连接的第二通路模块SPB,三个第二通路模块SPB模块均由一个基础的3x3普通卷积和两个带有残差结构的3x3深度可分离卷积层依次连接组成;第一通路网络FPN和第二通路网络SPN之间通过三个第二通路注意力模块SPAM和三个通路融合模块PFM进行交互;解码网络DN由三个特征融合模块FFM组成;B、原始图像分别输入第一通路网络FPN和第二通路网络SPN中;在第一通路网络FPN中:原始图片先经过Patch Embeding处理,得到图片切成小块,然后对每个小块进行编码映射成高维的向量特征;高维的向量特征与第一个第一通路注意力模块SPAM的输出结果经元素级乘法后输入第一个第一通路模块FPB中;第一个第一通路模块FPB的处理结果分为两路输出,第一路与第二个第一通路注意力模块SPAM的处理结果经元素级乘法后输入第二个第一通路模块FPB,第二路输入第一个通路融合模块PFM中;第二个第一通路模块FPB模块的处理结果分为两路输出,第一路与第三个第一通路注意力模块SPAM的输出结果经元素级乘法后输入第三个第一通路模块FPB,第二路输入第二个通路融合模块PFM中;第三个第一通路模块FPB模块的处理结果输入第三个通路融合模块PFM中;在第二通路网络SPN中:原始图片输入第一个第二通路模块SPB中,第一个第二通路模块SPB的处理结果分别输入第一个第二通路注意力模块SPAM、第一个通路融合模块PFM、第二个第二通路模块SPB中;第二个第二通路模块SPB模块的处理结果分别输入第二个第二通路注意力模块SPAM、第二个通路融合模块PFM、第三个第二通路模块SPBB模块中;第三个第二通路模块SPB模块处理结果分别输入第三个第二通路注意力模块SPAM、第三个通路融合模块PFM中;第一个通路融合模块PFM、第二个通路融合模块PFM、第三个通路融合模块PFM的处理结果分别输入解码网络DN中;C、DN解码后,输出结果即为最终输出轮廓。2.如权利要求1所述的基于生物视觉双通路的边缘检测方法,其特征在于:所述的第一个第一通路模块FPB由2层Swin Transformer Lyer组成,第二个第一通路模块FPB由2层Swin Transformer Lyer组成、第三个第一通路模块FPB分别由18层Swin Transformer Lyer组成。3.如权利要求1所述的基于生物视觉双通路的边缘检测方法,其特征在于:所述的带有残差结构的3x3深度可分离卷积层包括依次连接的3x3深度卷积层、分组归
一化和GeLU激活函数模块、1x1卷积层;在带有残差结构的3x3深度可分离卷积层中,输入结果依次经过3x3深度卷积层、分组归一化和GeLU激活函数、1x1卷积层处理后,与其自身相加融合得到输出结果。4.如权利要求1所述的基于生物视觉双通路的边缘检测方法,其特征在于:所述的第一个第二通路注意力模块SPAM、第二个第二通路注意力模块SPAM、第三个第二通路注意力模块SPAM结构相同,分别包括步长为4卷积核为4
×
4的卷积和Si...

【专利技术属性】
技术研发人员:林川徐航王若璞陈曦陈永亮古家虹潘勇才韦艳霞
申请(专利权)人:广西科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1