具有密集感受野的自注意力转换网络的伪装目标检测方法技术

技术编号：43325380 阅读：18 留言：0更新日期：2024-11-15 20:24

本发明专利技术公开了一种具有密集感受野的自注意力转换网络的伪装目标检测方法，包括以下步骤：步骤1、获取待检测图像；步骤2、将待检测图像输入至基于自注意力转换网络的骨干特征提取器，以提取四级特征；步骤3、将步骤2得到的具有四级特征的张量分别送入至并行分支密集感受野特征提取模块，由并行分支密集感受野特征提取模块得到四级多尺度上下文特征；步骤4、将步骤3得到的多尺度上下文特征的张量，以及步骤2得到的基于多级特征的张量，分别送入至使用快速注意力引导的多级特征交互模块，由多级特征交互模块进行特征融合后得到具有融合特征的张量，由此完成待检测图像的目标检测。本发明专利技术能够难以有效捕捉和利用全局依赖关系。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及伪装感知检测方法领域，具体是一种具有密集感受野的自注意力转换网络的伪装目标检测方法。

技术介绍

1、伪装目标是指那些在颜色和纹理上与周围环境高度相似，从而难以被人眼识别的目标。这些目标可以根据其形成方式被划分为自然和人造两大类。自然伪装目标通常是指那些通过利用自然环境如地形、植物或自身身体特征等自然条件来避免被捕食者发现的生物，例如沙漠中的变色龙、海洋深处的鱼类、农田中的绿色蝗虫等。而人造伪装目标则是通过人为的技术手段，如迷彩涂装等，来减少目标的可探测性，例如穿戴迷彩服的军事人员、涂装隐蔽的军事飞行器等。伪装目标检测任务的目标是从背景中识别并分离出这些伪装目标，这一任务在多个领域都显示出了其重要性。在军事安全领域，它有助于提高战场态势的感知能力；在工业检测中，它能够辅助发现潜在的结构性问题；在农业害虫的监测中，它有助于精确识别和控制害虫；在医学成像中，它能够提高对疾病标志物的识别精度。因此，隐蔽目标分割技术在实际应用中具有广泛的前景和重要的价值。

2、早期的非深度学习方法主要依赖于人工设计的特征来辨别图像中的前景对象与背景，例如利用纹理特征、三维表面的凹凸信息、运动信息等。这些方法在处理非常简单的场景时或许有效，但在面对复杂多变的环境时，它们的性能往往会受到限制，难以达到预期的效果。

3、随着深度学习技术在视觉任务中的应用日益广泛，研究者们提出了多种创新框架和方法来应对伪装目标检测任务。最初，一种结合图像分类和伪装目标分割的框架被成功提出，它能够有效地识别和分割隐藏在复杂背景中的物体。随后，

4、然而，上述这些方法主要采用的是卷积神经网络，采用编码器-解码器架构。在这种架构中，编码器通常是由在大规模数据集上预训练的cnn组成，负责将输入图像转换成多层次的特征表示。随后，解码器会将这些特征进行重组，以生成最终的二进制分割图。如图1(a)所示，尽管卷积操作在提取局部特征方面表现出色，但它在捕捉全局依赖关系方面的能力有限。在伪装目标检测任务中，由于伪装目标与其周围背景在局部特征上的高相似性，全局依赖关系显得尤为关键。仅使用卷积操作在局部窗口内提取特征不仅难以识别伪装，反而容易受到这些高度相似的局部特征的干扰。尽管一些方法尝试通过全局池化层和非局部模块来整合全局上下文信息，但这些方法仅在网络的某些层中有效，并没有根本改变基于卷积操作的标准架构。因此，为了提高分割性能，特别是在处理伪装目标时，需要进一步探索能够有效捕捉和利用全局依赖关系的新方法。

5、在近期的研究中，源自自然语言处理的深度自注意力转换网络因其卓越的全局建模能力而在计算机视觉领域逐渐取代了传统的卷积神经网络，并实现了显著的进步。这种网络的核心优势在于通过自注意力机制来获取全局上下文信息，进而形成长距离的依赖关系，如图1(b)所示。为了适应视觉任务对图像处理的需求，并降低密集注意力带来的高内存和计算开销，研究者们开发了多种层级结构的视觉深度自注意力转换网络，例如pvt、swintransformer和mpvit等。这些网络在图像分类、目标检测和语义分割等任务上展现出了超越传统卷积网络的性能。鉴于此，将深度自注意力转换网络应用于伪装目标检测任务，利用其全局感知能力来提升分割性能，已成为一个值得探索的重要方向。通过这种方式，可以更有效地处理伪装目标与背景之间的复杂关系，从而在实际应用中实现更准确的分割结果。

技术实现思路

1、本专利技术提供了一种具有密集感受野的自注意力转换网络的伪装目标检测方法，以解决现有技术采用卷积神经网络基于编码器-解码器架构的伪装目标检测方法存在的难以有效捕捉和利用全局依赖关系的问题。

2、为了达到上述目的，本专利技术所采用的技术方案为：

3、具有密集感受野的自注意力转换网络的伪装目标检测方法，包括以下步骤：

4、步骤1、获取待检测图像；

5、步骤2、将步骤1获取的待检测图像输入至基于自注意力转换网络的骨干特征提取器；

6、所述骨干特征提取器包括四个依次级联的层级模块，待检测图像首先输入至第一级层级模块，由第一个层级模型从图像中提取得到第一级特征；第一级层级模块得到的提取有第一级特征的张量输出至第二级层级模块，由第二个层级模型提取得到第二级特征；第二级层级模块得到的提取有第二级特征的张量输出至第三级层级模块，由第三个层级模型提取得到第三级特征；第三级层级模块得到的提取有第三级特征的张量输出至第四个层级模块，由第四个层级模型提取得到第四级特征；

7、步骤3、令骨干特征提取器中四个层级模块分别得到的提取有相应级特征的张量，分别送入至并行分支密集感受野特征提取模块；

8、所述并行分支密集感受野特征提取模块包括四个并行的子模块，每个子模块分别包括局部分支和全局分支；四个子模块一一对应接收骨干特征提取器中四个层级模块输出的提取有相应级特征的张量；每个子模块分别在自身局部分支和全局分支中利用密集递进相连的深度可分离卷积块从提取有对应级特征的张量中提取出对应级多尺度上下文特征；

9、步骤4、令并行分支密集感受野特征提取模块中四个子模块分别得到的提取有对应级多尺度上下文特征的张量，以及骨干特征提取器中第一级层级模块、第二级层级模块、第三级层级模块分别得到的提取有相应级特征的张量，分别送入至使用快速注意力引导的多级特征交互模块；

10、所述多级特征交互模块包括三级依次级联的分模块，其中：

11、第三级分模块以并行分支密集感受野特征提取模块中第三个子模块得到的提取有对应级多尺度上下文特征的张量、第四个子模块得到的提取有对应级多尺度上下文特征的张量，以及骨干特征提取器中第三级层级模块得到的提取有相应级特征的张量作为输入，由第三级分模块进行特征融合后得到具有第三级融合特征的张量；

12、第二级分本文档来自技高网...

【技术保护点】

1.具有密集感受野的自注意力转换网络的伪装目标检测方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的具有密集感受野的自注意力转换网络的伪装目标检测方法，其特征在于，步骤3中，所述并行分支密集感受野特征提取模块的每个子模块的局部分支中，首先通过两个卷积层对输入的提取有对应级特征的张量进行通道数的调整；接着采用四个深度可分离卷积块分别从调整后的图像中提取局部特征；最后采用两个卷积层对四个深度可分离卷积块提取的不同尺度的局部特征进行融合，由此在图像中得到最终的局部特征。

3.根据权利要求2所述的具有密集感受野的自注意力转换网络的伪装目标检测方法，其特征在于，步骤3中，所述并行分支密集感受野特征提取模块的每个子模块的全局分支中，首先对提取有对应级特征的张量进行自适应最大池化后，再通过卷积层进行通道数的调整；然后通过四个深度可分离卷积块分别从调整后的图像中提取全局特征；接着采用两个卷积层对四个深度可分离卷积块提取的不同尺度的全局特征进行融合；最后通过双线性插值法扩大融合的全局特征的分辨率，由此在图像中得到最终的全局特征。

4.根据权利要求3所述的

5.根据权利要求1所述的具有密集感受野的自注意力转换网络的伪装目标检测方法，其特征在于，步骤4中，第三级分模块将并行分支密集感受野特征提取模块中第四个子模块得到的提取有对应级多尺度上下文特征的张量，采样至与第三级分模块对应级特征同样的分辨率大小后，再作为第三级分模块的输入；

6.根据权利要求1或5所述的具有密集感受野的自注意力转换网络的伪装目标检测方法，其特征在于，步骤4中，第三级分模块将骨干特征提取器中第三级层级模块提取的相应级特征通过三个卷积层进行通道数调整后，再与并行分支密集感受野特征提取模块中第四个子模块提取的对应级多尺度上下文特征进行逐像素相加，并与并行分支密集感受野特征提取模块中第三个子模块提取的对应级多尺度上下文特征在通道上进行连接，由此得到第三级融合特征；

...

【技术特征摘要】

1.具有密集感受野的自注意力转换网络的伪装目标检测方法，其特征在于，包括以下步骤：

4....

【专利技术属性】
技术研发人员：孙美君，闫馨宇，王征，
申请(专利权)人：天津大学合肥创新发展研究院，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人