一种基于通道和空间注意力机制的红外多光谱图像目标检测方法技术

技术编号：41467341 阅读：11 留言：0更新日期：2024-05-30 14:22

本发明专利技术提供了一种基于通道和空间注意力机制的红外多光谱图像目标检测方法，包括如下步骤：S1、将红外多光谱图像输入到网络中，利用由卷积核组成的初始特征嵌入层，提取红外多光谱图像的初始特征；S2、将初始特征输入到深层特征提取模块，输出图像的深层特征；S3、将图像的深层特征输入特征融合模块进行整合，得到特征张量；S4、将特征张量进行4阶段下采样后，得到4阶特征张量；S5、将4阶特征张量输入特征映射层，进行处理；S6、将经过特征映射层处理的4阶特征张量输入检测头后，得到目标的位置信息和类别信息；该目标检测方法解决了窗口注意力在窗口之间信息交互不足的问题，弥补和空间注意力在通道之间信息的捕获的不足。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于红外多光谱图像目标，具体涉及一种基于通道和空间注意力机制的红外多光谱图像目标检测方法。

技术介绍

1、红外多光谱图像目标检测技术是一种利用红外传感器对目标进行探测、识别和跟踪的技术。红外辐射是指物体在红外波段产生的热辐射，这种辐射可以被红外传感器所捕捉和分析。相比可见光，红外波段对于观察夜间、低照度或遮挡物后的场景具有天然的优势，因为大多数物体都会产生一定强度的红外辐射。

2、深度学习在目标检测中的应用已经成为当今计算机视觉领域的热点和关注的焦点。目标检测旨在从图像或视频中准确地确定目标的位置和类别。深度学习方法通过学习大量数据中的特征模式和抽象表示，能够更好地实现目标检测任务。

3、深度学习目标检测方法通常基于卷积神经网络(cnn)结构。cnn通过多层卷积和池化操作来逐渐提取图像的特征。经过卷积和池化层后，特征图会被输入到全连接层，通过分类器进行类别预测和边界框回归。目前广泛应用的深度学习目标检测方法包括faster r-cnn、yolo和ssd等。faster r-cnn引入了候选区域生成网络来快速生成候选目标区域，然后通过分类网络和边界框回归网络进行目标检测。yolo算法则将目标检测问题转化为一个回归问题，通过单次前向传递即可直接得到目标的类别和位置信息。为了进一步提升深度学习目标检测方法的性能，研究人员提出了一系列改进方法。如损失函数的改进和模型剪枝等，以提高模型的鲁棒性和推理速度。但是这类方法针对于一些特定场景下的复杂背景检测效果不佳，因此还需要进一步的改进。

>技术实现思路

1、针对现有基于卷积神经网络和窗口分块transformer目标检测方法存在的不足，本专利技术提供一种基于通道和空间注意力机制的红外多光谱目标检测方法。

2、为此，本专利技术提供了一种基于通道和空间注意力机制的红外多光谱图像目标检测方法，包括如下步骤：

3、s1、将红外多光谱图像输入到网络中，利用由卷积核组成的初始特征嵌入层，提取红外多光谱图像的初始特征nput＝[batch,32,640,640；

4、s2、将初始特征输入到深层特征提取模块，输出图像的深层特征；

5、s3、将图像的深层特征输入特征融合模块进行整合，得到特征张量；

6、s4、将特征张量进行4阶段下采样后，得到4阶特征张量；

7、s5、将4阶特征张量输入特征映射层，进行处理；

8、s6、将经过特征映射层处理的4阶特征张量输入检测头后，得到目标的位置信息和类别信息。

9、进一步的，所述输入到网络中的红外多光谱图像大小为640×640。

10、进一步的，所述深层特征提取模块包括多个空间通道transformer(sswat)，每个空间通道transformer包含两种注意力机制，分别是空间注意力机制和通道注意力机制。

11、进一步的，所述图像的深层特征包括ylocal局部注意力特征ylocal,yshuffle洗牌注意力特征yshuffle,通道注意力特征ychannel。

12、进一步的，所述s3、将图像的深层特征输入特征融合模块进行整合，得到特征张量y＝conv1×1(concat(ylocal+yshuffle+ychannel))。

13、本专利技术的优点是：本专利技术提供这种基于通道和空间注意力机制的红外多光谱图像目标检测方法，与传统的红外多光谱目标检测方法相比，本方法不依赖于手工提取特征，能够处理复杂背景下的目标检测，对环境变化具有较好鲁棒性，并且可以通过对各种场景图像的不断学习，提升模型的泛化能力；与基于cnn的红外多光谱目标检测方法相比，本方法可以同时考虑序列中的所有位置信息，从而能够捕捉更全局的上下文关系，不受固定的感受野大小限制。同时可以在计算注意力权重时根据输入的上下文动态地对每个位置分配权重，从而更好地捕捉输入序列中不同位置的相关性；与基于空间注意力的红外多光谱目标检测方法相比，本方法引入了洗牌注意力和通道注意力，解决了空间注意力计算复杂度高，消耗资源大等问题，同时解决了窗口注意力在窗口之间信息交互不足的问题，弥补和空间注意力在通道之间信息的捕获的不足。

14、下面结合附图和实施例对本专利技术做详细说明。

本文档来自技高网...

【技术保护点】

1.一种基于通道和空间注意力机制的红外多光谱图像目标检测方法，其特征在于，包括如下步骤：

2.如权利要求1所述的一种基于通道和空间注意力机制的红外多光谱图像目标检测方法，其特征在于：所述输入到网络中的红外多光谱图像大小为640×640。

3.如权利要求1所述的一种基于通道和空间注意力机制的红外多光谱图像目标检测方法，其特征在于：所述深层特征提取模块包括多个空间通道Transformer(SSWAT)，每个空间通道Transformer包含两种注意力机制，分别是空间注意力机制和通道注意力机制。

4.如权利要求1所述的一种基于通道和空间注意力机制的红外多光谱图像目标检测方法，其特征在于：所述图像的深层特征包括Ylocal局部注意力特征Ylocal,Yshuffle洗牌注意力特征Yshuffle,通道注意力特征Ychannel。

5.如权利要求1所述的一种基于通道和空间注意力机制的红外多光谱图像目标检测方法，其特征在于：S3、将图像的深层特征输入特征融合模块进行整合，得到特征张量Y＝Conv1×1(concat(Ylocal+Yshuffle+Ychannel))。

...

【技术特征摘要】

1.一种基于通道和空间注意力机制的红外多光谱图像目标检测方法，其特征在于，包括如下步骤：

3.如权利要求1所述的一种基于通道和空间注意力机制的红外多光谱图像目标检测方法，其特征在于：所述深层特征提取模块包括多个空间通道transformer(sswat)，每个空间通道transformer包含两种注意力机制，分别是空间注意力机制和通道注意...

【专利技术属性】
技术研发人员：刘伟，陈继铭，段程鹏，
申请(专利权)人：西安中科立德红外科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人