基于知识蒸馏和快速多尺度融合的红外目标检测方法技术

技术编号：44666417 阅读：7 留言：0更新日期：2025-03-19 20:23

本发明专利技术公开了一种基于知识蒸馏和快速多尺度融合的红外目标检测方法，通过构建一个基于师生网络的红外目标检测模型，将获取的红外目标图像划分为训练集和测试集，然后将训练集数据输入模型进行训练，得到训练好的模型，输入测试集进行测试，测试完成后将待检测的红外目标图像输入模型，输出红外目标检测结果，完成红外目标检测。本发明专利技术的方法利用知识蒸馏技术，使用高复杂的教师网络模型辅助学生网络模型训练，对教师网络和学生网络设计快速多尺度融合模块和快速自适应敏感度策略，节约计算机存储空间和计算资源，使小目标的定位更加准确，并保留小目标不同水平的特征，有效的缓解大量的存储空间和计算资源，实现对红外小目标的精确检测。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于红外目标检测，具体涉及一种基于知识蒸馏和快速多尺度融合的红外目标检测方法。

技术介绍

1、红外目标探测在医疗成像、火灾警报、车载辅助驾驶、农业生产等方面有着广泛的应用。红外目标通常具有“弱”、“小”的典型特征。“弱”主要表现为低对比度和低信噪比；“小”是由于目标在整个红外图像中所占像素数较低。此外，背景通常是不光滑和不均匀的，包括各种环境和各种自然气象条件。基于这些因素，目标很容易被淹没在复杂的场景中。

2、红外弱小目标检测算法主要经历基于背景抑制，基于人类视觉，基于优化理论，基于深度学习的四个阶段。对于基于背景抑制的算法，由于目标和背景之前存在明显的差异性，背景抑制的算法强调运用图像处理方案来分析图像和背景。具有代表性的方法有tophat滤波，max-median滤波等。对于基于视觉显著性的算法，该算法是仿照人类视觉处理的原理进行研究的。近年来，许多学者将基于人类视觉的机制应用到红外弱小目标检测领域中来，代表性方法有lcm算法模型，mpcm算法模型等。对于优化理论的算法，由于自然图像中的信息一般具有低秩性质，即在一个连续的数据块中，相邻的行列之间具有相似性。对此，利用低秩矩阵恢复模型来进行红外弱小目标检测有广泛的应用。其代表性的方法包括ipi模型，pstnn模型等。基于深度学习算法进行红外弱小目标检测是近些年兴起的，主要通过构建神经网络来实现红外小目标检测，例如acm网络，dnanet网络，agpcnet网络，mdfa-net网络。然而，基于深度学习的方法倾向于通过设计一些特定的模块或通过某些特征融合

技术实现思路

1、为解决上述技术问题，本专利技术提供了一种基于知识蒸馏和快速多尺度融合的红外目标检测方法，实现对红外小目标的精确检测。

2、本专利技术采用的技术方案为：一种基于知识蒸馏和快速多尺度融合的红外目标检测方法，具体步骤如下：

3、s1、构建一个基于师生网络的红外目标检测模型；

4、所述红外目标检测模型包括：前处理微调模块、教师网络、学生网络、后处理微调模块。

5、s2、基于步骤s1，将获取的红外目标图像划分为训练集和测试集，然后将训练集数据输入所述红外目标检测模型进行训练，得到训练好的模型；

6、s3、基于步骤s2得到的训练好的模型，输入测试集进行测试，测试完成后将待检测的红外目标图像输入模型，输出红外目标检测结果，完成红外目标检测。

7、进一步地，所述步骤s2具体如下：

8、s21、将获取的任意尺寸大小的红外目标图像数据按照7:3的比例划分为训练集和测试集；

9、其中，训练集用于训练所述红外目标检测模型中的参数，测试集用于评估模型的检测性能。

10、s22、基于步骤s21，将训练集数据输入前处理微调模块进行预处理；

11、首先采用批归一化方法对每一小批量的红外目标图像数据进行归一化，并将红外目标图像的长宽尺寸统一裁剪为480×480。

12、然后对红外目标图像进行数据增强，具体如下：

13、先对红外目标图像进行随机翻转，随机裁剪操作，再对红外目标图像数据进行高斯噪声，随机擦除，最后对红外目标图像进行复制-粘贴自适应增强。

14、其中，所述复制-粘贴自适应增强具体如下：

15、随机获取两幅红外目标图像，根据其中一幅红外目标图像中目标区域的灰度强度和面积比信息对另外一幅红外目标图像中的目标区域进行自适应增强，然后将自适应增强后的目标区域粘贴到随机翻转后的红外目标图像中，得到扩增后的红外目标图像，即数据增强后的红外目标图像。

16、s23、基于步骤s22前处理微调后的图像，输入教师网络获得特征图和预测图；

17、在对教师网络进行训练的过程中，初始的学习率设置为0.02，且在预热过程中逐渐升高达到最大值，学习率采用指数衰减的形式。

18、所述教师网络包括：3个快速下采样模块、1个快速多尺度融合模块、3个快速上采样模块。

19、其中，快速多尺度融合模块包括：3个快速卷积模块，3个特征映射模块，3个高效通道eca注意力机制模块。

20、对于教师网络，首先对输入图像n×c×h×w通过3个快速下采样模块进行3个残差模块的快速下采样，即分别经过深度可分离卷积，最大池化，激活函数，空间与通道融合注意力机制四个模块进行特征提取，得到第一层的第一特征图u1，第二层的第二特征图u2，第三层的第三特征图u3。则所述快速下采样模块的表达式如下：

21、ui＝scc(relu(maxpool(ds(imi)))) i＝1,2,3

22、其中，n表示一批次输入的图像数量，c表示单个图像通道数，h表示单个图像高度，w表示单个图像宽度。imi表示输入的红外图像，ds表示深度可分离卷积，卷积核尺寸为3×3，卷积核步长为1；maxpool表示最大池化；scc表示空间与通道融合注意力机制，空间与通道融合注意力机制的具体表达式如下：

23、

24、其中，表示融合权重。sc表示空间注意力机制；cc表示通道注意力机制。

25、然后将特征图u1～u3通过快速多尺度融合模块。

26、其中，快速卷积模块包括：1个局部卷积pconv和2个标准卷积conv以及归一化层bn和激活层relu。

27、局部卷积在处理输入特征图时，仅对输入特征图中的最前面或最后面连续的cp个通道执行标准卷积操作，其他的通道则保持不变，则可得输入和输出特征图的通道数量相等，然后调整cp的取值为通道数的

28、2个标准卷积层共同组成倒置的残余块，且中间层的通道数量被拓展，放置快捷连接以重复使用输入特征，则倒置的残余块的表达式如下：

29、yi＝relu(bn(conv2(conv1(pconv(xi))))) i＝1,2,3

30、其中，xi表示该阶段输入的红外目标图像，pconv表示局部卷积，卷积核尺寸为3×3，卷积核步长为1，卷积的通道数为conv表示3×3的标准卷积，其中conv1表示下采样卷积，卷积核尺寸为3×3，卷积核步长为1；conv2表示上采样卷积，采用卷积核大小为本文档来自技高网...

【技术保护点】

1.一种基于知识蒸馏和快速多尺度融合的红外目标检测方法，具体步骤如下：

2.根据权利要求1所述的一种基于知识蒸馏和快速多尺度融合的红外目标检测方法，其特征在于，所述步骤S2具体如下：

【技术特征摘要】

1.一种基于知识蒸馏和快速多尺度融合的红外目标检测方法，具体步骤如下：

2.根据权利要...

【专利技术属性】
技术研发人员：罗俊海，戎亿，邱翔昱，张陆平，崔兴晔，
申请(专利权)人：电子科技大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人