一种基于扩散模型的遥感目标检测方法技术

技术编号：43734369 阅读：18 留言：0更新日期：2024-12-20 12:58

本发明专利技术属于模式识别技术领域，具体公开了一种基于扩散模型的遥感目标检测方法，包括如下步骤：获取遥感图像训练数据；使用遥感图像训练数据对神经网络进行训练，得到遥感目标检测模型；遥感目标检测模型包括视觉特征提取模块、多尺度特征提取模块和实例级别目标检测模块；视觉特征提取模块为预训练的基础扩散模型；多尺度特征提取模块用于对初始特征图进行特征提取，得到多级特征图；将目标遥感图像数据输入遥感目标检测模型，通过遥感目标检测模型输出目标遥感图像的检测结果。本发明专利技术可以减少训练资源需求，缩短学习进化时间，提高模型的适应性和可扩展性。解决了现有技术中遥感图像数据检测过程中训练资源较为复杂的问题。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于模式识别，具体涉及一种基于扩散模型的遥感目标检测方法。

技术介绍

1、近年来，随着深度学习模型的大量探究，计算机视觉任务取得了重大进展。其中，扩散模型已成为一类功能强大且用途广泛的生成模型，在各种计算机视觉任务中取得了显著的成功。扩散模型受到扩散的物理过程的启发，为建模复杂数据的分布和生成高保真图像提供了一个强大的框架。扩散模型通过一系列可逆步骤逐步将简单的噪声分布转换为目标数据分布。这种迭代去噪过程通常由神经网络引导，使扩散模型能够生成高度详细和连贯的图像。扩散模型在计算机视觉中的应用涵盖了广泛的任务，包括图像生成、图像修复、超分辨率等。它们的多功能性和稳健性使它们适合解决标准和具有挑战性的视觉问题，为图像处理和合成的新创新和改进铺平了道路。随着研究界继续探索和完善这些模型，基于扩散的方法将在计算机视觉的未来发挥关键作用，为创建、分析和理解视觉数据提供新的工具和方法。

2、遥感目标检测是计算机视觉领域中一个发展迅速的领域，其重点是从空中图像中识别和定位物体，这些图像通常由无人机、卫星或其他机载平台捕获。这项技术因其在城市规划、农业、环境监测、灾害管理和防御等各个领域的广泛应用而备受关注。遥感图片提供的独特视角允许对大型复杂景观进行全面分析，而这通常是地面方法无法实现的。然而，与传统的物体检测任务相比，遥感目标检测面临着独特的挑战。图像捕获的高空会导致物体尺度、遮挡和背景环境的变化，所有这些都使检测过程变得复杂。遥感目标检测利用先进的深度学习模型，特别是卷积神经网络(cnn)及其扩展，来应对这些挑战。这

技术实现思路

1、针对现有技术中的上述不足，本专利技术提供的一种基于扩散模型的遥感目标检测方法，解决了现有技术中遥感图像数据检测过程中训练资源较为复杂的问题。

2、为了达到上述专利技术目的，本专利技术采用的技术方案为：一种基于扩散模型的遥感目标检测方法，包括如下步骤：

3、s1、获取遥感图像训练数据；

4、s2、使用遥感图像训练数据对神经网络进行训练，得到遥感目标检测模型；

5、遥感目标检测模型包括视觉特征提取模块、多尺度特征提取模块和实例级别目标检测模块；

6、视觉特征提取模块为预训练的基础扩散模型，用于提取遥感图像训练数据的图像特征，得到遥感图像训练数据的初始特征图；

7、多尺度特征提取模块用于对初始特征图进行特征提取，得到多级特征图；

8、实例级别目标检测模块用于对多级特征图进行目标检测，并输出检测结果；

9、s3、将目标遥感图像数据输入遥感目标检测模型，通过遥感目标检测模型输出目标遥感图像的检测结果。

10、上述方案的有益效果是：

11、（1）本专利技术可以在目标遥感图像数据检测的过程中，固定基础模型vae encoder的训练参数，仅训练轻量级的多尺度特征提取模块及实例级别目标检测模块的参数，从而减少了训练资源需求，缩短了学习进化时间，提高了模型的适应性和可扩展性。

12、（2）本专利技术在目标遥感图像数据检测的过程中，可以利用基础模型的先验知识进行预测，提高了检测的准确性和效率。

13、进一步地，步骤s2中，预训练的基础扩散模型包括特征编码器和unet网络；

14、其中，特征编码器用于提取遥感图像训练数据的图像特征；

15、unet网络用于对遥感图像训练数据的图像特征进行进一步编码，得到初始特征图。

16、进一步地，步骤s2中，多级特征图的维度相同。

17、上述进一步方案的有益效果是：本专利技术利用预训练的基础扩散模型stable-diffusion，在视觉特征提取过程中，冻结了原有图像编码器的全部参数，并在训练过程中通过随机裁剪等数据增强操作，可以提升模型的泛化能力。

18、进一步地，步骤s2中，实例级别目标检测模块包括9层堆叠的子模块，子模块包括交叉注意力cross-attention、自注意力self-attention和前馈神经网络ffn。

19、进一步地，交叉注意力cross-attention用于学习遥感图像训练数据的类别；

20、自注意力self-attention用于学习遥感图像训练数据中的预测框；

21、前馈神经网络ffn用于学习遥感图像训练数据中的预测掩码。

22、进一步地，步骤s2中，遥感目标检测模型的损失函数为：

23、

24、其中，表示分类损失，表示预测概率，表示实例类别，表示检测框损失，表示预测框，表示真实框，表示掩膜损失，表示预测掩膜，表示实例掩膜。

25、进一步地，预训练的基础扩散模型为stable-diffusion，并且预训练的基础扩散模型的特征编码器的参数保持不变。

26、上述进一步方案的有益效果是：提高了遥感图像目标检测的效率和准确性，同时通过优化模型结构和损失函数设计，使得整个系统更加稳健和适应性更强，为解决复杂的实际应用场景提供了强有力的工具和方法。

本文档来自技高网...

【技术保护点】

1.一种基于扩散模型的遥感目标检测方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述步骤S2中，所述预训练的基础扩散模型包括特征编码器和UNet网络；

3.根据权利要求1所述的方法，其特征在于，所述步骤S2中，所述多级特征图的维度相同，所述多级特征图的维度为所述多级特征图中表示像素的向量的维度。

4.根据权利要求1所述的方法，其特征在于，所述步骤S2中，所述实例级别目标检测模块包括9层堆叠的子模块，所述子模块包括交叉注意力Cross-Attention、自注意力Self-Attention和前馈神经网络FFN。

5.根据权利要求4所述的方法，其特征在于，所述交叉注意力Cross-Attention用于学习所述遥感图像训练数据的类别；

6.根据权利要求1所述的方法，其特征在于，所述步骤S2中，所述遥感目标检测模型的损失函数为：

7.根据权利要求2所述的方法，其特征在于，所述预训练的基础扩散模型为Stable-Diffusion，并且所述预训练的基础扩散模型的特征编码器的参数保持不变。

...

【技术特征摘要】

1.一种基于扩散模型的遥感目标检测方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述步骤s2中，所述预训练的基础扩散模型包括特征编码器和unet网络；

3.根据权利要求1所述的方法，其特征在于，所述步骤s2中，所述多级特征图的维度相同，所述多级特征图的维度为所述多级特征图中表示像素的向量的维度。

4.根据权利要求1所述的方法，其特征在于，所述步骤s2中，所述实例级别目标检测模块包括9层堆叠的子模块，所述子模块包括交叉注意力cro...

【专利技术属性】
技术研发人员：张艳宁，王笑鸣，王鹏，张世周，席庆彪，田雪涛，
申请(专利权)人：西北工业大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人