一种基于改进Mask R-CNN的遥感图像目标检测方法技术

技术编号：42502058 阅读：8 留言：0更新日期：2024-08-22 14:15

本发明专利技术提供一种基于改进Mask R‑CNN的遥感图像目标检测方法，涉及计算机视觉技术领域。该方法具体包括：获取含有待检测目标的原始遥感图像；对原始遥感图像进行格式转换，并利用转换后的遥感图像构建遥感图像数据集，按照预设比例将遥感图像数据集划分为训练数据集，验证数据集和测试数据集；构建基于改进Mask R‑CNN的遥感图像目标检测模型；利用训练数据集训练基于改进Mask R‑CNN的遥感图像目标检测模型，再利用验证数据集对训练好的基于改进Mask R‑CNN的遥感图像目标检测模型进行验证，得到最终的遥感图像目标检测模型；将测试数据集输入训练好的目标检测模型进行目标检测，得到目标检测结果。本方法在合理控制计算复杂度的基础上，显著提高了遥感图像目标检测精度。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于计算机视觉，具体涉及一种基于改进mask r-cnn的遥感图像目标检测方法。

技术介绍

1、近年来，随着遥感成像技术的迅速发展和遥感卫星的相继发射，遥感图像数据在质量和规模上都得到了较大的提升，海量的高分辨率遥感图像为独立目标个体的检测带来了新的机遇和挑战。在计算机视觉领域，目标检测算法作为其最具挑战的任务之一，在军事国防部署、地质交通监测以及智慧城市规划等各个方面都具有着重要的研究意义和应用前景。

2、随着遥感图像应用范围的不断扩大，目前基于深度学习的目标检测器已经能够实现特征的自动提取，并取得了比传统方法更好的检测性能。但是，遥感图像目标检测往往依托于自然图像下的检测技术，未考虑二者间的视觉差异和数据信息。相较于自然图像，高分辨率遥感图像中会夹杂着各种密集排列的多尺度目标物体，这给基于深度学习的目标检测任务带来了巨大挑战。

3、针对遥感图像背景复杂、目标尺度差异性等问题，研究人员开始在现有特征提取网络和当前主流目标检测模型的基础上，根据遥感图像自身特点来调整网络结构，使其能够提高算法在遥感图像目标检测任务中的鲁棒性。通过增加注意力机制、多尺度特征融合以及引入空洞卷积等手段对模型的网络结构进行创新，使模型对于多数遥感图像目标检测具有较好的效果。

4、虽然当前根据遥感图像自身特点设计的基于深度学习的遥感图像目标检测方法可以实现自动化目标检测任务，但现有方法的检测效果仍有进一步提升的空间。现有方法对于复杂背景下密集目标的检测不具有鲁棒性，也很少会针对模型的计算量等方面进行研究，导致

技术实现思路

1、针对上述现有技术的不足，本专利技术提出了一种基于改进mask r-cnn的遥感图像目标检测方法，通过设计一个可以在高分辨率遥感图像下精准且高效地识别建筑物目标的检测模型，解决了遥感图像背景复杂下尺度变化较大的目标和密集排列的目标无法准确检测的问题。

2、本专利技术提出的一种基于改进mask r-cnn的遥感图像目标检测方法，该方法包括如下步骤：

3、步骤1：获取含有待检测目标的原始遥感图像；

4、步骤2：对原始遥感图像进行格式转换，并利用转换后的遥感图像构建遥感图像数据集，按照预设比例将遥感图像数据集划分为训练数据集，验证数据集和测试数据集；

5、步骤3：构建基于改进mask r-cnn的遥感图像目标检测模型；

6、所述基于改进mask r-cnn的遥感图像目标检测模型为：在基于掩码区域的卷积神经网络mask r-cnn的深度学习模型的基础上，骨干网络采用hsressenet-bifpn网络，用于对接收到的遥感图像进行特征提取和特征融合，生成多尺度特征图；

7、所述hsressenet-bifpn网络的构建方法为：向基于掩码区域的卷积神经网络maskr-cnn的深度学习模型中的残差网络resnet101中引入注意力机制senet和分层分割网络hs-resnet构建hsressenet网络，再将加权双向特征金字塔网络bifpn与hsressenet网络结合构建hsressenet-bifpn网络；

8、步骤4：利用训练数据集对基于改进mask r-cnn的遥感图像目标检测模型进行训练，再利用验证数据集对训练好的基于改进mask r-cnn的遥感图像目标检测模型进行验证，得到最终的遥感图像目标检测模型；

9、步骤5：将测试数据集输入训练好的目标检测模型进行目标检测，预测遥感影像中待检测目标的类别和位置，并获取遥感影像中的待检测目标，生成目标分割掩膜；

10、步骤2中所述对原始遥感图像进行格式转换的方法为：采用标注工具对原始遥感图像进行标注，并将标注后的数据格式转换为标准的coco数据集格式；

11、步骤3中所述基于改进mask r-cnn的遥感图像目标检测模型，包括：输入端、骨干网络、区域建议网络rpn、区域对齐层roi align和输出端；

12、所述输入端，用于输入含有待检测目标的原始遥感图像，并将该遥感图像传输至骨干网络；

13、所述骨干网络采用hsressenet-bifpn网络，用于对接收到的遥感图像进行特征提取和特征融合，生成多尺度特征图并传输给区域建议网络rpn；

14、所述区域建议网络rpn，用于对接收到的多尺度特征图提取检测框，得到一组建议区域；

15、所述区域对齐层roi align，用于根据多尺度特征图为每个建议区域生成大小相同的感兴趣区域roi特征；

16、所述输出端，用于根据感兴趣区域roi特征预测遥感影像中待检测目标的类别和位置，并获取遥感影像中的待检测目标，生成目标分割掩膜；

17、所述hsressenet-bifpn网络为：向hsressenet-bifpn网络中输入遥感图像，采用零填充zeropad的方式对输入的遥感影像依次进行卷积操作和最大值池化操作，得到特征图c1；将特征图c1输入第一下采样残差块和2个串联的第一基于注意力机制senet和hs-resnet网络的恒等残差块中得到特征图c2；将特征图c2输入第二下采样残差块和3个串联的第二基于注意力机制senet和hs-resnet网络的恒等残差块中得到特征图c3；将特征图c3输入第三下采样残差块和22个串联的第三基于注意力机制senet和hs-resnet网络的恒等残差块中得到特征图c4；将特征图c4输入第四下采样残差块和2个串联的第四基于注意力机制senet和hs-resnet网络的恒等残差块中得到特征图c5；再将特征图c2、特征图c3、特征图c4和特征图c5输入bifpn网络中进行特征融合得到特征图p2'、特征图p3'、特征图p4'和特征图p5'，同时对特征图c5进行最大值池化得到特征图c6，特征图c6无需进行特征融合直接作为特征图p6，并将特征图p2'、特征图p3'、特征图p4'、特征图p5'和特征图p6作为多尺度特征图输入区域建议网络rpn；

18、所述第一基于注意力机制senet和hs-resnet网络的恒等残差块、第二基于注意力机制senet和hs-resnet网络的恒等残差块、第三基于注意力机制senet和hs-resnet网络的恒等残差块和第四基于注意力机制senet和hs-resnet网络的恒等残差块的结构相同，均为依次连接的：尺寸为1×1的卷积层、嵌入hs-resnet网络的尺寸为3×3的卷积层、尺寸为1×1的卷积层、注意力机制senet模块和拼接层；

19、所述输出端包括：并列的掩膜分支、分类分支和回归分支；所述掩膜分支为全卷积网络fcn，用于生成遥感影像中待检测目标的目标分割掩膜；所述分类分支和回归分支为两个大小本文档来自技高网...

【技术保护点】

1.一种基于改进Mask R-CNN的遥感图像目标检测方法，其特征在于，该方法包括如下步骤：

2.根据权利要求1中所述一种基于改进Mask R-CNN的遥感图像目标检测方法，其特征在于，步骤2中所述对原始遥感图像进行格式转换的方法为：采用标注工具对原始遥感图像进行标注，并将标注后的数据格式转换为标准的COCO数据集格式。

3.根据权利要求1中所述一种基于改进Mask R-CNN的遥感图像目标检测方法，其特征在于，步骤3中所述基于改进Mask R-CNN的遥感图像目标检测模型，包括：输入端、骨干网络、区域建议网络RPN、区域对齐层ROIAlign和输出端；

4.根据权利要求3中所述一种基于改进Mask R-CNN的遥感图像目标检测方法，其特征在于，所述HSResSENet-BiFPN网络为：向HSResSENet-BiFPN网络中输入待检测的遥感图像，采用零填充Zeropad的方式对输入的遥感影像依次进行卷积操作和最大值池化操作，得到特征图C1；将特征图C1输入第一下采样残差块和2个串联的第一基于注意力机制SENet和HS-ResNet网络的恒等

5.根据权利要求4中所述一种基于改进Mask R-CNN的遥感图像目标检测方法，其特征在于，所述第一基于注意力机制SENet和HS-ResNet网络的恒等残差块、第二基于注意力机制SENet和HS-ResNet网络的恒等残差块、第三基于注意力机制SENet和HS-ResNet网络的恒等残差块和第四基于注意力机制SENet和HS-ResNet网络的恒等残差块的结构相同，均为依次连接的：尺寸为1×1的卷积层、嵌入HS-ResNet网络的尺寸为3×3的卷积层、尺寸为1×1的卷积层、注意力机制SENet模块和拼接层。

6.根据权利要求5中所述一种基于改进Mask R-CNN的遥感图像目标检测方法，其特征在于，所述输出端包括：并列的掩膜分支、分类分支和回归分支；所述掩膜分支为全卷积网络FCN，用于生成遥感影像中待检测目标的目标分割掩膜；所述分类分支和回归分支为两个大小相同且通道数相同的全连接层；所述分类分支用于根据输入的感兴趣区域ROI特征预测遥感影像中待检测目标的类别；所述回归分支用于对输入的感兴趣区域ROI特征进行回归计算，得到检测目标的边界框，计算该边界框相对于检测框的回归向量，预测遥感影像中待检测目标的位置。

7.根据权利要求6中所述一种基于改进Mask R-CNN的遥感图像目标检测方法，其特征在于，所述步骤4进一步包括：

8.根据权利要求7中所述一种基于改进Mask R-CNN的遥感图像目标检测方法，其特征在于，所述步骤4.2进一步包括：

9.根据权利要求8中所述一种基于改进Mask R-CNN的遥感图像目标检测方法，其特征在于，步骤4.2.2中所述利用滤波器卷积对s组特征图进行特征提取的方法为：利用滤波器卷积对第i组特征图Xi进行特征提取，其中i＝2，…，s-1，将提取出的特征图Yi在通道维度上平均分为两个子组Yi1和Yi2，将Yi2与第i+1组特征图Xi+1串联后通过滤波器卷积进行特征提取，得到特征图Yi+1；重复上述过程，直至得到特征图Ys；再将第1组特征图X1、特征图Y2的子组Y21、…、特征图Yi的子组Yi1和特征图Ys串联，得到新的特征图Y；再利用滤波器卷积对特征图Y进行特征提取得到新的特征图X。

...

【技术特征摘要】

1.一种基于改进mask r-cnn的遥感图像目标检测方法，其特征在于，该方法包括如下步骤：

2.根据权利要求1中所述一种基于改进mask r-cnn的遥感图像目标检测方法，其特征在于，步骤2中所述对原始遥感图像进行格式转换的方法为：采用标注工具对原始遥感图像进行标注，并将标注后的数据格式转换为标准的coco数据集格式。

3.根据权利要求1中所述一种基于改进mask r-cnn的遥感图像目标检测方法，其特征在于，步骤3中所述基于改进mask r-cnn的遥感图像目标检测模型，包括：输入端、骨干网络、区域建议网络rpn、区域对齐层roialign和输出端；

4.根据权利要求3中所述一种基于改进mask r-cnn的遥感图像目标检测方法，其特征在于，所述hsressenet-bifpn网络为：向hsressenet-bifpn网络中输入待检测的遥感图像，采用零填充zeropad的方式对输入的遥感影像依次进行卷积操作和最大值池化操作，得到特征图c1；将特征图c1输入第一下采样残差块和2个串联的第一基于注意力机制senet和hs-resnet网络的恒等残差块中得到特征图c2；将特征图c2输入第二下采样残差块和3个串联的第二基于注意力机制senet和hs-resnet网络的恒等残差块中得到特征图c3；将特征图c3输入第三下采样残差块和22个串联的第三基于注意力机制senet和hs-resnet网络的恒等残差块中得到特征图c4；将特征图c4输入第四下采样残差块和2个串联的第四基于注意力机制senet和hs-resnet网络的恒等残差块中得到特征图c5；再将特征图c2、特征图c3、特征图c4和特征图c5输入bifpn网络中进行特征融合得到特征图p2'、特征图p3'、特征图p4'和特征图p5'，同时对特征图c5进行最大值池化得到特征图c6，特征图c6无需进行特征融合直接作为特征图p6，并将特征图p2'、特征图p3'、特征图p4'、特征图p5'和特征图p6作为多尺度特征图输入区域建议网络rpn。

5.根据权利要求4中所述一种基于改进mask r-cnn的遥感图像...

【专利技术属性】
技术研发人员：翟莹莹，饶家闽，李海鑫，张恩德，王斌，杨晓春，
申请(专利权)人：东北大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人