当前位置: 首页 > 专利查询>中山大学专利>正文

一种单阶段遥感图像目标检测算法制造技术

技术编号:26766492 阅读:28 留言:0更新日期:2020-12-18 23:43
本发明专利技术公开了一种单阶段遥感图像目标检测算法,以Yolo v3为基准,在Yolo v3的特征提取网络中加入金字塔卷积,将Yolo v3的检测网络替换为路径聚合网络,并改进所述路径聚合网络的上采样方式为转置卷积,最后在所述特征提取网络及所述检测网络之间加入空间金字塔池化作为中间连接。本发明专利技术的单阶段遥感图像目标检测算法与Yolo v3相比,检测速度基本没有影响,有效提高了检测精度。

【技术实现步骤摘要】
一种单阶段遥感图像目标检测算法
本专利技术涉及深度学习目标检测
,具体涉及一种单阶段遥感图像目标检测算法。
技术介绍
随着卫星、航空航天还有传感器技术的飞速发展,遥感技术的应用日渐广泛,遥感数据也日渐丰富。遥感图像目标检测是遥感数据研究的一个重要分支,能够在资源探测、环境检测、城市规划等领域发挥重要作用。如何高效地实现遥感图像目标检测,已成为图像识别领域的热点研究内容。传统遥感图像目标检测以划分区域-特征提取-分类器为主线,通过滑动窗口遍历整张图像,然后通过Haar、SIFT、HOG等特征提取的方式提取图像的纹理、色彩、尺度等特征,再通过传统机器学习方法对特征进行分类,实现遥感图像的目标检测。这种检测算法会使得时间复杂度过高,产生大量冗余的窗口,严重影响特征提取、检测性能。虽然传统的遥感图像目标检测也出现了人工设计特征的方法,但由于目标形态多样性、光照变化性、背景多样性等要素,设计鲁棒的特征存在一定难度,而提取的特征好坏直接影响分类准确性。基于深度学习的遥感图像目标检测在2016年Girshick将深度学习神经网络用于目标检测后快速发展起来,由于深度学习具有强大的自动提取特征能力,因此也在遥感图像目标检测算法中被广泛运用。目前基于深度学习的遥感图像目标检测算法分为两类:基于区域的两阶段目标检测方法及端到端的单阶段目标检测深度学习方法。两阶段通用目标检测方法主要有R-CNN、FastR-CNN等,通常由四个部分组成:1、候选区域生成,每张图片采用选择性搜索的方式,生成1000到2000的候选框,并给相似图像区域打分;2、特征提取,对每个候选区域,采用卷积神经网络提取特征;3、类别判定,标签与候选框组成的正负样本形成相应特征向量,并将特征送入SVM分类器,判定所属类别;4、位置精修,采用回归器精准确定候选框位置。基于区域的两阶段目标检测方法能够获得良好的识别精度,但由于在特征提取前还需要经过候选框生成,因此具有较高的时间复杂度,不利于遥感图像目标检测的项目落地。单阶段目标检测方法是直接进行分类预测及边界框回归的算法结构,它的网络结构与两阶段相比更加简单,可以在检测性能上进行端到端的优化。目前单阶段目标检测算法主要有Yolo系列。Yolo使用全局的图片输入网络,直接在一个深度网络中进行特征提取、候选框分类和回归的工作,因此单阶段目标检测速度很快。但是由于这类方法直接将整张图片输入网络,图像中含有过多的背景、噪声,因此对于具有复杂背景的遥感图像进行检测,会发生误检、漏检现象,导致检测精度不高。
技术实现思路
为了弥补现有技术中存在的不足,本专利技术提供了一种单阶段遥感图像目标检测算法,能够兼顾检测速度及精度。为了达到上述目的,本专利技术采用的技术方案如下:一种单阶段遥感图像目标检测算法,以Yolov3为基准,在Yolov3的特征提取网络中加入金字塔卷积,将Yolov3的检测网络替换为路径聚合网络,并改进所述路径聚合网络的上采样方式为转置卷积,最后在所述特征提取网络及所述检测网络之间加入空间金字塔池化作为中间连接。进一步的,所述特征提取网络的主干网络前两层3×3卷积替换为所述金字塔卷积。进一步的,所述金字塔卷积内部进行分组卷积。进一步的,所述空间金字塔池化的步骤为,首先对所述特征提取网络输出的特征图进行通道数为512的1×1卷积,再经过尺度为5、步长为1的最大池化,之后又回到所述特征图并进行尺度为13、步长为1的最大池化,最后将所有最大池化的结果与所述特征图进行维度的拼接。进一步的,上述目标检测算法采用Pytorch1.3进行训练,训练过程中选择随机梯度下降的方法对模型进行优化。进一步的,训练过程使用损失函数更新权重,所述损失函数由预测框的位置损失、置信度损失和类别损失组成,所述位置损失的公式为GIOU损失,表达式如下,上式中A为候选框,B为原标记框,C为A、B的最小闭包;所述置信度损失的公式如下,上式中的FL为Focalloss,设置γ为0.5,λnoobj为0.005;类别损失的公式如下,上式中,表示(i,j)预测框属于类别c的概率,表示标记框所属类别真实值。进一步的,所述类别损失进行加权处理,λc为类别权重,公式如下,进一步的,所述类别损失还加入了Focalloss,公式如下,FL(pt)=-(1-pt)γlog(pt)相对于现有技术,本专利技术具有以下有益技术效果:本专利技术所述的单阶段遥感图像目标检测算法,加入金字塔卷积改进后的特征提取网络能够有效扩展输出特征图的感受野,改进后的算法精度提高了1.9%;加入空间金字塔池化及替换检测网络为上采样改进的路径聚合网络后,算法精度在原有基础上提升了2.2%;本算法与Yolov3相比,检测速度基本没有影响,有效提高了检测精度。附图说明图1是本专利技术所述的单阶段遥感图像目标检测算法的金字塔卷积结构图;图2是本专利技术所述的单阶段遥感图像目标检测算法的路径聚合网络示意图;图3是本专利技术所述的单阶段遥感图像目标检测算法的整体框架结构图。具体实施方式在下面的描述中阐述了很多具体细节以便于充分理解本专利技术。但是本专利技术能够以很多不同于此描述的其他方式来实施,本领域技术人员可以在不违背本专利技术内涵的情况下做类似推广,因此本专利技术不受下面公开的具体实施例的限制。一、数据集介绍及处理本专利技术的单阶段目标检测算法在DOTA航空遥感图像数据集上进行实验及评估,DOTA数据集是武汉大学遥感国重实验室和华中科技大学合作的一个航拍遥感图像数据集。该数据集中包含2806张遥感图像,一共检测15个类别:小型车辆(small-vehicle)、大型车辆(large-vehicle)、飞机(plane)、码头(harbor)、船(ship)、游泳池(swimming-pool)、网球场(tennis-court)、环形交叉路口(roundabout)、棒球场(baseball-diamond)、篮球场(basketball-court)、足球场(soccer-ball-field)、田径场(ground-track-field)、直升机(helicopter)、储蓄罐(storage-tank)、桥梁(bridge)。每幅图像大小约为800×800到4000×4000像素,包含不同尺度、方向和形状的对象。完整注释的DOTA数据集包含188,282个实例。由于数据集中图片尺寸过大,先将图片进行切割处理,每张图片裁剪为800×800大小,相邻图片间设置64宽度的重叠。进行裁剪后,各类目标数量极其不平衡,因此对于足球场、棒球场、环形交叉路口、直升机、篮球场、田径场这些目标样本数少的类别,对这些图片采取了旋转、反转、尺度缩放的方法进行数据增强,缓解了各类目标样本数量不均衡的现象。二、基于Yolov3改进的单阶段遥感图像目标检测算法本专利技术的单阶段遥感图像目标检测算法本文档来自技高网
...

【技术保护点】
1.一种单阶段遥感图像目标检测算法,其特征在于:以Yolo v3为基准,在Yolo v3的特征提取网络中加入金字塔卷积,将Yolo v3的检测网络替换为路径聚合网络(PAN网络),并改进所述路径聚合网络的上采样方式为转置卷积,最后在所述特征提取网络及所述检测网络之间加入空间金字塔池化作为中间连接。/n

【技术特征摘要】
1.一种单阶段遥感图像目标检测算法,其特征在于:以Yolov3为基准,在Yolov3的特征提取网络中加入金字塔卷积,将Yolov3的检测网络替换为路径聚合网络(PAN网络),并改进所述路径聚合网络的上采样方式为转置卷积,最后在所述特征提取网络及所述检测网络之间加入空间金字塔池化作为中间连接。


2.根据权利要求1所述的单阶段遥感图像目标检测算法,其特征在于:所述特征提取网络的主干网络前两层3×3卷积替换为所述金字塔卷积。


3.根据权利要求2所述的单阶段遥感图像目标检测算法,其特征在于:所述金字塔卷积内部进行分组卷积。


4.根据权利要求1-3任一项所述的单阶段遥感图像目标检测算法,其特征在于:所述空间金字塔池化的步骤为,首先对所述特征提取网络输出的特征图进行通道数为512的1×1卷积,再经过尺度为5、步长为1的最大池化,之后又回到所述特征图并进行尺度为13、步长为1的最大池化,最后将所有最大池化的结果与所述特征图进行维度的拼接。


5.根据权利要求1-3任一项所述的单阶段遥感图像目标检测算法,其特征在于:采用P...

【专利技术属性】
技术研发人员:粟涛周雨迪陈弟虎
申请(专利权)人:中山大学
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1