一种任意尺度的高分辨率图像小目标检测方法技术

技术编号：24355080 阅读：145 留言：0更新日期：2020-06-03 02:23

一种任意尺度的高分辨率图像小目标检测方法，包括以下步骤：获取标注清洗的目标数据集，划分训练集和测试集；对数据集通过优化聚类算法计算预设锚框；设计卷积神经网络，通过特征提取得到特征图，在预测网络上添加补丁使上采样得到的特征图和特征提取层对应特征图维度保持一致，在不同尺度特征图上做多尺度检测；利用卷积神经网络对数据集进行训练，待性能评价指标收敛后得到具有小目标检测能力的神经网络模型；对测试数据集进行检测，得到目标类别和位置坐标。本发明专利技术适用任意尺寸的图像输入网络，避免缩小到固定尺寸输入网络后特征图上小目标特征的丢失，或裁剪图像导致边缘目标上下文信息丢失，有助于高分辨率图像小目标的检测，适用性广。

A small target detection method of high resolution image at any scale

全部详细技术资料下载

【技术实现步骤摘要】
一种任意尺度的高分辨率图像小目标检测方法
本专利技术属于深度学习图像处理和遥感高分辨率图像小目标检测
，特别涉及到一种任意尺度的高分辨率图像小目标检测方法。
技术介绍
随着卫星遥感技术及计算机视觉技术的发展和应用，光学遥感图像中的目标检测在民用和军事方面有着重要意义。在民用上，高精度目标检测有助于辅助交通管理和规划；在军事上，高精度的目标检测有助于准确的情报侦察，精确锁定敌对目标入侵和危害，维护国家安全。而分辨率高、目标小是遥感图像目标检测的难点和最突出的问题之一。传统的遥感图像目标检测基于图像处理，即先进行纹理分割、纹理特征提取，然后使用模板匹配等方法对目标进行判断，不仅对特征的抽象和泛化能力弱，而且工程复杂度高。深度卷积神经网络的应用大大提高了目标检测精度，但是无论是以YOLO为代表的one-stage检测算法，还是以R-CNN为代表的two-stage检测算法，都需要对高分辨率的遥感图像进行裁剪或者进行插值计算放缩到较小的图像尺寸，裁剪导致特征提取后裁剪块边缘目标上下文信息丢失，而对图像进行插值计算放缩到较小的固定尺寸，原始图像中小目标尺寸更小，通过深层的特征提取网络所得到的特征图，小目标特征丢失，会造成小目标的漏检。以YOLO为例，如果输入图像原始大小为1355×1526，图像中小目标尺寸为32×32，输入网络需要对图片进行插值缩小到416×416的固定大小，小目标尺寸缩小到10～16之间，小目标通过特征提取网络在特征图上目标特征消失，最终造成小目标的漏检。
技术实现思路
本...

【技术保护点】
1.一种任意尺度的高分辨率图像小目标检测方法，其特征在于：具体包括以下步骤：/nS1、获取目标数据集，对目标数据集进行标注清洗，并划分训练集和测试集；/nS2、对步骤S1中的目标数据集通过优化的kmeans聚类算法计算预设锚框Anchors；/nS3、设计卷积神经网络，通过特征提取网络得到特征图，并在预测网络上通过添加补丁的方式使上采样得到的特征图和特征提取层所对应特征图维度保持一致，进行特征融合，在原图的

【技术特征摘要】
1.一种任意尺度的高分辨率图像小目标检测方法，其特征在于：具体包括以下步骤：
S1、获取目标数据集，对目标数据集进行标注清洗，并划分训练集和测试集；
S2、对步骤S1中的目标数据集通过优化的kmeans聚类算法计算预设锚框Anchors；
S3、设计卷积神经网络，通过特征提取网络得到特征图，并在预测网络上通过添加补丁的方式使上采样得到的特征图和特征提取层所对应特征图维度保持一致，进行特征融合，在原图的和大小的特征图上做多尺度检测；
S4、将步骤S1中得到的训练集和对应的样本标签作为输入数据，利用步骤S3中得到的卷积神经网络进行训练，待性能评价指标达到收敛后得到具有小目标检测能力的神经网络模型；
S5、根据步骤S4得到的神经网络模型，对测试数据集进行检测，得到检测结果。

2.根据权利要求1所述的一种任意尺度的高分辨率图像小目标检测方法，其特征在于：所述步骤S1具体包括以下子步骤：
S11、选取数据集中包含汽车的图片作为目标数据集，对目标数据集进行标注清洗，构成实验中所用的数据集和样本标签；
S12、对步骤S11中得到的数据集和样本标签进行旋转、翻转、加噪声操作，实现数据扩展和数据增强，不对图片进行尺寸变换；
S13、对步骤S12中得到的数据集和对应样本标签随机打乱后，任取80％～90％作为训练集，剩下的作为测试集。

3.根据权利要求1所述的一种任意尺度的高分辨率图像小目标检测方法，其特征在于：所述步骤S2中具体包含以下子步骤：
S21、对样本中目标数据进行如下公式的去归一化处理，

其中，Txmin和Tymin分别表示去归一化后目标框左上角横、纵坐标，Tw和Th分别表示去归一化后目标框的宽、高，Gw和Gh分别表示图片的宽、高，center_x和center_y分别表示归一化目标中心坐标，tw和th分别表示归一化的宽、高；
S22、将步骤S21去归一化处理后的样本标签数据进行随机打乱，并记录在列表集合中，从中随机选取一个索引，该索引在列表中代表目标框的宽、高作为初始聚类中心，计算列表中每一个索引代表的目标框和最近的聚类中心的交并比，最后得到预设的K个聚类中心，通过kmeans算法得到K个预设的锚框Anchor值，其中公式如下：

其中，d(box，centroid)表示聚类的距离度量，选取新聚类中心点时，d(box，centroid)越大，被选取的概率就越大，IOU...

【专利技术属性】
技术研发人员：李建清，吴锦涛，王宏，
申请(专利权)人：电子科技大学，
类型：发明
国别省市：四川;51

全部详细技术资料下载我是这个专利的主人