一种稀土开采高分影像识别与定位方法技术

技术编号:29045352 阅读:36 留言:0更新日期:2021-06-26 05:59
本发明专利技术涉及稀土开采技术领域,特别是一种稀土开采高分影像识别与定位方法,包括以下步骤,步骤S1:遥感影像数据获取与预处理;步骤S2:YOLOv3模型建立;步骤S3:YOLOv3算法调整;步骤S4:模型输出结果,将包含预测边界框的像素位置信息,即相对于图像左上角的像素坐标信息以点的形式在遥感图像上标出。采用上述方法后,本发明专利技术对YOLOv3目标检测算法进行改进,将注意力机制嵌入特征提取网络中,使得具有注意力效果的梯度能流入更深的网络中,在不影响检测速度的前提下改进了其对于关键特征的提取能力,同时通过改进损失函数实现了模型更快、更稳定地收敛。更稳定地收敛。更稳定地收敛。

【技术实现步骤摘要】
一种稀土开采高分影像识别与定位方法


[0001]本专利技术涉及稀土开采
,特别是一种稀土开采高分影像识别与定位 方法。

技术介绍

[0002]南方离子吸附型稀土矿区是我国稀土资源开采最重要的矿区之一。稀土矿 区涉及范围广且多位于偏远山区,普通监测方法效率低下,时效性差。
[0003]实地调查是稀土开采监测的工作基础,现有稀土矿开采的监测手段主要有 地面调查、卫星遥感监测和无人机遥感监测。高空间分辨率影像能够更加清楚 地表达地物目标的空间结构与表层纹理特征,可以分辨出地物内部更为精细的 组成,已在稀土开采过程及地表环境扰动识别方面得到应用,但是实地调查和 卫星遥感监测存在效率低下、时效性差的局限性。随着深度学习在目标检测领 域的快速发展,基于神经网络的目标检测算法表现出良好的性能,成为近年来 的研究热点。基于神经网络的目标检测算法可分为两类:第一类为Two

stage检 测算法,首先将图像输入区域推荐网络(RPN)生成候选区域,然后对候选区域再 进行精细分类。代表性的算法有R

CNN,Fast R

CNN,Faster R

CNN等。这类算 法通常具有精度高的优点,但由于检测过程分为两步,所以存在检测速度慢, 存储成本高,模型无法压缩等问题。第二类为One

stage检测算法,其将目标检 测任务视为一个单一的回归问题,是一种端对端目标检测算法,核心思想是将 整个图像作为网络的输入,直接返回输出层中的边界框坐标和分类置信度,降 低了计算复杂度。One

stage检测算法在检测速度上优于two

stage检测算法, 但定位精度低于two

stage检测算法。代表性算法有YOLO、YOLOv3、SSD等。其 中,YOLOv3算法由于检测速度快,小目标检测效果好,通用性强,而得到广泛 关注。
[0004]中国专利技术专利CN 110147778 A公开了一种稀土矿开采识别方法,从离子吸 附型稀土矿开采过程中沉淀池状态及其空间分布关系入手,构建了基于高空间 分辨率遥感影像的深度学习模型,实现稀土开采状态的识别与检测。该模型采 用了一种特征金字塔网络FPN结合双线性插值ROIAlign的卷积神经网络的深度 学习算法,此外,针对离子稀土开采过程中沉淀池存在浸矿液体特征,加入遥 感影像的水体指数NDWI作为为输入训练模型,再将模型用于离子型稀土开采识 别;FPN+ROIAlign+NDWI的组合识别效果最好,能够实现较高的识别准确率,可 以为离子型稀土开采监管提供技术支持。

技术实现思路

[0005]本专利技术需要解决的技术问题是提供一种实现快速、精准地对稀土矿区开采状 态进行监测的方法。
[0006]为解决上述技术问题,本专利技术的一种稀土开采高分影像识别与定位方法,包 括以下步骤,
[0007]步骤S1:遥感影像数据获取与预处理,获得遥感影像数据后进行辐射校正、 几何校正和图像融合预处理,然后导出为RGB三通道图像,最后对图像进行裁 剪,剔除图像中不
包含检测目标的部分;
[0008]步骤S2:YOLOv3模型建立,先进行YOLOv3算法网络结构的确定,然后进行YOLOv3算法中损失函数的确定,所述损失函数包括第一部分目标定位损失,第 二部分目标置信度损失,最后一部分目标分类损失;
[0009]步骤S3:YOLOv3算法调整,当预测框和真实框不相交时,使用CIOU Loss 替换原有目标定位损失函数;将CBAM嵌入YOLOv3算法网络结构的Darknet

53 中;
[0010]步骤S4:模型输出结果,将包含预测边界框的像素位置信息,即相对于图像 左上角的像素坐标信息以点的形式在遥感图像上标出。
[0011]优选的,所述步骤S1中图像进行裁剪后,采用翻转、旋转、镜像、亮度、 色度、高斯模糊数据增强方法将数据集进行扩充。
[0012]优选的,所述步骤S2中YOLOv3算法网络结构的确定包括Darknet

53特征 提取网络部分和多尺度检测部分。
[0013]优选的,所述多尺度检测部分通过YOLOv3算法采用的特征金字塔网络的结 构,将每个尺度的特征图与经过两倍上采样的上一尺度的特征图进行特征融合。
[0014]优选的,所述步骤S3中目标定位损失以均方误差作为损失函数的目标函数, 具体包括首先计算网络生成的预测框与真实框的交集的面积与并集的面积的比 值,获得两个框的交并比;然后通过预先设定好的IOU阈值对预测框进行筛选, 筛选出IOU大于阈值的预测框;最后计算其对应的目标定位损失。
[0015]优选的,当预测框和真实框不相交时,两个框的IOU值为0时,使用CIOU Loss 替换原有目标定位损失函数。
[0016]优选的,所述步骤S1中在裁剪后的图像在图像训练与识别过程中需要将其 分割为尺寸较小的多张图像后输入模型进行训练和检测。
[0017]优选的,分割后的图像中若识别该沉淀池为2个或多个预测框,需要用完整 的预测框替换不完整的预测框,具体包括:
[0018]先指定一个阈值α,计算两个预测框的IOMIN指数,如果IOMIN大于α, 则删除面积较小的预测框,保留面积较大的预测框。
[0019]优选的,在遥感影像的稀土矿区沉淀池定位过程中采用随机森林分类法。
[0020]采用上述方法后,本专利技术对YOLOv3目标监测算法进行改进,将注意力机制 嵌入特征提取网络中,使得具有注意力效果的梯度能流入更深的网络中,在不 影响检测速度的前提下改进了其对于关键特征的提取能力,同时通过改进损失 函数实现了模型更快、更稳定地收敛。此外,本文还提出一种影像偏移分割方 法以及一个新的指数IOMIN,二者结合用于解决遥感影像分割过程中可能导致同 一个目标出现多个检测框或者目标被分割后难以识别从而出现漏检的问题。最 后利用坐标转换公式将稀土矿区沉淀池的检测结果转换为平面坐标系中的定位 点,为稀土管理部门及时了解稀土矿区沉淀池的分布情况并进行高效的处理工 作提供技术支持。
附图说明
[0021]下面结合附图和具体实施方式对本专利技术作进一步详细的说明。
[0022]图1为经预处理后的遥感数据图像示意图;
[0023]图2为YOLOv3网络结构示意图;
[0024]图3为通道注意力机制结构示意图;
[0025]图4为空间注意力机制结构示意图;
[0026]图5为CBAM嵌入Darknet

53的残差结构中示意图;
[0027]图6为样本边界框框K

means聚类结果示意图;
[0028]图7为边界框的尺寸先验与位置预测示意图;
[0029]图8为YOLOv3算法检测流程示意图;
[0030]图9为改进后的YOLOv3模型检测结果示意本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种稀土开采高分影像识别与定位方法,其特征在于,包括以下步骤,步骤S1:遥感影像数据获取与预处理,获得遥感影像数据后进行辐射校正、几何校正和图像融合预处理,然后导出为RGB三通道图像,最后对图像进行裁剪,剔除图像中不包含检测目标的部分;步骤S2:YOLOv3模型建立,先进行YOLOv3算法网络结构的确定,然后进行YOLOv3算法中损失函数的确定,所述损失函数包括第一部分目标定位损失,第二部分目标置信度损失,最后一部分目标分类损失;步骤S3:YOLOv3算法调整,当预测框和真实框不相交时,使用CIOU Loss替换原有目标定位损失函数;将CBAM嵌入YOLOv3算法网络结构的Darknet

53中;步骤S4:模型输出结果,将包含预测边界框的像素位置信息,即相对于图像左上角的像素坐标信息以点的形式在遥感图像上标出。2.按照权利要求1所述的一种稀土开采高分影像识别与定位方法,其特征在于:所述步骤S1中图像进行裁剪后,采用翻转、旋转、镜像、亮度、色度、高斯模糊数据增强方法将数据集进行扩充。3.按照权利要求1所述的一种稀土开采高分影像识别与定位方法,其特征在于,所述步骤S2中YOLOv3算法网络结构的确定包括Darknet

53特征提取网络部分和多尺度检测部分。4.按照权利要求3所述的一种稀土开采高分影像识别与定位方法,其特征在于:所述多尺度检测部分通...

【专利技术属性】
技术研发人员:李恒凯肖松松王利娟武镇邦
申请(专利权)人:江西理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1