基于YoloV3的探地雷达图像目标检测方法技术

技术编号:31378787 阅读:15 留言:0更新日期:2021-12-15 11:20
本发明专利技术公开了一种基于Yolo V3的探地雷达图像目标检测方法,包括如下步骤:采用探地雷达设备采集相关的地质图像,并进行数据准备;对采集到的图像进行预处理;使用网络Darknet

【技术实现步骤摘要】
基于Yolo V3的探地雷达图像目标检测方法


[0001]本专利技术涉及雷达图像处理方法
,尤其涉及一种基于Yolo V3的探地雷达图像目标检测方法。

技术介绍

[0002]探地雷达作为一种基于高频电磁波的无损探测设备,当电磁波在地下介质传播时,遇到地下目标的电性差异分界面时会产生双曲线形状的反射线,称为双曲波。通过双曲波的波形、振幅强度和时间变化等特性可以推断出地下目标的空间位置、结构、形态和埋藏深度等重要信息。因此这对于理解地下目标的特点具有重要的指示作用。但是由于系统噪声和地下介质的不均匀性,会导致生成的图像非常复杂。

技术实现思路

[0003]本专利技术所要解决的技术问题是如何提供一种可以更好的提取出特征,提高检测效果的基于Yolo V3的探地雷达图像目标检测方法。
[0004]为解决上述技术问题,本专利技术所采取的技术方案是:一种基于Yolo V3的探地雷达图像目标检测方法,其特征在于包括如下步骤:
[0005]采用探地雷达设备采集相关的地质图像,并进行数据准备;
[0006]对采集到的图像进行预处理;
[0007]使用网络Darknet

53来提取特征;
[0008]图像处理方法为数据先经过preprocess_true_boxes()函数处理,然后输入到模型,损失函数是yolo_loss(),网络最后一个卷积层的输出作为函数yolo_head()的输入,然后再使用函数yolo_eval()得到目标检测结果。
[0009]进一步的技术方案在于,进行数据准备的方法如下:
[0010]预测特征图的anchor框集合:3个尺度的特征图,每个特征图3个anchor框,共9个框,从小到大排列;框1

3在大尺度52x52特征图中使用,框4

6是中尺度26x26,框7

9是小尺度13x13;大尺度特征图用于检测小物体,小尺度检测大物体;9个anchor来源于边界框的K

Means聚类;
[0011]图片输入尺寸:默认为416x416,选择416的原因是:图片尺寸满足32的倍数,在DarkNet网络中,执行5次步长为2卷积,降采样;
[0012]在最底层时,特征图尺寸需要满足为奇数,以保证中心点落在唯一框中。
[0013]进一步的技术方案在于,对采集到的图像进行预处理的方法如下:
[0014]灰度化:灰度化,在RGB模型中,如果R=G=B时,则彩色表示一种灰度颜色,其中R=G=B的值叫灰度值,因此,灰度图像每个像素只需一个字节存放灰度值灰度范围为0

255;采用分量法、最大值法、平均值法或加权平均法对彩色图像进行灰度化;
[0015]几何变换:图像几何变换又称为图像空间变换,通过平移、转置、镜像、旋转、缩放对采集的图像进行处理,用于改正图像采集系统的系统误差和仪器位置的随机误差;使用
最近邻插值、双线性插值或双三次插值算法,使得输出图像的像素被映射到输入图像的整数坐标上;
[0016]图像增强:增强图像中的有用信息,它可以是一个失真的过程,其目的是要改善图像的视觉效果,针对给定图像的应用场合,有目的地强调图像的整体或局部特性,将原来不清晰的图像变得清晰或强调某些感兴趣的特征,扩大图像中不同物体特征之间的差别,抑制不感兴趣的特征,使之改善图像质量、丰富信息量,加强图像判读和识别效果,满足某些特殊分析的需要。
[0017]进一步的技术方案在于,所述YoloV3所使用的主干特征提取网络为Darknet

53,Darknet

53包括连续的3
×
3和1
×
1卷积层,一共有53个卷积层,所以称它为Darknet

53,
[0018]Darknet53具有一个重要特点是使用了残差网络Residual,Darknet53中的残差卷积就是首先进行一次卷积核大小为3x3、步长为2的卷积,该卷积会压缩输入进来的特征层的宽和高,此时可以获得一个特征层,将该特征层命名为layer;之后我们再对该特征层进行一次1x1的卷积和一次3x3的卷积,并把这个结果加上layer,此时便构成了残差结构;通过不断的1x1卷积和3x3卷积以及残差边的叠加,大幅度的加深网络;
[0019]Darknet

53的每一个卷积部分使用DarknetConv2D结构,每一次卷积时进行l2正则化,完成卷积后进行BatchNormalization标准化与LeakyReLU;Leaky ReLU则是给所有负值赋予一个非零斜率,以数学的方式可以表示为:
[0020][0021]进一步的技术方案在于,YoloV3的解码过程分为两步:
[0022]先将每个网格点加上它对应的x_offset和y_offset,加完后的结果就是预测框的中心;
[0023]然后再利用先验框和h、w结合计算出预测框的宽高,得到整个预测框的位置。
[0024]进一步的技术方案在于,所述Darknet

53网络进行训练的方法如下:
[0025]1)计算loss所需参数;
[0026]2)对于Yolo V3的模型来说,网络最后输出的内容就是三个特征层每个网格点对应的预测框及其种类,即三个特征层分别对应着图片被分为不同size的网格后,每个网格点上三个先验框对应的位置、置信度及其种类;
[0027]输出层的shape分别为(13,13,75),(26,26,75),(52,52,75),最后一个维度为75是因为是基于voc数据集的,它的类为20种,Yolo V3只有针对每一个特征层存在3个先验框,所以最后维度为3x25;
[0028]如果使用的是coco训练集,类则为80种,最后的维度应该为255=3x85,三个特征层的shape为(13,13,255),(26,26,255),(52,52,255)
[0029]3)loss的计算过程:
[0030]得到pred和target后,进行如下步骤:
[0031]3‑
1)判断真实框在图片中的位置,判断其属于哪一个网格点去检测;
[0032]3‑
2)判断真实框和哪个先验框重合程度最高;
[0033]3‑
3)计算该网格点应该有怎么样的预测结果才能获得真实框;
[0034]3‑
4)对所有真实框进行处理;
[0035]3‑
5)获得网络应该有的预测结果,将其与实际的预测结果对比。
[0036]进一步的技术方案在于,preprocess_true_boxes()函数包括如下参数:
[0037]true_boxes:实际框的位置和类别,维度为boxes_num
×
5,boxes_num表示一张图片中有几个实际框,第二个本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于YoloV3的探地雷达图像目标检测方法,其特征在于包括如下步骤:采用探地雷达设备采集相关的地质图像,并进行数据准备;对采集到的图像进行预处理;使用网络Darknet

53来提取特征;图像处理方法为数据先经过preprocess_true_boxes()函数处理,然后输入到模型,损失函数是yolo_loss(),网络最后一个卷积层的输出作为函数yolo_head()的输入,然后再使用函数yolo_eval()得到目标检测结果。2.如权利要求1所述的基于YoloV3的探地雷达图像目标检测方法,其特征在于,进行数据准备的方法如下:预测特征图的anchor框集合:3个尺度的特征图,每个特征图3个anchor框,共9个框,从小到大排列;框1

3在大尺度52x52特征图中使用,框4

6是中尺度26x26,框7

9是小尺度13x13;大尺度特征图用于检测小物体,小尺度检测大物体;9个anchor来源于边界框的K

Means聚类;图片输入尺寸:默认为416x416,选择416的原因是:图片尺寸满足32的倍数,在DarkNet网络中,执行5次步长为2卷积,降采样;在最底层时,特征图尺寸需要满足为奇数,以保证中心点落在唯一框中。3.如权利要求1所述的基于YoloV3的探地雷达图像目标检测方法,其特征在于,对采集到的图像进行预处理的方法如下:灰度化:灰度化,在RGB模型中,如果R=G=B时,则彩色表示一种灰度颜色,其中R=G=B的值叫灰度值,因此,灰度图像每个像素只需一个字节存放灰度值灰度范围为0

255;采用分量法、最大值法、平均值法或加权平均法对彩色图像进行灰度化;几何变换:图像几何变换又称为图像空间变换,通过平移、转置、镜像、旋转、缩放对采集的图像进行处理,用于改正图像采集系统的系统误差和仪器位置的随机误差;使用最近邻插值、双线性插值或双三次插值算法,使得输出图像的像素被映射到输入图像的整数坐标上;图像增强:增强图像中的有用信息,它可以是一个失真的过程,其目的是要改善图像的视觉效果,针对给定图像的应用场合,有目的地强调图像的整体或局部特性,将原来不清晰的图像变得清晰或强调某些感兴趣的特征,扩大图像中不同物体特征之间的差别,抑制不感兴趣的特征,使之改善图像质量、丰富信息量,加强图像判读和识别效果,满足某些特殊分析的需要。4.如权利要求1所述的基于YoloV3的探地雷达图像目标检测方法,其特征在于,所述YoloV3所使用的主干特征提取网络为Darknet

53,Darknet

53包括连续的3
×
3和1
×
1卷积层,一共有53个卷积层,所以称它为Darknet

53,Darknet53具有一个重要特点是使用了残差网络Residual,Darknet53中的残差卷积就是首先进行一次卷积核大小为3x3、步长为2的卷积,该卷积会压缩输入进来的特征层的宽和高,此时可以获得一个特征层,将该特征层命名为layer;之后我们再对该特征层进行一次1x1的卷积和一次3x3的卷积,并把这个结果加上layer,此时便构成了残差结构;通过不断的1x1卷积和3x3卷积以及残差边的叠加,大幅度的加深网络;Darknet

53的每一个卷积部分使用DarknetConv2D结构,每一次卷积时进行l2正则化,
完成卷积后进行BatchNormalization标准化与LeakyReLU;Leaky ReLU则是给所有负值赋予一个非零斜率,以数学的方式可以表示为:5.如权利要求...

【专利技术属性】
技术研发人员:马月红崔琳剧畅洋刘永泽刘佳张亭
申请(专利权)人:石家庄铁道大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1