一种基于YOLO神经网络的建筑构建目标检测方法技术

技术编号:23099779 阅读:23 留言:0更新日期:2020-01-14 20:43
本发明专利技术公开一种基于YOLO神经网络的建筑构建目标检测方法,步骤1,在施工场地采集原始图像数据,将采集的原始图像数据分为测试集和训练集,对训练集进行预处理;步骤2,对YOLO神经网络的基于Darknet‑53目标识别模型进行训练;步骤3,用测试集对基于Darknet‑53目标识别模型进行测试,得到测试结果;步骤4,对步骤3的测试结果进行分析;步骤5,在施工场地采集图像,利用基于Darknet‑53的目标识别模型对所采集图像中的建筑构建目标进行检测。本发明专利技术解决了已有的YOLO算法对于建筑施工场地图像中目标图层深、尺度小这些问题无法快速、准确的识别的缺陷。

A method of building construction target detection based on Yolo neural network

【技术实现步骤摘要】
一种基于YOLO神经网络的建筑构建目标检测方法
本专利技术涉及深度学习目标检测领域,具体是一种基于YOLO神经网络的建筑构建目标检测方法。
技术介绍
随着我国建筑行业的快速发展,在建筑行业技术和工期要求日益严格的趋势下,装配式建筑逐渐开始发挥着日益重要的作用,针对装配式建筑构建的目标检测将具有十分重要的研究意义。目标检测技术作为计算机视觉的一部分,其目的在于快速定位和分类识别图像中的目标。装配式建筑构建的目标检测是在建筑施工场地针对待装配的建筑构建进行定位和分类。已有的YOLO算法可以在图像结构清晰、目标大小合适以及光照条件良好的情况下识别效率较高,但对于建筑施工场地图像中目标图层深、尺度小等问题,无法快速、准确的识别。
技术实现思路
本专利技术的目的在于提供一种基于YOLO神经网络的建筑构建目标检测方法,以解决已有的YOLO算法对于建筑施工场地图像中目标图层深、尺度小这些问题无法快速、准确的识别的缺陷。本专利技术的目的通过如下技术方案实现:一种基于YOLO神经网络的建筑构建目标检测方法,包括如下步骤:步骤1,在施工场地采集原始图像数据,原始图像数据采集时包含建筑构建的多角度、且包含多个单类目标的不同图层深度;然后将采集的原始图像数据分为测试集和训练集,对训练集进行预处理;步骤2,通过空间金字塔池化对步骤1预处理后的训练集进行特征提取,得到特征图像,然后将得到的特征图像的候选框映射到YOLO神经网络的特征图像中,最后对YOLO神经网络的基于Darknet-53目标识别模型进行训练,得到训练好的基于Darknet-53目标识别模型;步骤3,用测试集对基于Darknet-53目标识别模型进行测试,得到测试结果;步骤4,对步骤3的测试结果进行分析,若测试结果中准确标出建筑构件位置和识别出建筑构件,则进行步骤5;若测试结果中出现未能准确标出建筑构件位置和/或未能识别出建筑构件的情况,则调整基于Darknet-53目标识别模型的参数,再重复进行步骤3,直至测试结果中准确标出建筑构件位置和识别出建筑构件,然后进行步骤5;步骤5,在施工场地采集图像,利用基于Darknet-53的目标识别模型对所采集图像中的建筑构建目标进行检测。优选的,所述步骤1中,在施工场地采集原始图像数据的过程包括如下步骤:优选的,步骤1.1,对施工场地的建筑构建进行不同角度的拍摄,拍摄的对象包含单个目标和多个单类目标;步骤1.2,在一天中的不同时刻,光照条件不同时按照步骤1.1对目标进行拍摄,拍摄时在顺光以及背光条件下进行;在进行步骤1.2和步骤1.3时,所拍摄的原始图像数据尽量多的包含施工场地建筑构件之外的其他建筑构建。优选的,对训练集进行预处理的过程包括:将训练集的图像数据采用LabelImg-master标注工具进行标注,标注目标完成后将产生的XML文件转换成基于Darknet-53的目标识别模型可以读取的txt文件。优选的,所述基于Darknet-53目标识别模型包括卷积层、特征融合层和预测层,其中:卷积层:用于对于输入的图像进行特征提取,采取边卷积边向上采样的方式,将采集到的特征图分为13×13、26×26和52×52三个不同的尺度;特征融合层:用于将所述卷积层采集的三个不同尺度的特征图进行特征融合;预测层:用于利用特征融合层融合后的特征图进行目标预测,对应产生三种不同尺度的预测图。优选的,步骤2中,通过步骤1预处理得到的训练集对基于Darknet-53目标识别模型进行训练时,使用预训练权重文件darknet53.conv.74对基于Darknet-53的目标识别模型进行训练,包括如下步骤:步骤2.1,配置基于Darknet-53的目标识别模型参数,采用YOLO神经网络配合基于Darknet-53的目标识别模型进行目标识别;步骤2.2,设置训练集、预训练权重文件darknet53.conv.74和新生成权重文件的保存路径,并将识别目标的名称保存在.names文件中;步骤2.3,在DOS下进入基于Darknet-53目标识别模型的保存路径,使用训练指令开启对基于Darknet-53目标识别模型的训练,训练过程中在迭代预设的次数后产生新的权重文件,筛选出产生的新的权重文件中训练最好的权重文件。优选的,所述步骤2.1中,基于Darknet-53的目标识别模型参数包括Classes、步长和学习率。优选的,设置Classes=1,设置步长为64,设置学习率为0.001。优选的,所述步骤3中,采用步骤2.3产生的新的权重文件中训练最好的权重文件对基于Darknet-53的目标识别模型进行测试。优选的,所述步骤4中,调整的基于Darknet-53目标识别模型的参数包括学习率和迭代次数;调整基于Darknet-53目标识别模型的参数时:若测试结果中出现未能准确标出建筑构件位置,将学习率降低并增加迭代次数;若未能识别出建筑构件且损失函数过大,则先调大学习率,待损失函数降低再将学习率降低,增加迭代次数并重复进行步骤3。本专利技术具有如下有益效果:本专利技术的基于YOLO神经网络的建筑构建目标检测方利用了空间金子塔池化的思想。首先将原始图像在YOLO神经网络中进行特征提取,得到特征图像,然后将原始图像经过空间金字塔池化的方式得到的候选框映射到第一YOLO神经网络的特征图像中进行特征融合最后通过预测层输出;将空间金字塔池化引入网络中,扩大了特征图中的搜索区域,对于小目标识别具有较好的识别效果,在原有的基础上模型的识别精度有所改善。附图说明图1是本专利技术采用的YOLO神经网络的网络结构图;图2是本专利技术在原始图像上引入了空间金字塔池化后的YOLO神经网络的网络结构图;图3是本专利技术在原始图像上引入了空间金字塔池化后的YOLO神经网络与现有技术中的YOLO识别效果对比图,原始图为在施工场地采集到的图像,其中,图3(a)为光照弱的改进前的识别图,图3(b)为光照弱的改进后的识别图,图3(c)为图层深改进前的识别图,图3(d)为图层深改进后的识别图。图4(a)为本专利技术实施例中光照弱改进前识别精度图,图4(b)为本专利技术实施例中光照弱改进后识别精度图,图4(c)为本专利技术实施例中图层深改进前识别精度图,图4(d)为本专利技术实施例中图层深改进后识别精度图。具体实施方式下面结合附属图和实施例对本专利技术作进一步的说明。本专利技术采用的技术方案为:基于YOLO神经网络的建筑构建目标检测方法,包括如下步骤:步骤一,在施工场地采集原始图像数据,原始图像数据采集时必须包含建筑构建的多角度,且包含多个单类目标的不同图层深度。考虑到光照条件的影响,原始图像数据需在不同时间段的不同光照条件下进行采集。然后将采集的原始图像数据分为测试集和训练集,对训练集的图像进行预处理。具体的步骤一包括如下步骤:步骤1.1,在施工本文档来自技高网...

【技术保护点】
1.一种基于YOLO神经网络的建筑构建目标检测方法,其特征在于,包括如下步骤:/n步骤1,在施工场地采集原始图像数据,原始图像数据采集时包含建筑构建的多角度、且包含多个单类目标的不同图层深度;然后将采集的原始图像数据分为测试集和训练集,对训练集进行预处理;/n步骤2,通过空间金字塔池化对步骤1预处理后的训练集进行特征提取,得到特征图像,然后将得到的特征图像的候选框映射到YOLO神经网络的特征图像中,最后对YOLO神经网络的基于Darknet-53目标识别模型进行训练,得到训练好的基于Darknet-53目标识别模型;/n步骤3,用测试集对基于Darknet-53目标识别模型进行测试,得到测试结果;/n步骤4,对步骤3的测试结果进行分析,若测试结果中准确标出建筑构件位置和识别出建筑构件,则进行步骤5;若测试结果中出现未能准确标出建筑构件位置和/或未能识别出建筑构件的情况,则调整基于Darknet-53目标识别模型的参数,再重复进行步骤3,直至测试结果中准确标出建筑构件位置和识别出建筑构件,然后进行步骤5;/n步骤5,在施工场地采集图像,利用基于Darknet-53的目标识别模型对所采集图像中的建筑构建目标进行检测。/n...

【技术特征摘要】
1.一种基于YOLO神经网络的建筑构建目标检测方法,其特征在于,包括如下步骤:
步骤1,在施工场地采集原始图像数据,原始图像数据采集时包含建筑构建的多角度、且包含多个单类目标的不同图层深度;然后将采集的原始图像数据分为测试集和训练集,对训练集进行预处理;
步骤2,通过空间金字塔池化对步骤1预处理后的训练集进行特征提取,得到特征图像,然后将得到的特征图像的候选框映射到YOLO神经网络的特征图像中,最后对YOLO神经网络的基于Darknet-53目标识别模型进行训练,得到训练好的基于Darknet-53目标识别模型;
步骤3,用测试集对基于Darknet-53目标识别模型进行测试,得到测试结果;
步骤4,对步骤3的测试结果进行分析,若测试结果中准确标出建筑构件位置和识别出建筑构件,则进行步骤5;若测试结果中出现未能准确标出建筑构件位置和/或未能识别出建筑构件的情况,则调整基于Darknet-53目标识别模型的参数,再重复进行步骤3,直至测试结果中准确标出建筑构件位置和识别出建筑构件,然后进行步骤5;
步骤5,在施工场地采集图像,利用基于Darknet-53的目标识别模型对所采集图像中的建筑构建目标进行检测。


2.根据权利要求1所述的一种基于YOLO神经网络的建筑构建目标检测方法,其特征在于,所述步骤1中,在施工场地采集原始图像数据的过程包括如下步骤:
步骤1.1,对施工场地的建筑构建进行不同角度的拍摄,拍摄的对象包含单个目标和多个单类目标;
步骤1.2,在一天中的不同时刻,光照条件不同时按照步骤1.1对目标进行拍摄,拍摄时在顺光以及背光条件下进行;
在进行步骤1.2和步骤1.3时,所拍摄的原始图像数据尽量多的包含施工场地建筑构件之外的其他建筑构建。


3.根据权利要求1所述的一种基于YOLO神经网络的建筑构建目标检测方法,其特征在于,对训练集进行预处理的过程包括:将训练集的图像数据采用LabelImg-master标注工具进行标注,标注目标完成后将产生的XML文件转换成基于Darknet-53的目标识别模型可以读取的txt文件。


4.根据权利要求1所述的一种基于YOLO神经网络的建筑构建目标检测方法,其特征在于,所述基于Darknet-53目标识别模型包括卷积层、特征融合层和预测层,其中:
卷积层:用于对于输入的图像进行特征提取,采取边卷积边向上采样的方式,将采集到的特征图分为13×13、26×26和52×52三个不...

【专利技术属性】
技术研发人员:张翔姚江涛董丽丽
申请(专利权)人:西安建筑科技大学
类型:发明
国别省市:陕西;61

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1