本发明专利技术公开了一种引入注意力机制和ConvNext网络的YOLO v5钢铁表面损伤的检测方法,包括以下步骤:S1:通过图像数据的采集,对裂纹、斑块、夹杂、划伤、麻点、压入氧化铁皮6种缺陷图像进行数据增强,从而获得待检测图像8100张,建立测试数据集;S2:建立和改进YOLO v5的神经网络模型包括引入注意力机制和ConvNext网络模型;S3:将训练数据集中的钢铁的图像,输入到YOLO v5的网络模型中,对YOLO v5的网络模型进行训练,深化YOLO的网络模型;S4:将训练好的权重文件保存到YOLO的网络模型,使用这个权重文件对钢铁表面进行检测,检测钢铁表面是否有损伤;本发明专利技术结合深度学习网络与图像处理,实现了对钢铁表面的损伤的快速、准确的检测效果。准确的检测效果。准确的检测效果。
【技术实现步骤摘要】
引入注意力机制和ConvNext网络的YOLO v5钢铁表面损伤的检测方法
[0001]本专利技术属于机械表面故障诊断和图像智能识别领域,更具体地,设计一种引入注意力机制和ConvNext网络的YOLO v5钢铁表面损伤的检测方法。
技术介绍
[0002]在机械制造业中,钢材是极其重要的材料。钢铁有着良好的表面质量和机械性能,在车辆生产、航空、船舶等行业拥有广泛应用。我国现阶段我国正处于工业化发展中后期阶段,钢铁需求巨大,钢铁行业面临较大的市场空间。钢铁需求量变大的同时,对钢材的质量的要求也会越来越高。然而,在钢材的生产的过程中,由于各种原因,总是会有产生许多表面缺陷,如裂纹、夹杂、斑块、麻点、压入氧化铁皮、划伤等。表面损伤对钢材的质量是有很大的影响,不但会使得钢材外观变差,还会使得钢材的机械性能和抗腐蚀的能力变差。因此,如何快速并且高效的检测出钢板表面的损伤,是当前的研究重点。
[0003]原始的钢铁表面损伤检测方法主要有人工检测和传统光电检测。人工检测又称人工目视法,主要靠工人的眼睛判断,没有固定的标准,检测效率很低,不适合快速和准确的检测要求,慢慢的就被弃用了。传统的光电检测主要有涡流检测、漏磁检测等。这些光电技术的检测系统,相比于人工检测方法,检测速度、准确率、效率有了一定的提高。但是他们都有一定程度上的局限性。例如,涡流检测具有灵敏性高、响应迅速、操作方便等优点。但同时浪费资源大、难以检测小损伤目标等缺点,不太适合钢铁表面的损伤检测。
[0004]YOLO v5作为目前综合性能最好的目标检测算法之一,对目标可以做到实时检测,同时还能达到较好的检测效果,已被学术界广泛应用。但YOLO v5存在以下缺陷:1)检测小目标时不够准确;2)边界框位置不够精确;3)训练大量的数据集的时候,所消耗的内存较大。
技术实现思路
[0005]本专利技术的目的在于提供一种引入注意力机制和ConvNext网络的YOLO v5钢铁表面损伤的检测方法,能够在复杂的背景条件下对损伤特征进行高效准确的检测和提取,并且模型具有良好的迁移性和泛化性。让模型训练和检测时对硬件的要求更低,可以被广泛应用于工业检测。
[0006]本专利技术通过下述技术方案实现:一种引入注意力机制和ConvNext网络的YOLO v5钢铁表面损伤的检测方法,包括以下步骤:S1:建立测试数据集:采集图像数据,之后对夹杂、裂纹、麻点、斑块、划伤、压入氧化铁皮6种缺陷图像通过物理变换对图像进行数据增强,从而获得由待检测图像8100张构成的测试数据集;S2:建立和改进YOLO v5的神经网络模型:
建立YOLO v5的神经网络模型:调整和配置相应的参数;改进YOLO v5的神经网络模型:用ConvNext替代了原本的CSPdarknet;在特征提取的加强网络层上加入注意力机制;S3:训练以优化YOLO v5的网络模型:将裂纹、夹杂、斑块、麻点、压入氧化铁皮、划伤 6 种经过数据增广的钢铁损伤图像,输入到YOLO v5的网络模型中,对YOLO v5的网络模型进行训练,以优化YOLO v5的网络模型;YOLO v5的网络模型进行训练每训练一次,对应生成一权重文件;S4:将训练好的权重文件保存到YOLO的网络模型,之后基于所述权重文件对钢铁进行预测,以检测钢铁表面是否有损伤。
[0007]优选地,S1具体包括:S11:选取目标结构物,利用相机采集钢材表面图像;其中,图像包括有损坏和没有损坏的钢材图像;采集应包括各种不同的条件,条件包括:光强度和阴影变化;S12:将S11中获取的钢材表面图像分割成小图像,以增加训练库中图像的数量;S13:将分割得到的小图像分别标记为含有损伤的图像和没有损伤的图像,形成图像数据库;S14:对图像数据进行数据增强:数据增强方式包括图像水平翻转、垂直翻转、加入高斯噪声及色温变换。
[0008]优选地,S2具体包括:S21:建立网络模型的特征提取的主干网络为ConvNext,ConvNext由ConvNet模块构建;ConvNext首先利用7
×
7的逐层卷积,然后进行归一化处理,使得钢铁的的图片尺寸和像素大小的参数保持一致性;其中,层归一化代替了批归一化,以加速网络的收敛并减少过拟合;S22:利用K
‑
Means重新聚类得到的新的预测框尺寸,得到新的先验框;S23:在特征提取的加强网络层构建了FPN特征金字塔进行加强特征提取;对特征提取的加强网络层加入注意力机制ECA模块;S24:设置冻结训练:学习率使用余弦退火衰减法,学习率会先上升再下降,上升的时候使用线性上升,下降的时候模拟cos函数下降;S25:主干网络上使用了GELU激活函数,其中GELU激活函数可以表示为: x*sigmoid(1.703x)。
[0009]优选地,S21具体包括:S211: ConvNext网络模型采用步长为4的4
×
4卷积核,让窗口之间不相交,每次只处理一个patch的特征,同时在卷积层后加入LayerNorm替代了原本的BatchNorma;S212: ConvNext网络模型使用更少的激活层:在bottleneck的两个1
×
1卷积核之间使用激活层,其他位置不使用。
[0010]优选地,S23具体包括:在特征提取的主干网络进入特征加强网络的特征融合层时和卷积过后进入上采样层时,都加入ECA注意力机制,以加强对图片中待检测目标的特征提取并减少背景目标的
特征提取。
[0011]优选地,S24具体包括:S241:在冻结训练中,设置冻结前50个世代的训练,batch_size为12;S242:在训练模型中选用sgd优化器,其中参数momentum的值设置为0.937,选用cos学习率下降方式。
[0012]优选地,S3具体包括:将S1中测试数据集,输入优化后的YOLO v5的网络模型中进行训练;其中设置训练世代为300,训练的batch_size 设置为6。
[0013]本专利技术与现有技术相比,具有以下优点及有益效果:1)针对YOLO v5存在检测小目标时不够准确的问题,本专利技术在特征层模块上采样的模块加入了ECANet注意力机制模块,可以让网络重点去关注待检测目标,相应实现重要特征的突出表现,以达到提高小目标检测精度的目的;2)关于边界框位置不够精确的问题,本专利技术对获取预测框的算法K
‑
Means进行了改进,放弃了原本YOLO v5的预测框尺寸,针对钢铁损伤这种小目标检测,利用K
‑
Means重新聚类得到的新的预测框尺寸,得到更适合的先验框,进而提高检测的精度;3)对于YOLO v5在训练大量的数据集的时候,所消耗的内存较大的问题,本专利技术将ConvNext应用到YOLO v5的主干网络中,ConvNext可以捕获全局信息和丰富的上下文信息,并且在高密度的对象上有更好的性能,让YOLOv5在检测小目标的性能上得到提升,进而提高检测的精度。同时ConvNext网络模型在处理大量数据集时,会消耗更少的内存并且具有本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种引入注意力机制和ConvNext网络的YOLO v5钢铁表面损伤的检测方法,其特征在于,包括以下步骤:S1:建立测试数据集:采集图像数据,之后对夹杂、裂纹、麻点、斑块、划伤、压入氧化铁皮6种缺陷图像通过物理变换对图像进行数据增强,从而获得由待检测图像8100张构成的测试数据集;S2:建立和改进YOLO v5的神经网络模型:建立YOLO v5的神经网络模型:调整和配置相应的参数;改进YOLO v5的神经网络模型:用ConvNext替代了原本的CSPdarknet;在特征提取的加强网络层上加入注意力机制;S3:训练以优化YOLO v5的网络模型:将裂纹、夹杂、斑块、麻点、压入氧化铁皮、划伤 6 种经过数据增广的钢铁损伤图像,输入到YOLO v5的网络模型中,对YOLO v5的网络模型进行训练,以优化YOLO v5的网络模型;YOLO v5的网络模型进行训练每训练一次,对应生成一权重文件;S4:将训练好的权重文件保存到YOLO的网络模型,之后基于所述权重文件对钢铁进行预测,以检测钢铁表面是否有损伤。2.根据权利要求1所述的一种引入注意力机制和ConvNext网络的YOLO v5钢铁表面损伤的检测方法,其特征在于,S1具体包括:S11:选取目标结构物,利用相机采集钢材表面图像;其中,图像包括有损坏和没有损坏的钢材图像;采集应包括各种不同的条件,条件包括:光强度和阴影变化;S12:将S11中获取的钢材表面图像分割成小图像,以增加训练库中图像的数量;S13:将分割得到的小图像分别标记为含有损伤的图像和没有损伤的图像,形成图像数据库;S14:对图像数据进行数据增强:数据增强方式包括图像水平翻转、垂直翻转、加入高斯噪声及色温变换。3.根据权利要求2所述的一种引入注意力机制和ConvNext网络的YOLO v5钢铁表面损伤的检测方法,其特征在于,S2具体包括:S21:建立YOLO v5的网络模型的特征提取的主干网络为ConvNext;其中,ConvNext由ConvNet模块构建;ConvNext首先利用7
×
7的逐层卷积,然后进行归一化处理,使得钢铁的的图片尺寸和像素大小的参数保持一致性;其中,层归一化代替了批归一化,以加速网络的收...
【专利技术属性】
技术研发人员:李强强,皋军,邵星,王翠香,
申请(专利权)人:盐城工学院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。