一种引入注意力机制的YOLOv7热轧带钢表面缺陷检测方法技术

技术编号:38161135 阅读:24 留言:0更新日期:2023-07-13 09:33
本发明专利技术公开了一种引入注意力机制的YOLOv7热轧带钢表面缺陷检测方法,通过分析传统图像处理方法严重依赖环境,泛化能力弱等问题,以及现有目标检测方法识别效率低等问题,对网络中模块进行分组卷积处理,降低模型参数量,提升运行速度;提出基于注意力机制和YOLOv7网络结合的方式,通过在YOLOv7网络的特征提取网络中引入多尺度融合轻量级注意力模块,使特征提取网络具有全局感受野,提高整个模型的表达能力,增加识别准确率。解决了现有带钢表面缺陷检测系统精度高而速度慢或者速度高而精度低等问题,相较于原版YOLOv7网络模型,改进后的YOLOv7网络模型在精度上提升了4.34%,参数量减少了11%。参数量减少了11%。参数量减少了11%。

【技术实现步骤摘要】
一种引入注意力机制的YOLOv7热轧带钢表面缺陷检测方法


[0001]本专利技术属于计算机
中的目标检测技术,具体涉及一种引入注意力机制的YOLOv7热轧带钢表面缺陷检测方法。

技术介绍

[0002]热轧带钢作为重要的钢铁产品之一,是工业发展的基础,为我国的经济发展发挥着重要作用。在生产热轧带钢的流程中,由于现场工艺和材料性能等因素,热轧带钢表面会产生不同种类的表面缺陷,而表面缺陷会使带钢的机械性能和抗腐蚀的能力降低,同时还会导致相应的产品性能下降。早期的缺陷识别算法对小目标表面缺陷的检测能力较差,比如检测不出裂纹、凹坑等一些细节上的缺陷。在现代热轧带钢生产中,热轧带钢年产量能够达到6578.05万吨、钢带轧制速度从最小3m/s到18m/s不等,因此对热轧带钢表面缺陷检测的准确性和快速性提出了更高的要求,早期的缺陷识别算法已逐渐不能满足当前热轧带钢表面缺陷检测的需求。随着CCD(Charge Coupled Device)相机的广泛应用和各种机器学习方法的发展,基于热轧带钢表面缺陷图片的检测方法成为了当前热轧带钢表面缺陷检测领域的研究热点。
[0003]鉴于深度学习实时性和易于实现智能化的特点,使用RCNN、SSD等卷积神经网络对热轧带钢表面缺陷图片进行检测的方法开始流行。文献1(Shiyang Zhou,Youping Chen,et al.Classification of Surface Defects of Steel Sheet Using Rectified Convolutional Neural Networks[A].武汉理工大学.2015物联网及其应用国际论坛会议文集[C].武汉理工大学:武汉理工大学理学院,2015:3.)提出一种从低像素到高像素的缺陷特征学习方法用于带钢缺陷分类,但该方法过程复杂不符合缺陷检测实时性要求。文献2(LIU Y,XU K,XU J W.Periodic surface defect detection in steel plates based on deep learning[J].Applied Sciences,2019,9(15),3127.)提出一种基于卷积神经网络和长短期记忆的缺陷检测方法,但仅针对热轧钢板上的轧痕缺陷,局限性较大。专利1(李维刚,叶欣,赵云涛.一种基于深度学习的热轧带钢表面缺陷检测方法[P].中国专利:CN110660052A,2020.01.07)通过增加一个特征提取层提高对热轧带钢表面缺陷检测的精度,专利2(周友行,潘恒,杨沛,翟明龙.一种基于微小缺陷YOLO网络的钢板表面缺陷检测方法[P].中国专利:CN115205193A,2022.10.18)通过增加小目标检测层提高对热轧带钢表面缺陷检测的精度,而这两种方法都会导致参数量增加,不利于网络的实时性。结合上述存在的问题,本文提出一种引入注意力机制的YOLOv7热轧带钢表面缺陷检测方法。该算法具有识别速度快,检测精度高和对环境依赖小的优点。

技术实现思路

[0004]本专利技术的目的是针对实际工业环境中,深度学习模型在热轧带钢表面缺陷检测中存在检测精度低,小目标漏检率高等问题,对网络中模块进行改进,并将注意力机制于目标检测技术相结合,形成一个更加完善有效的检测方法,从而提高工业生产效率。
[0005]本专利技术克服了现有技术中的缺点,提供一种引入注意力机制的YOLOv7热轧带钢表面缺陷检测方法。通过分析传统图像处理方法严重依赖环境,泛化能力弱等问题,以及现有目标检测方法识别效率低等问题,对网络中模块进行分组卷积处理,降低模型参数量,提升运行速度;提出基于注意力机制和YOLOv7网络结合的方式,通过在YOLOv7网络的特征提取网络中引入多尺度融合轻量级注意力模块,使特征提取网络具有全局感受野,提高整个模型的表达能力,增加识别准确率。解决了现有带钢表面缺陷检测系统精度高而速度慢或者速度高而精度低等问题。
[0006]为了解决上述存在的技术问题,本专利技术提出如下技术方案:一种引入注意力机制的YOLOv7热轧带钢表面缺陷检测方法,其包括如下步骤:
[0007]S1、构建标注有待检测带钢表面缺陷的数据集;
[0008]S2、将YOLOv7颈部网络模块SPPCSP替换为SPPCSPC

Group,对其中卷积进行分组,降低模块的参数量和计算量,构建轻量化的检测模型;
[0009]S3.将添加感受野的轻量级注意力模块添加至检测模型中;
[0010]S4、利用数据集对检测模型行迭代训练,在收敛后选取精度最高的检测模型作为带钢表面缺陷检测模型;
[0011]优选的,在步骤S1中,获取钢材表面缺陷检测数据集图像;提取数据集全图的平均灰度值,对图像周围进行灰度填充,将像素值由200*200填充至640*640;对数据集中标签进行适配,根据填充操作生成对应标签。
[0012]优选的,在步骤S2中,SPPCSPC模块中包括CSP模块与SPP结构中两个分支共7个卷积,需要对这7个卷积进行卷积分组。
[0013]优选的,在步骤S2中,对于每一个卷积,都将其分为4组,减少参数量。
[0014]优选的,在步骤S3中,多尺度融合轻量级注意力模块添加在主干特征提取网络和Neck之间,确保主干特征提取网络的预训练权重使用。
[0015]优选的,添加多尺度融合轻量级注意力模块具体为:
[0016]对主干网络提取出的三个不同大小的特征张量先输入不同尺度感受野的注意力模块中,进行特征融合;
[0017]对输入特征X∈R
C
×
H
×
W
进行分组,输入X沿着通道维度拆分为G组:X=[X1,...,X
G
],R
C/G
×
H
×
W

[0018]特征X
k
沿着通道维度拆分成两个分支X
k1
,X
k2
∈R
C/2G
×
H
×
W
,一个分支用于学习通道注意力特征,一个分支用于学习空域注意力特征。
[0019]在通道注意力实现方面,采用了最简单的GAP+Scale+Sigmoid的组合,该过程可以描述如下:
[0020][0021]X
k
′1=σ(F
C
(s))
·
X
k1
=σ(W1s+b1)
·
X
k1
ꢀꢀꢀꢀꢀꢀ
(2)
[0022]其中W1∈R
C/2G
×1×1,b1∈R
C/2G
×1×1表示可学习参数。
[0023]在空间注意力实现方面,采用GN对X
k2
进行处理得到空域层面的统计信息,然后采用F
C
(
·
)进行增强。该过程可以描述如下:
[0024本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种引入注意力机制的YOLOv7热轧带钢表面缺陷检测方法,其特征在于,该检测方法包括以下步骤:S1、构建标注有待检测带钢表面缺陷的数据集;S2、将YOLOv7颈部网络模块SPPCSP替换为SPPCSPC

Group,对其中卷积进行分组,降低模块的参数量和计算量,构建轻量化的检测模型;S3、将多尺度融合轻量级注意力模块添加至检测模型中;S4、利用数据集对检测模型行迭代训练,在收敛后选取精度最高的检测模型作为带钢表面缺陷检测模型。2.根据权利要求1所述的一种引入注意力机制的YOLOv7热轧带钢表面缺陷检测方法,其特征在于:在步骤S1中,获取钢材表面缺陷检测数据集图像;提取数据集全图的平均灰度值,对图像周围进行灰度填充,将像素值由200*200填充至640*640;对数据集中标签进行适配,根据填充操作生成对应标签。3.根据权利要求2所述的一种引入注意力机制的YOLOv7热轧带钢表面缺陷检测方法,其特征在于:在步骤S2中,SPPCSPC模块中包括CSP模块与SPP结构中两个分支共7个卷积,需要对这7个卷积进行卷积分组。4.根据权利要求2所述的一种引入注意力机制的YOLOv7热轧带钢表面缺陷检测方法,其特征在于:在步骤S2中,对于每一个卷积,都将其分为4组,减少参数量。5.根据权利要求2所述的一种引入注意力机制的YOLOv7热轧带钢表面缺陷检测方法,其特征在于:在步骤S3中,多尺度融合轻量级注意力模块添加在主干特征提取网络和Neck之间,确保主干特征提取网络的预训练权重使用。6.根据权利要求3所述的一种引入注意力机制的YOLOv7热轧带钢表面缺陷检测方法,其特征在于:添多尺度融合轻量级注意力模块具体为:S61、对主干网络提取出的三个不同大小的特征张量先输入不同尺度感受野的注意力模块中,进行特征融合;S62、对输入特征X∈R
C
×
H
×
W
进行分组,输入X沿着通道维度拆分为G组:X=[X1,...,X
G
],R
C/G
×
H
×
W
;特征X
k
沿着通道维度拆分成两个分支X
k1
,X
k2
∈R
C/2G
×
H
×
W
,一个分支用于学习通道注意力特征,一个分支用于学习空域注意力特征;在通道注意力实现方面,采用了最简单的GAP+Scale+Sigmoid的组合,该过程可以描述如下:X
k
′1=σ(F
C
(s))
·
X
k1
=σ(W1s+b1)
·
X
k1
其中W1∈R
C/2G
×1×1,b1∈R
C/2G
×1×1表示可学习参数;在空间注意力实现方面,采用GN对X
k2
进行处理得到空域层面的统计信息,然后采用F
C
(
·
)进行增强。该过程可以描述如下:X

k2
=...

【专利技术属性】
技术研发人员:包广清周芷意
申请(专利权)人:西南石油大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1