一种引入注意力机制的YOLOv7热轧带钢表面缺陷检测方法技术

技术编号：38161135 阅读：24 留言：0更新日期：2023-07-13 09:33

本发明专利技术公开了一种引入注意力机制的YOLOv7热轧带钢表面缺陷检测方法，通过分析传统图像处理方法严重依赖环境，泛化能力弱等问题，以及现有目标检测方法识别效率低等问题，对网络中模块进行分组卷积处理，降低模型参数量，提升运行速度；提出基于注意力机制和YOLOv7网络结合的方式，通过在YOLOv7网络的特征提取网络中引入多尺度融合轻量级注意力模块，使特征提取网络具有全局感受野，提高整个模型的表达能力，增加识别准确率。解决了现有带钢表面缺陷检测系统精度高而速度慢或者速度高而精度低等问题，相较于原版YOLOv7网络模型，改进后的YOLOv7网络模型在精度上提升了4.34％，参数量减少了11％。参数量减少了11％。参数量减少了11％。

全部详细技术资料下载

【技术实现步骤摘要】
一种引入注意力机制的YOLOv7热轧带钢表面缺陷检测方法

[0001]本专利技术属于计算机
中的目标检测技术,具体涉及一种引入注意力机制的YOLOv7热轧带钢表面缺陷检测方法。

技术介绍

[0002]热轧带钢作为重要的钢铁产品之一，是工业发展的基础，为我国的经济发展发挥着重要作用。在生产热轧带钢的流程中，由于现场工艺和材料性能等因素，热轧带钢表面会产生不同种类的表面缺陷，而表面缺陷会使带钢的机械性能和抗腐蚀的能力降低，同时还会导致相应的产品性能下降。早期的缺陷识别算法对小目标表面缺陷的检测能力较差，比如检测不出裂纹、凹坑等一些细节上的缺陷。在现代热轧带钢生产中，热轧带钢年产量能够达到6578.05万吨、钢带轧制速度从最小3m/s到18m/s不等，因此对热轧带钢表面缺陷检测的准确性和快速性提出了更高的要求，早期的缺陷识别算法已逐渐不能满足当前热轧带钢表面缺陷检测的需求。随着CCD(Charge Coupled Device)相机的广泛应用和各种机器学习方法的发展，基于热轧带钢表面缺陷图片的检测方法成为了当前热轧带钢表面缺陷检测领域的研究热点。
[0003]鉴于深度学习实时性和易于实现智能化的特点，使用RCNN、SSD等卷积神经网络对热轧带钢表面缺陷图片进行检测的方法开始流行。文献1(Shiyang Zhou,Youping Chen,et al.Classification of Surface Defects of Steel Sheet Using Rectified Convolutional Ne...

【技术保护点】

【技术特征摘要】
1.一种引入注意力机制的YOLOv7热轧带钢表面缺陷检测方法，其特征在于，该检测方法包括以下步骤：S1、构建标注有待检测带钢表面缺陷的数据集；S2、将YOLOv7颈部网络模块SPPCSP替换为SPPCSPC
‑
Group，对其中卷积进行分组,降低模块的参数量和计算量，构建轻量化的检测模型；S3、将多尺度融合轻量级注意力模块添加至检测模型中；S4、利用数据集对检测模型行迭代训练，在收敛后选取精度最高的检测模型作为带钢表面缺陷检测模型。2.根据权利要求1所述的一种引入注意力机制的YOLOv7热轧带钢表面缺陷检测方法，其特征在于：在步骤S1中，获取钢材表面缺陷检测数据集图像；提取数据集全图的平均灰度值，对图像周围进行灰度填充，将像素值由200*200填充至640*640；对数据集中标签进行适配，根据填充操作生成对应标签。3.根据权利要求2所述的一种引入注意力机制的YOLOv7热轧带钢表面缺陷检测方法，其特征在于：在步骤S2中，SPPCSPC模块中包括CSP模块与SPP结构中两个分支共7个卷积，需要对这7个卷积进行卷积分组。4.根据权利要求2所述的一种引入注意力机制的YOLOv7热轧带钢表面缺陷检测方法，其特征在于：在步骤S2中，对于每一个卷积，都将其分为4组，减少参数量。5.根据权利要求2所述的一种引入注意力机制的YOLOv7热轧带钢表面缺陷检测方法，其特征在于：在步骤S3中，多尺度融合轻量级注意力模块添加在主干特征提取网络和Neck之间，确保主干特征提取网络的预训练权重使用。6.根据权利要求3所述的一种引入注意力机制的YOLOv7热轧带钢表面缺陷检测方法，其特征在于：添多尺度融合轻量级注意力模块具体为：S61、对主干网络提取出的三个不同大小的特征张量先输入不同尺度感受野的注意力模块中,进行特征融合；S62、对输入特征X∈R
C
×
H
×
W
进行分组，输入X沿着通道维度拆分为G组：X＝[X1,...,X
G
],R
C/G
×
H
×
W
；特征X
k
沿着通道维度拆分成两个分支X
k1
,X
k2
∈R
C/2G
×
H
×
W
，一个分支用于学习通道注意力特征，一个分支用于学习空域注意力特征；在通道注意力实现方面，采用了最简单的GAP+Scale+Sigmoid的组合，该过程可以描述如下：X
k
′1＝σ(F
C
(s))
·
X
k1
＝σ(W1s+b1)
·
X
k1
其中W1∈R
C/2G
×1×1，b1∈R
C/2G
×1×1表示可学习参数；在空间注意力实现方面，采用GN对X
k2
进行处理得到空域层面的统计信息，然后采用F
C
(
·
)进行增强。该过程可以描述如下：X
′
k2
＝...

【专利技术属性】
技术研发人员：包广清，周芷意，
申请(专利权)人：西南石油大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人