本发明专利技术针对布匹瑕疵本身形状不规则、长宽比例不均匀,包含背景纹理的情况,在改进YOLOv7的基础上,设计了新的模块DW
【技术实现步骤摘要】
一种改进的深度分离层聚合和空间增强注意力的布匹瑕疵检测方法
[0001]本专利技术属于计算机视觉中的目标检测领域,改进了YOLOv7的网络结构模块,设计了一种实时布匹瑕疵目标检测网络,该网络能对工业上的布匹瑕疵进行准确实时的检测。
技术介绍
[0002]近几年来,随着深度学习的快速发展,计算机相关领域技术的不断提升和计算机基础硬件的升级,为深度学习的蓬勃发展提供了更便利的条件。
[0003]基于深度学习的目标检测方法已经越来越多应用在工业生产上,例如应用在布匹瑕疵的检测上。在布匹的生产过程中,布匹表面往往会产生不同种类的瑕疵,不同瑕疵之间的形状差异较大,通常表现为形状不规则、长宽比例不均匀的目标,并且布匹的瑕疵图片中很难找到稳定的关键性特征,同时在瑕疵中难免会包含各种各样的背景,如布匹的纹理、颜色等导致布匹的检测难度较大。
[0004]YOLOv7作为2022年提出的效果非常优秀的目标检测模型,在大多数领域上都能取得相当不错的检测效果,给目标检测领域的后续发展提供了很好的借鉴作用。但由于布匹瑕疵自身带有的特性,给目标检测带来了许多难题,在实际应用中,YOLOv7的布匹瑕疵检测效果做不到令人满意,仍然存在改进的空间。
[0005]为了解决以往方法在布匹中无法有效提取瑕疵特征以及布匹瑕疵质量检测的实时性问题,本专利技术设计了一种实时布匹瑕疵目标检测网络。该网络在YOLOv7网络的基础上,增加了深度分离层聚合和空间增强注意力模块,有效解决了布匹瑕疵检测的问题,提高了网络的检测性能,使网络能更好地学习到布匹的关键特征,扩大网络的感受野,提取上下文关键信息,提高在下游任务布匹瑕疵检测中对瑕疵目标形状和纹理的吸收归纳。做到了对布匹产品中常见的瑕疵进行准确的实时检测。
技术实现思路
[0006]本专利技术针对布匹瑕疵检测难度大的特点,提出了一种基于深度分离层聚合和空间增强注意力的布匹瑕疵检测方法,该方法优化了YOLOv7的网络结构,基于ELAN提出了深度分离层聚合模块DW
‑
ELAN,使用5
×
5的深度可分离卷积替换3
×
3卷积,增大了网络感受野,提高网络对关键信息的提取能力。同时引入空间增强注意力模块MPCOA,替代了原本用最大池化层和卷积两个分支组成的MP2模块,利用注意力机制将空间中的关键特征信息保留到深层结构中,减少了一些位置信息的丢失,有效提高布匹瑕疵检测的准确率。
[0007]本专利技术包含以下步骤:
[0008]步骤1:使用工业相机在实地工厂对布匹瑕疵数据进行采集。
[0009]步骤2:基于YOLOv7的网络结构,对以下模块进行改进:在YOLOv7的主干网络中,把所有的四个ELAN模块替换成深度分离层聚合DW
‑
ELAN模块,主要目的是通过引入大尺度的5
×
5深度可分离卷积核来替换ELAN模块中的普通3
×
3卷积来扩大感受野,在更大范围内对
瑕疵特征进行提取。
[0010]步骤3:在YOLOv7网络的头部结构中,把原本的一个分支为池化层和1
×
1卷积层以及另一分支为1
×
1卷积层和3
×
3卷积层的MP2模块,都替换成空间增强注意力MPCOA模块。MPCOA模块主要包含最大池化卷积层MP和1
×
1卷积层、短路连接和空间注意力三个分支。和MP2模块一样,特征图经过MPCOA模块之后它的特征图尺寸不变、通道数减半。MPCOA模块利用了注意力机制,对卷积堆叠的部分进行改进,使用一维全局池化从水平和垂直两个方向对输入的特征图进行特征聚合,分为两个分支分别带有两个方向的位置信息,把特征中的方向位置信息进行编码保留到深层网络,指导深层网络中对布匹瑕疵位置的预测,有效提升布匹瑕疵检测的准确率。
[0011]步骤4:将待检测的可能包含布匹瑕疵的图片,输入至改进后的布匹检测网络进行推理。
[0012]本专利技术提供的技术方案的改进效果是:本专利技术主要针对布匹瑕疵形状不规则、长宽比例不均匀、特征不明显,导致使用深度学习方法进行瑕疵的难度大大提升。本专利技术提出的基于YOLOv7的优化结构提出了新的深度分离层聚合和空间增强注意力模块,分别替换了原有的ELAN和MP2模块。增强了网络对细节特征的敏感性,提高了网络的检测性能,使网络能更好地学习到布匹的关键特征。使用5
×
5的深度可分离卷积替换3
×
3卷积,增大了网络感受野,提高网络对关键信息的提取能力。并且利用注意力机制对特征中需要重点关注的特征放大,使网络提取特征更完整丰富,使得关键特征信息得以保留到深层结构中,增加了特征的表现力,更适配于本专利技术所提出的对布匹瑕疵的实施准确检测。
附图说明
[0013]为了更清楚的展示本专利技术的网络结构以及训练过程,下面将对实施例中所需要的附图做以简单的介绍。
[0014]图1为本专利技术的布匹瑕疵检测流程。
[0015]图2为本专利技术设计的深度分离层聚合模块DW
‑
ELAN结构图。
[0016]图3为本专利技术设计的空间增强注意力模块MPCOA结构图。
具体实施方式
[0017]为了更具体地描述本专利技术,下面将结合附图以及具体实施方式对本专利技术的方案进行详细说明。
[0018]本专利技术设计了一种改进的深度分离层聚合和空间增强注意力的布匹瑕疵检测方法,布匹瑕疵检测的工作流程如图1所示,其主要步骤如下:
[0019]1.布匹瑕疵检测网络实时读取布匹图像;
[0020]2.布匹图像将输入到网络模型中,进行前向推理过程;
[0021]3.进入网络判断布匹图像中是否存在瑕疵,如果有瑕疵则进入步骤4,否则进入步骤5;
[0022]4.检测系统将对布匹瑕疵进行标注,并提示该图像存在瑕疵;
[0023]5.继续将未读取的图像输入网络模型,如果存在未读取图像则回到步骤1,否则结束此次检测。
[0024]其中的网络模型在改进YOLOv7模块的基础上得到,具体实施方式如下:步骤1:使用工业相机在实地工厂对布匹瑕疵数据进行采集。
[0025]步骤2:在YOLOv7的主干网络中,包含有四个ELAN模块,它是一个高效的网络结构,能让网络能够学习到更多的特征,并且提高鲁棒性,ELAN模块的输入输出的特征图大小、通道数相同。
[0026]把YOLOv7的所有ELAN模块都替换成深度分离层聚合DW
‑
ELAN模块,主要思路是将四个3
×
3卷积替换成四个5
×
5的深度可分离卷积。DW
‑
ELAN模块具体结构如图2,共分为4个分支。首先对输入的特征图使用3
×
3卷积得到提取的特征,之后将提取的特征分别通过2个1
×
1的卷积可以得到分支3和分支4,将分支3经过2个5
×
5的深度可分离卷积可以得到分本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.本发明设计了一种改进的深度分离层聚合和空间增强注意力的布匹瑕疵检测方法,其中的网络模型在改进YOLOv7模块的基础上得到,其特征在于具体实施方式如下:步骤1:使用工业相机在实地工厂对布匹瑕疵数据进行采集;步骤2:在YOLOv7的主干网络中,包含有四个ELAN模块,它是一个高效的网络结构,能让网络能够学习到更多的特征,并且提高鲁棒性,ELAN模块的输入输出的特征图大小、通道数相同。把YOLOv7的所有ELAN模块,都替换成深度分离层聚合DW
‑
ELAN模块。主要思路是将四个3
×
3卷积替换成四个5
×
5的深度可分离卷积。DW
‑
ELAN模块具体结构共分为4个分支。首先对输入的特征图使用3
×
3卷积得到提取的特征,之后将提取的特征分别通过2个1
×
1的卷积可以得到分支3和分支4,将分支3经过2个5
×
5的深度可分离卷积可以得到分支1的结果,而分支2的结果是分支3经过4个5
×
5的深度可分离卷积得到,得到大感受野下对关键的特征的提取;步骤3:在YOLOv7网络的头部结构中,包含有两个MP2模块,它的组成为一个分支为池化层和1
×
1卷积层以及另一分支为1
×
1卷积层和3
×
3卷积层,该模块的输出会将输入的通道数扩大一倍。把YOLOv7的所有MP2模块,都替换成空间增强注意力MPCOA模块。MPCOA模块具体结构共分为3个分支。第一个分支中输入将通过一个最大池化卷积层MP和1
×
1卷积层对池化后的结果提取特征,提取特征后的结果为分支1。分支2是一个短路连接,不对输入进行任何操作,相当于对输入进行了简单的复制,通过增加短路连接,可以提高网络的鲁棒性和稳定性...
【专利技术属性】
技术研发人员:李笑岚,应铭,邵泽源,
申请(专利权)人:浙江工商大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。