【技术实现步骤摘要】
一种基于大律算法与通道注意力机制的数据增强方法
[0001]本专利技术涉及表面缺陷检测
,尤其涉及一种基于大律算法与通道注意力机制的数据增强方法。
技术介绍
[0002]表面缺陷检测一直是工业产品检验的热点问题,广泛应用于印刷、玻璃、纺织等行业。其目的是通过自动化检测,定位产品表面的划痕、裂缝、灰尘和油墨等缺陷,以替代人工检查。随着深度学习的发展,其性能在大多数场景下已经远远超越传统算法。但与传统算法相比,深度学习需要大量的数据驱动,如目标检测用的COCO数据集和图像分类所使用的ImageNet数据集等。因此,在规模庞大的数据集的驱动下,深度学习模型的性能得到了显著提高,数据获取变得至关重要。然而,目前工业领域中数据的获取存在以下问题:1.获取缺陷的异常样本困难,因为在实际生产中次品率极低,且异常样本存在大量无用的重复样本,有时甚至没有可用的异常样本;2.异常出现位置随机,即使采集足够数量的数据集,也无法确保异常在图像的各个位置都出现,使得数据集驱动的模型无法在各种背景下具有较强的检测性能;3.对异常样本进行数据标注需要耗费大量人力物力,因为相对于COCO等训练集的目标,工业生产中产生的缺陷往往十分微小,使得在复杂背景中寻找缺陷变得十分困难。尽管人们已经开始研究自监督或无监督的缺陷检测方法,但目前基于嵌入方法的异常检测技术严重限制了计算速度,基于重建的方法不能有效区分异常图像和正常图像,而基于数据增强的异常检测方法只能简单模拟真实缺陷。
[0003]因此,工业产品表面缺陷检测的数据获取和标注是一个具有挑 ...
【技术保护点】
【技术特征摘要】
1.一种基于大律算法与通道注意力机制的数据增强方法,其特征包括如下步骤:步骤1:建立异常检测数据集,该数据集应包括验证集和训练集两个部分;其中,训练集仅包含正常无缺陷的样本,验证集则包含正常样本和异常样本两类,在处理异常样本时,不应进行类别的区分。步骤2:对训练集中的样本进行预处理。首先,将所有图像统一调整为256
×
256像素大小,接着,进行图像归一化处理,使得所有图像的均值为[0.485,0.456,0.406],标准差为[0.229,0.224,0.225];步骤3:读取数据集中的图像,并使用大律算法(OTSU)计算每张图像的灰度直方图。通过选取最佳阈值,将图像分为前景图像和背景图像。步骤4:使用步骤3中获得的最佳阈值,对图像进行二值化阈值分割。将前景图像设为白色,背景图像设为黑色,从而获得二值化掩码。步骤5:将二值化掩码图像表示为矩阵M,该矩阵中只有0和1两个值,其中0代表图像中黑色像素点,1表示图像中白色像素点;步骤6:将所有矩阵M中值为1的像素点表示为一个数组IDX,在进行数据增强的过程中,应随机选取该数组中IDX中的某个元素作为数据增强的位置,从而确保其在前景图像内部而不在背景图像中,避免污染数据生成。步骤7:随机获取原图像的一个位置,并裁剪一个随机大小、宽长比的矩形图像块。接着,旋转该图像块随机的角度并施加一定的颜色抖动。步骤8:使用泊松图像融合算法,将步骤7中获得的图像块无缝地粘贴在步骤6中获取的位置上。这样,就获得了一幅模拟的异常图像,完成了数据增强。步骤9:将生成的模拟图像与正常样本图像一起送入神经网络进行训练。为了提取特征,我们使用了ResNet18作为主干网络,并对图像进行图像级的数据标注,即正常样本标注为1,模拟的异常样本标注为0。为了加速训练过程,我们使用了预训练模型,并冻结了前20个epoch。步骤10:结合自注意力机制的神经网络:引入自注意力机制的神经网络。该网络包含ResNet18主干神经网络和SENet自注意力机制模块。ResNet18神经网络包含1个卷积层、1个最大池化层、4个残差块、1个平均池化层和1个全连接层。SENet注意力机制包含Squeeze模块和Excitation模块。假设给定了图像的特征张量其中X使通道数量,H和W是空间维度。首先通过对X进行全局平均池化得到通道维度上的平均特征向量V:其中j=1,2,...,C。然后通过两个全连接层得到通道维度上的特征权重向量w2=σ(Uδ(Wz)) (2)其中和是两个权重矩阵,δ(
·
)和σ(
·
)分别表示激活函数和sigmoid函数,最后通过权重向量w2应用于输入特征张量X来获得自注意力特征:Y
jik
=w
j
X
jik
ꢀꢀꢀ
(3)其中j=1,2,...,C。最终将自注意力特征Y与原始特征X按元素相加得到最终的输出特
征。该自注意力模块在ResNet18神经网络的第四个残差块提取特征后插放;步骤11:通过神经网络训练得到特征提取模型...
【专利技术属性】
技术研发人员:王正松,杨文翰,汤晟楠,杨乐,
申请(专利权)人:东北大学秦皇岛分校,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。