一种基于大律算法与通道注意力机制的数据增强方法技术

技术编号：39140205 阅读：29 留言：0更新日期：2023-10-23 14:54

本发明专利技术提供了一种基于大律算法与通道注意力机制的数据增强方法，涉及表面缺陷检测技术领域。首先对输入的正常样本进行大律算法(OTSU)计算，以得到对图像进行阈值分割的最佳阈值，并将图像进行二值化操作，得到二值化掩码图像作为数据增强的ROI。然后，将二值化掩码图像表示为矩阵，将其中值为1的像素点坐标放入数组IDX中，并通过随机方式在IDX数组中选择一个seed像素点作为数据增强的位置，以避免数据增强的图像块粘贴到背景中产生污染数据。最后，通过随机裁剪原图像以获得图像块，将图像块与原图无缝融合，实现数据增强。在神经网络的训练中，引入SENet自注意力模块，加强网络的建模能力，提高检测性能。提高检测性能。提高检测性能。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于大律算法与通道注意力机制的数据增强方法

[0001]本专利技术涉及表面缺陷检测
，尤其涉及一种基于大律算法与通道注意力机制的数据增强方法。

技术介绍

[0002]表面缺陷检测一直是工业产品检验的热点问题，广泛应用于印刷、玻璃、纺织等行业。其目的是通过自动化检测，定位产品表面的划痕、裂缝、灰尘和油墨等缺陷，以替代人工检查。随着深度学习的发展，其性能在大多数场景下已经远远超越传统算法。但与传统算法相比，深度学习需要大量的数据驱动，如目标检测用的COCO数据集和图像分类所使用的ImageNet数据集等。因此，在规模庞大的数据集的驱动下，深度学习模型的性能得到了显著提高，数据获取变得至关重要。然而，目前工业领域中数据的获取存在以下问题：1.获取缺陷的异常样本困难，因为在实际生产中次品率极低，且异常样本存在大量无用的重复样本，有时甚至没有可用的异常样本；2.异常出现位置随机，即使采集足够数量的数据集，也无法确保异常在图像的各个位置都出现，使得数据集驱动的模型无法在各种背景下具有较强的检测性能；3.对异常样本进行数据标注需要耗费大量人力物力，因为相对于COCO等训练集的目标，工业生产中产生的缺陷往往十分微小，使得在复杂背景中寻找缺陷变得十分困难。尽管人们已经开始研究自监督或无监督的缺陷检测方法，但目前基于嵌入方法的异常检测技术严重限制了计算速度，基于重建的方法不能有效区分异常图像和正常图像，而基于数据增强的异常检测方法只能简单模拟真实缺陷。
[0003]因此，工业产品表面缺陷检测的数据获取和标注是一个具有挑...

【技术保护点】

【技术特征摘要】
1.一种基于大律算法与通道注意力机制的数据增强方法，其特征包括如下步骤：步骤1：建立异常检测数据集，该数据集应包括验证集和训练集两个部分；其中，训练集仅包含正常无缺陷的样本，验证集则包含正常样本和异常样本两类，在处理异常样本时，不应进行类别的区分。步骤2：对训练集中的样本进行预处理。首先，将所有图像统一调整为256
×
256像素大小，接着，进行图像归一化处理，使得所有图像的均值为[0.485,0.456,0.406]，标准差为[0.229,0.224,0.225]；步骤3：读取数据集中的图像，并使用大律算法(OTSU)计算每张图像的灰度直方图。通过选取最佳阈值，将图像分为前景图像和背景图像。步骤4：使用步骤3中获得的最佳阈值，对图像进行二值化阈值分割。将前景图像设为白色，背景图像设为黑色，从而获得二值化掩码。步骤5：将二值化掩码图像表示为矩阵M，该矩阵中只有0和1两个值，其中0代表图像中黑色像素点，1表示图像中白色像素点；步骤6：将所有矩阵M中值为1的像素点表示为一个数组IDX，在进行数据增强的过程中，应随机选取该数组中IDX中的某个元素作为数据增强的位置，从而确保其在前景图像内部而不在背景图像中，避免污染数据生成。步骤7：随机获取原图像的一个位置，并裁剪一个随机大小、宽长比的矩形图像块。接着，旋转该图像块随机的角度并施加一定的颜色抖动。步骤8：使用泊松图像融合算法，将步骤7中获得的图像块无缝地粘贴在步骤6中获取的位置上。这样，就获得了一幅模拟的异常图像，完成了数据增强。步骤9：将生成的模拟图像与正常样本图像一起送入神经网络进行训练。为了提取特征，我们使用了ResNet18作为主干网络，并对图像进行图像级的数据标注，即正常样本标注为1，模拟的异常样本标注为0。为了加速训练过程，我们使用了预训练模型，并冻结了前20个epoch。步骤10：结合自注意力机制的神经网络：引入自注意力机制的神经网络。该网络包含ResNet18主干神经网络和SENet自注意力机制模块。ResNet18神经网络包含1个卷积层、1个最大池化层、4个残差块、1个平均池化层和1个全连接层。SENet注意力机制包含Squeeze模块和Excitation模块。假设给定了图像的特征张量其中X使通道数量，H和W是空间维度。首先通过对X进行全局平均池化得到通道维度上的平均特征向量V：其中j＝1,2,...,C。然后通过两个全连接层得到通道维度上的特征权重向量w2＝σ(Uδ(Wz)) (2)其中和是两个权重矩阵，δ(
·
)和σ(
·
)分别表示激活函数和sigmoid函数，最后通过权重向量w2应用于输入特征张量X来获得自注意力特征：Y
jik
＝w
j
X
jik
ꢀꢀꢀ
(3)其中j＝1,2,...,C。最终将自注意力特征Y与原始特征X按元素相加得到最终的输出特
征。该自注意力模块在ResNet18神经网络的第四个残差块提取特征后插放；步骤11：通过神经网络训练得到特征提取模型...

【专利技术属性】
技术研发人员：王正松，杨文翰，汤晟楠，杨乐，
申请(专利权)人：东北大学秦皇岛分校，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人