一种表观缺陷跨域分类识别的负迁移抑制方法技术

技术编号：38876722 阅读：22 留言：0更新日期：2023-09-22 14:09

本发明专利技术公开了一种表观缺陷跨域分类识别的负迁移抑制方法。以多种非注塑制品的表观缺陷图像作为源域数据集，以注塑制品表观缺陷图像作为目标域数据集，同时设定中间域来提取对应特征。对源域和中间域图像进行域信息标注；使用HOG进行源域和目标域特征提取；基于K均值法进行双重聚类；构建负迁移抑制策略；建立基于多领域自适应算法的多目标域任务泛化模型。本发明专利技术可有效抑制表观缺陷跨域分类识别中的负迁移现象，有效地实现注塑制品表观缺陷分类识别。识别。识别。

全部详细技术资料下载

【技术实现步骤摘要】
一种表观缺陷跨域分类识别的负迁移抑制方法

[0001]本专利技术属于机器视觉及工业自动化
，具体涉及一种表观缺陷跨域分类识别的负迁移抑制方法。

技术介绍

[0002]注塑制品表面质量影响因素众多，与工艺参数、加工环境、冷却条件和后处理工艺密切相关，易产生各种缺陷，又因其缺陷形成原理复杂，难以量化，表面缺陷识别一直是一个难题，因此往往通过借用其他领域的数据进行迁移学习，来高效自动地实现表面缺陷检测任务。
[0003]但不同数据域之间的关联程度，是限制迁移学习更广泛应用的一个重要因素。如果两个域之间的关联度很小，那么从源域学习的知识的作用会十分有限，甚至产生负面影响，即负迁移现象。进行跨域迁移学习时，不同领域之间的数据分布差异很大，无法有效从源域中提取与目标域对应的特征，导致跨迁移的实行难度很大。
[0004]因此如何使用已有的远距离数据源，提取对应特征，将其正确地迁移到目标域上，并有效避免负迁移，提升迁移学习的效率和准确性，对迁移学习的发展和工业自动化技术的发展具有重要的意义。

技术实现思路

[0005]本专利技术为解决上述远距离迁移过程中负迁移程度过大，迁移学习准确率和效率低的问题，提出了一种表观缺陷跨域分类识别的负迁移抑制方法。
[0006]针对金属制品表面缺陷的特征稀疏的特点，采用简化的HOG特征对表面缺陷进行描述；基于该特征，采用双重聚类的方法将源域的训练划分成若干个中间域，从而完成传递式的迁移学习任务。
[0007]本专利技术的技术方案包括如下步骤：/>[0008]步骤1：使用HOG进行源域和目标域的特征提取，获得低维向量描述的图像集；
[0009]步骤2：基于K均值双重聚类算法对目标域与源域进行缺陷特征划分；
[0010]步骤3：使用无监督的前向传播神经网络和监督学习构建自动编码器，用于捕捉输入数据的重要特征，并通过迭代的方式根据源域和中间域的数据集更新自动编码器的参数；
[0011]本文源域为金属制品，目标域为注塑制品，根据权值w，从源域和中间域中筛选出不符合目标域的样本，抑制不符合目标域样本的数据对迁移学习效果的干扰，保证目标域上的模型学习到有利的知识，从而完成远距离迁移过程；
[0012]步骤4：构建基于多领域和自适应算法的多目标域任务泛化模型。
[0013]通过从多领域进行知识迁移，使学习到的模型可以在目标域上达到更好的效果，基于训练样本域目标域的距离来衡量它们的损失，通过多个领域的知识迁移，使最终模型可以通过源域的特征给目标域上的数据进行准确的标注。
[0014]所述步骤1)具体为：
[0015]1.1)输入源域和目标域中的图片；
[0016]源域为已完成缺陷标注的金属制品图像集及其他材料制品图像集，目标域为待识别缺陷的注塑制品图像；
[0017]1.2)对图像进行灰度化，根据灰度范围去除灰度信息在设定范围外即缺陷特性作用小的RGB信息；
[0018]1.3)对图像进行归一化操作，以降低图像噪声(局部阴影、光照变化、光照强度的影响)对结果的影响；
[0019]1.4)遍历图像中的像素点，计算图像中像素点的梯度方向值，获取图像的缺陷和边缘信息，弱化噪声的影响；
[0020]1.5)将图像分割为若干个小的单元区块，对单元区块内每个像素，在梯度方向的直方图上进行加权投影，从而得到各个单元区块的梯度方向直方图；
[0021]本文选取的单元区块的大小为20*20，将二维的信号转化为一维的向量，使用这些直方图的组合来表征图像中的目标(缺陷)。
[0022]1.6)记录每个单元区块梯度幅值的均值，选取梯度幅值最大的单元区块作为图像的特征(以实现区域的合并)，获得使用低维向量描述的图像，完成源域和目标域中图像的主要特征提取。
[0023]所述步骤2)具体为：
[0024]2.1)根据目标域和源域的缺陷种类的数量，确定k的大小，k表示缺陷类别数；
[0025]2.2)确定实验参数：聚类簇数为k，迭代次数为T1,T2；t1,T2分别作为聚类1和聚类2的迭代次数；
[0026]2.3)从样本集D中随机选择K张图像作为初始源域均值向量集{μ1,μ2,
…
,μ
i
,
…
,μ
K
}；
[0027]其中，μ
i
为K张图像中的第i张图像；样本集D为步骤1)获得的源域中的低维向量描述的图像集，样本集D为述的图像集，样本集D为为样本集D中的第j张图像，m为图像的数量，j∈{1,2,
…
,m}；
[0028]2.4)聚类一：遍历样本集D，计算样本集D中的样本与各源域均值向量的距离：
[0029][0030]根据源域均值向量确定样本集的簇C＝{C1,C2,
…
,C
i
,
…
,C
k
}及簇标注，根据距离最近原则，即d
ji
最小，将样本划入最近的源域均值向量对应的簇C样本中；
[0031]源域均值向量集的初始量为步骤2.3)得到的初始源域均值向量集{μ1,μ2,
…
,μ
i
,
…
,μ
K
}；
[0032]2.5)通过下式更新步骤2.4)的源域均值向量：
[0033][0034]得到新的源域均值向量集{μ
′1,μ
′2,
…
,μ
′
i
,
…
,μ
′
k
}；
[0035]2.6)重复T1次步骤2.4)和2.5)，获得更新后的源域均值向量集
并输出更新后的簇簇C包含全部的
[0036]2.7)聚类二：遍历样本集E，计算样本集E中的新样本与步骤2.6)中更新后的源域均值向量集的距离：
[0037][0038]其中，样本集E为步骤1)获得的目标域中的低维向量描述的图像集，样本集E为其中，样本集E为步骤1)获得的目标域中的低维向量描述的图像集，样本集E为为样本集E中第p张图像，p∈{1,2,
…
,l}；
[0039]的初始量为源域均值向量集中的第i个样本第n次迭代时，为均值向量集中的第i个样本
[0040]根据源域均值向量集确定新样本集的簇A＝{A1,A2,
…
A
k
}及簇标记，根据距离最近原则，即d
pi
最小，将样本划入最近的均值向量对应的簇A样本中：
[0041]2.8)计算所有样本与源域均值向量的距离的均值：
[0042][0043]获得的均值向量集用于更新源域均值向量集
[0044]2.9)重复T2次步骤2.7)和2.8)，获得最终更新后的均值向量集输出k个聚类簇完成目标域和源域的缺陷特征分类。
[0045]所述步骤3)本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种表观缺陷跨域分类识别的负迁移抑制方法，其特征在于，包括以下步骤，步骤1：使用HOG进行源域和目标域的特征提取，获得低维向量描述的图像集；步骤2：基于K均值双重聚类算法对目标域与源域进行缺陷特征划分；步骤3：使用无监督的前向传播神经网络和监督学习构建自动编码器，用于捕捉输入数据的重要特征，并通过迭代的方式根据源域和中间域的数据集更新自动编码器的参数；步骤4：构建基于多领域和自适应算法的多目标域任务泛化模型。2.根据权利要求1所述的一种表观缺陷跨域分类识别的负迁移抑制方法，其特征在于，所述步骤1)具体为：1.1)输入源域和目标域中的图片；源域为已完成缺陷标注的金属制品图像集，目标域为待识别缺陷的注塑制品图像；1.2)对图像进行灰度化，根据灰度范围去除灰度信息在设定范围外的RGB信息；1.3)对图像进行归一化操作；1.4)遍历图像中的像素点，计算图像中像素点的梯度方向值；1.5)将图像分割为若干个小的单元区块，对单元区块内每个像素，在梯度方向的直方图上进行加权投影，从而得到各个单元区块的梯度方向直方图；1.6)记录每个单元区块梯度幅值的均值，选取梯度幅值最大的单元区块作为图像的特征，获得使用低维向量描述的图像，完成源域和目标域中图像的主要特征提取。3.根据权利要求1所述的一种表观缺陷跨域分类识别的负迁移抑制方法，其特征在于，所述步骤2)具体为：2.1)根据目标域和源域的缺陷种类的数量，确定k的大小，k表示缺陷类别数；2.2)确定实验参数：聚类簇数为k，迭代次数为T1,T2；2.3)从样本集D中随机选择K张图像作为初始源域均值向量集{μ1,μ2,
…
,μ
i
,
…
,μ
K
}；其中，μ
i
为K张图像中的第i张图像；样本集D为步骤1)获得的源域中的低维向量描述的图像集，样本集D为图像集，样本集D为为样本集D中的第j张图像，m为图像的数量，j∈{1,2,
…
,m}；2.4)聚类一：遍历样本集D，计算样本集D中的样本与各源域均值向量的距离：根据源域均值向量确定样本集的簇C＝{C1,C2,
…
,C
i
,
…
,C
k
}及簇标注，根据距离最近原则，即d
ji
最小，将样本划入最近的源域均值向量对应的簇C样本中；源域均值向量集的初始量为步骤2.3)得到的初始源域均值向量集{u1,μ2,
…
,μ
i
,
…
,μ
K
}；2.5)通过下式更新步骤2.4)的源域均值向量：得到新的源域均值向量集{μ
′1,μ
′2,
…
,μ
′
i
,
…
,μ
′
k
}；2.6)重复T1次步骤2.4)和2.5)，获得更新后的源域均值向量集
并输出更新后的簇簇C包含全部的2.7)聚类二：遍历样本集E，计算样本集E中的新样本与步骤2.6)中更新后的源域均值向量集的距离：其中，样本集E为步骤1)获得的目标域中的低维向量描述的图像集，样本集E为其中，样本集E为步骤1)获得的目标域中的低维向量描述的图像集，样本集E为为样本集E中第p张图像，p∈{1,2,
…
,l}；根据源域均值向量集确定新样本集的簇A＝{A1,A2,
…
A
k
}及簇标记，根据距离最近原则，即d
pi
最小，将样本划入最近的均值向量对应的簇A样本中：计算样本集E中所有样本与源域均值向量的距离的均值：获得的均值向量集用于更新源域均值向量集2.8)重复T2次步骤2.7)，获得最终更新后的均值向量集输出k个聚类簇完成目标域和源域的缺陷特征分类。4.根据权利要求1所述的一种表观缺陷跨域分类识别的负迁移抑制方法，其特征在于，所述步骤3)中，输入的数据分别为带有簇标记的源域数据集S、目标域数据集T和中间域数据集I：I.带有簇标记的源域数据集数据集S即为步骤2中根据初始均值向量{μ1,μ2,
…
,μ
i
,
…
,μ
K
}确定的带有簇标记的簇集合大小为n
s
＝k；其中，为原属于样本集D后划入带有簇标记的簇C中的II.设定目标域数据集为：集合大小n
t
＝l；其中，为样本集E中的III.设定中间域数据集I为：
其中，I
j
为步骤2)中更新后的簇中第j个样本，j∈{1,2,
…
,k}；分别为样本I1、I
j
、I
k
的集合大小。5.根据权利要求1所述的一种表观缺陷跨域分类识别的负迁移抑制方法，其特征在于，所述步骤3)中，自动编码器的构成具体包括以下步骤：3.1)设定目标函数对自动编码器进行无监督学习训练：其中，n
s
和n

【专利技术属性】
技术研发人员：伊国栋，曾威，李琎，王阳，
申请(专利权)人：浙江大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人