当前位置: 首页 > 专利查询>郑州大学专利>正文

一种用于工业制品表面缺陷检测的数据标注方法技术

技术编号:38913729 阅读:13 留言:0更新日期:2023-09-25 09:29
本发明专利技术公开了一种用于工业制品表面缺陷检测的数据标注方法,包括步骤:使用缺陷已标注数据集对特征提取模型和标注分类模型进行训练,利用训练好的特征提取模型提取缺陷未标注数据集的特征向量,将上述特征向量输入到训练好的标注分类模型,挑选出需要人工标注的样本图像,交给人工标注;将人工标注的样本图像扩充到已标注数据集,并从缺陷未标注数据集中去除;判断上述特征提取模型和标注分类模型是否达到要求,达到要求则结束缺陷分类标注,否则重复上述训练。该方法不仅降低标注成本,还提高标注效率和标注质量。提高标注效率和标注质量。提高标注效率和标注质量。

【技术实现步骤摘要】
一种用于工业制品表面缺陷检测的数据标注方法


[0001]本专利技术涉及工业制品表面缺陷检测领域,尤其涉及一种用于工业制品表面缺陷检测的数据标注方法。

技术介绍

[0002]工业制品表面缺陷检测是工业生产中的重要环节,对提高工业制品质量有着重要意义。由于工业制品表面缺陷检测要求精度较高,因此,大部分的工业制品表面缺陷检测的方法为监督学习,而监督学习需要大量标注数据训练模型,因此,标注数据的质量和数量对于工业制品表面缺陷检测的结果至关重要。
[0003]目前工业制品的缺陷标注主要依靠人工标注,这种方式需要消耗大量的人力物力,并且获取的标注数据的一致性较差。由于在构建智能缺陷标注模型的过程中,工业制品表面缺陷数据具有标注样本少、样本不均衡、缺陷面积差距大且存在异常点的问题,因此亟需探索智能缺陷标注模型以降低标注成本,提高标注效率和标注质量。

技术实现思路

[0004]本专利技术主要解决的技术问题是提供一种用于工业制品表面缺陷检测的数据标注方法,解决工业制品表面缺陷数据具有标注样本少、样本不均衡、缺陷面积差距大且存在异常点的问题。
[0005]为解决上述技术问题,本专利技术采用的一个技术方案是提供一种用于工业制品表面缺陷检测的数据标注方法,包括步骤:
[0006]第一步,获取用于对工业制品表面缺陷进行标注的缺陷已标注数据集,缺陷已标注数据集包括已标注缺陷的第一批缺陷样本图像。
[0007]第二步,使用缺陷已标注数据集对特征提取模型进行训练,提取第一批缺陷样本图像的特征向量。r/>[0008]第三步,将第一批缺陷样本图像的特征向量,作为训练数据输入到标注分类模型,并对其进行训练。
[0009]第四步,对缺陷未标注数据集中未标注缺陷的第一批未标注样本图像,利用训练好的特征提取模型和标注分类模型进行分类,得到未标注缺陷的第二批未标注样本图像。
[0010]第五步,若缺陷未标注数据集中的第二批未标注样本图像的数量,与第一批未标注样本图像的数量的比值,大于预设的阈值门限,则对第二批未标注样本图像进行人工标注,得到第二批缺陷样本图像。
[0011]第六步,承接第五步,将第二批缺陷样本图像和第一批缺陷样本图像合并,作为下一轮送代运算所需的缺陷已标注数据集;将缺陷未标注数据集中去除第二批缺陷样本图像,作为下一轮迭代运算所需的缺陷未标注数据集;然后返回第一步,对特征提取模型和标注分类模型进行选代训练。
[0012]第七步,承接第四步,若缺陷未标注数据集中的第二批未标注样本图像的数量,与
第一批未标注样本图像的数量的比值,小于或等于预设的阈值门限,则表明特征提取模型和标注分类模型均完成训练,结束缺陷分类标注。
[0013]优选的,特征提取模型包括下采样处理单元、上采样处理单元和标准化处理单元,下采样单元包括多级依次串联的卷积块,下采样处理单元对第一批缺陷样本图像进行连续下采样处理,并输出多个具有不同语义的特征至上采样处理单元;上采样处理单元包括多级依次串联的融合卷积块,上采样处理单元对多个具有不同语义的的特征进行连续上采样,并横向连接来自下采样处理单元输出的多个具有不同语义的特征,进行融合后形成多个融合特征,多个融合特征又分别经过3x3卷积操作后,形成多个特征图,多个特征图横向输出至标准化处理单元;标准化处理单元对多个特征图进行归一和激活处理,防止特征提取模型过拟合,并对多个特征图进行非线性变换,最后输出第一批缺陷样本图像的多个特征向量。
[0014]优选的,下采样处理单元包括依次串联的第一卷积块、第二卷积块、第三卷积块、第四卷积块和第五卷积块,第一卷积块提取第一批缺陷样本图像的图像特征形成第一语义特征,并输出第一语义特征至第二卷积块;第二卷积块对输入的第一语义特征进行下采样形成第二语义特征,并输出第二语义特征至第三卷积块,同时通过下采样处理单元的第一输出端输出第二语义特征至上采样处理单元的第一输入端;第三卷积块对第二卷积块提取的第二语义特征进行下采样形成第三语义特征,并输出第三语义特征至第四卷积块,同时通过下采样处理单元的第二输出端输出第三语义特征至上采样处理单元的第二输入端;第四卷积块对第三卷积块提取的第三语义特征进行下采样形成第四语义特征,并输出第四语义特征至第五卷积块,同时通过下采样处理单元的第三输出端输出第四语义特征至上采样处理单元的第三输入端;第五卷积块对第四卷积块提取的第四语义特征进行下采样形成第五语义特征,并输出第五语义特征,同时通过下采样处理单元的第四输出端输出第五语义特征至上采样处理单元的第四输入端。优选的,上采样处理单元包括依次串联的第四融合卷积块、第三融合卷积块、第二融合卷积块和第一融合卷积块,第四融合卷积块的输入端连接上采样处理单元的第四输入端,来自下采样处理单元的第五语义特征通过第四融合卷积块的输出端输出第四融合特征至第三融合卷积块,同时通过上采样处理单元的第四输出端横向输出第四融合特征至标准化处理单元的第四输入端;第三融合卷积块对第四融合特征进行上采样,并融合上采样处理单元的第三输入端输入的第四语义特征,形成第三融合特征,并输出第三融合特征至第二融合卷积块,同时通过上采样处理单元的第三输出端横向输出第三融合特征至标准化处理单元的第三输入端;第二融合卷积块对第三融合特征进行上采样,并融合上采样处理单元的第二输入端输入的第三语义特征,形成第二融合特征,并输出第二融合特征至第一融合卷积块,同时通过上采样处理单元的第二输出端横向输出第二融合特征至标准化处理单元的第二输入端;第一融合卷积块对第二融合特征进行上采样,并融合上采样处理单元的第一输入端输入的第二语义特征,形成第一融合特征,并通过上采样处理单元的第一输出端横向输出第一融合特征至标准化处理单元的第一输入端。
[0015]上采样处理单元的第一输出端输出的第一融合特征、第二输出端输出的第二融合特征、第三输出端输出的第三融合特征和第四输出端输出的第四融合特征分别经过3x3卷积操作后,形成四个不同的特征图,分别对应输入至标准化处理单元的第一输入端、第二输入端、第三输入端和第四输入端。
[0016]优选的,标准化处理单元分别对其四个输入端输入的四个特征图进行归一和激活处理,并通过标准化处理单元的第一输出端、第二输出端、第三输出端和第四输出端分别输出4个1x100的特征向量。
[0017]优选的,特征提取模型训练时利用Focal Loss的类平衡损失函数,Focal Loss的类平衡损失函数定义如下:
[0018]其中,z为所有样本类别的预测,z=[z1,z2,...,z
C
]T
,C为类别总数N为样本体积,n
y
表示在真实类y中的样本数量,γ为可调节因子,p
i
表示为特征提取模型的预测类别的概率。
[0019]优选的,标注分类模型基于鲁棒最小二乘支持向量数据描述对缺陷已标注数据集的每类数据都拟合一个超球面,拟合的超球面只与该类缺陷已标注数据集有关,与其它类缺陷已标注数据集无关。
[0020]优选的,鲁棒最小本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种用于工业制品表面缺陷检测的数据标注方法,其特征在于,包括步骤:第一步,获取用于对工业制品表面缺陷进行标注的缺陷已标注数据集,所述缺陷已标注数据集包括已标注缺陷的第一批缺陷样本图像;第二步,使用所述缺陷已标注数据集对特征提取模型进行训练,提取所述第一批缺陷样本图像的特征向量;第三步,将所述第一批缺陷样本图像的特征向量,作为训练数据输入到标注分类模型,并对其进行训练;第四步,对缺陷未标注数据集中未标注缺陷的第一批未标注样本图像,利用训练好的所述特征提取模型和所述标注分类模型进行分类,得到未标注缺陷的第二批未标注样本图像;第五步,若所述缺陷未标注数据集中的第二批未标注样本图像的数量,与所述第一批未标注样本图像的数量的比值,大于预设的阈值门限,则对第二批未标注样本图像进行人工标注,得到第二批缺陷样本图像;第六步,承接第五步,将所述第二批缺陷样本图像和所述第一批缺陷样本图像合并,作为下一轮送代运算所需的缺陷已标注数据集;将所述缺陷未标注数据集中去除所述第二批缺陷样本图像,作为下一轮迭代运算所需的缺陷未标注数据集;然后返回第一步,对所述特征提取模型和所述标注分类模型进行选代训练;第七步,承接第四步,若所述缺陷未标注数据集中的第二批未标注样本图像的数量,与所述第一批未标注样本图像的数量的比值,小于或等于预设的阈值门限,则表明所述特征提取模型和所述标注分类模型均完成训练,结束缺陷分类标注。2.根据权利要求1所述的用于工业制品表面缺陷检测的数据标注方法,其特征在于,所述特征提取模型包括下采样处理单元、上采样处理单元和标准化处理单元,所述下采样单元包括多级依次串联的卷积块,所述下采样处理单元对所述第一批缺陷样本图像进行连续下采样处理,并输出多个具有不同语义的特征至上采样处理单元;所述上采样处理单元包括多级依次串联的融合卷积块,所述上采样处理单元对多个具有不同语义的特征进行连续上采样,并横向连接来自下采样处理单元输出的多个具有不同语义的特征,进行融合后形成多个融合特征,所述多个融合特征又分别经过3x3卷积操作后,形成多个特征图,所述多个特征图横向输出至标准化处理单元;所述标准化处理单元对所述多个特征图进行归一和激活处理,防止所述特征提取模型过拟合,并对所述多个特征图进行非线性变换,最后输出所述第一批缺陷样本图像的多个特征向量。3.根据权利要求2所述的用于工业制品表面缺陷检测的数据标注方法,其特征在于,所述下采样处理单元包括依次串联的第一卷积块、第二卷积块、第三卷积块、第四卷积块和第五卷积块,所述第一卷积块提取第一批缺陷样本图像的图像特征形成第一语义特征,并输出第一语义特征至第二卷积块;第二卷积块对输入的第一语义特征进行下采样形成第二语义特征,并输出第二语义特征至第三卷积块,同时通过下采样处理单元的第一输出端输出第二语义特征至上采样处理单元的第一输入端;第三卷积块对第二卷积块提取的第二语义特征进行下采样形成第三语义特征,并输出第三语义特征至第四卷积块,同时通过下采样处理单元的第二输出端输出第三语义特征至上采样处理单元的第二输入端;第四卷积块对
第三卷积块提取的第三语义特征进行下采样形成第四语义特征,并输出第四语义特征至第五卷积块,同时通过下采样处理单元的第三输出端输出第四语义特征至上采样处理单元的第三输入端;第五卷积块对第四卷积块提取的第四语义特征进行下采样形成第五语义特征,并输出第五语义特征,同时通过下采样处理单元的第四输出端输出第五语义特征至上采样处理单元的第四输入端。4.根据权利要求3所述的用于工业制品表面缺陷检测的数据标注方法,其特征在于,所述上采样处理单元包括依次串接的第四融合卷...

【专利技术属性】
技术研发人员:陈丽靳启帆徐明亮姜晓恒酒明远李书攀卢洋
申请(专利权)人:郑州大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1