样本标签分类方法、系统及电子设备技术方案

技术编号:38485821 阅读:15 留言:0更新日期:2023-08-15 17:01
本发明专利技术提供了一种样本标签分类方法、系统及电子设备,涉及数据分类技术领域,该方法将缺陷图像进行特征提取后通过聚类的方式进行数据样本标签的划分,并通过注意力层计算每个块与其他块之间的注意力权重以捕获图像中的全局信息,特征向量根据注意力权重加权以聚合图像中的信息。该方法对数据进行特征提取并对提取后的特征向量进行概率分布聚类,从特征提取聚类的角度进行缺陷数据集的标签分类与定义,将特征表现相似的数据集合并成为一个标签,达到同一个缺陷类别的特征相似,从而提高标签的分类效果。标签的分类效果。标签的分类效果。

【技术实现步骤摘要】
样本标签分类方法、系统及电子设备


[0001]本专利技术涉及数据分类
,尤其是涉及一种样本标签分类方法、系统及电子设备。

技术介绍

[0002]随着人工智能的发展,相关的卷积神经网络模型在工业缺陷识别的场景中也得到广泛普及。将工业场景中获取的待识别图像输入至相关模型中,通过模型的识别即可得到该场景中包含的缺陷数据。模型的识别精度依赖于样本数据的训练效果,训练时主要针对的是缺陷数据。具体实施过程中需要将训练用的缺陷数据按照标签进行分类,同时对其缺陷进行精准定义,以此来保证训练精度。
[0003]实际场景中,根据缺陷在图像中的呈现颜色、形态、位置进行标签的分类与缺陷定义,当缺陷数据的形态颜色相似时就无法准确区分。具体的,在模型训练时不同标签形态相似的缺陷之间存在混检,缺陷与缺陷之间、缺陷与非缺陷之间都存在易混淆、特征差距不明显的情况。对于基于深度学习的缺陷检测方式而言,如果同类标签中的数据差别比较大,会导致以下问题。
[0004]训练困难:同一类别的缺陷数据差别过大,会导致缺陷检测模型难以捕捉到缺陷的共性特征。这可能会使模型训练困难,导致模型的准确性较低;过拟合:如果同一类别的缺陷数据差别过大,模型可能会过度拟合部分数据,而无法准确地泛化到其他数据。这可能会导致模型在训练集上表现很好,但在测试集上表现很差;特征学习不充分:同一类别的缺陷数据差别过大,可能会导致模型无法充分学习该类别的特征,从而影响缺陷检测的准确性。
[0005]对于此类基于深度学习的缺陷检测来说,如果同一类别的缺陷数据尽量的做到相似,那么模型的训练效果和检测准确性就会得到提升,但现有技术对模型训练所用的样本标签分类过程中还存在着分类效果差的问题。

技术实现思路

[0006]有鉴于此,本专利技术的目的在于提供一种样本标签分类方法、系统及电子设备,该方法将缺陷图像进行特征提取后通过聚类的方式进行数据样本标签的划分,并通过注意力层计算每个块与其他块之间的注意力权重以捕获图像中的全局信息,特征向量根据注意力权重加权以聚合图像中的信息。该方法对数据进行特征提取并对提取后的特征向量进行概率分布聚类,从特征提取聚类的角度进行缺陷数据集的标签分类与定义,将特征表现相似的数据集合并成为一个标签,达到同一个缺陷类别的特征相似,从而提高标签的分类效果。
[0007]本专利技术实施例带来了至少以下有益效果:本专利技术提供了一种样本标签分类方法、系统及电子设备,该方法首先执行初始化步骤:获取待分类的样本标签图像,并按照预设的分块策略对样本标签图像进行分块处理,
得到样本标签图像的块图;然后执行特征向量获取步骤:对块图进行向量化处理得到样本标签图像的特征向量;随后聚类结果生成步骤:基于特征向量的概率分布结果对特征向量进行聚类处理,得到特征向量的聚类结果;最后执行分类执行步骤:根据特征向量的聚类结果确定样本标签图像的聚类标签,并利用聚类标签对样本标签图像进行分类,得到样本标签图像的分类结果。该方法将缺陷图像进行特征提取后通过聚类的方式进行数据样本标签的划分,并通过注意力层计算每个块与其他块之间的注意力权重以捕获图像中的全局信息,特征向量根据注意力权重加权以聚合图像中的信息,因此该方法对数据进行特征提取并对提取后的特征向量进行概率分布聚类,从特征提取聚类的角度进行缺陷数据集的标签分类与定义,将特征表现相似的数据集合并成为一个标签,达到同一个缺陷类别的特征相似,从而提高标签的分类效果。
附图说明
[0008]图1为本专利技术实施例提供的一种样本标签分类方法的流程图;图2为本专利技术实施例提供的一种样本标签分类方法中初始化步骤的流程图;图3为本专利技术实施例提供的一种样本标签分类方法中特征向量获取步骤的流程图;图4为本专利技术实施例提供的一种样本标签分类方法中聚类结果生成步骤的流程图;图5为本专利技术实施例提供的一种样本标签分类方法中利用极值关系确定特征向量的聚类结果的流程图;图6为本专利技术实施例提供的一种样本标签分类方法中分类执行步骤的流程图;图7为本专利技术实施例提供的一种样本标签分类系统的结构示意图;图8为本专利技术实施例提供的一种电子设备的结构示意图。
[0009]图标:710

初始化单元;720

特征向量获取单元;730

聚类结果生成单元;740

分类执行单元;101

处理器;102

存储器;103

总线;104

通信接口。
具体实施方式
[0010]为便于对本实施例进行理解,首先对本专利技术实施例所公开的一种样本标签分类方法进行详细介绍,如图1所示,该方法包括以下步骤:初始化步骤:获取待分类的样本标签图像,并按照预设的分块策略对样本标签图像进行分块处理,得到样本标签图像的块图;初始化步骤S101:获取待分类的样本标签图像,并按照预设的分块策略对样本标签图像进行分块处理,得到样本标签图像的块图。
[0011]样本标签图像为工业场景中获取的待识别图像,可从产线部署的相机中获取,也可通过相关数据库、服务器中的数据调用接口对其请求获取。由于是作为模型的训练数据,因此样本标签图像的数据量通常较大。样本标签图像获取后按照预设的分块策略对样本标签图像进行分块处理,提取样本标签图像的潜在特征表示,得到样本标签图像中包含的所
有块图。具体的,可将缺陷图像分解为一系列的16 x 16像素的块,对这些块进行缩放以及归一化的预处理操作,再将这些块通过一个全连接层来进行嵌入。
[0012]特征向量获取步骤S102:对块图进行向量化处理得到样本标签图像的特征向量。
[0013]将包含缺陷的样本标签图像分解为一系列的块图后,对这些块图进行缩放以及归一化等操作,进而对其进行向量化处理,得到聚合全局信息的特征向量。
[0014]聚类结果生成步骤S103:基于特征向量的概率分布结果对特征向量进行聚类处理,得到特征向量的聚类结果。
[0015]将提取到的样本标签图像特征向量进行进一步的聚类,具体可使用基于概率分布的聚类方法对特征向量进行聚类分析。该聚类方法可以将样本标签图像分配到多个聚类中心,同时考虑每个样本标签图像属于每个聚类的概率。同时,将每个样本标签图像表示为一个向量,并将每个向量映射到一个概率分布上。这个概率分布代表着样本标签图像属于每个聚类的概率。
[0016]分类执行步骤S104:根据特征向量的聚类结果确定样本标签图像的聚类标签,并利用聚类标签对样本标签图像进行分类,得到样本标签图像的分类结果。
[0017]根据聚类的结果对样本标签图像进行分类,将聚类在一起的样本标签图像定义为同一个标签,保证了同一类别的样本标签图像具有类似的特征分布特点,不同缺陷类别的数据具有一定的差异,避免了人工进行数据缺陷分类时对于相似的数据区分模糊,导致模型检测精度低。
[0018]在一些实施方式中,初始化步骤S101,如图2所示,包括:步骤S201,对样本标签图像进行特征提取,得本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种样本标签分类方法,其特征在于,所述方法包括以下步骤:初始化步骤:获取待分类的样本标签图像,并按照预设的分块策略对所述样本标签图像进行分块处理,得到所述样本标签图像的块图;特征向量获取步骤:对所述块图进行向量化处理得到所述样本标签图像的特征向量;聚类结果生成步骤:基于所述特征向量的概率分布结果对所述特征向量进行聚类处理,得到所述特征向量的聚类结果;分类执行步骤:根据所述特征向量的聚类结果确定所述样本标签图像的聚类标签,并利用所述聚类标签对所述样本标签图像进行分类,得到所述样本标签图像的分类结果。2.根据权利要求1所述的样本标签分类方法,其特征在于,所述初始化步骤,包括:对所述样本标签图像进行特征提取,得到所述样本标签图像对应的特征提取数据;根据所述特征提取数据确定所述样本标签图像对应的特征维度数据,利用所述分块策略对所述特征维度数据进行分块计算,得到所述样本标签图像对应的所述块图。3.根据权利要求1所述的样本标签分类方法,其特征在于,所述特征向量获取步骤,包括:将所述块图按照预设比例缩放后进行归一化处理,生成预处理块图;将所述预处理块图进行全连接嵌入计算,生成所述块图对应的多维向量;对所述多维向量进行位置编码运算,并利用已完成位置编码的所述多维向量计算所述块图之间的相似性得分,并利用所述相似性得分计算所述块图之间的注意力权重值;利用所述多维向量及其对应的所述注意力权重值,生成所述样本标签图像的特征向量。4.根据权利要求1所述的样本标签分类方法,其特征在于,所述聚类结果生成步骤,包括:根据所述特征向量的类型,初始化多个聚类中心向量;计算所述特征向量与所述聚类中心向量之间的分布距离;利用softmax函数计算所述分布距离对应的概率分布,得到所述特征向量的所述概率分布结果;根据所述概率分布结果确定所述特征向量与所述聚类中心向量的极值关系,并利用所述极值关系确定所述特征向量的聚类结果;其中,所述极值关系至少包括:所述特征向量属于所述聚类中心向量的最大概率值、所述特征向量属于所述聚类中心向量的最小分布距离。5.根据权利要求4所述的样本标签分类方法,其特征在于,根据所述概率分布结果确定所述特征向量与所述聚类中心向量的极值关系,通过最小化目标函数来实现;所述最小化目标函数为:;其中,为所述分布距离对应的计算集;为所述聚类中心向量对应的计算集;为所述特...

【专利技术属性】
技术研发人员:晏文仲马原田楷陈立名胡江洪曹彬黄金陈秀睿
申请(专利权)人:菲特天津检测技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1