样本标签分类方法、系统及电子设备技术方案

技术编号：38485821 阅读：30 留言：0更新日期：2023-08-15 17:01

本发明专利技术提供了一种样本标签分类方法、系统及电子设备，涉及数据分类技术领域，该方法将缺陷图像进行特征提取后通过聚类的方式进行数据样本标签的划分，并通过注意力层计算每个块与其他块之间的注意力权重以捕获图像中的全局信息，特征向量根据注意力权重加权以聚合图像中的信息。该方法对数据进行特征提取并对提取后的特征向量进行概率分布聚类，从特征提取聚类的角度进行缺陷数据集的标签分类与定义，将特征表现相似的数据集合并成为一个标签，达到同一个缺陷类别的特征相似，从而提高标签的分类效果。标签的分类效果。标签的分类效果。

全部详细技术资料下载

【技术实现步骤摘要】
样本标签分类方法、系统及电子设备

[0001]本专利技术涉及数据分类
，尤其是涉及一种样本标签分类方法、系统及电子设备。

技术介绍

[0002]随着人工智能的发展，相关的卷积神经网络模型在工业缺陷识别的场景中也得到广泛普及。将工业场景中获取的待识别图像输入至相关模型中，通过模型的识别即可得到该场景中包含的缺陷数据。模型的识别精度依赖于样本数据的训练效果，训练时主要针对的是缺陷数据。具体实施过程中需要将训练用的缺陷数据按照标签进行分类，同时对其缺陷进行精准定义，以此来保证训练精度。
[0003]实际场景中，根据缺陷在图像中的呈现颜色、形态、位置进行标签的分类与缺陷定义，当缺陷数据的形态颜色相似时就无法准确区分。具体的，在模型训练时不同标签形态相似的缺陷之间存在混检，缺陷与缺陷之间、缺陷与非缺陷之间都存在易混淆、特征差距不明显的情况。对于基于深度学习的缺陷检测方式而言，如果同类标签中的数据差别比较大，会导致以下问题。
[0004]训练困难：同一类别的缺陷数据差别过大，会导致缺陷检测模型难以捕捉到缺陷的共性特征。这可能会使模型训练困难，导致模型的准确性较低；过拟合：如果同一类别的缺陷数据差别过大，模型可能会过度拟合部分数据，而无法准确地泛化到其他数据。这可能会导致模型在训练集上表现很好，但在测试集上表现很差；特征学习不充分：同一类别的缺陷数据差别过大，可能会导致模型无法充分学习该类别的特征，从而影响缺陷检测的准确性。
[0005]对于此类基于深度学习的缺陷检测来说，如果同一类别的缺陷数据尽量的...

【技术保护点】

【技术特征摘要】
1.一种样本标签分类方法，其特征在于，所述方法包括以下步骤：初始化步骤：获取待分类的样本标签图像，并按照预设的分块策略对所述样本标签图像进行分块处理，得到所述样本标签图像的块图；特征向量获取步骤：对所述块图进行向量化处理得到所述样本标签图像的特征向量；聚类结果生成步骤：基于所述特征向量的概率分布结果对所述特征向量进行聚类处理，得到所述特征向量的聚类结果；分类执行步骤：根据所述特征向量的聚类结果确定所述样本标签图像的聚类标签，并利用所述聚类标签对所述样本标签图像进行分类，得到所述样本标签图像的分类结果。2.根据权利要求1所述的样本标签分类方法，其特征在于，所述初始化步骤，包括：对所述样本标签图像进行特征提取，得到所述样本标签图像对应的特征提取数据；根据所述特征提取数据确定所述样本标签图像对应的特征维度数据，利用所述分块策略对所述特征维度数据进行分块计算，得到所述样本标签图像对应的所述块图。3.根据权利要求1所述的样本标签分类方法，其特征在于，所述特征向量获取步骤，包括：将所述块图按照预设比例缩放后进行归一化处理，生成预处理块图；将所述预处理块图进行全连接嵌入计算，生成所述块图对应的多维向量；对所述多维向量进行位置编码运算，并利用已完成位置编码的所述多维向量计算所述块图之间的相似性得分，并利用所述相似性得分计算所述块图之间的注意力权重值；利用所述多维向量及其对应的所述注意力权重值，生成所述样本标签图像的特征向量。4.根据权利要求1所述的样本标签分类方法，其特征在于，所述聚类结果生成步骤，包括：根据所述特征向量的类型，初始化多个聚类中心向量；计算所述特征向量与所述聚类中心向量之间的分布距离；利用softmax函数计算所述分布距离对应的概率分布，得到所述特征向量的所述概率分布结果；根据所述概率分布结果确定所述特征向量与所述聚类中心向量的极值关系，并利用所述极值关系确定所述特征向量的聚类结果；其中，所述极值关系至少包括：所述特征向量属于所述聚类中心向量的最大概率值、所述特征向量属于所述聚类中心向量的最小分布距离。5.根据权利要求4所述的样本标签分类方法，其特征在于，根据所述概率分布结果确定所述特征向量与所述聚类中心向量的极值关系，通过最小化目标函数来实现；所述最小化目标函数为：；其中，为所述分布距离对应的计算集；为所述聚类中心向量对应的计算集；为所述特...

【专利技术属性】
技术研发人员：晏文仲，马原，田楷，陈立名，胡江洪，曹彬，黄金，陈秀睿，
申请(专利权)人：菲特天津检测技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人