一种蒸馏数据的方法、介质及视觉任务处理方法技术

技术编号：38415047 阅读：19 留言：0更新日期：2023-08-07 11:18

本发明专利技术公开一种蒸馏数据的方法，其首先从第一数据集、第二数据集中分别采样，得到第一样本数据、第二样本数据，然后通过N次迭代，对第一数据集进行更新。其中初始的第一数据集由第二数据集随机采样得到。每次迭代则首先通过特征提取模块分别提取第一样本数据及第二样本数据的特征，得到第一特征、第二特征，然后计算第一特征与第二特征的差异，并将其作为监督信号进行反向传播，更新第一数据集。该方法基于对比学习的技术实现数据蒸馏，可以对多种标签数据或无标签数据进行蒸馏，得到的蒸馏数据可以应用到包括分类在内的多种视觉任务中。可以应用到包括分类在内的多种视觉任务中。可以应用到包括分类在内的多种视觉任务中。

全部详细技术资料下载

【技术实现步骤摘要】
一种蒸馏数据的方法、介质及视觉任务处理方法

[0001]本专利技术涉及计算机视觉
，特别涉及一种蒸馏数据的方法、介质及视觉任务处理方法。

技术介绍

[0002]数据蒸馏(Dataset Distillation或Dataset Condensation)任务的目标是将数量为N的大型训练数据集(或称真实数据集)提炼成一组数量为M的合成数据集，其中M<<N，且期望相同的模型使用合成数据集训练与使用大型数据集训练得到尽可能一致的结果，或者说在测试集中的准确率接近。数据蒸馏的核心是降低数据的冗余性，将相似的多个图像合成进更少的图像，提高图像中的有效信息密度。
[0003]现有的数据蒸馏技术都是在分类任务中进行，由于分类任务自带了类别信息，因此现有数据蒸馏技术的技术原理基本相同，都是在分类数据集上利用分类标签，根据类别标签将相同类别图像合成到一张或一簇代表这一类别的合成图像上。可以看出，现有的方法合成数据共用一个类别标签，无需对标签做任何改动。但是这也使得在其他任务的数据集以及无标签数据，如目标检测数据集中每个图像对应的标签各不相同时，会导致合成图像的标签必须是一个包含所有待合成样本标签信息的“综合标签”，这个综合标签如何生成并没有一个很好的解决方案。可见，现有的蒸馏手段难以用于除分类数据集外的其他数据集，并且无法用于除了分类任务外的其他任务。且目前暂时没有可用于分类标签外其他诸如检测、分割等标签数据，或者无标签数据的数据蒸馏方法，更没有将蒸馏数据应用至分类外任务的框架范式。
...

【技术保护点】

【技术特征摘要】
1.一种蒸馏数据的方法，其特征在于，包括步骤：从第一数据集、第二数据集中分别采样，得到第一样本数据、第二样本数据，其中所述第一数据集由所述第二数据集随机采样得到；以及通过N次迭代，对所述第一数据集进行更新，其中N为自然数，且每次迭代包括：通过特征提取模块分别提取所述第一样本数据及第二样本数据的特征，得到第一特征、第二特征；以及计算所述第一特征与第二特征的差异，并将所述差异作为监督信号进行反向传播，更新所述第一数据集。2.如权利要求1所述的方法，其特征在于，还包括步骤：对所述特征提取模块进行更新。3.如权利要求1所述的方法，其特征在于，还包括步骤：在每次更新第一数据集前，先对所述特征提取模块进行更新。4.如权利要求2所述的方法，其特征在于，更新所述特征提取模块的一次迭代包括步骤：对所述第二样本数据进行两次不同的数据增强处理，得到正样本对；将所述正样本对分别输入所述特征提取模块的正样本编码器及负样本编码器，以得到正样本特征向量及负样本特征向量；计算所述正样本特征向量及负样本特征向量的相似度向量，并计算所述负样本特征向量与预存储的负样本特征向量的相似度矩阵；计算损失，并反向传播更新所述正样本编码器；以及将所述负样本特征向量放入负样本特征向量队列中，并将等量的队列末尾的负样本特征向量移出队列，实现队列更新，同时根据正样本编码器的参数按照动量更新方法更新负样本编码器的参数。5.如权利要求4所述的方法，其特征在于，所述数据增强处理包括：平移、和/或旋转、和/或随机裁剪、和/或颜色变换、和/或翻转。6.如权利要求4所述的方法，其特征在于，所述正样本编码器包括骨干网络、以及投射层；以及所述负样本编码...

【专利技术属性】
技术研发人员：许思杰，张钟毓，张行程，
申请(专利权)人：上海人工智能创新中心，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人