一种基于梯度优化的少样本图像分类方法技术

技术编号：42656685 阅读：25 留言：0更新日期：2024-09-10 12:16

本发明专利技术属于计算机多媒体技术领域，具体为一种基于梯度优化的少样本图像分类方法。本发明专利技术方法如下：1)图像输入阶段，将源域图像与目标域小样本图像，输入图像分类网络提取特征，计算损失值Loss；2)梯度引导阶段，将两个Loss同时输入GradMF算法中计算梯度，通过算法将大样本源域梯度引导至小样本目标域梯度方向上；3)更新模型阶段，将新的梯度返回到网络，更新网络参数，提升网络对小样本图像的分类准确率；4)模型分类阶段，利用训练好的网络模型对需要分类的少样本目标进行分类。本发明专利技术提出的方法解决少量样本无法有效训练准确率较高的模型问题，能够优化各类图像分类模型的准确率，并且使得分类模型具有较强的鲁棒性。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及种一种基于梯度优化的少样本图像分类方法，属于计算机多媒体。

技术介绍

1、随着移动互联网、物联网和社交媒体网络的广泛应用，图像数据的规模和多样性呈现爆发式增长。不同于传统的基于手工设计特征的图像分类方法，深度学习技术以其卓越的性能在图像分类任务中崭露头角。通过构建深层神经网络，特别是卷积神经网络(cnn)，可以实现端到端的图像特征学习和分类。cnn能够自动从图像中学习到高层次的抽象特征，从而在图像分类任务中取得优异的表现。

2、然而，在许多场景中，如医学图像处理、工业异常检测和自动驾驶，训练样本的数量有限，并且很难获得注释。为了应对这一挑战，迁移学习已被广泛研究为可行的解决方案。迁移学习旨在利用源域中相似特征的知识来解决目标域中的相应问题。迁移学习的关键在于跨域和跨任务的知识迁移。通过在源领域(大规模数据集)上学习到的知识，可以在目标领域(小样本数据集)上进行迁移，解决相应问题。目前迁移学习的方法主要集中在微调预训练模型、多任务学习、领域自适应等方法，然而当目标域训练样本较少，则可能导致模型泛化能力不足，此外当两个或多个任务差异显著时，可能存在非目标任务梯度占据主导位置导致梯度冲突。因此，在针对上述问题，如何有效利用少量的图像数据训练的小样本迁移学习成为了一项关键任务。小样本迁移学习旨在通过利用已有的大规模数据集中学习到的知识，帮助解决在小样本情况下的图像分类问题。迁移学习方法通过特征提取、参数初始化、模型调优等技术手段，将源领域的知识迁移到目标领域，大大提高了深度学习的效率与性能，使得很多技术任务取得了突破性的进展。

技术实现思路

1、为了克服现有技术的不足，本专利技术提供一种基于梯度优化的少样本图像分类方法。本专利技术的输入在训练阶段为源域图像数据集与目标域图像数据集，分类阶段为待检测图像；输出对该图像类别判断。本专利技术先构建梯度优化算法和图像多标签分类模型，然后将源域图像和目标域图像分别输入分类模型，获得源域梯度与目标域梯度，通过梯度优化算法得到新的梯度，利用优化后的梯度更新模型，完成模型训练，最后通过将待检测图像输入模型，判断图像类别。本专利技术提出的方法解决少量样本无法有效训练准确率较高的模型问题，能够优化各类图像分类模型的准确率，并且使得分类模型具有较强的鲁棒性。

2、本专利技术的技术方案具体介绍如下。

3、本专利技术提供一种基于梯度优化的少样本图像分类方法，其对无法直接训练的少样本目标域进行图像分类，分为4个阶段图像：输入阶段、梯度引导阶段、模型更新阶段和模型分类阶段，其中：

4、在图像输入阶段，将源域图像与目标域小样本图像输入图像多标签分类网络提取特征，计算损失值loss：源域损失值ls和目标域损失值lt；

5、在梯度引导阶段，将两个loss同时输入梯度修正(gradient modification，gradmf)算法计算梯度，通过算法将大样本源域梯度引导至小样本目标域梯度方向上；

6、在模型更新阶段，将新的梯度返回到网络，并采取类预训练方法更新网络参数，提升网络对小样本图像的分类准确率；

7、在模型分类阶段，利用训练好的网络模型对需要分类的少样本目标进行分类。

8、本专利技术中，图像输入阶段中，图像多标签分类网络为cnn网络分类模型。在图像输入阶段，由于目标域图像过少无法直接训练模型，因此选用与目标域具有类似特征的源域图像采取类预训练的方式共同输入到分类模型中训练，计算出源域损失值ls，目标域损失值lt。

9、本专利技术中，在梯度引导阶段，将两个loss同时输入gradmf算法中计算梯度，具体方法如下：

10、gradmf分为两个阶段，gradmf-c和gradmf-s；

11、首先将两个损失值计算出来的梯度gs和gt在gradmf-c中扩展为一维向量，并进入gradmf-c的算法循环，当算法循环到第k-1次时，如公式(1)：

12、

13、其中是gradmf-c第k次得到的目标域梯度，是的模；

14、然后将与相加，得到此时，如果得到的通过公式(2)计算出角相似度sθ大于等于设置的阈值α，或由计算得到的为局部最小值，则进入gradmf-s阶段，反之则继续重复gradmf-c；

15、

16、在gradmf-s阶段，直接将投影向上，快速将源域梯度引导至目标域梯度方向上。

17、本专利技术中，模型更新阶段，采用类预训练ptl方法，将源域数据视为预训练数据集，使用目标域数据的一小部分进行训练；具体如下：ptl先使用源域训练集训练模型，根据预设的epoch节点，将目标域训练集输入到模型中进行训练，并保存模型继续训练源域数据集；每次训练目标域图像时，获得模型给出的损失值ls和lt，并输入gradmf计算新梯度g来更新loss。

18、本专利技术的有益效果如下：

19、1.本专利技术创新性的在梯度层面，引导模型能够有效的完成小样本分类问题。利用分类模型提取出的源域知识作为深度学习所需要的图像知识，将源域知识应用于目标域的图像信息的学习，达到了小样本图像有效训练深度学习图像多标签分类模型的目的。本专利技术根据梯度的引导来完成小样本迁移学习，与实际使用的图像分类模型不具有强关联性，因此可以即插即用的提升任意模型在目标域图像分类任务上的准确性，提高了模型的准确率和鲁棒性。

20、2.本专利技术无需人工设计特征，本专利技术使用中的网络参数皆为自动学习得到。

本文档来自技高网...

【技术保护点】

1.一种基于梯度优化的少样本图像分类方法，其特征在于，其对无法直接训练的少样本目标域进行图像分类，分为4个阶段：图像输入阶段、梯度引导阶段、模型更新阶段和模型分类阶段，其中：

2.根据权利要求1所述的基于梯度优化的少样本图像分类方法，其特征在于，图像输入阶段中，图像多标签分类网络为CNN网络分类模型。

3.根据权利要求1所述的基于梯度优化少样本图像分类方法，其特征在于，在梯度引导阶段，将两个Loss同时输入GradMF算法中计算梯度，具体方法如下：

4.根据权利要求1所述基于梯度优化的少样本图像分类方法，其特征在于，模型更新阶段，采用类预训练PTL方法，将源域数据视为预训练数据集，使用目标域数据的一小部分进行训练；具体如下：PTL先使用源域训练集训练模型，根据预设的epoch节点，将目标域训练集输入到模型中进行训练，并保存模型继续训练源域数据集；每次训练目标域图像时，获得模型给出的损失值Ls和Lt，并输入GradMF计算新梯度G来更新Loss。

【技术特征摘要】

2.根据权利要求1所述的基于梯度优化的少样本图像分类方法，其特征在于，图像输入阶段中，图像多标签分类网络为cnn网络分类模型。

3.根据权利要求1所述的基于梯度优化少样本图像分类方法，其特征在于，在梯度引导阶段，将两个loss同时输入gradmf...

【专利技术属性】
技术研发人员：陈昨寒，冯尊磊，金城，
申请(专利权)人：复旦大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人