一种基于融合属性和属性分布相似度的小样本分类方法技术

技术编号:38345270 阅读:12 留言:0更新日期:2023-08-02 09:25
本发明专利技术提出了一种基于小样本学习的自适应属性分布相似度分类方法,根据图像属性之间的相似度,完成对图像的分类。包括步骤1构建元训练集和图像处理;步骤2预训练;步骤3将元训练集按照情景训练方式从数据集中构建训练任务并进行元训练;步骤4属性合成;步骤5属性去余;步骤6计算特征相似度计算和属性分布相似度;步骤7计算结果。本方法中的属性的获取不需要专家标注,那么相比于原来基于属性的工作来说,本发明专利技术拓展到了没有标注好的属性向量的数据集;本发明专利技术也为小样本学习的发展提供了一种新的思路;本发明专利技术在求属性的相似度的时候,与以往方法不同,本发明专利技术考虑了了没有属性标注的数据集。数据集。数据集。

【技术实现步骤摘要】
一种基于融合属性和属性分布相似度的小样本分类方法


[0001]本专利技术涉及信息
,具体来讲是一种基于融合属性和属性分布相似度的小样本分类方法。

技术介绍

[0002]虽然深度学习已经在图像识别领域取得了巨大的成功,但依赖大量的标注数据也是深度学习一直以来的一大痛点。大量数据进行人工标注十分费时费力,但如果不进行数据的标注,缺乏数据集又会造成模型过拟合和泛化能力差的问题,而小样本学习的出现带来了革命性的解决方案。并且随着小样本学习的不断发展,衍生出了很多方法,比如基于梯度更新式的元学习的方法、基于图神经网络的方法、基于属性的方法等等。但小样本学习中的方法大部分采用预训练加元学习测试阶段的策略。这一方法的关键在如何利用训练集预训练一个初始模型,并在测试阶段时,利用测试集进模型参数微调,获得一个适合新样本集的模型。这也意味着在元学习的测试阶段,不会利用训练集的信息优化模型,但是这不能说明训练集不能帮助测试集优化模型。
[0003]根据目前小样本学习工作的进展,网络在元学习的测试阶段如何继续利用训练集的问题,目前主要是利用训练集的信息与测试集中参与微调的信息进行融合,增强待分类类别的代表力,补全图像信息。这一方式十分复杂,并使用条件高,但是仍然有不少方法和工程采用这一方法。
[0004]基于属性的方法就是其中具有代表性的方法之一,简单来说,就是网络通过属性特征不断增强样本信息来优化模型。首先,这一类型的方法大部分都需要依靠专家标注好的属性。因此,专家的专业程度,以及标注的角度方式,甚至属性选择的范围和个数导致分类结果相差很大,那么如何找到一种简单、易理解的替代方法成为目前的一大问题。其次,这一类方式所利用的方法大体上分为两种,一种利用属性增强信息,也就是如上文所说,利用属性和待分类类别的信息相融合,补全待分类类别缺失的部分信息;第二种是利用敏感属性进行分类。但是这并不意味着不敏感的属性对于分类的效果就没有提升了,那么如果利用不敏感的属性也是当前亟待解决的问题。
[0005]现如今有大量的方法通过预训练的方式来解决这一问题,原因在于预训练的方式具有强大的特征提取的功能因此能够提升网络模型的表现能力。并且,我们预训练我们的模型,也能够帮助我们得到更加准确的属性信息。
[0006]与本专利技术相关的现有技术
[0007]现有技术方案一:
[0008]2021年,Zhang等人在《Prototype Completion With Primitive Knowledge for Few

Shot Learning》提出了一种基于原型补全的方法,该方法通过Glove这一工具获得训练集的属性向量,再利用WordNet找到训练集和测试集的共同的属性集。在训练集上合成属性,在元学习的测试阶段时,将训练集获得的属性合成到测试集中待分类类别信息中,从而将只依靠测试集获得的原型点,补全原型点的信息,提高模型的分类准确性。
[0009]现有技术方案一缺点:
[0010]上述方案利用了WordNet找到两个训练集中共同属性,在元学习的测试阶段利用训练集的信息补全测试集待分类类别的信息。这一方法需要更多的计算资源,补全的过程非常复杂、相对来说耗费计算资源多,并且也没有考虑到单利用合成的属性就能进行分类这一特点。对于相同的类别来说,往往具有相同的属性特征,或者说在计算与属性的敏感程度的时候,相同的类对于同一属性特征的敏感程度类似。
[0011]现有技术方案二:
[0012]2021年,Cao等人在《CONCEPT LEARNERS FOR FEW

SHOT LEARNING》中提出了一种利用人工标注的属性向量进行分类的方法,该方法利用了人工标注的属性进行分类,为每一个类选出最具有代表性的属性,求出属性之间的相似度而不是利用了全局特征的相似度进行分类。该模型进行多次比较属性的相似度,取得了显著的效果。
[0013]现有技术方案二的缺点:
[0014]该模型所利用的属性的方案是非常常用的一种方法,也就是人工标注的属性,这一方法广泛的应用于基于属性的小样本学习的方法中。但是一味地依赖于人工标注的方法会对人工的依赖度很高,并非非常费时费力。标注这一工作也需要专家来进行。第二点在于分类的标准是相同的类对于某些共有的属性敏感程度类似,这一方法明显没有考虑到他们均没有的属性的敏感程度,可靠性明显不足。
[0015]现有技术方案三:
[0016]2022年,专利《一种基于元迁移学习的任务自适应的小样本图像分类方法》,这一方法利用了图像的全局特征进行分类,并且提出组件更困难的分类任务,经过多次训练,模型能够在面临更加困难的任务的时候,得到更好的分类结果。这一方法使得学习器在困难任务中学习得更快,效果更好。
[0017]现有技术方案三的缺点:
[0018]这一方法的缺陷在于利用了全局特征进行分类,很明显,对于信息利用不足,训练集中的数据样本仅仅是用来帮助训练一个初始模型。并且全局特征的分类方法有一个缺点,背景干扰信息过多,导致分类效果提升空间不高,单纯的利用图片的全局信息难以得到更好的分类效果。

技术实现思路

[0019]神经网络的强大能力是建立在海量数据集的基础之上的,但现实中的很多问题并没有足够的数据集,例如医学研究、航空航天研究、物理图像研究等等,此时传统神经网络方法在这些小数据集中将失去其强大的能力,小样本学习正是为了解决这类问题应运而生。在图像数量较少的情况下,为了使模型达到一个较好的效果,充分利用图像信息成了至关重要的一环。在现实生活中,很多图像根据其属性便可以分辨出其所属类别。因此,本专利技术以图像属性为切入点,提出了一种基于小样本学习的自适应属性分布相似度分类方法,根据图像属性之间的相似度,完成对图像的分类。
[0020]本专利技术是这样实现的,构造一种基于融合属性和属性分布相似度的小样本分类方法,其特征在于;按照如下方式实施;
[0021]步骤1构建元训练集和图像处理;将图片大于10000张的图片构建成元训练集,对
元训练集进行预处理;首先将图片大小统一调整为92x92px,然后对图像做增强处理,包括随机旋转和剪切;输出处理好的图像;
[0022]步骤2预训练;将处理好的图像传入深层卷积神经网络进行预训练,输出特征提取器的权重参数θ和分类器权重参数φ,保存特征提取器的权重参数θ;
[0023]步骤3将元训练集按照情景训练方式从数据集中构建训练任务并进行元训练;具体地,从训练集中随机选择N个类,从选中的每个类中随机选K个样本为做支持集,共N*K个,从N个类中随机选M个样本作为查询集,并且和支持集不出现重复;然后将训练任务对特征提取器和分类器进行小样本中经典的元训练,得到小样本基础分类网络;
[0024]步骤4属性合成;
[0025]步骤5属性去余;对融合计算好的属性的进行检查,将属性参数值完全相同的去余;
[0026]步骤6计算特征相似度计算和属性分布相本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于融合属性和属性分布相似度的小样本分类方法,其特征在于;按照如下方式实施;步骤1构建元训练集和图像处理;将图片大于10000张的图片构建成元训练集,对元训练集进行预处理;首先将图片大小统一调整为92x92px,然后对图像做增强处理,包括随机旋转和剪切;输出处理好的图像;步骤2预训练;将处理好的图像传入深层卷积神经网络进行预训练,输出特征提取器的权重参数θ和分类器权重参数φ,保存特征提取器的权重参数θ;步骤3将元训练集按照情景训练方式从数据集中构建训练任务并进行元训练;具体地,从训练集中随机选择N个类,从选中的每个类中随机选K个样本为做支持集,共N*K个,从N个类中随机选M个样本作为查询集,并且和支持集不出现重复;然后将训练任务对特征提取器和分类器进行小样本中经典的元训练,得到小样本基础分类网络;步骤4属性合成;步骤5属性去余;对融合计算好的属性的进行检查,将属性参数值完全相同的去余;步骤6计算特征相似度计算和属性分布相似度;步骤7计算结果。2.根据权利要求1所述一种基于融合属性和属性分布相似度的小样本分类方法,其特征在于;步骤3对应的元训练的过程如下;3.1将训练任务中的支持集放入到特征提取器中获取N*K个特征图;3.2对属于相同类别的特征图求算数平均值,获得类别特征,共N个;3.3从查询集中随机选择一个样本,传入到特征提取器和分类器中,分类器计算和每个类别特征的余弦相似度,经过softmax函数,对类别相似度进行归一化,得到p
i
,归一化公式为:其中p
i
为第当前查询集样本对第i个类的预测结果;t为N个类别特征中的第t个特征;e为幂运算的底数;3.4将查询集中所有的样本相似度和标签求损失,损失函数为:其中L为当前训练任务损失结果;y
i
为样本对应类别的真实标签,为一个one

hot标签,里面的每一个元素取0或者1,0代表不是该类别,1代表为该类别;p
i
是softmax的结果,3.5利用梯度回传对特征提取器和分类器组合的网络进行参数更新,重复步骤3中的步骤,直到网络收敛,参数不再更新,得到小样本基础分类网络。3.根据权利要求1所述一种基于融合属性和属性分布相似度的小样本分类方法,其特征在于;步骤4设计了一种属性合成方法,具体如下:4.1构建元测试集、获取数据集的属性标签;将待分类的小样本图像数据集构建为元测
试集,将元训练集和元测试集的标签传入WordNet,查询用于合成属性的标签,输出两个数据集的标签交集,这里获得的标签记为属性标签;4.2计算类别特征,将处理好的元训练集再次传入到预训练好的特征提取器中,对每一个类计算类别特征,计算函数:其中s
(i)
代表第i个特征,S
i
为第i个类别样本数据;F
(θ)
表示具有特征提取器权重参数的模型;x
i
和y
i
表示类别下的第i个样本和标签;4.3计算属性;将具有相同属性标签的类别的特征进行计算,计算函数为:其中a
(j)<...

【专利技术属性】
技术研发人员:周川陈雷霆蔡安平陈永奇
申请(专利权)人:电子科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1