【技术实现步骤摘要】
一种基于融合属性和属性分布相似度的小样本分类方法
[0001]本专利技术涉及信息
,具体来讲是一种基于融合属性和属性分布相似度的小样本分类方法。
技术介绍
[0002]虽然深度学习已经在图像识别领域取得了巨大的成功,但依赖大量的标注数据也是深度学习一直以来的一大痛点。大量数据进行人工标注十分费时费力,但如果不进行数据的标注,缺乏数据集又会造成模型过拟合和泛化能力差的问题,而小样本学习的出现带来了革命性的解决方案。并且随着小样本学习的不断发展,衍生出了很多方法,比如基于梯度更新式的元学习的方法、基于图神经网络的方法、基于属性的方法等等。但小样本学习中的方法大部分采用预训练加元学习测试阶段的策略。这一方法的关键在如何利用训练集预训练一个初始模型,并在测试阶段时,利用测试集进模型参数微调,获得一个适合新样本集的模型。这也意味着在元学习的测试阶段,不会利用训练集的信息优化模型,但是这不能说明训练集不能帮助测试集优化模型。
[0003]根据目前小样本学习工作的进展,网络在元学习的测试阶段如何继续利用训练集的问题,目前主要是利用训练集的信息与测试集中参与微调的信息进行融合,增强待分类类别的代表力,补全图像信息。这一方式十分复杂,并使用条件高,但是仍然有不少方法和工程采用这一方法。
[0004]基于属性的方法就是其中具有代表性的方法之一,简单来说,就是网络通过属性特征不断增强样本信息来优化模型。首先,这一类型的方法大部分都需要依靠专家标注好的属性。因此,专家的专业程度,以及标注的角度方式,甚至属性选择的范围和 ...
【技术保护点】
【技术特征摘要】
1.一种基于融合属性和属性分布相似度的小样本分类方法,其特征在于;按照如下方式实施;步骤1构建元训练集和图像处理;将图片大于10000张的图片构建成元训练集,对元训练集进行预处理;首先将图片大小统一调整为92x92px,然后对图像做增强处理,包括随机旋转和剪切;输出处理好的图像;步骤2预训练;将处理好的图像传入深层卷积神经网络进行预训练,输出特征提取器的权重参数θ和分类器权重参数φ,保存特征提取器的权重参数θ;步骤3将元训练集按照情景训练方式从数据集中构建训练任务并进行元训练;具体地,从训练集中随机选择N个类,从选中的每个类中随机选K个样本为做支持集,共N*K个,从N个类中随机选M个样本作为查询集,并且和支持集不出现重复;然后将训练任务对特征提取器和分类器进行小样本中经典的元训练,得到小样本基础分类网络;步骤4属性合成;步骤5属性去余;对融合计算好的属性的进行检查,将属性参数值完全相同的去余;步骤6计算特征相似度计算和属性分布相似度;步骤7计算结果。2.根据权利要求1所述一种基于融合属性和属性分布相似度的小样本分类方法,其特征在于;步骤3对应的元训练的过程如下;3.1将训练任务中的支持集放入到特征提取器中获取N*K个特征图;3.2对属于相同类别的特征图求算数平均值,获得类别特征,共N个;3.3从查询集中随机选择一个样本,传入到特征提取器和分类器中,分类器计算和每个类别特征的余弦相似度,经过softmax函数,对类别相似度进行归一化,得到p
i
,归一化公式为:其中p
i
为第当前查询集样本对第i个类的预测结果;t为N个类别特征中的第t个特征;e为幂运算的底数;3.4将查询集中所有的样本相似度和标签求损失,损失函数为:其中L为当前训练任务损失结果;y
i
为样本对应类别的真实标签,为一个one
‑
hot标签,里面的每一个元素取0或者1,0代表不是该类别,1代表为该类别;p
i
是softmax的结果,3.5利用梯度回传对特征提取器和分类器组合的网络进行参数更新,重复步骤3中的步骤,直到网络收敛,参数不再更新,得到小样本基础分类网络。3.根据权利要求1所述一种基于融合属性和属性分布相似度的小样本分类方法,其特征在于;步骤4设计了一种属性合成方法,具体如下:4.1构建元测试集、获取数据集的属性标签;将待分类的小样本图像数据集构建为元测
试集,将元训练集和元测试集的标签传入WordNet,查询用于合成属性的标签,输出两个数据集的标签交集,这里获得的标签记为属性标签;4.2计算类别特征,将处理好的元训练集再次传入到预训练好的特征提取器中,对每一个类计算类别特征,计算函数:其中s
(i)
代表第i个特征,S
i
为第i个类别样本数据;F
(θ)
表示具有特征提取器权重参数的模型;x
i
和y
i
表示类别下的第i个样本和标签;4.3计算属性;将具有相同属性标签的类别的特征进行计算,计算函数为:其中a
(j)<...
【专利技术属性】
技术研发人员:周川,陈雷霆,蔡安平,陈永奇,
申请(专利权)人:电子科技大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。