System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种小样本图像分类的方法技术_技高网

一种小样本图像分类的方法技术

技术编号:42367293 阅读:6 留言:0更新日期:2024-08-16 14:49
一种小样本图像分类的方法,属于图像分类技术领域。本发明专利技术为了解决小样本图像分类效果不佳的问题。本发明专利技术针对待分类图像与若干类已知类别图像中每一类图像,分别进行特征提取,进行特征提取的过程中,首先将图像送入Swin Transformer进行特征提取,然后送入空间注意力和通道注意力CSAM处理;待分类图像经过CSAM处理后的表示1个图像对应的向量与已知类别图像中任意一类图像经过CSAM处理后的表示1个图像对应的向量,利用EMD距离得到最优匹配流,并基于最佳匹配计算图像表示之间的相似性得分,根据得分确定待分类图像的类别。

【技术实现步骤摘要】

本专利技术属于图像分类,具体涉及一种小样本图像分类的方法


技术介绍

1、随着大数据时代的到来,深度学习模型在计算机视觉的各个领域都取得了比较好的成果.但深度学习模型的较高准确率往往需要大量训练数据,需要很多人工标注,为了节约这些成本,于是人们思考如何通过少量数据就能做到准确分类物体。例如,一个幼年的小孩子没有见过兔子,给他一张卡片上面是一个兔子,当他看到真实的兔子时,就会立刻在脑海中反映出来并且认出兔子,即使兔子的体型大小,毛发的颜色和身体姿态等与所看的图片有较大的差异,也能准确识别出来,受到人类学习观点的启发,小样本学习(few-shotlearning)的概念被提出,使得机器学习更加靠近人类思维。

2、在标准的小样本学习任务中,数据集分为两部分:一个带有cbase类的基集和一个带有cnovel类的新集,其中cbase是一个辅助数据集,目的是通过迁移学习来训练分类器,cnovel是执行任务分类的数据集。训练通常在cbase类上进行,其目标是将学到的知识迁移到基于cnovel构建的新任务中。在测试期间,需要为每个任务都建立一个支持集s和一个查询集q。支持集s包含n个类,每个类有k个图像。查询集q包括n×q个未标记的图像。在大多数文献中,n设置为5,k设置为1或5。

3、小样本学习所面临的核心问题在于标注数据太少,基于数据增强的这一类方法通过使用不同的方式生成数据,以此扩充数据集,从而缓解小样本学习过程中面临的数据稀疏问题。现主要可以通过三种方式实现数据增强:第一种是对图像进行变换或是使用生成模型生成虚假数据,将生成数据与原始数据混合来达到扩充数据的目的;第二种是通过半监督学习,利用少量的标注信息从大量无标注数据中学习,提升模型学习效果;第三种则是让模型进行自监督学习,这种训练方式是避免使用标注数据的一种有效方法。在深度学习中,数据增广是一种常用的技巧,这种方法通过各种变换方式实现对训练数据集的扩充。数据增强的方法也同样适用于小样本学习,在小样本图像识别过程中,通过对图像进行旋转、平移、翻转、裁剪或者添加噪声等方式能够有效增强特征编码网络的稳健性,从而提升小样本学习的效果。

4、小样本学习的研究可以追溯到2006年li等人提出的一种生成式目标分类模型,该模型通过应用贝叶斯理论框架从少量标注样本中学习目标类别,以达到与人类相同的学习效果。目前深度学习技术已经被广泛地应用于各领域,基于深度学习的小样本学习也取得了不错的发展。但是,由于小样本学习提出的时间较短,因此相关技术的发展还不太成熟,且相关文章也比较少。目前,对小样本学习技术做出了比较系统的阐述,安胜彪等介绍了用于小样本学习的常用算法,以及小样本图像分类在有监督、半监督和无监督下的技术发展;刘颖等将小样本图像分类算法分为卷积神经网络模型和图神经网络模型两大类。赵凯琳等人从基于模型微调、数据增强和迁移学习的三个方向来介绍小样本学习的方法,并且进行了归纳总结;刘春磊等人将小样本学习方法归纳为基于迁移学习的范式和基于元学习的范式,再按照改进策略的不同进行小样本目标检测综述介绍;张振伟等人从基于度量学习、数据增强、模型结构、元学习等六方面对小样本目标检测方法进行了总结分析。概括来讲,上述文献的共同点是侧重于小样本学习的技术发展现状,但是目前的小样本图像分类效果依然存在效果不佳的问题。


技术实现思路

1、本专利技术为了解决小样本图像分类效果不佳的问题。

2、一种小样本图像分类的方法,包括以下步骤:

3、针对待分类图像与若干类已知类别图像中每一类图像,分别进行特征提取,进行特征提取的过程中,首先将图像送入swin transformer进行特征提取,然后送入空间注意力和通道注意力csam处理;

4、待分类图像经过csam处理后,1个图像表示为含局部特征向量的集合[u1,u2,..,uhw],h、w分别为csam处理后特征图的长和宽,每个向量ui看作是集合中的一个节点;

5、已知类别图像中任意一类图像经过csam处理后,1个图像表示为含局部特征向量的集合[v1,v2,..,vhw],vj也看做另一个图片的局部特征向量集合中的一个节点;

6、通过从两个图像特征计算嵌入节点ui和vj之间的成对距离来获得单位成本:

7、

8、通过节点特征和另一个特征图中的平均节点特征之间的点积来生成相关性分数作为权重值:

9、

10、再对ai和bj进行归一化得到和

11、然后基于权重和cij,利用emd距离得到最优匹配流然后计算图像表示之间的相似性得分:

12、

13、其中,为最优匹配流中的元素;

14、利用得到待分类图像与若干类已知类别图像中每一类图像的相似性得分确定待分类图像的类别。

15、进一步地,图像送入swin transformer进行特征提取后,需经过一层自适应平均池化层处理,然后再将自适应平均池化后的特征图送入空间注意力和通道注意力csam处理。

16、进一步地,所述的swin transformer包括多个block单元,其中第一个block单元包括一个线性嵌入层和若干个swin transformer block,其余block单元包括一patchmerging层和若干个swin transformer block。

17、进一步地,所述的swin transformer包括4个block单元,其中第一个block单元包括一个线性嵌入层和2个swin transformer block,第二至第四block单元分别包括2、6、2个swin transformer block。

18、进一步地,空间注意力和通道注意力csam处理过程包括以下步骤:

19、输入的特征图记为f,f分别进入通道注意力路径和空间注意力路径,分别用mc(f)和mp(f)表示通道注意图和空间注意力图;

20、通道注意力路径mc(f)如下:

21、mc(f)=σ(fc(globalavgpool(f))+fc(globalmaxpool(f)))

22、式中,globalavgpool表示全局平均池化;globalmaxpool表示全局最大池化;fc表示全连接层;σ表示sigmoid激活函数;

23、空间注意力路径mp(f)如下:

24、mp(f)=conv1×1(conv3×3((conv3×3(conv1×1(f)))))

25、式中,conv表示卷积操作,1×1和3×3表示卷积核大小;σ表示sigmoid激活函数;

26、然后将mc(f)和mp(f)按元素相加,经sigmoid激活函数后,再和原特征图f按元素相加得到最终的输出fcsam=f+σ(mc(f)+mp(f))。

27、进一步地,对ai和bj进行归一化得到的和为:

28、进一步地,基于权重和cij本文档来自技高网...

【技术保护点】

1.一种小样本图像分类的方法,其特征在于,包括以下步骤:

2.根据权利要求所述的一种小样本图像分类的方法,其特征在于,在进行特征提取的过程中,图像送入Swin Transformer进行特征提取后,需经过一层自适应平均池化层处理,然后再将自适应平均池化后的特征图送入空间注意力和通道注意力CSAM处理。

3.根据权利要求1所述的一种小样本图像分类的方法,其特征在于,所述的SwinTransformer包括多个block单元,其中第一个block单元包括一个线性嵌入层和若干个Swin Transformer block,其余block单元包括一Patch Merging层和若干个SwinTransformer block。

4.根据权利要求3所述的一种小样本图像分类的方法,其特征在于,所述的SwinTransformer包括4个block单元,其中第一个block单元包括一个线性嵌入层和2个SwinTransformer block,第二至第四block单元分别包括2、6、2个Swin Transformer block。

5.根据权利要求1所述的一种小样本图像分类的方法,其特征在于,空间注意力和通道注意力CSAM处理过程包括以下步骤:

6.根据权利要求1至5任意一项所述的一种小样本图像分类的方法,其特征在于,对ai和bj进行归一化得到的和为:

7.根据权利要求6所述的一种小样本图像分类的方法,其特征在于,基于权重和cij利用EMD距离得到最优匹配流的过程中,EMD公式如下:

8.根据权利要求1所述的一种小样本图像分类的方法,其特征在于,在针对待分类图像与若干类已知类别图像中每一类图像,分别进行特征提取的过程中,采用k-shot学习的方式提取特征,包括以下步骤:

...

【技术特征摘要】

1.一种小样本图像分类的方法,其特征在于,包括以下步骤:

2.根据权利要求所述的一种小样本图像分类的方法,其特征在于,在进行特征提取的过程中,图像送入swin transformer进行特征提取后,需经过一层自适应平均池化层处理,然后再将自适应平均池化后的特征图送入空间注意力和通道注意力csam处理。

3.根据权利要求1所述的一种小样本图像分类的方法,其特征在于,所述的swintransformer包括多个block单元,其中第一个block单元包括一个线性嵌入层和若干个swin transformer block,其余block单元包括一patch merging层和若干个swintransformer block。

4.根据权利要求3所述的一种小样本图像分类的方法,其特征在于,所述的swintransformer包括4个block单元...

【专利技术属性】
技术研发人员:张旭韩小为郎博张鹏毅曾祥鑫陈得宇孙华东
申请(专利权)人:哈尔滨商业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1