基于网络扩张与记忆召回机制的增量学习的图像识别方法技术

技术编号:32511364 阅读:48 留言:0更新日期:2022-03-02 10:56
本发明专利技术提供了一种基于网络扩张与记忆召回机制的增量学习的图像识别方法。其采用网络扩张模块提高卷积神经网络的特征表达能力,再通过召回机制实现旧类与新类分布之间的抗混叠系统地缓解对旧类的灾难性遗忘和对新类的过度适应,能够实现最小化模型过度拟合和类混淆,以实现以少量样本完成可驱动的持续训练,从而得到增量分类神经网络,实现图片的分类。实现图片的分类。

【技术实现步骤摘要】
基于网络扩张与记忆召回机制的增量学习的图像识别方法


[0001]本专利技术涉及图像识别
,具体涉及通过对网络扩张与记忆召回实现只需少量样本驱动的可持续学习的图像识别方法。

技术介绍

[0002]近年来,随着大数据的发展和深度学习的推进,人工智能逐渐进入大众视野,逐步渗透进人们的生活。计算机视觉不仅是人工智能落地的最好领域之一,也是人类获取信息的最重要途径之一。
[0003]计算机视觉通过计算机对一些视觉目标如图像、视频进行识别和分析,从而可以辅助或代替人类视觉系统进行工作,以减轻人类获取和处理这些视觉信息的工作量。因此计算机视觉的应用也是无处不在。从市政安防、自动驾驶、影视娱乐、时尚设计,到日常生活中触手可及的人机交互、刷脸认证、扫码支付、相册管理,再到目前新兴的电商平台领域应用,等等计算机视觉技术正持续快速地落地与渗透。
[0004]近年来随着高性能并行计算技术的逐渐成熟以及大数据的积累,基于深度学习方法的计算机视觉技术开始涌现且迅速取代传统方法,有很多成熟的算法已经部署到实际场景中。目前较为成熟的方法,大部分都是用数据驱动类型的技术,也就是需要借助于大规模的标注数据。但是这种技术,在落地的过程中往往面临两个问题。
[0005]第一个问题是在大部分实际应用场景中,数据标注往往比较匮乏。而基于深度学习的计算机视觉技术很大程度上依赖于样本数据的分布和数量,若要实现良好效果,就需要有足够数量的已标注样本的支持。反之,在数据匮乏的情况下,简单地应用基于深度学习的计算机视觉算法往往不能取得很好的效果。解决数据标注匮乏这一问题又是一件十分耗费财力物力的工作,甚至有些数据本来就非常难以获得大量的数据(例如濒临灭绝的野生动物,出现概率非常低的自然现象等等)。
[0006]另一个问题则是这些算法大部分都是批量学习(Batch Learning)模式,即假设在训练之前所有训练样本一次都可以得到,学习这些样本之后,学习过程就终止了,不再学习新的知识。然而在实际应用中,训练样本通常不可能一次全部得到,而是随着时间逐步得到的,并且样本反映的信息也可能随着时间产生了变化。如果新样本到达后要重新学习全部数据,需要消耗大量时间和空间。
[0007]因此,需要开发一种能够用少量样本即可驱动的持续学习方法,实现终身学习的新兴机器学习机制。

技术实现思路

[0008]为了克服上述问题,本专利技术人提出了一种基于网络扩张与记忆召回机制的增量学习的图像识别方法,ARRANGE方法,利用少量样本即可驱动的持续学习。利用可学习的分布保持和分布召回的方法,系统地缓解对旧类的灾难性遗忘和对新类的过度适应。ARRANGE方法能够自适应地扩展网络节点以重新排列特征空间,从而在添加新的类分布时保留旧的类
分布。还可以通过选择性地调用旧的类分布来正则化新的类分布,从而最小化模型过度拟合和类混淆。大量实验表明,ARRANGE显著改进了基线方法,在CUB、CIFAR

100和miniImage数据集上实现了新的技术水平,从而完成了本专利技术。
[0009]本专利技术第一方面提供了一种基于网络扩张与记忆召回机制的增量学习的图像识别方法。所述方法包括以下步骤:
[0010]步骤一、获取待分类图片,形成待分类图片集;
[0011]步骤二、将待分类图片输入至增量分类神经网络;
[0012]所述增量分类神经网络采用网络扩张模块提高卷积神经网络的特征表达能力,再通过召回机制实现旧类与新类分布之间的抗混叠,以实现以少量样本完成可驱动的持续训练;
[0013]步骤三、利用增量分类神经网络对待分类图片提取特征、进行分类,并输出分类结果。
[0014]步骤二中,采用ARRANGE方法获得增量分类神经网络,具体包括以下步骤:
[0015]步骤1、利用训练集的基础类别对基础卷积神经网络进行分类训练,得到分类卷积神经网络;
[0016]步骤2、利用网络扩张模块提高分类卷积神经网络的特征表达能力,得到加强卷积神经网络;
[0017]步骤3、在步骤2得到的加强卷积神经网络上实行召回机制,得到能够实现在旧类样本与新类样本分布之间抗混叠的卷积神经网络;
[0018]步骤4、利用步骤3中得到的卷积神经网络对训练图像提取特征;
[0019]步骤5、收敛卷积神经网络。
[0020]本专利技术第二方面还提供了一种计算机可读存储介质,存储有基于网络扩张与记忆召回机制的增量学习的图像识别的分类实施程序,所述程序被处理器执行时,使得处理器执行所述基于网络扩张与记忆召回机制的增量学习的图像识别方法的步骤。
[0021]本专利技术第三方面还提供了一种计算机设备,包括存储器和处理器,所述存储器存储有基于网络扩张与记忆召回机制的增量学习图像识别的分类程序,所述程序被处理器执行时,使得处理器执行所述基于网络扩张与记忆召回机制的增量学习图像识别方法的步骤。
[0022]本专利技术所具有的有益效果包括:
[0023](1)本专利技术中结合了终身学习与小样本学习优点提供的基于网络扩张与记忆召回机制的增量学习图像识别方法是一种面向终身学习的新兴机器学习机制。在给定具有足够训练数据的旧类(基类)和较少监督的新类,从旧类中训练出一个网络模型,并不断地使其适应新类,从而实现良好的可持续学习的分类效果。从而避免过度依赖于已标注样本数据的支持,同时也可以避免新样本到达后重新学习全部数据,使用更加灵活和快捷。
[0024](2)本专利技术提出基于网络扩张与记忆召回机制的增量学习图像识别方法是一种可学习的网络扩展神经网络,能够自适应地扩展网络节点,重新排列特征空间,在添加新的类分布时保留原有的类分布。
[0025](3)本专利技术提出基于网络扩张与记忆召回机制的增量学习图像识别方法能够进行自激励召回机制,通过有选择地调用旧的类分布来正则化新的类分布,从而最小化模型过
度拟合,实现旧类样本与新类样本分布之间的抗混叠。
附图说明
[0026]图1示出根据本专利技术ARRANGE方法的增量学习图像识别示意图;
[0027]图2示出根据本专利技术一种专利技术ARRANGE方法的可学习召回机制的示意图;
[0028]图3示出简单的基础神经网络和本专利技术ARRANGE方法的特征分布的t

SNE非线性降维可视化示意图;
[0029]图4示出根据本专利技术实施例1中TOPIC、SKW、FSLL、CEC和本专利技术ARRANGE方法在CUB200数据集训练任务正确率的变化趋势图;
[0030]图5示出根据本专利技术实施例1中TOPIC、CEC和本专利技术ARRANGE方法在CIFAR100数据集训练任务正确率的变化趋势图;
[0031]图6示出根据本专利技术的混淆矩阵性能图,明显看到本专利技术ARRANGE方法使得分类正确率大幅度提升。
具体实施方式
[0032]下面通过附图和实施方式对本专利技术进一步详细说明。通过这些说明,本专利技术的特点和优点将变得更为清楚明确。本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于网络扩张与记忆召回机制的增量学习的图像识别方法,其特征在于,所述方法包括以下步骤:步骤一、获取待分类图片,形成待分类图片集;步骤二、将待分类图片输入至增量分类神经网络;所述增量分类神经网络采用网络扩张模块提高卷积神经网络的特征表达能力,再通过召回机制实现旧类与新类分布之间的抗混叠,以实现以少量样本完成可驱动的持续训练;步骤三、利用增量分类神经网络对待分类图片提取特征、进行分类,并输出分类结果。2.根据权利要求1所述的方法,其特征在于,步骤二中,采用ARRANGE方法获得增量分类神经网络,具体包括以下步骤:步骤1、利用训练集的基础类别对基础卷积神经网络进行分类训练,得到分类卷积神经网络;步骤2、利用网络扩张模块提高分类卷积神经网络的特征表达能力,得到加强卷积神经网络;步骤3、在步骤2得到的加强卷积神经网络上实行召回机制,得到能够实现在旧类样本与新类样本分布之间抗混叠的卷积神经网络;步骤4、利用步骤3中得到的卷积神经网络对训练图像提取特征;步骤5、收敛卷积神经网络。3.根据权利要求2所述的方法,其特征在于,步骤1中,将数据集划分为基础类别,标记为C
(0)
,与增量类,标记为C
(t)
;利用基础类别训练集对基础卷积神经网络进行分类训练后,再使用增量类集合C
(t)
中的数据D
(t)
对网络进行微调。4.根据权利要求2或3所述的方法,其特征在于,步骤1中,所述利用基础类别进行的训练中,将D
(0)
中的每个图像I送到基础卷积神经网络中,以提取特征向量X,并将其投影到特征空间,其中,X=f(I;θ0),f(
·
)表示由θ
o
参数化的卷积神经网络;以θ
c(0)
参数化的卷积神经网络g(
·
)作为分类器,所述分类卷积神经网络的预测结果为:5.根据权利要求2至4之一所述的方法,其特征在于,步骤1中,在基础卷积神经网络进行分类训练期间,给定图像真实值y,将优化以下分类损失函数:其中,θ为网络参数为θ
b
为基础卷积神经网络的参数,θ0为新扩张的网络层的参数,θ
c
为分类器g(
·

【专利技术属性】
技术研发人员:季向阳叶齐祥张云霄杨博宇刘冰昊焦建彬
申请(专利权)人:中国科学院大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1