基于网络扩张与记忆召回机制的增量学习的图像识别方法技术

技术编号：32511364 阅读：48 留言：0更新日期：2022-03-02 10:56

本发明专利技术提供了一种基于网络扩张与记忆召回机制的增量学习的图像识别方法。其采用网络扩张模块提高卷积神经网络的特征表达能力，再通过召回机制实现旧类与新类分布之间的抗混叠系统地缓解对旧类的灾难性遗忘和对新类的过度适应，能够实现最小化模型过度拟合和类混淆，以实现以少量样本完成可驱动的持续训练，从而得到增量分类神经网络，实现图片的分类。实现图片的分类。

全部详细技术资料下载

【技术实现步骤摘要】
基于网络扩张与记忆召回机制的增量学习的图像识别方法

[0001]本专利技术涉及图像识别
，具体涉及通过对网络扩张与记忆召回实现只需少量样本驱动的可持续学习的图像识别方法。

技术介绍

[0002]近年来，随着大数据的发展和深度学习的推进，人工智能逐渐进入大众视野，逐步渗透进人们的生活。计算机视觉不仅是人工智能落地的最好领域之一，也是人类获取信息的最重要途径之一。
[0003]计算机视觉通过计算机对一些视觉目标如图像、视频进行识别和分析，从而可以辅助或代替人类视觉系统进行工作，以减轻人类获取和处理这些视觉信息的工作量。因此计算机视觉的应用也是无处不在。从市政安防、自动驾驶、影视娱乐、时尚设计，到日常生活中触手可及的人机交互、刷脸认证、扫码支付、相册管理，再到目前新兴的电商平台领域应用，等等计算机视觉技术正持续快速地落地与渗透。
[0004]近年来随着高性能并行计算技术的逐渐成熟以及大数据的积累，基于深度学习方法的计算机视觉技术开始涌现且迅速取代传统方法，有很多成熟的算法已经部署到实际场景中。目前较为成熟的方法，大部分都是用数据驱动类型的技术，也就是需要借助于大规模的标注数据。但是这种技术，在落地的过程中往往面临两个问题。
[0005]第一个问题是在大部分实际应用场景中，数据标注往往比较匮乏。而基于深度学习的计算机视觉技术很大程度上依赖于样本数据的分布和数量，若要实现良好效果，就需要有足够数量的已标注样本的支持。反之，在数据匮乏的情况下，简单地应用基于深度学习的计算机视觉算法往往不能取得很好的...

【技术保护点】

【技术特征摘要】
1.一种基于网络扩张与记忆召回机制的增量学习的图像识别方法，其特征在于，所述方法包括以下步骤：步骤一、获取待分类图片，形成待分类图片集；步骤二、将待分类图片输入至增量分类神经网络；所述增量分类神经网络采用网络扩张模块提高卷积神经网络的特征表达能力，再通过召回机制实现旧类与新类分布之间的抗混叠，以实现以少量样本完成可驱动的持续训练；步骤三、利用增量分类神经网络对待分类图片提取特征、进行分类，并输出分类结果。2.根据权利要求1所述的方法，其特征在于，步骤二中，采用ARRANGE方法获得增量分类神经网络，具体包括以下步骤：步骤1、利用训练集的基础类别对基础卷积神经网络进行分类训练，得到分类卷积神经网络；步骤2、利用网络扩张模块提高分类卷积神经网络的特征表达能力，得到加强卷积神经网络；步骤3、在步骤2得到的加强卷积神经网络上实行召回机制，得到能够实现在旧类样本与新类样本分布之间抗混叠的卷积神经网络；步骤4、利用步骤3中得到的卷积神经网络对训练图像提取特征；步骤5、收敛卷积神经网络。3.根据权利要求2所述的方法，其特征在于，步骤1中，将数据集划分为基础类别，标记为C
(0)
，与增量类，标记为C
(t)
；利用基础类别训练集对基础卷积神经网络进行分类训练后，再使用增量类集合C
(t)
中的数据D
(t)
对网络进行微调。4.根据权利要求2或3所述的方法，其特征在于，步骤1中，所述利用基础类别进行的训练中，将D
(0)
中的每个图像I送到基础卷积神经网络中，以提取特征向量X，并将其投影到特征空间，其中，X＝f(I；θ0)，f(
·
)表示由θ
o
参数化的卷积神经网络；以θ
c(0)
参数化的卷积神经网络g(
·
)作为分类器，所述分类卷积神经网络的预测结果为：5.根据权利要求2至4之一所述的方法，其特征在于，步骤1中，在基础卷积神经网络进行分类训练期间，给定图像真实值y，将优化以下分类损失函数：其中，θ为网络参数为θ
b
为基础卷积神经网络的参数，θ0为新扩张的网络层的参数，θ
c
为分类器g(
·

【专利技术属性】
技术研发人员：季向阳，叶齐祥，张云霄，杨博宇，刘冰昊，焦建彬，
申请(专利权)人：中国科学院大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人