图像分类方法、装置、设备及介质制造方法及图纸

技术编号:34337554 阅读:23 留言:0更新日期:2022-07-31 03:16
本发明专利技术涉及人工智能技术领域,提供了一种图像分类方法、装置、设备及介质。该方法包括:利用训练数据集训练卷积神经模型,生成增量学习分类模型;将待测图像输入所述增量学习分类模型的特征提取器进行特征提取,输出所述待测图像的特征维度;获取所述特征提取器的每层卷积层的输出,将每层所述卷积层的输出与所述特征维度进行聚合计算,得到所述待测图像的特征嵌入;将所述特征嵌入输入所述增量学习分类模型的分类器进行分类,输出所述待测图像的类别结果。本发明专利技术还涉及区块链技术领域,上述特征维度、特征嵌入还可以存储于一区块链的节点中。中。中。

Image classification method, device, equipment and medium

【技术实现步骤摘要】
图像分类方法、装置、设备及介质


[0001]本专利技术涉及人工智能
,尤其涉及一种图像分类方法、装置、设备及介质。

技术介绍

[0002]随着深度神经网络的兴起,增量学习已应用在综多领域,例如,在图像分类、目标检测、语义分割等任务中。在增量学习的过程主要是如何克服深度学习模型在新任务上学习新知识进行训练的同时,模型对旧知识(旧任务)被遗忘或覆盖的问题。
[0003]目前主流的增量学习策略,例如,基于回放的增量学习方法、基于约束的增量学习方法及基于参数隔离的增量学习方法,虽然上述的方法能够较好地完成图像分类的任务,但是对于小数量新任务难以进行分类学习,由于每个任务所需学习的新分类数量少造成训练样本少和任务学习时间较长,对于小数量任务分类学习任务的表现效果较差。

技术实现思路

[0004]鉴于以上内容,本专利技术提供一种图像分类方法、装置、设备及介质,其目的在于解决现有技术中对小数量新任务难以进行图像分类学习的技术问题。
[0005]为实现上述目的,本专利技术提供一种图像分类方法,该方法包括:
[0006]利用训练数据集训练卷积神经模型,生成增量学习分类模型;
[0007]将待测图像输入所述增量学习分类模型的特征提取器进行特征提取,输出所述待测图像的特征维度;
[0008]获取所述特征提取器的每层卷积层的输出,将每层所述卷积层的输出与所述特征维度进行聚合计算,得到所述待测图像的特征嵌入;
[0009]将所述特征嵌入输入所述增量学习分类模型的分类器进行分类,输出所述待测图像的类别结果。
[0010]优选的,所述利用训练数据集训练卷积神经模型,生成增量学习分类模型,包括:
[0011]读取第一训练数据及第二训练数据,作为所述训练数据集;
[0012]将所述训练数据集输入所述卷积神经模型训练特征提取器和分类器,以生成所述增量学习分类模型。
[0013]优选的,所述将待测图像输入所述增量学习分类模型的特征提取器进行特征提取,输出所述待测图像的特征维度,包括:
[0014]将所述待测图像输入所述特征提取器的输入层,输入所述待测图像的特征图;
[0015]将所述特征图输入所述特征提取器的卷积层进行特征信息提取后,通过所述特征提取器的全连接层进行特征比对,输出所述待测图像的特征维度。
[0016]优选的,所述特征提取器包括两层以上的卷积层,所述获取所述特征提取器的每层卷积层的输出,将每层所述卷积层的输出与所述特征维度进行聚合计算,得到所述待测图像的特征嵌入,包括:
[0017]将每层所述卷积层的输出进行池化操作后,根据预设空间维度计算公式,对所述
待测分类图像的预设位置的特征进行聚合,以将所述待测分类图像的特征维度转换成空间维度的向量;
[0018]对所述特征提取器最后一层卷积层的输出进行约束,得到所述待测分类图像的平面约束参数;
[0019]将所述空间维度的向量和所述平面约束参数进行聚合,得到所述待测图像的特征嵌入。
[0020]优选的,所述预设空间维度计算公式,包括:
[0021][0022]其中,为所述待测图像的空间维度的向量,为第t

1时刻所述卷积神经模型的第一层卷积层输出,为第t时刻所述增量学习分类模型的第一层卷积层输出,为第t

1时刻所述卷积神经模型的的每层卷积层输出,为第t时刻所述增量学习分类模型的每层卷积层输出,C为所述待测图像的通道信息,W为所述待测图像的空间维度参数的高度信息,H为所述待测图像的空间维度参数的宽度信息,l为所述特征提取器的卷积层的数量,c为所述通道信息的数量,w为所述空间维度参数的特征维度,h为所述空间维度参数的宽度信息的特征维度。
[0023]优选的,所述将所述特征嵌入输入所述增量学习分类模型的分类器进行分类,输出所述待测图像的类别结果,包括:
[0024]将所述特征嵌入转换成多个表征向量后输入所述分类器进行计算,得到所述待测图像与所述训练数据集的每个类别的目标相似度;
[0025]将所述训练数据集的所有类别输入所述分类器进行两两类别之间的相似度计算,读取所有两两类别的相似度进行求均值,得到所述所有类别的平均相似度;
[0026]根据交叉熵损失函数,计算所述目标相似度与所述平均相似度之间交叉熵损失值,得到每个所述类别的概率分布值,从多个概率值选取最大的概率值对应的类别作为待测图像的类别结果。
[0027]优选的,所述交叉熵损失函数的计算公式,包括:
[0028][0029]其中,为所述训练数据集的每个类别的概率值,为所述所有类别的平均相似度,为所述待测图像与所述训练数据集的每个类别的目标相似度。
[0030]为实现上述目的,本专利技术还提供一种图像分类装置,所述装置包括:
[0031]生成模块:用于利用训练数据集训练卷积神经模型,生成增量学习分类模型;
[0032]提取模块:用于将待测图像输入所述增量学习分类模型的特征提取器进行特征提取,输出所述待测图像的特征维度;
[0033]计算模块:用于获取所述特征提取器的每层卷积层的输出,将每层所述卷积层的输出与所述特征维度进行聚合计算,得到所述待测图像的特征嵌入;
[0034]输出模块:用于将所述特征嵌入输入所述增量学习分类模型的分类器进行分类,输出所述待测图像的类别结果。
[0035]为实现上述目的,本专利技术还提供一种电子设备,所述电子设备包括:
[0036]至少一个处理器;以及,
[0037]与所述至少一个处理器通信连接的存储器;其中,
[0038]所述存储器存储有可被所述至少一个处理器执行的程序,所述程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行如权利要求1至7中任一项所述图像分类方法。
[0039]为实现上述目的,本专利技术还提供一种计算机可读介质,所述计算机可读介质存储有图像分类,所述图像分类被处理器执行时,实现如权利要求1至7中任一项所述图像分类方法的步骤。
[0040]本专利技术通过卷积神经模型训练小数量的新任务得到增量学习分类模型,当增量学习分类模型对待测图像提取特征维度后,利用知识蒸馏损失函数计算方法对于卷积神经模型的输出特征进行池化操作,根据池化后的特征和增量学习分类模型的输出特征进行差异计算,控制卷积神经模型与增量学习分类模型之间的相似度适应小数量新任务的特征嵌入,可以同时兼容新任务和旧任务的重要特征。
[0041]将待测图像与训练数据集的每个类别的目标相似度,与所有类别的平均相似度进行交叉熵损失值计算,得到待测图像的类别结果。将待测图像的特征嵌入转换成多个表征向量方式代替现有的单一表征向量方式,使每个样本的预测结果更接近真实类别,提高了增量学习分类模型对小数量新任务分类学习任务的表现效果。
附图说明
[0042]图1为本专利技术图像分类方法较佳实施例的流程图示意图;
[0043]图2为本专利技术图像分类装置本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种图像分类方法,其特征在于,所述方法包括:利用训练数据集训练卷积神经模型,生成增量学习分类模型;将待测图像输入所述增量学习分类模型的特征提取器进行特征提取,输出所述待测图像的特征维度;获取所述特征提取器的每层卷积层的输出,将每层所述卷积层的输出与所述特征维度进行聚合计算,得到所述待测图像的特征嵌入;将所述特征嵌入输入所述增量学习分类模型的分类器进行分类,输出所述待测图像的类别结果。2.如权利要求1所述的图像分类方法,其特征在于,所述利用训练数据集训练卷积神经模型,生成增量学习分类模型,包括:读取第一训练数据及第二训练数据,作为所述训练数据集;将所述训练数据集输入所述卷积神经模型训练特征提取器和分类器,以生成所述增量学习分类模型。3.如权利要求1所述的图像分类方法,其特征在于,所述将待测图像输入所述增量学习分类模型的特征提取器进行特征提取,输出所述待测图像的特征维度,包括:将所述待测图像输入所述特征提取器的输入层,输入所述待测图像的特征图;将所述特征图输入所述特征提取器的卷积层进行特征信息提取后,通过所述特征提取器的全连接层进行特征比对,输出所述待测图像的特征维度。4.如权利要求1所述的图像分类方法,其特征在于,所述特征提取器包括两层以上的卷积层,所述获取所述特征提取器的每层卷积层的输出,将每层所述卷积层的输出与所述特征维度进行聚合计算,得到所述待测图像的特征嵌入,包括:将每层所述卷积层的输出进行池化操作后,根据预设空间维度计算公式,对所述待测分类图像的预设位置的特征进行聚合,以将所述待测分类图像的特征维度转换成空间维度的向量;对所述特征提取器最后一层卷积层的输出进行约束,得到所述待测分类图像的平面约束参数;将所述空间维度的向量和所述平面约束参数进行聚合,得到所述待测图像的特征嵌入。5.如权利要求4所述的图像分类方法,其特征在于,所述预设空间维度计算公式,包括:
其中,为所述待测图像的空间维度的向量,为第t

1时刻所述卷积神经模型的第一层卷积层输出,为第t时刻所述增量学习分类模型的第一层卷积层输出,为第t

1时刻所述卷积神经模型的的每层卷积层输出,为第t时刻所述增量学习分类模型的每层卷积层输出,...

【专利技术属性】
技术研发人员:舒畅陈又新
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1