图像分类方法、装置、设备及存储介质制造方法及图纸

技术编号:37253922 阅读:22 留言:0更新日期:2023-04-20 23:31
本申请提出一种图像分类方法、装置、设备及存储介质,该方法包括:获取第一训练集,第一训练集包括多个图像,每个图像中均标注有各个图像类别对应的类别标签;构建用于进行多标签分类的第一神经网络模型的结构;根据第一训练集对构建的第一神经网络模型进行训练,得到多类别分类模型。本申请通过一个模型实现多个图像类别的同时分类。该模型通过双向长短期记忆网络学习不同类别的特征之间的相关性,学习到的特征具有更好的鲁棒性。若某个图像类别对应的分类准确性较低,还训练该图像类别对应的分支模型,利用分支模型对模型进行修正,解决个别图像类别分类准确性低的问题。采用交叉熵损失和平滑损失函数组合训练模型,训练更加平稳,效果更好。效果更好。效果更好。

【技术实现步骤摘要】
图像分类方法、装置、设备及存储介质


[0001]本申请属于图像处理
,具体涉及一种图像分类方法、装置、设备及存储介质。

技术介绍

[0002]目前,在网络中每天都会产生大量的图像,基于海量的图像可以为用户提供文字搜图、以图搜图等服务。在提供这些服务之前首先需要对图像进行分类。
[0003]相关技术中对每个图像类别都单独训练了分类模型,通过每个图像类别对应的分类模型分别从海量的图像中识别出各图像类别的图像。但随着图像类别数目的增加,分类模型的数量也线性增加,需要大量的模型训练操作,且通过多个分类模型分别进行分类处理,操作繁琐冗余,效率低下。且通过不同的分类模型分别进行分类处理,分类模型无法学习到不同图像类别之间的相关性,导致分类效果差。

技术实现思路

[0004]本申请提出一种图像分类方法、装置、设备及存储介质,基于标注了各个图像类别对应的类别标签的图像来训练多类别分类模型,使得多类别分类模型能够对多个图像类别的同时分类,只训练一个模型即可实现对多种图像类别的分类,效率高,操作简单。
[0005]本申请第一方面实施例提出了一种图像分类方法,包括:
[0006]获取第一训练集,所述第一训练集包括多个图像,每个图像中均标注有各个图像类别对应的类别标签;
[0007]构建用于进行多标签分类的第一神经网络模型的结构;
[0008]根据所述第一训练集对构建的所述第一神经网络模型进行训练,得到多类别分类模型。
[0009]在本申请的一些实施例中,所述构建用于进行多标签分类的第一神经网络模型的结构,包括:
[0010]将预设高效网络的输出端与双向长短期记忆网络的输入端连接,得到用于进行多标签分类的第一神经网络模型。
[0011]在本申请的一些实施例中,所述根据所述第一训练集对构建的所述第一神经网络模型进行训练,得到多类别分类模型,包括:
[0012]从所述第一训练集中获取多个图像;
[0013]将获取的图像输入构建的所述第一神经网络模型中,分别得到每个图像的分类结果;
[0014]根据所述每个图像的分类结果,通过交叉熵损失函数和平滑损失函数计算当前训练周期的损失值。
[0015]在本申请的一些实施例中,所述根据所述第一训练集对构建的所述第一神经网络模型进行训练,得到多类别分类模型之后,还包括:
[0016]获取待分类图像;
[0017]通过所述多类别分类模型对所述待分类图像进行分类处理,分别得到所述待分类图像属于各个图像类别的概率。
[0018]在本申请的一些实施例中,所述根据所述第一训练集对构建的所述第一神经网络模型进行训练,得到多类别分类模型之后,还包括:
[0019]分别确定所述多类别分类模型对每个图像类别进行分类的准确度;
[0020]若存在准确度低于预设阈值的第一图像类别,则训练所述第一图像类别对应的分支模型;
[0021]利用所述分支模型对所述多类别分类模型进行修正,得到修正后的多类别分类模型。
[0022]在本申请的一些实施例中,所述训练所述第一图像类别对应的分支模型,包括:
[0023]获取所述第一图像类别对应的第二训练集,所述第二训练集包括多个图像,每个图像中均标注有所述第一图像类别对应的类别标签;
[0024]构建用于对所述第一图像类别进行单独分类的第二神经网络模型的结构,所述第二神经网络模型包括所述第一图像类别对应的分支模型;
[0025]根据所述第二训练集对所述第二神经网络模型进行训练,得到训练好的所述分支模型。
[0026]在本申请的一些实施例中,所述构建用于对所述第一图像类别进行单独分类的第二神经网络模型的结构,包括:
[0027]将预设数目个全连接层依次串联,得到所述第一图像类别对应的分支模型;
[0028]将所述多类别分类模型中的预设高效网络的输出端与所述分支模型的输入端连接,得到用于对所述第一图像类别进行单独分类的第二神经网络模型。
[0029]在本申请的一些实施例中,所述利用所述分支模型对所述多类别分类模型进行修正,得到修正后的多类别分类模型,包括:
[0030]将训练好的所述分支模型的输入端与所述多类别分类模型中预设高效网络的输出端连接;
[0031]将所述分支模型的输出端通过融合模块与所述多类别分类模型中双向长短期记忆网络的输出端连接,得到修正后的多类别分类模型;
[0032]其中,所述融合模块,用于将所述分支模型输出的所述第一图像类别对应的第一分类结果和所述双向长短期记忆网络输出的所述第一图像类别对应的第二分类结果进行融合。
[0033]在本申请的一些实施例中,所述方法还包括:
[0034]获取待分类图像;
[0035]通过修正后的多类别分类模型对所述待分类图像进行分类处理,分别得到所述待分类图像属于各个图像类别的概率。
[0036]在本申请的一些实施例中,所述通过修正后的多类别分类模型对所述待分类图像进行分类处理,分别得到所述待分类图像属于各个图像类别的概率,包括:
[0037]通过所述修正后的多类别分类模型中的预设高效网络提取所述待分类图像的特征向量;
[0038]通过所述修正后的多类别分类模型中的所述分支模型对所述特征向量分类处理,得到所述待分类图像属于第一图像类别的第一概率;
[0039]通过所述修正后的多类别分类模型中的双向长短期记忆网络对所述特征向量分类处理,分别得到所述待分类图像属于各个图像类别的概率,其中包括所述待分类图像属于第一图像类别的第二概率;
[0040]将所述第一概率和所述第二概率进行融合,得到所述待分类图像属于所述第一图像类别的最终概率。
[0041]本申请第二方面的实施例提供了一种图像分类装置,包括:
[0042]获取模块,用于获取第一训练集,所述第一训练集包括多个图像,每个图像中均标注有各个图像类别对应的类别标签;
[0043]构建模块,用于构建用于进行多标签分类的第一神经网络模型的结构;
[0044]训练模块,用于根据所述第一训练集对构建的所述第一神经网络模型进行训练,得到多类别分类模型。
[0045]本申请第三方面的实施例提供了一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器运行所述计算机程序以实现上述第一方面所述的方法。
[0046]本申请第四方面的实施例提供了一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行实现上述第一方面所述的方法。
[0047]本申请实施例中提供的技术方案,至少具有如下技术效果或优点:
[0048]在本申请实施例中,通过训练多类别分类模型,通过一个神经网络模型实现多个图像类别的同时分类。该多类别分类模型中包括双向长短期记忆网络,通过双向长短期记忆网络可以学习到不同类别的特征之间的相关性,使得学习到的特征具有更好的鲁棒性。对本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种图像分类方法,其特征在于,包括:获取第一训练集,所述第一训练集包括多个图像,每个图像中均标注有各个图像类别对应的类别标签;构建用于进行多标签分类的第一神经网络模型的结构;根据所述第一训练集对构建的所述第一神经网络模型进行训练,得到多类别分类模型。2.根据权利要求1所述的方法,其特征在于,所述构建用于进行多标签分类的第一神经网络模型的结构,包括:将预设高效网络的输出端与双向长短期记忆网络的输入端连接,得到用于进行多标签分类的第一神经网络模型。3.根据权利要求1所述的方法,其特征在于,所述根据所述第一训练集对构建的所述第一神经网络模型进行训练,得到多类别分类模型,包括:从所述第一训练集中获取多个图像;将获取的图像输入构建的所述第一神经网络模型中,分别得到每个图像的分类结果;根据所述每个图像的分类结果,通过交叉熵损失函数和平滑损失函数计算当前训练周期的损失值。4.根据权利要求1

3任一项所述的方法,其特征在于,所述根据所述第一训练集对构建的所述第一神经网络模型进行训练,得到多类别分类模型之后,还包括:获取待分类图像;通过所述多类别分类模型对所述待分类图像进行分类处理,分别得到所述待分类图像属于各个图像类别的概率。5.根据权利要求1

3任一项所述的方法,其特征在于,所述根据所述第一训练集对构建的所述第一神经网络模型进行训练,得到多类别分类模型之后,还包括:分别确定所述多类别分类模型对每个图像类别进行分类的准确度;若存在准确度低于预设阈值的第一图像类别,则训练所述第一图像类别对应的分支模型;利用所述分支模型对所述多类别分类模型进行修正,得到修正后的多类别分类模型。6.根据权利要求5所述的方法,其特征在于,所述训练所述第一图像类别对应的分支模型,包括:获取所述第一图像类别对应的第二训练集,所述第二训练集包括多个图像,每个图像中均标注有所述第一图像类别对应的类别标签;构建用于对所述第一图像类别进行单独分类的第二神经网络模型的结构,所述第二神经网络模型包括所述第一图像类别对应的分支模型;根据所述第二训练集对所述第二神经网络模型进行训练,得到训练好的所述分支模型。7.根据权利要求6所述的方法,其特征在于,所述构建用于对所述第一图像类别进行单独分类的第二神经网络模型的结构,包括:将预设数目个全连接层依次串联,得到所述第一图像类别对应的分支模型;将所述多类别分类模型中的...

【专利技术属性】
技术研发人员:降小龙
申请(专利权)人:北京新氧科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1