一种图像分类方法、装置、电子设备及存储介质制造方法及图纸

技术编号:32517059 阅读:54 留言:0更新日期:2022-03-02 11:13
本公开关于一种图像分类方法、装置、电子设备及存储介质,包括:获取待分类图像;将所述待分类图像输入至预设多层神经网络中进行特征提取,得到每层神经网络的输出结果;将多个预设层神经网络的输出结果输入至多标签分类深度学习模型进行自注意力计算,得到所述待分类图像属于每个类别的概率。这样,结合待分类图像在每层神经网络的特征提取结果进行图像分类,由于底层神经网络的特征提取结果中往往包含更多的局部细节信息,因此,图像分类的结果也会参考到这些局部细节信息,减少局部细节信息经过多层卷积之后消失的情况,从而可以实现对待分类图像中的小目标的精准识别,提高多标签图像分类任务的精准度。标签图像分类任务的精准度。标签图像分类任务的精准度。

【技术实现步骤摘要】
一种图像分类方法、装置、电子设备及存储介质


[0001]本公开涉及图像处理领域,尤其涉及一种图像分类方法、装置、电子设备及存储介质。

技术介绍

[0002]多标签图像分类任务旨在将一个图像归类为所有他应该属于的类别,不同于最通常的单标签图像分类任务,多标签图像分类任务通常具有多个标签,这使得多标签分类网络更加难以实现、挑战性更大。通常的类别划分按照图像之中所有出现过的实体进行划分,实际应用之中一张图片里面往往不止一个实体,所以多标签分类任务是一个比单标签分类网络应用场景更加广泛的问题,在诸多下游任务中都有它的身影。
[0003]在多标签图像分类任务中,用由底向上逐步增加每一个像素点的感受野的卷积全值共享网络,其本意是利用逐层的卷积核渐渐得到语义层级高的上层信息,但是,在上述过程中,可能丢失了很多局部信息或者局部信息经过多层卷积之后到达上层已经不太正确,使得多标签图像分类任务的精准度降低。

技术实现思路

[0004]本公开提供一种图像分类方法、装置、电子设备及存储介质,以至少解决相关技术中多标签图像分类任务中可能丢失了很多局部信息或者局部信息经过多层卷积之后到达上层已经不太正确,使得多标签图像分类任务的精准度降低的问题。本公开的技术方案如下:
[0005]根据本公开实施例的第一方面,提供一种图像分类方法,包括:
[0006]获取待分类图像;
[0007]将所述待分类图像输入至预设多层神经网络中进行特征提取,得到每层神经网络的输出结果;
[0008]将多个预设层神经网络的输出结果输入至多标签分类深度学习模型进行特征提取,得到所述待分类图像属于每个类别的概率。
[0009]可选的,所述将所述待分类图像输入至预设多层神经网络中进行特征提取,得到每层神经网络的输出结果,包括:
[0010]对所述待分类图像进行图像增强处理,将图像增强处理后的待分类图像裁剪为预设尺寸的子图像;
[0011]将所述子图像输入至预设多层神经网络中进行特征提取,得到每层神经网络的输出结果。
[0012]可选的,所述将所述子图像输入至预设多层神经网络中进行特征提取,得到每层神经网络的输出结果,包括:
[0013]将所述子图像依次输入每层神经网络中进行特征提取,对每层神经网络的特征提取结果进行对应的池化操作,得到每层神经网络的输出结果。
[0014]可选的,所述将每层神经网络的输出结果输入至多标签分类深度学习模型进行特征提取,得到所述待分类图像属于每个类别的概率,包括:
[0015]将多个预设层神经网络的输出结果调整至预设尺寸,得到中间图像;
[0016]将所述中间图像输入至多标签分类深度学习模型进行自注意力计算,得到注意力分布图,所述注意力分布图中每个像素点的取值与所述中间图像内同一位置的像素点与所述中间图像的相关性成正比;
[0017]根据所述注意力分布图对所述多个预设层神经网络的输出结果进行加权处理,将加权处理结果输入至多层感知器,得到所述待分类图像属于每个类别的概率。
[0018]可选的,所述将多个预设层神经网络的输出结果输入至多标签分类深度学习模型进行自注意力计算,得到所述待分类图像属于每个类别的概率,包括:
[0019]将最后三层神经网络的输出结果输入至多标签分类深度学习模型进行自注意力计算,得到所述待分类图像属于每个类别的概率。
[0020]根据本公开实施例的第二方面,提供一种图像分类装置,包括:
[0021]获取单元,被配置为执行获取待分类图像;
[0022]特征提取单元,被配置为执行将所述待分类图像输入至预设多层神经网络中进行特征提取,得到每层神经网络的输出结果;
[0023]分类单元,被配置为执行将多个预设层神经网络的输出结果输入至多标签分类深度学习模型进行特征提取,得到所述待分类图像属于每个类别的概率。
[0024]可选的,所述特征提取单元,被配置为执行:
[0025]对所述待分类图像进行图像增强处理,将图像增强处理后的待分类图像裁剪为预设尺寸的子图像;
[0026]将所述子图像输入至预设多层神经网络中进行特征提取,得到每层神经网络的输出结果。
[0027]可选的,所述特征提取单元,被配置为执行:
[0028]将所述子图像依次输入每层神经网络中进行特征提取,对每层神经网络的特征提取结果进行对应的池化操作,得到每层神经网络的输出结果。
[0029]可选的,所述分类单元,被配置为执行:
[0030]将多个预设层神经网络的输出结果调整至预设尺寸,得到中间图像;
[0031]将所述中间图像输入至多标签分类深度学习模型进行自注意力计算,得到注意力分布图,所述注意力分布图中每个像素点的取值与所述中间图像内同一位置的像素点与所述中间图像的相关性成正比;
[0032]根据所述注意力分布图对所述多个预设层神经网络的输出结果进行加权处理,将加权处理结果输入至多层感知器,得到所述待分类图像属于每个类别的概率。
[0033]可选的,所述分类单元,被配置为执行:
[0034]将最后三层神经网络的输出结果输入至多标签分类深度学习模型进行自注意力计算,得到所述待分类图像属于每个类别的概率。
[0035]根据本公开实施例的第三方面,提供一种图像分类电子设备,包括:
[0036]处理器;
[0037]用于存储所述处理器可执行指令的存储器;
[0038]其中,所述处理器被配置为执行所述指令,以实现上述第一项所述的图像分类方法。
[0039]根据本公开实施例的第四方面,提供一种计算机可读存储介质,当所述计算机可读存储介质中的指令由图像分类电子设备的处理器执行时,使得图像分类电子设备能够执行上述第一项所述的图像分类方法。
[0040]根据本公开实施例的第五方面,提供一种计算机程序产品,包括计算机程序/指令,所述计算机程序/指令被处理器执行时实现上述第一项所述的图像分类方法。
[0041]本公开的实施例提供的技术方案至少带来以下有益效果:
[0042]获取待分类图像;将待分类图像输入至预设多层神经网络中进行特征提取,得到每层神经网络的输出结果;将每层神经网络的输出结果输入至多标签分类深度学习模型进行自注意力计算,得到所述待分类图像属于每个类别的概率。
[0043]这样,结合待分类图像在每层神经网络的特征提取结果进行图像分类,由于底层神经网络的特征提取结果中往往包含更多的局部细节信息,因此,图像分类的结果也会参考到这些局部细节信息,减少局部细节信息经过多层卷积之后消失的情况,从而可以实现对待分类图像中的小目标的精准识别,提高多标签图像分类任务的精准度。
[0044]应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
[0045]此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种图像分类方法,其特征在于,包括:获取待分类图像;将所述待分类图像输入至预设多层神经网络中进行特征提取处理,得到每层神经网络的输出结果;将多个预设层神经网络的输出结果输入至多标签分类深度学习模型进行自注意力计算,得到所述待分类图像属于每个类别的概率。2.根据权利要求1所述的图像分类方法,其特征在于,所述将所述待分类图像输入至预设多层神经网络中进行特征提取,得到每层神经网络的输出结果,包括:对所述待分类图像进行图像增强处理,将图像增强处理后的待分类图像裁剪为第一预设尺寸的子图像;将所述子图像输入至预设多层神经网络中进行特征提取,得到每层神经网络的输出结果。3.根据权利要求2所述的图像分类方法,其特征在于,所述将所述子图像输入至预设多层神经网络中进行特征提取,得到每层神经网络的输出结果,包括:将所述子图像依次输入每层神经网络中进行特征提取,对每层神经网络的特征提取结果进行对应的池化操作,得到每层神经网络的输出结果。4.根据权利要求1所述的图像分类方法,其特征在于,所述将多个预设层神经网络的输出结果输入至多标签分类深度学习模型进行自注意力计算,得到所述待分类图像属于每个类别的概率,包括:将多个预设层神经网络的输出结果调整至第二预设尺寸,得到中间图像;将所述中间图像输入至多标签分类深度学习模型进行自注意力计算,得到注意力分布图,所述注意力分布图中每个像素点的取值与所述中间图像内同一位置的像素点与所述中间图像的相关性成正比;根据所述注意力分布图对所述多个预设层神经网络的输出结果进行加权处理,将加权处理结果输入至多层感知器,得到所述待分类图像属于每个...

【专利技术属性】
技术研发人员:程星吴翔宇
申请(专利权)人:北京达佳互联信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1