一种图像分类方法、装置、电子设备及存储介质制造方法及图纸

技术编号：32517059 阅读：58 留言：0更新日期：2022-03-02 11:13

本公开关于一种图像分类方法、装置、电子设备及存储介质，包括：获取待分类图像；将所述待分类图像输入至预设多层神经网络中进行特征提取，得到每层神经网络的输出结果；将多个预设层神经网络的输出结果输入至多标签分类深度学习模型进行自注意力计算，得到所述待分类图像属于每个类别的概率。这样，结合待分类图像在每层神经网络的特征提取结果进行图像分类，由于底层神经网络的特征提取结果中往往包含更多的局部细节信息，因此，图像分类的结果也会参考到这些局部细节信息，减少局部细节信息经过多层卷积之后消失的情况，从而可以实现对待分类图像中的小目标的精准识别，提高多标签图像分类任务的精准度。标签图像分类任务的精准度。标签图像分类任务的精准度。

全部详细技术资料下载

【技术实现步骤摘要】
一种图像分类方法、装置、电子设备及存储介质

[0001]本公开涉及图像处理领域，尤其涉及一种图像分类方法、装置、电子设备及存储介质。

技术介绍

[0002]多标签图像分类任务旨在将一个图像归类为所有他应该属于的类别，不同于最通常的单标签图像分类任务，多标签图像分类任务通常具有多个标签，这使得多标签分类网络更加难以实现、挑战性更大。通常的类别划分按照图像之中所有出现过的实体进行划分，实际应用之中一张图片里面往往不止一个实体，所以多标签分类任务是一个比单标签分类网络应用场景更加广泛的问题，在诸多下游任务中都有它的身影。
[0003]在多标签图像分类任务中，用由底向上逐步增加每一个像素点的感受野的卷积全值共享网络，其本意是利用逐层的卷积核渐渐得到语义层级高的上层信息，但是，在上述过程中，可能丢失了很多局部信息或者局部信息经过多层卷积之后到达上层已经不太正确，使得多标签图像分类任务的精准度降低。

技术实现思路

[0004]本公开提供一种图像分类方法、装置、电子设备及存储介质，以至少解决相关技术中多标签图像分类任务中可能丢失了很多局部信息或者局部信息经过多层卷积之后到达上层已经不太正确，使得多标签图像分类任务的精准度降低的问题。本公开的技术方案如下：
[0005]根据本公开实施例的第一方面，提供一种图像分类方法，包括：
[0006]获取待分类图像；
[0007]将所述待分类图像输入至预设多层神经网络中进行特征提取，得到每层神经网络的输出结果；
[0008]将多个预设层神经...

【技术保护点】

【技术特征摘要】
1.一种图像分类方法，其特征在于，包括：获取待分类图像；将所述待分类图像输入至预设多层神经网络中进行特征提取处理，得到每层神经网络的输出结果；将多个预设层神经网络的输出结果输入至多标签分类深度学习模型进行自注意力计算，得到所述待分类图像属于每个类别的概率。2.根据权利要求1所述的图像分类方法，其特征在于，所述将所述待分类图像输入至预设多层神经网络中进行特征提取，得到每层神经网络的输出结果，包括：对所述待分类图像进行图像增强处理，将图像增强处理后的待分类图像裁剪为第一预设尺寸的子图像；将所述子图像输入至预设多层神经网络中进行特征提取，得到每层神经网络的输出结果。3.根据权利要求2所述的图像分类方法，其特征在于，所述将所述子图像输入至预设多层神经网络中进行特征提取，得到每层神经网络的输出结果，包括：将所述子图像依次输入每层神经网络中进行特征提取，对每层神经网络的特征提取结果进行对应的池化操作，得到每层神经网络的输出结果。4.根据权利要求1所述的图像分类方法，其特征在于，所述将多个预设层神经网络的输出结果输入至多标签分类深度学习模型进行自注意力计算，得到所述待分类图像属于每个类别的概率，包括：将多个预设层神经网络的输出结果调整至第二预设尺寸，得到中间图像；将所述中间图像输入至多标签分类深度学习模型进行自注意力计算，得到注意力分布图，所述注意力分布图中每个像素点的取值与所述中间图像内同一位置的像素点与所述中间图像的相关性成正比；根据所述注意力分布图对所述多个预设层神经网络的输出结果进行加权处理，将加权处理结果输入至多层感知器，得到所述待分类图像属于每个...

【专利技术属性】
技术研发人员：程星，吴翔宇，
申请(专利权)人：北京达佳互联信息技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人