一种图像分类的方法和装置制造方法及图纸

技术编号：31825394 阅读：15 留言：0更新日期：2022-01-12 12:51

本申请涉及图像处理领域，提供了一种图像分类的方法，包括：获取目标图像；对所述目标图像进行预处理，生成预设格式的特征图；对所述预设格式的特征图进行傅里叶逆变换，生成第一逆变换结果；对所述预设格式的特征图和所述第一逆变换结果进行拼接处理，生成第一拼接结果；对所述第一拼接结果进行特征提取，生成第一特征；根据所述第一特征确定图像分类结果。上述方法能够解决现有Transformer神经网络模型的计算时间长和内存占用较大的问题。型的计算时间长和内存占用较大的问题。型的计算时间长和内存占用较大的问题。

全部详细技术资料下载

【技术实现步骤摘要】
一种图像分类的方法和装置

[0001]本申请涉及图像处理领域，尤其涉及一种图像分类的方法和装置。

技术介绍

[0002]Transformer是一种基于自我注意机制的深度神经网络，不仅应用于自然语言处理领域而且还应用于图像处理领域，比如，将二维图像数据转化成一维序列以及对二维图像进行多尺度特征提取，但是Transformer神经网络模型极其复杂，从而导致该神经网络模型的内存占用较大、训练时间较长。
[0003]因此，如何减少现有Transformer神经网络模型的计算时间和内存占用是当前急需解决的问题。

技术实现思路

[0004]本申请提供了一种图像分类的方法和装置，能够解决现有Transformer神经网络模型的计算时间长和内存占用较大的问题。
[0005]第一方面，提供了一种图像分类的方法，包括：获取目标图像；对所述目标图像进行预处理，生成预设格式的特征图；对所述预设格式的特征图进行傅里叶逆变换，生成第一逆变换结果；对所述预设格式的特征图和所述第一逆变换结果进行拼接处理，生成第一拼接结果；对所述第一拼接结果进行特征提取，生成第一特征；根据所述第一特征确定图像分类结果。
[0006]上述方法可以由电子设备上的芯片执行。相比现有Transformer神经网络模型中使用复杂的自注意力层对预设格式的特征图进行多次卷积处理，本申请将现有Transformer神经网络模型中复杂的自注意力层使用傅里叶逆变换代替，形成新Transformer神经网络模型；该新Transformer神经网络...

【技术保护点】

【技术特征摘要】
1.一种图像分类的方法，其特征在于，所述方法包括：获取目标图像；对所述目标图像进行预处理，生成预设格式的特征图；对所述预设格式的特征图进行傅里叶逆变换，生成第一逆变换结果；对所述预设格式的特征图和所述第一逆变换结果进行拼接处理，生成第一拼接结果；对所述第一拼接结果进行特征提取，生成第一特征；根据所述第一特征确定图像分类结果。2.根据权利要求1所述的方法，其特征在于，根据所述第一特征确定图像分类结果，包括：对所述第一特征和所述第一逆变换结果进行拼接处理，生成第二拼接结果；通过至少一个分类网络对所述第二拼接结果进行分类处理，其中，所述至少一个分类网络中任意一个分类网络包括块合并模块、第一归一化层、傅里叶层、第二归一化层和多层感知机，所述块合并模块用于对输入所述分类网络的数据进行合并处理，所述第一归一化层用于对所述块合并模块的输出结果进行归一化处理，所述傅里叶层用于对所述第一归一化层的输出结果进行傅里叶逆变换处理，所述第二归一化层用于对所述块合并模块和所述傅里叶层的输出结果的拼接结果进行归一化处理，所述多层感知机用于对所述第二归一化层的输出结果进行特征提取处理。3.根据权利要求2所述的方法，其特征在于，还包括：通...

【专利技术属性】
技术研发人员：刘宝玉，王磊，马晓亮，程俊，
申请(专利权)人：中国科学院深圳理工大学筹，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人