System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 图像分类方法、装置、计算机设备及存储介质制造方法及图纸_技高网

图像分类方法、装置、计算机设备及存储介质制造方法及图纸

技术编号:44303807 阅读:0 留言:0更新日期:2025-02-18 20:20
本申请实施例属于人工智能领域,涉及一种图像分类方法,包括:获取目标图像,并生成所述目标图像的目标特征向量;将所述目标特征向量输入图像分类模型中的编码器,得到所述编码器中各编码层输出的隐藏层特征状态,其中,所述各编码层添加有高斯模糊计算;通过层注意力机制给所述各编码层的隐藏层特征状态添加权重,并根据所述各编码层带有权重的隐藏层特征状态生成第一特征矩阵;对所述第一特征矩阵进行矩阵加权操作,并在矩阵加权后进行池化操作,得到分类向量;将所述分类向量输入所述图像分类模型中的分类器,得到所述目标图像的图像类别。本申请还提供一种图像分类装置、计算机设备及存储介质。本申请提高了图像分类的准确性。

【技术实现步骤摘要】

本申请涉及人工智能,尤其涉及一种图像分类方法、装置、计算机设备及存储介质


技术介绍

1、现有的图像分类技术主要依赖于深度学习模型,尤其是卷积神经网络(cnn)和基于转换器模型(transformer)的模型,并在图像分类任务中取得了显著进展。例如,在医疗图片分类领域,对舌苔图像进行自动分类从而判断病症类别,或者对医疗影像进行分类以判断是否存在肿瘤或者肿块。

2、由于某些领域(例如医疗领域)图像数据的稀缺性和复杂性,现有的图像分类技术在实际应用中仍然存在一些不足。首先,卷积神经网络如vgg和resnet,在处理复杂图像时,可能会丢失重要的特征,导致分类准确率较低。转换器模型由于其全局自注意力机制,在图像特征提取和分类上表现更好,但其层叠式结构容易导致深层次特征对早期层次特征的忽略,从而丢失重要的信息。此外,医疗领域的图像数据往往具有高度的稀疏性和特殊性,现有技术在面对训练集中未出现的图片时,容易过拟合,导致泛化能力不强,无法有效处理新出现的图片。这些问题都影响了图像分类的准确性。


技术实现思路

1、本申请实施例的目的在于提出一种图像分类方法、装置、计算机设备及存储介质,以解决图像分类准确性较低的问题。

2、为了解决上述技术问题,本申请实施例提供一种图像分类方法,采用了如下所述的技术方案:

3、获取目标图像,并生成所述目标图像的目标特征向量;

4、将所述目标特征向量输入图像分类模型中的编码器,得到所述编码器中各编码层输出的隐藏层特征状态,其中,所述各编码层添加有高斯模糊计算;

5、通过层注意力机制给所述各编码层的隐藏层特征状态添加权重,并根据所述各编码层带有权重的隐藏层特征状态生成第一特征矩阵;

6、对所述第一特征矩阵进行矩阵加权操作,并在矩阵加权后进行池化操作,得到分类向量;

7、将所述分类向量输入所述图像分类模型中的分类器,得到所述目标图像的图像类别。

8、为了解决上述技术问题,本申请实施例还提供一种图像分类装置,采用了如下所述的技术方案:

9、图像获取模块,用于获取目标图像,并生成所述目标图像的目标特征向量;

10、向量输入模块,用于将所述目标特征向量输入图像分类模型中的编码器,得到所述编码器中各编码层输出的隐藏层特征状态,其中,所述各编码层添加有高斯模糊计算;

11、权重添加模块,用于通过层注意力机制给所述各编码层的隐藏层特征状态添加权重,并根据所述各编码层带有权重的隐藏层特征状态生成第一特征矩阵;

12、加权池化模块,用于对所述第一特征矩阵进行矩阵加权操作,并在矩阵加权后进行池化操作,得到分类向量;

13、图像分类模块,用于将所述分类向量输入所述图像分类模型中的分类器,得到所述目标图像的图像类别。

14、为了解决上述技术问题,本申请实施例还提供一种计算机设备,采用了如下所述的技术方案:

15、获取目标图像,并生成所述目标图像的目标特征向量;

16、将所述目标特征向量输入图像分类模型中的编码器,得到所述编码器中各编码层输出的隐藏层特征状态,其中,所述各编码层添加有高斯模糊计算;

17、通过层注意力机制给所述各编码层的隐藏层特征状态添加权重,并根据所述各编码层带有权重的隐藏层特征状态生成第一特征矩阵;

18、对所述第一特征矩阵进行矩阵加权操作,并在矩阵加权后进行池化操作,得到分类向量;

19、将所述分类向量输入所述图像分类模型中的分类器,得到所述目标图像的图像类别。

20、为了解决上述技术问题,本申请实施例还提供一种计算机可读存储介质,采用了如下所述的技术方案:

21、获取目标图像,并生成所述目标图像的目标特征向量;

22、将所述目标特征向量输入图像分类模型中的编码器,得到所述编码器中各编码层输出的隐藏层特征状态,其中,所述各编码层添加有高斯模糊计算;

23、通过层注意力机制给所述各编码层的隐藏层特征状态添加权重,并根据所述各编码层带有权重的隐藏层特征状态生成第一特征矩阵;

24、对所述第一特征矩阵进行矩阵加权操作,并在矩阵加权后进行池化操作,得到分类向量;

25、将所述分类向量输入所述图像分类模型中的分类器,得到所述目标图像的图像类别。

26、与现有技术相比,本申请实施例主要有以下有益效果:在进行图像分类时,通过高斯模糊和层注意力机制,增强了模型对图像块之间关联性的捕捉能力;在编码器的多层结构中加入高斯模糊计算,模型提升对未见过图像数据的泛化能力,减少过拟合问题;层注意力机制使模型能够动态地分配不同的权重给每一层的隐藏特征状态,避免了传统堆叠模型中过深的层次信息丢失问题,确保浅层和深层特征都能对最终分类起到贡献;池化和矩阵加权操作进一步提取了最显著的特征信息,使分类器能够精准判断图像类别,这种层次化的特征处理提高了分类的准确性,在对复杂、稀缺图像进行分类时,可以提升分类的准确性。

本文档来自技高网...

【技术保护点】

1.一种图像分类方法,其特征在于,包括下述步骤:

2.根据权利要求1所述的图像分类方法,其特征在于,所述生成所述目标图像的目标特征向量的步骤包括:

3.根据权利要求1所述的图像分类方法,其特征在于,所述将所述目标特征向量输入图像分类模型中的编码器,得到所述编码器中各编码层输出的隐藏层特征状态的步骤包括:

4.根据权利要求3所述的图像分类方法,其特征在于,各编码层中多头注意力机制的输出结果表示为:

5.根据权利要求2所述的图像分类方法,其特征在于,所述通过层注意力机制给所述各编码层的隐藏层特征状态添加权重,并根据所述各编码层带有权重的隐藏层特征状态生成第一特征矩阵的步骤包括:

6.根据权利要求1所述的图像分类方法,其特征在于,所述对所述第一特征矩阵进行矩阵加权操作,并在矩阵加权后进行池化操作,得到分类向量的步骤包括:

7.根据权利要求1所述的图像分类方法,其特征在于,所述将所述分类向量输入所述图像分类模型中的分类器,得到所述目标图像的图像类别的步骤包括:

8.一种图像分类装置,其特征在于,包括:p>

9.一种计算机设备,其特征在于,包括存储器和处理器,所述存储器中存储有计算机可读指令,所述处理器执行所述计算机可读指令时实现如权利要求1至7中任一项所述的图像分类方法的步骤。

10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机可读指令,所述计算机可读指令被处理器执行时实现如权利要求1至7中任一项所述的图像分类方法的步骤。

...

【技术特征摘要】

1.一种图像分类方法,其特征在于,包括下述步骤:

2.根据权利要求1所述的图像分类方法,其特征在于,所述生成所述目标图像的目标特征向量的步骤包括:

3.根据权利要求1所述的图像分类方法,其特征在于,所述将所述目标特征向量输入图像分类模型中的编码器,得到所述编码器中各编码层输出的隐藏层特征状态的步骤包括:

4.根据权利要求3所述的图像分类方法,其特征在于,各编码层中多头注意力机制的输出结果表示为:

5.根据权利要求2所述的图像分类方法,其特征在于,所述通过层注意力机制给所述各编码层的隐藏层特征状态添加权重,并根据所述各编码层带有权重的隐藏层特征状态生成第一特征矩阵的步骤包括:

6.根据权利要求1所述的图像分类方法,其特...

【专利技术属性】
技术研发人员:舒畅陈又新
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1