System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 基于MCA注意力机制高效网络的遥感图像场景分类方法技术_技高网
当前位置: 首页 > 专利查询>无锡学院专利>正文

基于MCA注意力机制高效网络的遥感图像场景分类方法技术

技术编号:43307218 阅读:6 留言:0更新日期:2024-11-12 16:23
本发明专利技术公开了一种基于MCA注意力机制高效网络的遥感图像场景分类方法,该方法包括:获取遥感图像数据集并按比例划分为训练样本和测试样本;对遥感图像数据集进行预处理;构建MCA注意力模块;构建MCA‑EfficientNet B0网络模型;在MCA‑EfficientNet B0中加载ImageNet1K数据集上的预训练权重,然后将训练样本输入到网络模型中,通过反向传播算法不断优化带权重的交叉熵损失函数,调整网络参数,最后得到训练好的网络模型;将测试样本输入到训练好的网络模型中,得到遥感图像场景分类结果;与传统方法相比,本发明专利技术保持了较低的参数量和计算量,同时有着较好的遥感图像场景分类准确率。

【技术实现步骤摘要】

本专利技术涉及图像分类,特别是涉及一种基于mca注意力机制高效网络的遥感图像场景分类方法。


技术介绍

1、近年来,随着卫星和航空遥感技术的不断进步,遥感图像的分辨率越来越高,蕴含的地物信息也越来越丰富。这些高分辨率遥感图像在土地利用、资源调查、自然灾害观测等领域得到了广泛的应用。然而,随着分辨率的增加,遥感图像的语义信息变得更加复杂,其空间纹理也变得更加多样,同时,类内的差异显著,而类间的差异却相对较小。因此,如何快速准确的对遥感图像进行场景分类已经成为计算机视觉领域的一个研究热点。

2、早期的遥感图像场景分类方法主要包括基于手工特征的方法和基于中层特征的方法。基于手工特征的方法是指利用人工设计的特征来描述遥感图像的内容,如颜色、纹理、结构等传统图像处理的特征。这些特征提取的过程比较耗时,且通常难以覆盖图像中的所有信息,无法适应复杂和多变的遥感图像场景。基于中层特征的方法是指对低层视觉特征进行编码和汇聚,以获得更具判别力和表达力的特征。这种方法通常需要复杂的特征工程和大量的参数调整,而且在处理高内在维度的数据时可能会遇到维度灾难。

3、最近的十多年来,人工智能和深度学习飞速发展,以卷积神经网络(convolutional neural network,cnn)和transformer为代表的深度学习模型在图像分类、目标检测、自然语言处理等领域取得了重要的进展。通过端到端的训练,深度神经网络能够自动学习和提取高层次的抽象特征,避免了繁琐的特征工程,在理解图像内容和提高场景分类的准确性方面表现出色。因此,不少的专家学者将其运用到遥感图像场景分类任务中。在这其中,轻量级卷积神经网络表现尤为出色。它们相比大型网络有着更少的参数量和计算量,同时还可以保持一定的分类性能,可以便捷的部署在资源受限的移动设备和嵌入式系统中。efficientnet b0网络作为一种具有代表性的轻量级cnn,它通过神经网络架构搜索(neural architecture search,nas)设计得到,优化了准确性和效率。其核心优点在于使用了一种复合缩放方法,这种方法通过平衡网络的深度、宽度和分辨率来提高性能。

4、尽管efficientnet b0是基于高效率设计原则构建的,在一般的图像分类任务中表现出色,但在处理特别复杂或细节丰富的图像数据时,如高分辨率的遥感图像,它可能无法完全捕捉到所有的细微特征和语义信息。


技术实现思路

1、为了解决以上技术问题,本专利技术提供一种基于mca注意力机制高效网络的遥感图像场景分类方法,包括以下步骤:

2、s1、获取遥感图像数据集,并按比例划分为训练样本和测试样本;

3、s2、对遥感图像数据集进行预处理,预处理包括裁剪、数据增强以及标准化;

4、s3、在坐标注意力ca中加入最大池化,构建mca注意力模块;

5、s4、在efficientnet b0卷积神经网络的最后一个卷积层之后、平均池化和全连接层之前插入mca注意力模块,构建mca-efficientnet b0网络模型;

6、s5、在mca-efficientnet b0网络模型中加载imagenetlk数据集上的预训练权重,然后将训练样本输入到mca-efficientnet b0网络模型中,通过反向传播算法不断优化带权重的交叉熵损失函数,调整网络参数,最后得到训练好的网络模型;

7、s6、将测试样本输入到训练好的网络模型中,得到遥感图像场景分类结果。

8、本专利技术进一步限定的技术方案是:

9、进一步的,步骤s1中,对uc merced land-use、aid和nwpu-resisc45三个遥感图像场景分类数据集分别按照8∶2、5∶5和2∶8的比例划分训练样本及测试样本。

10、如前所述的基于mca注意力机制高效网络的遥感图像场景分类方法,步骤s2中,将遥感图像数据集中的图像裁剪为224×224分辨率,然后以概率p水平翻转图像,最后对图像数据进行标准化处理。

11、如前所述的基于mca注意力机制高效网络的遥感图像场景分类方法,步骤s2中,概率p设置为0.5。

12、如前所述的基于mca注意力机制高效网络的遥感图像场景分类方法,步骤s3中,在坐标信息嵌入阶段,对于输入x,首先沿着水平坐标和垂直坐标对每个通道分别进行平均池化和最大池化的编码操作,然后使用1×1的卷积和relu激活函数对每个通道进行独立的处理;最后,再将两种池化的结果进行逐元素的加和操作;因此高度为h的第c通道的输出为:

13、

14、同样,宽度为w的第c通道的输出为:

15、

16、其中,xc(h,i)表示高度为h的第c通道的特征,xc(j,w)表示宽度为w的第c通道的特征;w表示特征图的宽度,h表示特征图的高度;f1为卷积操作;δ为激活函数。

17、如前所述的基于mca注意力机制高效网络的遥感图像场景分类方法,步骤s3中,在坐标注意力生成阶段,将两种变换的输出进行拼接操作,然后使用1×1的卷积变换函数f1对拼接后的特征进行变换操作:

18、f=δ(f1([zh,zw]))

19、其中,[·,·]表示沿空间维度的拼接操作;zh为垂直方向的特征;zw为水平方向的特征;δ表示非线性激活函数;f表示对空间信息在水平方向和垂直方向进行编码的中间特征映射;r是se块中的缩减率,通过控制r来增大或者减小f的通道数;

20、然后,沿空间维度把f分解成两个张量和其中,c/r表示使用se块缩减后的通道数,为实数矢量空间,fh为垂直方向的张量,fw为水平方向的张量;

21、再用另外两个1×1卷积变换fh和fw分别把fh和fw变换为与输入x通道数相同的张量,得到:

22、gh=σ(fh(fh))

23、gw=σ(fw(fw))

24、其中,σ为sigmoid激活函数,gh和gw分别为c×h×1和c×1×w的特征图;接着进行扩展并作为注意力权重;最后的输出y表示为:

25、

26、其中,xc(i,j)为第c通道的输入,为垂直方向的注意力权重,为水平方向的注意力权重。

27、如前所述的基于mca注意力机制高效网络的遥感图像场景分类方法,步骤s5具体包括以下分步骤:

28、s5.1、通过3×3的卷积层,提取浅层信息;

29、s5.2、依次通过7个mbconv模块,提取深层特征;

30、s5.3、通过一个3×3卷积层,进一步提取特征;

31、s5.4、通过mca注意力模块,对关键信息进行聚合;

32、s5.5、最后通过平均池化和全连接层,得到训练样本的分类结果。

33、如前所述的基于mca注意力机制高效网络的遥感图像场景分类方法,步骤s1中,ucmerced land-use数据集共包含21个场景类别的遥感图像本文档来自技高网...

【技术保护点】

1.一种基于MCA注意力机制高效网络的遥感图像场景分类方法,其特征在于:包括以下步骤:

2.根据权利要求1所述的基于MCA注意力机制高效网络的遥感图像场景分类方法,其特征在于:所述步骤S1中,对UC Merced Land-Use、AID和NWPU-RESISC45三个遥感图像场景分类数据集分别按照8∶2、5∶5和2∶8的比例划分训练样本及测试样本。

3.根据权利要求1所述的基于MCA注意力机制高效网络的遥感图像场景分类方法,其特征在于:所述步骤S2中,将遥感图像数据集中的图像裁剪为224×224分辨率,然后以概率p水平翻转图像,最后对图像数据进行标准化处理。

4.根据权利要求3所述的基于MCA注意力机制高效网络的遥感图像场景分类方法,其特征在于:所述步骤S2中,概率p设置为0.5。

5.根据权利要求1所述的基于MCA注意力机制高效网络的遥感图像场景分类方法,其特征在于:所述步骤S3中,在坐标信息嵌入阶段,对于输入X,首先沿着水平坐标和垂直坐标对每个通道分别进行平均池化和最大池化的编码操作,然后使用1×1的卷积和ReLu激活函数对每个通道进行独立的处理;最后,再将两种池化的结果进行逐元素的加和操作;因此高度为h的第c通道的输出为:

6.根据权利要求5所述的基于MCA注意力机制高效网络的遥感图像场景分类方法,其特征在于:所述步骤S3中,在坐标注意力生成阶段,将两种变换的输出进行拼接操作,然后使用1×1的卷积变换函数F1对拼接后的特征进行变换操作:

7.根据权利要求1所述的基于MCA注意力机制高效网络的遥感图像场景分类方法,其特征在于:所述步骤S5具体包括以下分步骤:

8.根据权利要求2所述的基于MCA注意力机制高效网络的遥感图像场景分类方法,其特征在于:所述步骤S1中,UC Merced Land-Use数据集共包含21个场景类别的遥感图像,场景类别包括飞机、海滩、棒球场以及建筑,每个场景类别包括100张大小为256×256像素的图像,共计2100张,图像的空间分辨率为0.3m。

9.根据权利要求2所述的基于MCA注意力机制高效网络的遥感图像场景分类方法,其特征在于:所述步骤S1中,AID数据集共包含30个场景类别的遥感图像,场景类别包括机场、桥梁、教堂以及密集住宅,每个场景类别包括220~420张大小为600×600像素的图像,共计10000张,图像的空间分辨率在0.5~8米之间变化。

10.根据权利要求2所述的基于MCA注意力机制高效网络的遥感图像场景分类方法,其特征在于:所述步骤S1中,NWPU-RESISC45数据集共包含45个场景类别的遥感图像,每个场景类别包括700张大小为256×256像素的图像,共计31500张,图像的空间分辨率在0.2~30米之间变化。

...

【技术特征摘要】

1.一种基于mca注意力机制高效网络的遥感图像场景分类方法,其特征在于:包括以下步骤:

2.根据权利要求1所述的基于mca注意力机制高效网络的遥感图像场景分类方法,其特征在于:所述步骤s1中,对uc merced land-use、aid和nwpu-resisc45三个遥感图像场景分类数据集分别按照8∶2、5∶5和2∶8的比例划分训练样本及测试样本。

3.根据权利要求1所述的基于mca注意力机制高效网络的遥感图像场景分类方法,其特征在于:所述步骤s2中,将遥感图像数据集中的图像裁剪为224×224分辨率,然后以概率p水平翻转图像,最后对图像数据进行标准化处理。

4.根据权利要求3所述的基于mca注意力机制高效网络的遥感图像场景分类方法,其特征在于:所述步骤s2中,概率p设置为0.5。

5.根据权利要求1所述的基于mca注意力机制高效网络的遥感图像场景分类方法,其特征在于:所述步骤s3中,在坐标信息嵌入阶段,对于输入x,首先沿着水平坐标和垂直坐标对每个通道分别进行平均池化和最大池化的编码操作,然后使用1×1的卷积和relu激活函数对每个通道进行独立的处理;最后,再将两种池化的结果进行逐元素的加和操作;因此高度为h的第c通道的输出为:

6.根据权利要求5所述的基于mca注意力机制高效网络的遥感图像场景分类方法,其特征在于:所述步骤s3...

【专利技术属性】
技术研发人员:李子奇李丹阳张永宏尹贺峰王振宇
申请(专利权)人:无锡学院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1