当前位置: 首页 > 专利查询>安徽大学专利>正文

一种基于CBAM-AlexNet卷积神经网络的航拍场景分类方法技术

技术编号:34571805 阅读:19 留言:0更新日期:2022-08-17 13:03
本发明专利技术提供了一种基于CBAM

【技术实现步骤摘要】
一种基于CBAM

AlexNet卷积神经网络的航拍场景分类方法


[0001]本专利技术涉及场景分类
,具体而言,涉及一种基于CBAM

AlexNet卷积神经网络的航拍场景分类方法。

技术介绍

[0002]遥感影像是研究地球环境不可或缺的工具,使我们能够对地球表面的结构进行详细地测量,在对地观测任务中提供了准确可靠的数据源。目前可用的对地观测仪器(如多/高光谱、合成孔径雷达等)生成了越来越多不同分辨率的机载或卫星图像,从而提出了通过遥感影像实现对地观测这一任务的重要前提要求:如何高效地对机载或空间平台仪器获得的场景影像进行智能鉴别与分类。遥感影像场景分类任务的要求就是按照影像的主要内容给其分配一个具有唯一性的语义标签,从而了解该影像属于哪一种类别,这也是现代遥感技术研发的重要基石,所以它也成为了航空与卫星影像分类领域的一项重要科研热点。
[0003]在早期由于技术等原因,遥感影像的空间分辨率都非常低,因此像元的大小通常比感兴趣对象的大小更粗,最理想的情况也只是相似。所以在研究的初始阶段,大多数利用遥感影像进行图像分析的方法都是基于像元级,即为遥感影像中的每个像元分配一个特定的主题类。然而,随着遥感技术的进一步发展,遥感影像的像素被逐渐细化。感兴趣对象的组成也从单个像元变为多个像元,这大大增加了类内变化,单个像元不再是孤立的而是相互依赖构成了一个具有一定空间图案的图像。在这种情况下,单个像元在区分不同主题类时会迅速失去主题意义和判别效率,所以仅简单地依赖像元级对遥感场景影像进行有效解译,通常情况下是很困难的,有时候甚至是完全不可能的。
[0004]虽然像元级和面向对象两种分类方法在一些典型的土地利用和识别任务中展现出了不俗的性能表现,但随着图像空间分辨率的提高,遥感场景变成由不同的主题类组成,揭示这些主题类的上下文,即场景的语义信息,成为了研究中的重要内容。像元,甚至是超像元,承载的语义信息很少,显然不足以支持正确地识别主题类。随着机器学习和深度学习理论的快速发展,出现了另一种研究方向——基于语义层次的遥感影像场景分类,目的是将每个场景图像标记为特定的语义类别,这里所提及的场景图像多数情况下是指大尺度航空或卫星影像中包含的具有明确语义类别的局部区域。
[0005]在遥感技术兴起之后,遥感影像场景分类在各个方面都有着广泛的应用。然而遥感影像庞大的数量以及其几何结构和空间布局的高复杂性,远远超出了人工处理能力的范围,单靠人工无法进行及时、有效地处理,因此如何利用计算机进行有效且高效的分类就成为主要研究问题。为完成遥感影像场景分类这项具有挑战性的任务,人们在各种分类方法的开发上做出了巨大努力。

技术实现思路

[0006]本专利技术的目的是以AlexNet为基础,对其加以改进并加入CBAM注意力模块构成一个新的网络架构,提高航拍场景分类的准确度问题。与现有技术相比解决了航拍场景分类
精度不理想的缺陷。
[0007]本专利技术的第一方面提供了一种基于CBAM

AlexNet卷积神经网络的航拍场景分类方法,所述方法包括:
[0008]S1,获取待分类的航拍场景图像,并进行预处理;
[0009]S2,根据CBAM

AlexNet卷积神经网络模型对所述航拍场景图像进行航拍场景图像分类,并输出分类结果;其中,所述CBAM

AlexNet卷积神经网络模型中,在其模型的后两层卷积层中将激活函数设置为h

Swish函数,其余层则使用ReLU激活函数;所述CBAM

AlexNet卷积神经网络模型的卷积层中还包括有卷积块注意力模块CBAM。
[0010]进一步,所述方法还包括对CBAM

AlexNet卷积神经网络模型进行构建,包括:
[0011]S21,在构建CBAM

AlexNet卷积神经网络模型中,将使用BN层取代LRN层;对于激活函数,使用h

Swish函数代替部分ReLU激活函数,其余层仍然使用ReLU激活函数;所述h

Swish函数表示为:
[0012][0013]对于CBAM

AlexNet卷积神经网络模型的归一化层,采用全添加BN层方式;
[0014]S22,CBAM

AlexNet卷积神经网络模型卷积层中加入CBAM模块。
[0015]进一步,所述CBAM模块包括通道模块CAM以及空间模块SAM;
[0016]所述CBAM

AlexNet卷积神经网络模型卷积层中加入CBAM模块,包括:
[0017]S221,在所述通道模块CAM中,平均池化操作AvgPool和最大池化操作MaxPool被分别应用于输入特征;经两种池化操作后的特征被引入多层感知机MLP,以产生通道注意力图;以元素相加的方式将两个输出图结合起来计算通道注意子模块,通道注意力M
C
的表示:
[0018]M
C
(F)=σ(MLP(AvgPool(F))+MLP(MaxPool(F)));
[0019]其中,σ指的是应用的sigmod函数;
[0020]S222,在所述空间模块SAM中,空间模块SAM沿通道轴应用平均池化AvgPool和最大池化MaxPool过程,并通过卷积层生成空间注意图;空间注意M
S
的计算公式显示如下:
[0021]M
S
(F')=σ(f([AvgPool(F'),MaxPool(F')]));
[0022]式中,σ指的是sigmoid函数,f表示卷积层运算。
[0023]S223,将待训练的航拍场景图像输入到搭建好的CBAM

AlexNet卷积神经网络模型,并引入空间注意力及通道注意力,对待训练的航拍场景图像中的特征进行选择性训练;得到训练模型。
[0024]进一步,所述对待训练的航拍场景图像中的特征进行选择性训练,包括:
[0025]获取待训练的航拍场景识别数据集作为训练样本,并进行预处理;
[0026]基于构建的CBAM

AlexNet卷积神经网络模型,将待训练的航拍场景图像输入CBAM

AlexNet卷积神经网络模型,并引入空间注意力及通道注意力,对待训练的航拍场景图像中的特征进行选择性训练。
[0027]进一步,所述预处理包括:
[0028]对每张图像进行随机裁剪,制作出两张符合模型输入尺寸的图像,并且随机翻转,借此进行扩展训练样本数据。
[0029]本专利技术的第二方面提供了一种电子装置,所述电子装置包括:一个或多个处理器,存储器,所述存储器用于存储一个或多个计算机程序;其特征在于,所述计算机程序被配置成由所述一个或多个处理器执行,所述程序包括用于执行如权利要本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于CBAM

AlexNet卷积神经网络的航拍场景分类方法,其特征在于,所述方法包括:S1,获取待分类的航拍场景图像,并进行预处理;S2,根据CBAM

AlexNet卷积神经网络模型对所述航拍场景图像进行航拍场景图像分类,并输出分类结果;其中,所述CBAM

AlexNet卷积神经网络模型中,在其模型的后两层卷积层中将激活函数设置为h

Swish函数,其余层则使用ReLU激活函数;所述CBAM

AlexNet卷积神经网络模型的卷积层中还包括有卷积块注意力模块CBAM。2.根据权利要求1所述的基于CBAM

AlexNet卷积神经网络的航拍场景分类方法,其特征在于,所述方法还包括对CBAM

AlexNet卷积神经网络模型进行构建,包括:S21,在构建CBAM

AlexNet卷积神经网络模型中,将使用BN层取代LRN层;对于激活函数,使用h

Swish函数代替部分ReLU激活函数,其余层仍然使用ReLU激活函数;所述h

Swish函数表示为:对于CBAM

AlexNet卷积神经网络模型的归一化层,采用全添加BN层方式;S22,CBAM

AlexNet卷积神经网络模型卷积层中加入CBAM模块。3.根据权利要求2所述的基于CBAM

AlexNet卷积神经网络的航拍场景分类方法,其特征在于,所述CBAM模块包括通道模块CAM以及空间模块SAM;所述CBAM

AlexNet卷积神经网络模型卷积层中加入CBAM模块,包括:S221,在所述通道模块CAM中,平均池化操作AvgPool和最大池化操作MaxPool被分别应用于输入特征;经两种池化操作后的特征被引入多层感知机MLP,以产生通道注意力图;以元素相加的方式将两个输出图结合起来计算通道注意子模块,通道注意力M
C
的表示:M
C
(F)=σ(MLP(AvgP...

【专利技术属性】
技术研发人员:赵晋陵刘盼储国民黄林生雷雨汪传建黄文江
申请(专利权)人:安徽大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1