一种小样本遥感图像场景分类方法技术

技术编号：37978701 阅读：9 留言：0更新日期：2023-06-30 09:53

本发明专利技术公开了一种小样本遥感图像场景分类方法，属于图像感知领域。该方法首先将遥感图像场景分类数据集划分为训练集、验证集和测试集；接着基于上述数据集分别构建情景集；接着构建基于注意力机制的深度近邻神经网络模型；接着基于情景集对基于注意力机制的深度近邻神经网络模型进行训练及验证；最后基于情景集对训练好的基于注意力机制的深度近邻神经网络模型进行测试。本发明专利技术针对遥感图像场景分类中场景背景复杂的问题，提出了基于注意力机制的深度神经网络模型，引入情景训练方式，采用深度局部描述子进行特征表示，引入了注意力机制得到场景类别相关的注意力图，将深度局部描述子区分为与场景相关和无关的两部分，基于度量模块计算查询图像的局部描述子与类别之间的相似性，并利用注意力图进行加权求和，解决了小样本遥感图像场景分类问题。决了小样本遥感图像场景分类问题。决了小样本遥感图像场景分类问题。

全部详细技术资料下载

【技术实现步骤摘要】
一种小样本遥感图像场景分类方法

[0001]本专利技术属于图像感知领域，特别是指一种小样本遥感图像场景分类方法，可用于对小样本遥感图像进行分类，为环境感知提供支撑。

技术介绍

[0002]遥感是远距离获取目标信息的一种探测技术，随着遥感技术的快速发展，遥感图像在军事和民用领域都发挥着越来越重要的作用。场景分类根据图像内容将每个遥感图像划分为不同的场景类别，是理解遥感图像的重要手段，可以实际应用于自然灾害检测、城市规划、环境监测、植被制图、土地覆盖分析等领域。
[0003]近年来，深度学习在遥感图像场景分类任务中取得了令人鼓舞的成绩。然而这些优秀的模型在很大程度上依赖于大量的标记训练样本。在实际应用中，由于遥感影像的特殊性，获取大量人工标注的高分辨率遥感图像是非常困难和耗时的，特别是对于军事设施等特殊场景(例如，导弹位置，军事区域)。一旦可用的标记数据不足，深度学习模型就会有过拟合的风险从而导致性能下降。因此，在标记样本较少的情况下，遥感图像场景分类问题已成为一项紧迫而重要的研究任务。
[0004]小样本场景分类网络可以直接对训练集中不存在的新场景进行分类，省去了标记图像以及重新训练的成本。但是现有的小样本图像分类网络通常是应用在自然图像，遥感图像与自然场景图像的差异非常显著。由于遥感图像以一种鸟瞰的俯视角度拍摄，不可避免地包含与场景语义类别无关的对象，会对分类性能造成不利干扰。例如在篮球场中，主要的目标物体是篮球场区域，但在图像中也存在一些不相关的物体，如汽车、建筑物和植物。类似的情况也出现在环形路口...

【技术保护点】

【技术特征摘要】
1.一种小样本遥感图像场景分类方法，其特征在于，包括如下步骤：步骤1，将遥感图像场景分类数据集划分为训练集、验证集和测试集；步骤2，基于上述数据集分别构建情景集；步骤3，构建基于注意力机制的深度近邻神经网络模型；步骤4，基于情景集对基于注意力机制的深度近邻神经网络模型进行训练及验证；步骤5，基于情景集对训练好的基于注意力机制的深度近邻神经网络模型进行测试。2.根据权利要求1所述的一种小样本遥感图像场景分类方法，其特征在于，步骤1所述的遥感图像场景分类数据集的划分方式为：1a)将遥感图像场景分类数据集用D
total
表示，训练集用D
train
表示，验证集D
val
用表示，测试集用D
test
表示；1b)将遥感图像场景分类数据集中的一部分类别划分为训练集D
train
，将剩余的一部分类别划分为验证集D
val
，将最后的类别划分为测试集D
test
；其中，；其中，D
train
∪D
val
∪D
test
＝D
total
。3.根据权利要求1所述的一种小样本遥感图像场景分类方法，其特征在于，步骤2所述的基于情景训练方法构建情景集的具体方式为：2a)从数据集中随机选取C个类别，每个类别K个样本，将抽取到的样本集合作为支持集S＝{(s
i
,y
i
)|i＝1,...,C
×
K}，其中s
i
表示支持样本集中的第i个样本，y
i
表示对应的标签；2b)在支持集中每个类别的剩余样本中随机选取N个样本，得到对应的查询集其中q
i
表示查询集中第j个样本，表示对应的标签；支持集与查询集不存在交集，即1个支持集和1个查询集构成1个情景集。4.根据权利要求1所述的一种小样本遥感图像场景分类方法，其特征在于，步骤3所述的基于注意力机制的深度近邻神经网络模型的构建方式为：3a)将基于注意力机制的深度近邻神经网络模型分为2个模块，分别为基于注意力机制的深入嵌入模块和度量模块3b)基于注意力机制的深入嵌入模块的构建方式为：3b
‑
1)使用卷积神经网络Conv
‑
64F、VGG16、ResNet18或ResNet50作为深度嵌入模块；3b
‑
2)经过深度嵌入模块提取后的深度特征f
ψ
(X
image
)是一个大小为h
×
w
×
d的张量，其中w、h、d分别表示深度嵌入模块提取特征图的宽度、高度和通道数，将其视为m个d维的深度描述子的集合：f
ψ
(X
image
)＝[x1,x2,...,x
m
]∈R
d
×
m
式中，m＝h
×
w，x
i
是第i个深度局部描述子，R
d
×
m
表示元素为实数的d行m列矩阵；3b
‑
3)采用类别相关注意力模块为深度嵌入模块引入注意力机制，将深度局部描述子区分为与场景相关部分和不相干部分，即为由深度嵌入模块得到的特征图中的每一个像素点构建一...

【专利技术属性】
技术研发人员：陈彦桥，柴兴华，朱良彬，张小龙，李阳阳，毛鹤亭，
申请(专利权)人：中国电子科技集团公司第五十四研究所，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人