渐进式训练多尺度信息检索网络的图像场景分类方法技术

技术编号：39496197 阅读：21 留言：0更新日期：2023-11-24 11:23

本发明专利技术公开一种渐进式训练多尺度信息检索网络的图像场景分类方法，主要解决现有遥感图像场景分类方法特征提取能力不足，受噪声样本影响的问题

全部详细技术资料下载

【技术实现步骤摘要】
渐进式训练多尺度信息检索网络的图像场景分类方法

[0001]本专利技术属于图像处理
，更进一步涉及图像分类
中的一种渐进式训练多尺度信息检索网络的图像场景分类方法
。
本专利技术可用于为遥感场景图像进行分类
。

技术介绍

[0002]在多种遥感技术中，遥感场景分类是一种基本的遥感判别技术，其目的是定义符合遥感场景内容的场景标签
。
准确的场景分类结果有利于不同的遥感任务和应用，如图像检索
、
土地覆盖分类
、
危害与环境监测
、
资源勘探
。
然而，由于遥感图像中包含的多元化的地理环境以及不同的土地利用类型，如山脉
、
河流
、
城市和湿地等，遥感场景相较于自然图像具有显著的复杂特征，理解遥感场景的复杂特征对于遥感图像场景分类方法具有实践意义
。
同时，在工程实践中由于遥感场景图像的土地覆被类别多
、
体量大等特征，使得对新获得的遥感场景进行标注十分困难
。
手动标记大规模遥感数据具备挑战性，耗时且费力，此外还要求从业人员具备专业知识
。
机器标记遥感数据的准确性还有待提高
。
由于神经网络强大的学习能力，错误标记的遥感场景会直接影响最终的分类性能
。
[0003]康健等人在其发表的论文“Noise
‑
tolerant deep neighborhood em...

【技术保护点】

【技术特征摘要】
1.
一种渐进式训练多尺度信息检索网络的图像场景分类方法，其特征在于，构建一个包含双孪生分支的多尺度信息检索网络，使用渐进式学习算法训练网络；该分类方法的步骤包括如下：步骤1，生成训练集：选取至少
P
张遥感图片组成训练集，训练集中至少包括
C
个遥感场景类别，每一个遥感场景类别中至少含有
N
张图片，并且该类别中含有
M
张噪声的遥感图片，其中，
N
大于或等于1，
M≤N
，
C
大于或等于2，
P
＝
C
×
N
；步骤2，搭建一个由结构相同的第一子网络和第二子网络并联组成双孪生分支结构的多尺度信息检索网络；每个子网络包括两个支路和四个尺度缩减层；所述第一支路由下采样模块
、
第一卷积模块
、
第二卷积模块
、
第三卷积模块
、
第四卷积模块依次串联组成；所述第二支路由拼接层
、Transformer
模块
、
分类器依次串联组成；第一支路中的第一至第四卷积模块分别与第一尺度至第四尺度缩减层相连后再与第二支路的拼接层相连接；第一支路中的第四卷积模块与第二支路的分类器相连；步骤3，采用反向学习策略，初步训练多尺度信息检索网络：将训练集输入到多尺度信息检索网络中，使用梯度下降法，迭代更新第一子网络的权重值，使用参数迁移法更新第二子网络的权重，直至网络的反向学习损失函数收敛为止，得到初步训练好的多尺度信息检索网络；步骤4，采用样本选择策略，进一步训练多尺度信息检索网络：将训练集输入到初步训练好的多尺度信息检索网络中，使用样本选择策略选择部分样本参与训练过程中交叉熵损失函数的计算；使用梯度下降法，迭代更新第一子网络的权重，使用参数迁移法更新第二子网络的权重，直至网络的交叉熵损失函数收敛为止，得到进一步训练好的多尺度信息检索网络；步骤5，采用重新标记策略，完成对多尺度信息检索网络的训练：将训练集输入到进一步训练好的多尺度信息检索网络中，使用重新标记策略为训练集中的训练样本重新分配标签；使用梯度下降法，迭代更新第一子网络的权重，使用参数迁移法更新第二子网络的权重，直至网络的交叉熵损失函数收敛为止，得到训练好的多尺度信息检索网络；步骤6，对遥感图像进行分类：将待分类的遥感图像输入到训练好的多尺度信息检索网络中，输出分类结果向量，该向量中包含与训练集中每一遥感场景类别相对应的概率值，将其中最大概率值所对应的类别作为待分类遥感图像的分类结果
。2.
根据权利要求1所述的渐进式训练多尺度信息检索网络的图像场景分类方法，其特征在于，步骤2中所述的下采样模块由卷积层，归一化层，激活层
、
最大池化层依次串联组成；将卷积层的输入通道数设置为
N
r
，
N
r
的取值与输入遥感场景图像的通道数相等，输出通道数设置为
64
，卷积核的大小设置为7×7，卷积步长设置为1，边界扩充值设置为1；将归一化层的通道数量设置为
64
；激活层使用
ReLU
激活函数实现；最大池化层的步长设置为
2。3.
根据权利要求1所述的渐进式训练多尺度信息检索网络的图像场景分类方法，其特征在于，步骤2中所述的第一卷积模块，第二卷积模块，第三卷积模块
、
第四卷积模块的结构为；第一卷积模块由第一残差块
、
第二残差块
、
最大池化层依次串联组成；第二卷积模块由
第三残差块
、
第四残差块
、
第五残差块
、
最大池化层依次串联组成；第三卷积模块由第六残差块
、
第七残差块
、
第八残差块
、
第九残差块
、
最大池化层依次串联组成；第四卷积模块由第十残差块
、
第十一残差块
、
最大池化层依次串联组成；将第一至第三卷积模块中的最大池化层的步长均设置为2；第四卷积模块中的最大池化层的步长设置为
7。4.
根据权利要求3所述的渐进式训练多尺度信息检索网络的图像场景分类方法，其特征在于，步骤2中所述第一卷积模块，第二卷积模块，第三卷积模块
、
第四卷积模块中第一至第十一残差块的结构均相同；每个残差块均由第一卷积层，第一批次归一化层，激活层，第二卷积层，第二批次归一化层依次串联组成；第一卷积层的输出与第二卷积层的输出相加；将第一
、
第二卷积层的卷积核大小均设置为3×3，卷积步长均设置为1，边界扩充值均设置为1；第一
、
第二批次归一化层的通道数与所属残差块的输出通道数相等；激活层使用
ReLU
激活函数实现；将第一至第十一残差块的输入通道数分别设置为
64
，
64
，
64
，
128
，
128
，
128
，
256
，
256
，
256
，
256
，
512
；输出通道数分别设置为
64
，
64
，
128
，
128
，
1...

【专利技术属性】
技术研发人员：唐旭，杜瑞琦，马晶晶，张向荣，焦李成，
申请(专利权)人：西安电子科技大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人