System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于多尺度查询的Maskformer耕地地块识别方法技术_技高网

一种基于多尺度查询的Maskformer耕地地块识别方法技术

技术编号:44265265 阅读:0 留言:0更新日期:2025-02-14 22:08
本发明专利技术提供了一种基于多尺度查询的Maskformer耕地地块识别方法,该方法包括:基于Maskformer模型构建MSQformer模型,其中,MSQformer模型包括多尺度特征提取与嵌入模块、mask生成模块、多尺度mask融合模块及分割预测模块,基于预设的数据集对MSQformer模型进行训练,得到训练后的MSQformer模型,基于训练后的MSQformer模型进行耕地地块识别。本发明专利技术借助多个查询来增加耕地块mask预测的准确性,同时基于每个查询和相应尺度的特征图进行耕地块mask的预测,提高了预测精度。

【技术实现步骤摘要】

本专利技术涉及耕地地块识别,特别是涉及一种基于多尺度查询的maskformer耕地地块识别方法。


技术介绍

1、耕地块作为农田的基本单位,是农田信息提取的关键,这对于农业信息调查农业发展和估产、种植模式推广等非常重要。随着高分辨率遥感影像可获得性的不断增加,耕地边界自动化提取研究得到有利支持。然而,由于不同的成像条件、复杂的背景特征和不断变化的时间阶段的影响,基于高分辨率遥感图像智能地获得高精度农田边界仍然是一个挑战。

2、深度神经网络在许多计算机视觉任务中取得显著突破,语义分割网络如u-net、deeplab等可以提供了逐像素的预测,应用到耕地提取任务中。大部分基于深度学习的耕地提取工作将语义分割与边缘检测结合起来,以提高地块边界的检测精度。现有方法通常是基于卷积神经网络的,通过局部连接、权值共享和采样,可以自动从训练数据中隐式学习高级深度特征,但这类方法往往缺乏长距离依赖关系的捕获能力,在更广泛的应用中提取性能受到限制。自vit在计算机视觉领域提出应用以来,基于transformer的模型借助优越的长程建模能力取得了非凡的成就,成为语义分割的新标准范式。在此基础上,有人将transformer方法改进应用到耕地提取任务中,为提高复杂场景下耕地提取精度提供了研究参考。考虑到耕地块对象是封闭连续的区域,基于掩膜分类的方法可能是一种新的思路,其中一类基于tranformer进行掩膜分类的代表模型是maskformer,特别适合处理遥感场景中类内方差大、类间方差小影像特征。mask分类是预测一组二进制掩码,并为每个mask分配单个类别。

3、然而,将maskformer应用到耕地提取中仍面临着一些问题。首先,maskformer通过降采样的特征图进行mask生成,而耕地提取往往面临着多尺度效应和跟耕地数量较多的情况,导致耕地块的复杂轮廓可能被忽视或变得模棱两可。其次,maskformer在类别单一但对象个数较多的耕地任务上进行语义分割,其实质是将所有耕地块合并为一个对象预测mask,通过单一的查询向量来找全找准所有耕地块比较困难,这不可避免地造成部分地块漏识别、地块合并。因此,设计一种基于多尺度查询的maskformer耕地地块识别方法是十分有必要的。


技术实现思路

1、为了克服现有技术的不足,本专利技术的目的是提供一种基于多尺度查询的maskformer耕地地块识别方法。

2、为实现上述目的,本专利技术提供了如下方案:

3、本专利技术提供了一种基于多尺度查询的maskformer耕地地块识别方法,包括:

4、基于maskformer模型构建msqformer模型,其中,msqformer模型包括多尺度特征提取与嵌入模块、mask生成模块、多尺度mask融合模块及分割预测模块;

5、基于预设的数据集对msqformer模型进行训练,得到训练后的msqformer模型;

6、基于训练后的msqformer模型进行耕地地块识别。

7、优选地,所述多尺度特征提取与嵌入模块用于通过骨干网络提取多尺度特征,并将最后的特征图作为嵌入特征输入transformer decoder进行解码,具体为:

8、将采集到的影像rgb∈rh×w输入骨干网络resnet50进行特征提取,得到降分辨率特征图尺度其中,cf为影像特征的通道维度,si=23+i(i=1,2,3,4),将其输入transformer decoder中进行语义解码,其中,transformer decoder由若干个transformer decoder layer堆叠组成,对同一个transformer decoder产生不同数量的查询向量以生成对应尺度的隐层特征其中cq为查询向量维度,ni为查询向量个数,ch为隐层特征维度,i=1,2,3,最终获取多尺度下一一对应的隐层特征和影像特征。

9、优选地,所述mask生成模块用于根据每个尺度下的隐层特征及影响特征生成预测mask,具体为:

10、将图像分割为2个区域,用二值掩码{mi|mi∈[0,1]h×w}表示,其中i=0,1表示类别为背景或耕地,将所有的耕地对象都作为一个整体区域包含在一个mask中,隐层特征中包含各个类别全局的mask信息,将隐层特征与影像特征分别经过全连接层与卷积层,得到mask嵌入向量和像素嵌入向量二者相乘得到预测其中,si=23+i且i=1,2,3。

11、优选地,所述多尺度mask融合模块用于进行多尺度的预测mask的融合,具体为:

12、基于多尺度mask融合模块逐级融合不同尺度的其中si=23+i且i=1,2,3,其中,低分辨率的mask并通过一层卷积和上采样操作与较高分辨率的mask进行融合,以此类推完成三个尺度下不同分辨率mask的融合,用于得到更精细地块和边界,最终将输入分割预测模块进行分割。

13、优选地,所述分割预测模块用于根据融合后的mask进行分割预测,具体为:

14、基于transformer decoder输出的第三个尺度的隐层特征通过一层全连接层来生成类别预测向量其中,k为类别数,与fused mask进行点乘操作并使用sigmoid函数激活得到预测结果,将预测掩膜上采样至原始分辨率大小得到分割结果seg∈rk×h×w。

15、优选地,所述msqformer模型采用交叉熵分类损失、二值掩模损失以及边缘损失的和作为总损失,其中mask损失包括权重分别为λfocal=20.0和λdice=1.0的focal loss和dice loss:

16、lclass=lcross_entropy(c,cgt)       (1)

17、lmask=λfocal·lfocal(m,mgt)+λdice·ldice(m,mgt)      (2)

18、式中,c和cgt分别为预测类别以及真实类别,m和mgt分别为预测mask以及真实mask;

19、通过对融合mask计算边缘损失,来监督各个尺度下mask的边界预测性能,为:

20、ledge=lfocal(e,egt)  (3)

21、式中,e和egt分别为预测mask和真实mask提取得到的边缘。

22、根据本专利技术提供的具体实施例,本专利技术公开了以下技术效果:

23、本专利技术提供了一种基于多尺度查询的maskformer耕地地块识别方法,该方法包括基于maskformer模型构建msqformer模型,其中,msqformer模型包括多尺度特征提取与嵌入模块、mask生成模块、多尺度mask融合模块及分割预测模块,基于预设的数据集对msqformer模型进行训练,得到训练后的msqformer模型,基于训练后的msqformer模型进行耕地地块识别。本专利技术存在以下几个优点:

24、(1)针对maskformer在耕地提取任务中存在的多尺度与多目标问题,在m本文档来自技高网...

【技术保护点】

1.一种基于多尺度查询的Maskformer耕地地块识别方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述多尺度特征提取与嵌入模块用于通过骨干网络提取多尺度特征,并将最后的特征图作为嵌入特征输入transformer decoder进行解码,具体为:

3.根据权利要求2所述的方法,其特征在于,所述mask生成模块用于根据每个尺度下的隐层特征及影响特征生成预测mask,具体为:

4.根据权利要求3所述的方法,其特征在于,所述多尺度mask融合模块用于进行多尺度的预测mask的融合,具体为:

5.根据权利要求4所述的方法,其特征在于,所述分割预测模块用于根据融合后的mask进行分割预测,具体为:

6.根据权利要求1所述的方法,其特征在于,所述MSQformer模型采用交叉熵分类损失、二值掩模损失以及边缘损失的和作为总损失,其中mask损失包括权重分别为λfocal=20.0和λdice=1.0的focal loss和dice loss:

【技术特征摘要】

1.一种基于多尺度查询的maskformer耕地地块识别方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述多尺度特征提取与嵌入模块用于通过骨干网络提取多尺度特征,并将最后的特征图作为嵌入特征输入transformer decoder进行解码,具体为:

3.根据权利要求2所述的方法,其特征在于,所述mask生成模块用于根据每个尺度下的隐层特征及影响特征生成预测mask,具体为:

4.根据权利要求3所述的方...

【专利技术属性】
技术研发人员:李之超董金玮
申请(专利权)人:中国科学院地理科学与资源研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1