【技术实现步骤摘要】
图像特征提取方法、网络模型、装置及设备
[0001]本专利技术涉及图像处理
,尤其涉及一种图像特征提取方法、网络模型、装置及设备。
技术介绍
[0002]随着网络技术的不断发展,Transformer模型架构开始在各种视觉任务上逐渐替代卷积神经网络(Convolutional Neural Networks,简称CNN)并展现出巨大的潜力,比如针对分类任务的视觉Transformer模型(ViT)、针对目标检测的基于Transform的深度学习目标检测(DEtection Transformer,简称DETR)模型和基于视觉Transformer的语义分割模型(SEgementation Transformer,简称SETR)等等可以实现不同的视觉任务。
[0003]目前,ViT和DeiT是Transformer架构的遥感分割模型中常用的主干网络,其往往通过堆叠多个自注意力网络层并输入所有划分出的图像特征向量token参与特征提取操作,由于在利用自注意网络层进行特征提取操作时,数据的计算量往往与图像特征向量数量的平方呈正相关,从而导致内存占用大,且吞吐量低。
技术实现思路
[0004]本专利技术实施例提供了一种图像特征提取方法、网络模型、装置及设备,能够基于动态调整的图像特征向量进行特征提取操作,不仅减少了数据处理操作所需要占用的内存,并能够提高图像特征提取操作的处理速度,提升吞吐量。
[0005]第一方面,本专利技术实施例提供一种图像特征提取方法,包括:
[0006]获 ...
【技术保护点】
【技术特征摘要】
1.一种图像特征提取方法,其特征在于,包括:获取与待处理图像相对应的多个图像块;确定与各个图像块相对应的图像特征向量以及用于实现特征提取操作的网络模型,所述网络模型包括多个特征提取网络层,其中,部分的特征提取网络层通信连接有辅助分类模块;通过所述辅助分类模块对输入至下一个特征提取网络层的图像特征向量进行调整,获得与下一个特征提取网络层相对应的有效特征向量,所述有效特征向量为所述图像特征向量的至少一部分,输入至当前特征提取网络层中的有效特征向量的数量大于或等于输入至下一个特征提取网络层中的有效特征向量的数量;基于所述多个特征提取网络层、图像特征向量以及有效特征向量进行特征提取操作,获得与所述待处理图像相对应的图像特征。2.根据权利要求1所述的方法,其特征在于,通过所述辅助分类模块对输入至下一个特征提取网络层的图像特征向量进行调整,获得与下一个特征提取网络层相对应的有效特征向量,包括:基于所述辅助分类模块确定与所述图像特征向量相对应的分类置信度;基于所述图像特征向量相对应的分类置信度对输入至下一个特征提取网络层的图像特征向量进行调整,获得与下一个特征提取网络层相对应的有效特征向量。3.根据权利要求2所述的方法,其特征在于,基于所述图像特征向量相对应的分类置信度对输入至下一个特征提取网络层的图像特征向量进行调整,获得与下一个特征提取网络层相对应的有效特征向量,包括:在所述分类置信度小于预设阈值时,则将与所述分类置信度相对应的图像特征向量确定为与下一个特征提取网络层相对应的无效特征向量;在所述分类置信度大于或等于预设阈值时,则将与所述分类置信度相对应的图像特征向量确定为与下一个特征提取网络层相对应的有效特征向量。4.根据权利要求1所述的方法,其特征在于,基于所述多个特征提取网络层、图像特征向量以及有效特征向量进行特征提取操作,获得与所述待处理图像相对应的图像特征,包括:获取用于输入至各个特征提取网络层的预设特征向量;基于所述图像特征向量、预设特征向量和有效特征向量,确定各个特征提取网络层的输入特征向量;利用所述多个特征提取网络层对所对应的输入特征向量进行处理,获得与所述待处理图像相对应的图像特征。5.根据权利要求4所述的方法,其特征在于,基于所述图像特征向量、预设特征向量和有效特征向量,确定各个特征提取网络层的输入特征向量,包括:在当前特征提取网络层通信连接有辅助分类模块时,则基于所述图像特征向量和有效特征向量,确定与下一个特征提取网络层相对应的无效特征向量;对所述无效特征向量与所述预设特征向量进行融合,获得融合后特征向量;将所述有效特征向量和所述融合后特征向量,确定为下一个特征提取网络层的目标输入特征向量。
6.根据权利要求4所述的方法,其特征在于,基于所述图像特征向量、预设特征向量和有效特征向量,确定各个特征提取网络层的输入特征向量,包括:在当前特征提取网络层未通信连接有辅助分类模块时,则基于所述图像特征向量、预设特征向量和有效特征向量,确定与所述当前特征提取网络层相对应的已输入特征向量;将所述已输入特征向量,确定为下一个特征提取网络层的目标输入特征向量。7.根据权利要求4所述的方法,其特征在于,利用所述多个特征提取网络层对所对应的输入特征向量进行处理,获得与所述待处理图像相对应的图像特征,包括:利用所述多个特征提取网络层对所对应的输入特征向量进行处理,获得目标输出特征向量;基于所述图像特征向量和所述目标输出特征向量,确定与所述待处理图像相对应的已退特征向量;对所述目标输出特征向量和所述已退特征向量进行复位,获得与所述待处理图像相对应的图像特征。8.根据权利要求1
‑
7中任意一项所述的方法,其特征在于,在获得与所述待处理图像相对应的图像特征之后,所述方法还包括:基于所述图像特征对所述待处理图像进行影像分割处理,获得与所述待处理图像相对应的影像分割结果。9.根据权利要求1
‑
7中任意一项所述的方法,...
【专利技术属性】
技术研发人员:刘宇昂,周强,王晶,王志斌,
申请(专利权)人:阿里巴巴中国有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。