【技术实现步骤摘要】
图像特征提取方法、图像分割方法和目标检测方法
[0001]本申请实施例涉及但不限于图像处理领域,尤其涉及图像特征提取方法
、
图像分割方法和目标检测方法
。
技术介绍
[0002]在计算机视觉领域中,基于多层感知机的模型
(Multi Layer Perceptrons,MLP)
,比如
MLP
‑
Mixer、MAXIM、gMLP
等方法,仅采用
MLP
网络层构造了非注意力的深度学习模型,表现优秀
。
然而,
MLP
网络层在
token
交互模块采用了全连接层,全连接层的模型参数与图像的长
、
宽相关,使得模型无法处理任意尺寸的输入图像,极大限制了
MLP
模型的功能和应用
。
另外,由于
MLP
模型无法处理不同尺寸的图像,从而无法直接将固定尺寸图像所训练的
MLP
预训练模型应用在下游任务中,如图像分割
、
目标检测
、
实例分割等
。
技术实现思路
[0003]以下是对本文详细描述的主题的概述
。
本概述并非是为了限制权利要求的保护范围
。
[0004]本申请的目的在于至少一定程度上解决相关技术中存在的技术问题之一,本申请实施例提供了图像特征提取方法
、
图像分割方法和目标检测方法,实现了利 ...
【技术保护点】
【技术特征摘要】
1.
一种图像特征提取方法,其特征在于,包括:获取待处理图像,将所述待处理图像输入至预设的图像处理模型进行区域划分操作得到子区域,其中,所述图像处理模型包括特征提取层;执行以下步骤:根据所述子区域进行第一扩展操作得到第一区域
、
第二区域和第三区域,所述第一区域的尺寸等于所述特征提取层对应的处理图像固定尺寸,所述第二区域的宽度等于所述特征提取层对应的处理图像固定宽度,所述第三区域的长度等于所述特征提取层对应的处理图像固定长度;通过所述特征提取层对所述第一区域在长度方向和宽度方向上进行特征提取得到第一特征,对所述第二区域在宽度方向上进行特征提取得到第二特征,对所述第三区域在长度方向上进行特征提取得到第三特征;根据所述第一特征
、
所述第二特征和所述第三特征进行第一特征合并操作,得到第一合并特征;或者,执行以下步骤:根据所述待处理图像的尺寸和所述特征提取层对应的处理图像固定尺寸确定特征区域划分参数;根据所述特征区域划分参数对所述待处理图像的原始特征进行特征区域划分得到划分特征,所述划分特征的尺寸等于所述特征提取层对应的处理图像固定尺寸;通过所述特征提取层对所述划分特征进行特征提取,得到第四特征;对所述第四特征中的重叠区域所对应的特征设置权重,根据所述权重对所述第四特征进行第二特征合并操作,得到第二合并特征
。2.
根据权利要求1所述的一种图像特征提取方法,其特征在于,所述根据所述子区域进行第一扩展操作得到第一区域
、
第二区域和第三区域,包括:当所述待处理图像的尺寸小于所述特征提取层对应的处理图像固定尺寸,对所述子区域中的第一子区域进行扩展得到第一区域;当所述待处理图像的尺寸大于或等于所述特征提取层对应的处理图像固定尺寸,对所述子区域中的第二子区域和第四子区域进行扩展得到第二区域,对所述子区域中的第三子区域和第四子区域进行扩展得到第三区域;其中,所述第一子区域
、
所述第二子区域
、
所述第三子区域和所述第四子区域构成所述待处理图像,所述待处理图像的尺寸为
(W
,
H)
,所述特征提取层对应的处理图像固定尺寸为
(w
,
h)
;所述第一子区域的尺寸为
(n
w
w
,
n
h
h)
,
n
w
=
[W/w]
,
n
h
=
[H/h]
;所述第二子区域的尺寸为
(W
‑
n
w
w
,
n
h
h)
;所述第三子区域的尺寸为
(n
w
w
,
H
‑
n
h
h)
;所述第四子区域的尺寸为
(W
‑
n
w
w
,
H
‑
n
h
h)。3.
根据权利要求2所述的一种图像特征提取方法,其特征在于,所述对所述子区域中的第二子区域和第四子区域进行扩展得到第二区域,包括:在所述第二子区域和所述第四子区域远离所述第一子区域的一侧进行扩展得到第一扩展区域,所述第一扩展区域的尺寸为
(p
w
,H),p
w
=
w
‑
(W
‑
n
w
w)
;由所述第二子区域
、
所述第四子区域和所述第一扩展区域组合得到第二区域
...
【专利技术属性】
技术研发人员:蓝湘源,曹桂平,张建国,蒋冬梅,王耀威,
申请(专利权)人:南方科技大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。