【技术实现步骤摘要】
姿态估计方法、装置、电子设备以及存储介质
[0001]本专利技术涉及姿态估计的
,尤其涉及一种姿态估计方法
、
装置
、
电子设备以及存储介质
。
技术介绍
[0002]随着三维人体姿态估计领域的发展,对基于深度学习的三维人体姿态估计方法的需求不断增加,相较于传统方法,深度学习对在复杂环境下的人体姿态具有更高的准确性和鲁棒性
。
[0003]当前基于深度学习的算法已经取得了不少成效明显的研究成果,但依然存在着许多亟待解决的难题
。
一方面,现有技术基于卷积神经网络,感受野较为受限,不同部位的有效特征交互非常有限,全局骨架点建模能力弱,另一方面,人体动作与姿态多样化
、
成像环境复杂
、
存在自遮挡与互遮挡问题
。
技术实现思路
[0004]根据本公开的一方面,提供了一种姿态估计方法,包括:
[0005]提取待检测图像的图像特征,所述待检测图像含有目标物;
[0006]确定所述图像特征转换的序列化特征和所述序列化特征在所述图像特征的位置信息;
[0007]采用编码器对所述序列化特征进行处理,得到多头注意力拼接特征;
[0008]基于所述位置信息将所述多头注意力拼接特征转换为图像编码特征;
[0009]利用解码器对所述图像编码特征进行解码,获得目标物的三维姿态估计结果
。
[0010]根据本公开的另一方面,提供了一种姿态估计装置,包括 ...
【技术保护点】
【技术特征摘要】
1.
一种姿态估计方法,其特征在于,包括:提取待检测图像的图像特征,所述待检测图像含有目标物;确定所述图像特征的序列化特征和所述序列化特征在所述图像特征的位置信息;采用编码器对所述序列化特征进行处理,得到多头注意力拼接特征;基于所述位置信息将所述多头注意力拼接特征转换为图像编码特征;利用解码器对所述图像编码特征进行解码,获得目标物的三维姿态估计结果
。2.
根据权利要求1所述的方法
,
其特征在于,所述提取待检测图像的图像特征,包括:提取所述待检测图像的多尺度特征图;对所述多尺度特征图进行特征融合,获得所述图像特征
。3.
根据权利要求1所述的方法,其特征在于,所述图像特征包括
N1
个
C1
×
H
×
W
的特征图,
N1
为大于或等于1的整数,
C1
表示所述特征图的通道数量,
H
表示所述特征图的高度,
W
表示所述特征图的宽度;所述序列化特征包括
N2
个
C2
×
L
的序列,
C2
表示所述序列的通道数量,
L
表示序列的维度,
L
=
H
×
W
,
N1
=
N2
,
C1
=
C2。4.
根据权利要求1所述的方法,其特征在于,所述编码器包括多头注意力模块和拼接模块,所述采用编码器对所述序列化特征进行处理,得到多头注意力拼接特征,包括:基于多头注意力模块处理所述序列化特征,获得多头注意力特征;基于所述拼接模块将所述多头注意力特征进行拼接,得到多头注意力拼接特征
。5.
根据权利要求4所述的方法,其...
【专利技术属性】
技术研发人员:邹嘉钰,赵国盛,王欣刚,王鹏,
申请(专利权)人:北京中科海芯科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。