基于多视角的多人三维人体位姿估计方法及装置制造方法及图纸

技术编号：33916357 阅读：19 留言：0更新日期：2022-06-25 20:18

本申请公开了一种基于多视角的多人三维人体位姿估计方法及装置，其中，方法包括：基于transformer方式估计每张人体图片的每个人的二维人体位姿；利用每个人的二维人体位姿，利用预先构建的行人重识别模型对每张人体图片的每个人进行人员配准识别，确定每个人的二维关节点；以及采用多视点三角化方式对每张图片中每个人的二维关节点进行三角化操作，拟合至三维空间中的三维关键点，生成三维人体姿态。由此，解决了相关技术中由于占用运算资源较多、运行时间较慢难以广泛应用于运算硬件条件较差的场景，适用性较低的技术问题。适用性较低的技术问题。适用性较低的技术问题。

全部详细技术资料下载

【技术实现步骤摘要】
基于多视角的多人三维人体位姿估计方法及装置

[0001]本申请涉及计算机视觉
，特别涉及一种基于多视角的多人三维人体位姿估计方法及装置。

技术介绍

[0002]人体姿态估计任务是当前计算机视觉领域中的一个重要研究分支，也是当下基于应用和产业需求的研究热点。人体姿态估计任务常用的划分方式有三种：根据提供输入视角数量划分，可以分为单视角估计任务和多视角估计任务；根据检测人数划分可分为单人场景任务和多人场景任务；根据目的信息可分为二维估计任务和三维估计任务。根据其基本分类和应用场景，人体姿态估计任务在全息现实、人体仿真、视频监控、无人机群等领域有着广泛的应用，并且还有着巨大的开发潜力。人体姿态估计也是诸多计算机视觉任务的研究基础，其估计精度对下游任务的效果有着重要的影响。所以，研究人体姿态估计问题，有着愈发重要的意义。
[0003]相关技术遵循单图内二维人体姿态估计、多图内人员配准识别，三维人体姿态拟合三个步骤，采用了一种多路匹配算法，该匹配算法首先通过分析外观信息本身建立交叉匹配矩阵，寻找多个视图中检测到的二维姿态的周期一致性对应，从而匹配多视角图片中不同的人，该匹配算法能够在不知道场景中真实人数的情况下，修剪错误检测并处理视图之间的部分重叠，在跨链接二维视图人员匹配问题上达到了很好的效果。同时，相关技术改良了常规的3DPS(3D pictorial structure，沉浸式投影显示系统)方法，通过在多个视图之间匹配检测到的二维姿态，生成二维姿态簇，每个簇包含不同视图下同一人的二维姿态，解决了身体层次上的...

【技术保护点】

【技术特征摘要】
1.一种基于多视角的多人三维人体位姿估计方法，其特征在于，包括以下步骤：基于transformer方式估计每张人体图片的每个人的二维人体位姿；利用所述每个人的二维人体位姿，利用预先构建的行人重识别模型对所述每张人体图片的每个人进行人员配准识别，确定所述每个人的二维关节点；以及采用多视点三角化方式对所述每张图片中每个人的二维关节点进行三角化操作，拟合至三维空间中的三维关键点，生成三维人体姿态。2.根据权利要求1所述的方法，其特征在于，所述基于transformer方式估计每张人体图片的每个人的二维人体位姿，包括：利用swin
‑
transformer骨架检测所述每张人体图片的每个人的二维人体位姿；或者，利用所述swin
‑
transformer骨架估计所述每个人的关节点位置，确定所述二维人体位姿。3.根据权利要求1所述的方法，其特征在于，在利用所述预先构建的行人重识别模型对所述每张人体图片的每个人进行人员配准识别之前，还包括：获取用于训练模型的公用数据集；利用所述公用数据集在基于深度学习构建的行人重识别模型上进行训练，生成所述预先构建的行人重识别模型。4.根据权利要求1所述的方法，其特征在于，所述基于transformer方式估计每张人体图片的每个人的二维人体位姿，包括：基于ViT的变形框架获取所述每张图片二维人体姿态估计。5.一种基于多视角的多人三维人体位姿估计装置，其特征在于，包括：位姿估计模块，用于基于transformer方式估计每张人体图片的每个人的二维人体位姿；识别模块，用于利用所述...

【专利技术属性】
技术研发人员：季向阳，余杭，连晓聪，
申请(专利权)人：清华大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人