基于深度图像引导的对抗网络的3D手部姿势估计制造技术

技术编号：31081489 阅读：11 留言：0更新日期：2021-12-01 12:02

提供了一种用于通过以下操作来估计图像中的三维(3D)手部姿势的计算机实现的方法、计算机可读存储介质和计算机系统：接收与手部图像相对应的数据，生成与所接收的手部图像数据相对应的深度图以及根据所接收的手部图像数据和所生成的深度图估计手部姿势。据和所生成的深度图估计手部姿势。据和所生成的深度图估计手部姿势。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】基于深度图像引导的对抗网络的3D手部姿势估计
[0001]相关申请的交叉引用
[0002]本申请要求于2019年12月12日在美国专利商标局提交的美国专利申请第16/712,228号的优先权，其全部公开内容通过引用整体并入本文中。

技术介绍

[0003]本公开内容总体上涉及计算领域，并且更具体地涉及估计3D手部姿势。
[0004]手部姿势估计是从图像或一组视频帧中找到手部的关节的任务。根据红
‑
绿
‑
蓝(RGB)彩色图像估计三维(3D)手部姿势对于广泛的潜在应用诸如计算机视觉、虚拟现实、增强现实和其他形式的人机交互是必不可少的。由于通过网络摄像头、物联网(IoT)摄像头和智能电话捕获RGB图像的可达性，根据RGB图像估计手部姿势变得显著地更加流行。

技术实现思路

[0005]实施方式涉及用于估计3D手部姿势的方法、系统和计算机可读介质。根据一个方面，提供了用于估计3D手部姿势的方法。该方法可以包括：由计算机接收与手部图像相对应的数据以及生成与所接收的手部图像数据相对应的深度图。计算机可以根据所接收的手部图像数据和所生成的深度图估计手部姿势。
[0006]根据另一方面，提供了用于估计3D手部姿势的计算机系统。计算机系统可以包括一个或更多个处理器、一个或更多个计算机可读存储器、一个或更多个计算机可读有形存储设备以及程序指令，所述程序指令存储在一个或更多个存储设备中的至少一个上，以由一个或更多个处理器中的至少一个经由一个或更多个存储器中的至少一个来执行，由此计算机系...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种估计图像中的三维(3D)手部姿势的方法，包括：由计算机接收与手部图像相对应的数据；由所述计算机生成与所接收的手部图像数据相对应的深度图；以及由所述计算机根据所接收的手部图像数据和所生成的深度图来估计手部姿势。2.根据权利要求1所述的方法，其中，通过生成性对抗网络执行所述生成。3.根据权利要求2所述的方法，其中，所述生成性对抗网络包括生成器和鉴别器。4.根据权利要求3所述的方法，其中，所述生成性对抗网络利用生成性对抗网络(GAN)损失值和任务损失值作为训练值。5.根据权利要求4所述的方法，其中，所述生成性对抗网络由使所述GAN损失值和所述任务损失值最小化的所述生成器来训练。6.根据权利要求4所述的方法，其中，所述生成性对抗网络由使所述GAN损失值和所述任务损失值最大化的所述鉴别器来训练。7.根据权利要求4所述的方法，其中，所述生成器仅使用所接收的手部图像数据来生成所述深度图。8.根据权利要求7所述的方法，其中，所述鉴别器使用所生成的深度图和一个或更多个未配对的深度图来确定所述GAN损失值。9.根据权利要求1所述的方法，其中，估计所述手部姿势包括：由所述计算机基于所接收的手部图像数据生成一个或更多个手部关节热图；由所述计算机基于所生成的热图估计关节位置；以及由所述计算机基于所估计的关节位置和所生成的深度图重建第二深度图。10.根据权利要求1所述的方法，其中，通过仅使用所接收的手部图像数据和与所接收的手部图像数据相对应的所生成的深度图来估计所述手部姿势。11.一种用于估计图像中的三维(3D)手部姿势的计算机系统，所述计算机系统包括：一个或更多个计算机可读非暂态存储介质，其被配置成存储计算机程序代码；以及一个或更多个计算机处理器，其被配置成访问所述计算机程序代码并按照所述计算机程序代码所指示的进行操作，所述计算机程序代码包括：接收代码，其...

【专利技术属性】
技术研发人员：林斯姚，谢于晟，谭辉，黄超，韩连漪，范伟，
申请(专利权)人：腾讯美国有限责任公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人