一种面向移动端的手势识别和跟踪方法及系统技术方案

技术编号：37543772 阅读：13 留言：0更新日期：2023-05-12 16:13

本发明专利技术公开了一种面向移动端的手势识别和跟踪方法及系统，包括：手部图像检测模块至少包括YOLOv5的手部检测模型，将原始图像输入手部检测模型进行处理，输出包括检测框、左手置信度、右手置信度及是否有手的置信度的手部图像检测结果；手势估计模块至少包括手势估计模型，手势估计模型网络的特征提取部分为轻量化网络ShuffleNet V2 0.5x模块，姿态网络部分为3个反卷积层与1个内核大小为1的卷积层，将手部图像检测模块处理后的手部图片输入手势估计模块，输出21个手势关键点估计结果；三维转换模块利用两视图几何，将手势估计模块输出的2D关键点转为3D，使用Levenberg

全部详细技术资料下载

【技术实现步骤摘要】
一种面向移动端的手势识别和跟踪方法及系统

[0001]本专利技术属于图像处理
，涉及一种手势跟踪及估计的方法，主要涉及了一种面向移动端的手势识别和跟踪方法及系统。

技术介绍

[0002]目前，VR等设备快速发展，对手势交互有着越来越强烈的需求。设备需要根据用户的手势，准确判断其采取的一系列行动，并作出各种丰富的响应。
[0003]然而，现有的手势估计方法往往采用较大的模型，无法部署在资源较少的移动端设备上；当前轻量化的模型往往存在精确度较低，三维预测结果不准确的问题。这些原因，制约着移动端设备上手势估计方法的应用。例如，VR眼镜作为移动端设备的其中一种，要求模型尽可能小，运算速度尽可能快，同时，稳定性、准确率都需要达到较高的水平。

技术实现思路

[0004]本专利技术正是针对现有手势估计方法无法成功部署在移动端设备的问题，提供一种面向移动端的手势识别和跟踪方法及系统，包括手部图像检测模块、手势估计模块及三维转换模块，手部图像检测模块至少包括手部检测模型，所述手部检测模型为YOLOv5，将原始图像输入手部检测模型进行处理，输出手部图像检测结果，所述手部图像检测结果输出包括检测框、左手置信度、右手置信度及是否有手的置信度；手势估计模块，至少包括手势估计模型，手势估计模型网络的特征提取部分为轻量化网络ShuffleNet V2 0.5x模块，姿态网络部分为3个反卷积层与1个内核大小为1的卷积层，将手部图像检测模块处理后的手部图片输入手势估计模块，输出21个手势关键点估计结果；三维转换模块利用两...

【技术保护点】

【技术特征摘要】
1.一种面向移动端的手势识别和跟踪系统，包括手部图像检测模块、手势估计模块及三维转换模块，所述手部图像检测模块，至少包括手部检测模型，所述手部检测模型为YOLOv5，将原始图像输入手部检测模型进行处理，输出手部图像检测结果，所述手部图像检测结果输出包括检测框、左手置信度、右手置信度及是否有手的置信度；所述手势估计模块，至少包括手势估计模型，手势估计模型网络的特征提取部分为轻量化网络ShuffleNet V2 0.5x模块，姿态网络部分为3个反卷积层与1个内核大小为1的卷积层，将手部图像检测模块处理后的手部图片输入手势估计模块，输出21个手势关键点估计结果；所述三维转换模块，利用两视图几何，将手势估计模块输出的2D关键点转为3D，使用Levenberg
‑
Marquardt算法、相机内外参数以及惯性测量单元参数，生成三维关键点坐标，实现手势的识别和跟踪。2.一种面向移动端的手势识别和跟踪方法，其特征在于，包括以下步骤：S1，手部图像检测：将原始图像输入手部检测模型进行处理，输出手部图像检测结果，所述手部检测模型为YOLOv5，其手部图像检测结果输出包括检测框、左手置信度、右手置信度及是否有手的置信度；S2,手部图像预处理：对经过步骤S1检测到的手部图像进行预处理，所属预处理至少包括对检测框裁剪图片、缩放大小并进行图像填充；S3，关键点估计：将经过步骤S2预处理后的手部图片输入手势估计模型进行处理，输出21个手势关键点；所述手势估计模型网络的特征提取部分为轻量化网络ShuffleNet V2 0.5x模块，姿态网络部分为3个反卷积层与1个内核大小为1的卷积层；S4，坐标转换：将数据增强后的裁剪框作为原裁剪框，模型输入大小作为目标裁剪框，进行仿射变换，从而得到相应的变换矩阵及其逆矩阵，利用逆变换矩阵，模型预测的关键点坐标转换为完整图像对应的关键点坐标；S5，结果输出：经过步骤S4的坐标转换，得到左右视图两张完整图像对应的2维关键点坐标，使用Levenberg
‑
Marquardt算法，添加相机内外参...

【专利技术属性】
技术研发人员：陈睿明，曹邹颖，范思远，高耕，顾枢衡，李明泽，荣逸鹏，杨飞，张子腾，周浩然，宋沫飞，耿新，
申请(专利权)人：东南大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人