【技术实现步骤摘要】
一种基于深度图像和彩色图像的手部运动识别方法
本专利技术涉及图像处理与智能交互
,特别涉及一种基于深度图像和彩色图像的手部运动识别方法。
技术介绍
随着机器视觉和人工智能相关学科的发展,人机交互技术逐渐开始成为一个重要的研究方向。手部形态的随机和多变性使得当前的手势识别技术无法在实际运用中来取代传统的交互设备,以此来完成人机交互,这是说明手势识别检测交互技术和一些其他的基于计算机视觉的识别技术仍然需要继续探索研究。与提供外观和纹理信息并对光变化敏感的彩色数据相比,深度数据提供更多的形状信息、清晰的边缘,并且对照明条件的变化具有鲁棒性。因此,利用额外的深度信息来促进彩色信息进行联合手部运动识别检测的任务已成为研究热点。鉴于此提出一种将彩色与深度数据以最佳方式进行联合的方法仍是手部运动识别检测的关键。
技术实现思路
为了解决上述技术问题,本专利技术提供了一种基于深度图像和彩色图像的手部运动识别方法,可以在复杂场景下读取手势的彩色信息和深度信息,通过精确识别手势与显示器进行交互。本专利技术所采用的技术方案是:一种基于深度图像和彩色图像的手部运动识别方法,其特征在于,包括以下步骤:步骤1:自建手部运动数据库;通过kinect读取模仿ASL手势库中的36种手势,建立深度手部运动数据库和彩色手部运动数据库;步骤2:对手部数据进行预处理,将预处理后的数据分为训练集和测试集;步骤3:训练深度手部运动检测模型和彩色手部运动检测模型;利用深度训练集训练深度 ...
【技术保护点】
1.一种基于深度图像和彩色图像的手部运动识别方法,其特征在于,包括以下步骤:/n步骤1:自建手部运动数据库;/n通过kinect读取模仿ASL手势库中的36种手势,建立深度手部运动数据库和彩色手部运动数据库;/n步骤2:对手部数据进行预处理,将预处理后的数据分为训练集和测试集;/n步骤3:训练深度手部运动检测模型和彩色手部运动检测模型;/n利用深度训练集训练深度环境下基于SSD_Mobilenet目标检测模型,利用彩色训练集训练彩色环境下基于SSD_Mobilenet目标检测模型;得到能分别在深度及彩色背景下对手部运动进行识别与检测的两类网络模型;/n步骤4:利用SSD_Mobilenet双流网络框架,对彩色及深度背景下两类手部运动识别检测网络模型的检测结果进行融合;/n步骤5:将融合的网络模型进行非极大值改进,引入比例惩罚系数的非极大值抑制算法,利用测试集中的数据对融合后的网络框架进行测试,得到手部运动高精度识别模型;/n步骤6:利用手部运动高精度识别模型对手部运动进行识别。/n
【技术特征摘要】
1.一种基于深度图像和彩色图像的手部运动识别方法,其特征在于,包括以下步骤:
步骤1:自建手部运动数据库;
通过kinect读取模仿ASL手势库中的36种手势,建立深度手部运动数据库和彩色手部运动数据库;
步骤2:对手部数据进行预处理,将预处理后的数据分为训练集和测试集;
步骤3:训练深度手部运动检测模型和彩色手部运动检测模型;
利用深度训练集训练深度环境下基于SSD_Mobilenet目标检测模型,利用彩色训练集训练彩色环境下基于SSD_Mobilenet目标检测模型;得到能分别在深度及彩色背景下对手部运动进行识别与检测的两类网络模型;
步骤4:利用SSD_Mobilenet双流网络框架,对彩色及深度背景下两类手部运动识别检测网络模型的检测结果进行融合;
步骤5:将融合的网络模型进行非极大值改进,引入比例惩罚系数的非极大值抑制算法,利用测试集中的数据对融合后的网络框架进行测试,得到手部运动高精度识别模型;
步骤6:利用手部运动高精度识别模型对手部运动进行识别。
2.根据权利要1所述的基于深度图像和彩色图像的手部运动识别方法,其特征在于:步骤2中,在Tensorflow深度学习框架下,通过人工标签彩色图像及深度图像并进行格式转换的方式对彩色图像数据与深度图像数据分别进行预处理。
3.根据权利要1所述的基于深度图像和彩色图像的手部运动识别方法,其特征在于:步骤3中,所述网络模型,能分别用于在彩色背景和彩色视频,深度背景和深度视频中对手势进行识别输出,输出结果包括手势在图像中的位置信息和手势类别置信度。
4.根据权利要1所述的基于深度图像和彩色图像的手部运动识别方法,其特征在于:步骤4中,基于SSD_Mobilenet双流网络框架的融合模型,同时向两个具有相同结构的SSD_Mobilenet网络中输入彩色及对应的深度图像,并同时分别各从基于彩色网络通道和深度网络通道的六个不同尺度的特征图上提取特征来进行检测,并将彩色网络通道和深度网络通道的检测结果同时进行非极大值抑制后输出;
其中,卷积网络的第l层的第j个神经元输出为为上层输出,fc(.)为卷积层的激活函数,M为选择的输入特征图的集合,wl为卷积网络第l层的权重,bl为网络层第l层的偏置,表示第l层的第i个通道的第j个神经元输出;
当第l层是池化层时,该层第j个神经元的输出为
其中,fp(.)为卷积层的激活函数,p(.)为池化函数;
当l层是全连接层时,该层第j个神...
【专利技术属性】
技术研发人员:刘玉婷,李公法,李蔚,田泉,蒋国璋,陶波,江都,
申请(专利权)人:武汉科技大学,
类型:发明
国别省市:湖北;42
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。