The invention discloses a dynamic gesture recognition method based on combination neural network, the method comprises the following steps: open the camera image sequence acquisition device containing control gestures; through a Haar feature detector and Camshift fast palm palm tracking machine based on the segmented image region corresponding to the palm of the hand movements, dynamic the gesture image sequences removed most of the background; dynamic gesture input image sequences to a pre trained neural network combined good extraction of temporal and spatial characteristics of dynamic gesture recognition required; the combination of the depth of network to extract dynamic gesture sequences obtained by spatial and temporal characteristics of input to the pre trained softmax classifier output layer, get the final results of the dynamic gesture recognition. The invention adopts the combination neural network to extract the temporal and spatial characteristics of the dynamic hand gesture image sequence, and has the advantages that the classifier can classify the features to obtain higher recognition rate.
【技术实现步骤摘要】
一种基于组合神经网络的动态手势识别方法
本专利技术涉及一种计算机视觉与机器学习技术,特别涉及一种基于组合神经网络的动态手势识别方法。
技术介绍
随着许多增强现实和虚拟现实设备产品的推出,给人机交互方面研究的热度又增加了不少。纵观人体全身,手已经被认为是最重要和普遍的交互工具了。同时,在人机交互领域,手势识别已经是一个很重要的研究方向。手势识别分为静态手势识别和动态手势识别,相对于静态手势识别,动态手势识别可以带给我们更加丰富的交互方式和交互体验,因为动态手势可以由很多的手部动作组合而成。目前,由于数字摄像头的广泛普及,基于图像和视频的手势识别研究已经成为计算机视觉领域的一个重要研究方向之一。许多关于各种各样的动态手势识别的传统方法早也已经被提出来,例如隐马尔科夫模型(HMM)、有限状态机(FSM)、动态贝叶斯网络(DBN)、动态时间规划(DTW)和人工神经网络(ANN)。这些传统方法模型通常是需要人工预定义特征,如尺度不变特征转换(SIFT)、加速度尺度不变特征(SURF)、方向梯度直方图(HOG)、傅里叶描述子等手形特征描述和基于光流、运动跟踪方法的手势运动信息描述,人工选择特征的方法有很大的局限性,通常需要先验知识、经验和大量的手工调整,而且算法模型的识别率容易因为动态手势操作速度、方向、手形大小的差异产生很大的影响。
技术实现思路
本专利技术的目的在于克服现有技术的缺点与不足,提供一种基于组合神经网络的动态手势识别方法。本专利技术的目的通过下述技术方案实现:一种基于组合神经网络的动态手势识别方法,包括如下步骤:(1)打开设备的摄像头采集含有手势动作的2D ...
【技术保护点】
一种基于组合神经网络的动态手势识别方法,其特征在于,包括以下步骤:(1)打开设备的摄像头采集含有手势动作的2D图像序列;(2)利用训练好的基于Haar特征的快速手掌检测器和Camshift手掌跟踪器对图像序列中的手掌进行跟踪定位,然后对图像序列中的背景进行剔除,剪切得到含有手势动作的动态手势子图像序列,图像大小为240*160像素;(3)对步骤(2)中所得到的动态手势的子图像序列,输入到一个预先训练好的组合神经网络提取动态手势图像序列的时空特征,组合神经网络包括一个6层的卷积神经网络CNN串接一个1层的时间递归神经网络LSTM RNN;卷积神经网络含有3层的卷积层和3层的下采样层,用于提取手掌的方向和形状特征;一层的时间递归神经网络LSTM RNN,用于提取动态手势序列的时间关系特征,结合卷积神经网络提取的空间特征得到动态手势序列的时空特征;(4)组合神经网络得到的时空特征,输入到具有n个softmax单元的分类器输出层,其中,n为动态手势的类别数,根据分类器出来的结果从而可得最终的手势识别结果。
【技术特征摘要】
1.一种基于组合神经网络的动态手势识别方法,其特征在于,包括以下步骤:(1)打开设备的摄像头采集含有手势动作的2D图像序列;(2)利用训练好的基于Haar特征的快速手掌检测器和Camshift手掌跟踪器对图像序列中的手掌进行跟踪定位,然后对图像序列中的背景进行剔除,剪切得到含有手势动作的动态手势子图像序列,图像大小为240*160像素;(3)对步骤(2)中所得到的动态手势的子图像序列,输入到一个预先训练好的组合神经网络提取动态手势图像序列的时空特征,组合神经网络包括一个6层的卷积神经网络CNN串接一个1层的时间递归神经网络LSTMRNN;卷积神经网络含有3层的卷积层和3层的下采样层,用于提取手掌的方向和形状特征;一层的时间递归神经网络LSTMRNN,用于提取动态手势序列的时间关系特征,结合卷积神经网络提取的空间特征得到动态手势序列的时空特征;(4)组合神经网络得到的时空特征,输入到具有n个softmax单元的分类器输出层,其中,n为动态手势的类别数,根据分类器出来的结果从而可得最终的手势识别结果。2.根据权利要求1所述的一种基于组合神经网络的动态手势识别方法,其特征在于,所述步骤(2)包括如下步骤:(2.1)摄像头得到的图像序列尺寸比较大,手掌检测器采用时间滑动窗口检测的方法,以加快检测的速度;(2.2)若检测器检测到图像中存在手掌,则判断为动态手势...
【专利技术属性】
技术研发人员:罗阳星,徐向民,郑晓旭,熊江丰,
申请(专利权)人:华南理工大学,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。