The invention discloses a gesture recognition method based on a depth residual network. The invention comprises the following steps: step 1. to obtain the original data signals, and its N mark 2N dimensional original label data; tag data step 2. of the original data information and the 2N dimension of the pretreatment; step 3, the original label data after preprocessing the original data and information into the 2N dimension the HDF5 format as the original training data input to train the network parameters in the network to get residual depth, gesture recognition model; step 4, to step 1 and gesture recognition data to do the same N point mark 2N dimensional identification tag to tag data data; step 5, treat gesture recognition data and 2N dimension preprocessing and gesture data and transformation after pretreatment for 2N dimensional HDF5 format to identify tag data, input to the gesture recognition model for recognition, and get the recognition result. The invention effectively solves the problems of gradient dispersion and network accuracy.
【技术实现步骤摘要】
一种基于深度残差网络的手势识别方法
本专利技术涉及图像处理、物体检索领域,尤其涉及一种基于深度残差网络的手势识别方法。
技术介绍
目前,基于视觉的手势交互已经被国内外广泛的研究,但由于手势本身所具有的多义性、时空差异性以及手的高纬度、多自由度及视觉问题本身的不适应性,基于手势识别的人工交互平台一直是一个固有挑战性的研究课题。该课题主要解决的核心点在于对手的形状的识别和对手势的跟踪。在传统方法上主要有两个方向:(1)基于隐马尔可夫链的方法:GRobel从带颜色手套的饰演者的记录视频中提取特征,采用隐马尔夫模型(HiddenMarkovModel,HMM)识别了261个鼓励测绘,其正确率达到了91.3%;(2)基于几何特征的手势识别。但这两种方法和之后所衍生出来的一些其他算法都极大程度上依赖于计算机的处理能力,而且在数据的拟合上存在很大的问题,同时很难达到对于大数据的信息源进行处理。由于手具有高度时空性,以及手势变换种类十分复杂,因此在训练过程中网络结构的好坏在很大程度上决定了训练出来的网络模型对于手势的识别精度。在人工智能迅速发展的今天,大部分人都采用深度学习中的CNN或者RCNN来对手势识别进行改进,在一定程度上提升了准确率。但随着CNN网络的发展,尤其是VGG网络的提出,在网络层数增加到一个临界点后梯度消失或弥散问题随之而来,与此同时网络精度达到饱和后迅速下降。
技术实现思路
本专利技术的目的是提供一种基于深度残差网络的手势识别方法,该方法能有效解决梯度弥散和网络精度问题,同时对于精度下降的问题有效的进行了遏制,降低了深度网络的训练难度,极大的提升了手势识别 ...
【技术保护点】
一种基于深度残差网络的手势识别方法,其特征在于包括如下步骤:步骤1.获取手势的原始数据信息,并将其进行N点标记得到2N维的原始标签数据;其中N≥1;步骤2.对上述原始数据信息及2N维的标签数据进行预处理;步骤3、将上述预处理后的原始数据信息与转化为hdf5格式的2N维的的原始标签数据作为原始训练数据,输入到深度残差网络中训练网络参数,得到手势识别模型;步骤4、将待识别手势数据做与步骤1相同的N点标记得到2N维的待识别标签数据;步骤5、对上述待识别手势数据及2N维的标签数据进行预处理,并将预处理后的手势数据与转化为hdf5格式的2N维的待识别标签数据,输入到上述手势识别模型中进行识别,得到识别结果。
【技术特征摘要】
2017.02.27 CN 20171010793531.一种基于深度残差网络的手势识别方法,其特征在于包括如下步骤:步骤1.获取手势的原始数据信息,并将其进行N点标记得到2N维的原始标签数据;其中N≥1;步骤2.对上述原始数据信息及2N维的标签数据进行预处理;步骤3、将上述预处理后的原始数据信息与转化为hdf5格式的2N维的的原始标签数据作为原始训练数据,输入到深度残差网络中训练网络参数,得到手势识别模型;步骤4、将待识别手势数据做与步骤1相同的N点标记得到2N维的待识别标签数据;步骤5、对上述待识别手势数据及2N维的标签数据进行预处理,并将预处理后的手势数据与转化为hdf5格式的2N维的待识别标签数据,输入到上述手势识别模型中进行识别,得到识别结果。2.如权利要求1所述的一种基于深度残差网络的手势识别方法,其特征在于所述手势的原始数据信息与所述待识别手势数据是指收集的各类手势图片。3.如权利要求1所述的一种基于深度残差网络的手势识别方法,其特征在于所述原始数据信息、2N维的标签数据、待识别手势数据进行预处理包括图像正则化、先验条件约束、数据格式及对应图像转换操作。4.如权利要求2所述的一种基于深度残差网络的手势识别方法,其特征在于对手势图片进行预处理是指利用ma...
【专利技术属性】
技术研发人员:谢益峰,颜成钢,王雁刚,邵碧尧,项露萱,
申请(专利权)人:杭州电子科技大学,
类型:发明
国别省市:浙江,33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。