基于改进型单次多目标检测器的静态手语实时识别方法技术

技术编号：17196618 阅读：33 留言：0更新日期：2018-02-03 23:09

本发明专利技术涉及一种基于改进型单次多目标检测器的静态手语实时识别方法，包括以下步骤：对静态手语样本图像进行预处理；构建并强化静态手语图像数据集；构建基于改进的单次多目标检测器的深度学习网络，该深度学习网络分为基础网络层和额外卷积特征层；其中，基础网络层用于特征提取，将输入的图像转换成多维度的特征表示；额外卷积层是一种特征选择策略，用小卷积滤波器来预测特征图上固定的一组默认边界框的类别分数和位置偏移，同时从不同尺度的特征图产生不同尺度的预测；利用静态手语数据集训练此网络，将摄像头实时采集手语视频输入训练好的网络，实现静态手语实时识别。本发明专利技术在保证识别精度的同时大大提高了识别速度。

全部详细技术资料下载

【技术实现步骤摘要】
基于改进型单次多目标检测器的静态手语实时识别方法
本专利技术涉及手语识别
，特别是涉及一种基于改进型单次多目标检测器的静态手语实时识别方法。
技术介绍
手语是聋哑人用手势代替正常言语进行交流的一种有效方式。研究手语识别能帮助聋哑人，尤其是一些未得到良好教育的聋哑人之间的交流，同时也能帮助聋哑人与正常人之间的交流；手语识别也是人机交互的一种便利的方式，研究手语识别能促进机械智能运作、移动设备终端的操作、门禁系统、远程控制等其他领域的发展；更进一步，研究手语识别能辅助计算机对人类语言的理解。基于单目视觉识别的手语识别，是使用一个普通摄像头进行信息输入利用计算机算法进行识别，相对于基于传感器等数字设备输入信息再通过计算机识别的方法，其对于设备的要求低、调教便利、投入资金低等优点，越来越受到研究者的关注。在手语识别领域，一个传统的完整识别方法通常包括了三个过程：分割、特征提取、识别。1)分割，常用方法是基于运动信息的模型、基于运动模板的模型、基于肤色信息的模型等；2)特征提取，常见方法是基于方向梯度直方图(HOG)的特征提取方法、基于局部二值模式纹理(LBP)的特征提取方法、基于卷积神经网络(CNN)特征提取的方法等；3)手势识别，常见方法有基于人工神经网络的多层感知器(MLP)、基于监督学习模型的支持向量机(SVM)等。静态手语识别技术虽然很早就有相关研究者进行了研究，但是面对人手骨架不统一、手型多变、手语词汇量大的特点，其特征信息很难灵活的获得，而且手工设计语言来描述手语特征的过程繁琐，并且无法挖掘深层次的特征信息，这就导致模型范性差、很难在基于视觉的手...
基于改进型单次多目标检测器的静态手语实时识别方法

【技术保护点】
一种基于改进型单次多目标检测器的静态手语实时识别方法，其特征在于，包括以下步骤：(1)对静态手语样本图像进行预处理；(2)构建并强化静态手语图像数据集；(3)构建基于改进的单次多目标检测器的深度学习网络，该深度学习网络分为基础网络层和额外卷积特征层；其中，基础网络层用于特征提取，将输入的图像转换成多维度的特征表示；额外卷积层是一种特征选择策略，用小卷积滤波器来预测特征图上固定的一组默认边界框的类别分数和位置偏移，同时从不同尺度的特征图产生不同尺度的预测；(4)利用静态手语数据集训练此网络，将摄像头实时采集手语视频输入训练好的网络，实现静态手语实时识别。

【技术特征摘要】
1.一种基于改进型单次多目标检测器的静态手语实时识别方法，其特征在于，包括以下步骤：(1)对静态手语样本图像进行预处理；(2)构建并强化静态手语图像数据集；(3)构建基于改进的单次多目标检测器的深度学习网络，该深度学习网络分为基础网络层和额外卷积特征层；其中，基础网络层用于特征提取，将输入的图像转换成多维度的特征表示；额外卷积层是一种特征选择策略，用小卷积滤波器来预测特征图上固定的一组默认边界框的类别分数和位置偏移，同时从不同尺度的特征图产生不同尺度的预测；(4)利用静态手语数据集训练此网络，将摄像头实时采集手语视频输入训练好的网络，实现静态手语实时识别。2.根据权利要求1所述的基于改进型单次多目标检测器的静态手语实时识别方法，其特征在于，所述步骤(1)具体为：录制静态手语视频，并将视频抽帧为图像，手动去除拖影严重和遮挡严重的图像，并对图像采用高通滤波的方法进行增强处理。3.根据权利要求1所述的基于改进型单次多目标检测器的静态手语实时识别方法，其特征在于，所述步骤(2)中构建的静态手语数据集包含原始样本图像及对原始样本图像进行手工标注后的标签图像，标注信息记录的图像标记框与原始图像一一对应；采用对原始图像做镜面对称处理的方式，并重新标记对应图像，达到强化静态手语数据集的目的。4.根据权利要求1所述的基于改进型单次多目标检测器的静态手语实时识别方法，其特征在于，所述步骤(3)中的基础网络层为采用去掉全连接层的AlexNet网络层，共计5层，池化采用最大值池化；所述额外卷积网络为9层网络，其中分为8层卷积网络层和1层均值池化层。5.根据权利要求4所述的基于改进型单次多目标...

【专利技术属性】
技术研发人员：张勋，陈亮，
申请(专利权)人：东华大学，
类型：发明
国别省市：上海,31

全部详细技术资料下载我是这个专利的主人