电视机控制用手势识别系统技术方案

技术编号：8687956 阅读：412 留言：0更新日期：2013-05-09 07:49

一种利用与运动信息结合的基于肤色的方法，实现实时分割的手势识别系统。利用Kalman滤波器跟踪手部的质心。计算提取的手部掩膜的手掌中心，手掌底部，以及从手掌中心到轮廓的最大距离。随后比较计算的距离和阈值，以确定当前姿势是“张开”还是“握紧”。在优选实施例中，“张开”姿势和“握紧”姿势之间的转变确定当前手势是处于“选择”状态还是“抓取”状态。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及手势识别，更具体地说，涉及遥控用手势识别。
技术介绍
手势识别是一种新兴技术，它能够提供更直接的人机交互方法。手势识别与空间和时间信息有关，可用于为未来的应用替代传统的控制设备。已尝试了手势识别系统，例如，美国专利N0.5，534，917。不过，这些系统通常涉及计算密集的复杂分析和/或需要昂贵的硬件。因而，本专利技术的目的是一种能够从典型的HD照相机获得输入，和利用一组简单的手势使计算力降至最低的手势识别系统。在下面的说明中，将满足这些目标中的至少一些目标。
技术实现思路
本专利技术包含处理作为输入的运动手部的视频，并输出每个图像中的当前手势状态和手部位置的系统和方法。在每个图像中，从背景中分割手部区域，并根据一个或多个参数，将其分类为“张开的手部”或“握紧的手部”。系统结合肤色模型和运动中的一个或多个，以获得实时手部分割性能。典型的应用包括(但不限于)用于基本电视机控制，电视机上的照片和web浏览，和计算机的手势识别。本专利技术在仅仅利用单个HD照相机的同时，以较低的计算复杂性，实现用于电视机控制的实时并且用户友好的手势识别系统。系统利用小型传感器进行手势识别，可利用简单手势，在3米以上的距离控制电视机、计算机或其它设备。组合肤色模型和运动，以便从背景中分离手部区域操作中，提取几个参数，比如手部大小，手掌中心和手部底部。这些参数被用于把当前手势分成“张开的手部”或“握紧的手部”。系统随后利用不同手势状态之间的转变来控制设备。有益的是，所述方法只利用单个HD照相机获得作为输入的视频序列，同时能够以较低的计算复杂性获得实时性能。本专利技术的系统...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】2010.09.17 US 12/885,0721.一种用于遥控设备的手势识别系统，包括: (a)在所述设备附近的位置处，捕捉用户的手部的视频数据的传感器； (b)处理捕捉的所述手部的视频数据的处理器； (c)可在所述处理器上运行，以执行多个步骤的程序，所述多个步骤包括: 根据肤色，分割捕捉的视频中的每个手部图像；提取分割的手部图像的一个或多个参数；跟踪手部图像中的所述一个或多个参数；根据所述一个或多个参数，把手势分类成“张开”或“握紧”;和根据所述手势的识别和对所述一个或多个参数的位置的跟踪，操纵所述设备。2.按照权利要求1所述的系统，其中分割每个手部图像包括: 把与所述手部相关的前景区域和围绕所述前景区域的背景区域分开；训练背景区域和前景区域的3分量混合模型；和根据运动和肤色中的一个或多个，对图像像素分类。3.按照权利要求1所述的系统，其中只利用Cb和Cr颜色通道分割图像。4.按照权利要求1所述的系统，其中提取一个或多个参数包括: 根据提取的手部的轮廓和骨架，获得用户的手部的手掌中心位置。5.按照权利要求4所述的系统，其中跟踪一个或多个参数包括利用Kalman滤波器，跟踪手掌中心位置。6.按照权利要求4所述的系统，其中提取一个或多个参数还包括: 获得手掌底部位置；和测量手掌中心位置与提取的图像轮廓上的最远轮廓点之间的距离；所述最远轮廓点在通过手掌底部位置和手掌中心位置的矢量的预定角度范围内。7.按照权利要求6所述的系统，其中把手势分类成“张开”或“握紧”包括: 比较到最远轮廓点的距离和阈值；如果到最远轮廓点的距离超过所述阈值，那么把图像分类成“张开”；以及如果到最远轮廓点的距离低于所述阈值，那么把图像分类成“握紧”。8.按照权利要求1所述的系统，其中所述设备包含与显示器耦接的用户界面，所述用户界面是在所述显示器上输出的；以及其中操纵所述设备包括根据所述手势的识别和所述一个或多个参数的跟踪，向用户界面发送命令。9.按照权利要求8所述的系统，其中“张开”手势和“握紧”手势之间的转变被用于确定“选择”或“抓取”命令是否被发送给用户界面。10.按照权利要求9所述的系统，其中张开手势的跟踪被用于确定光标在用户界面上的位置。11.一种用于遥控设备的手势识别系统，所述设备具有在显示器上显现的用户界面，所述手势识别系统包括: (a)在所述设备附近的位置，捕捉用户的手部的视频数据的传感器； (b)处理捕捉的所述手部的视频数据的处理器；(C)可在所述处理器上运行以执行多个步骤的程序，所述多个步骤包括: 根据肤色，分割捕捉的视频中的每个手部图像；提取分割的手部图像的一个或多个参数；跟踪手部图像中的所述一个或多个参数；根据所述一个或多个参数，把手势分类成“张开”或“握紧”;和根据所述手势的识别和所述一个或多个参数的跟踪，...

【专利技术属性】
技术研发人员：黄光满，刘明昌，余良吟，
申请(专利权)人：索尼公司，
类型：
国别省市：

全部详细技术资料下载我是这个专利的主人