当前位置: 首页 > 专利查询>吉林大学专利>正文

基于可判别性二叉树投票的动作识别方法技术

技术编号:11791765 阅读:99 留言:0更新日期:2015-07-29 17:17
基于可判别性二叉树投票的动作识别方法属计算机视觉技术领域,本发明专利技术提出一种人动作行为分析和准确定位的方法,主要分为训练部分和检测部分,训练部分将连续动作分解成时空立方块,提取立方块低维特征,在二叉树构建过程中,通过最小化目标类别不确定性和立体块中心偏移不确定性分裂左右结点,使得叶结点中立体块集合纯度最高,当二叉树达到最大深度或者叶结点立体块数低于阈值时,二叉树构建完成;检测部分将检测立体块遍历二叉树集,叶结点为到达的立体块进行投票,在动作空间寻求最大值,确定动作类别和目标中心位置,实验结果证明,在低分辨率、图像特征明显的视频序列中,本发明专利技术能准确判断人物的动作类别和人物位置。

【技术实现步骤摘要】

本专利技术属计算机视觉
,具体涉及一种基于可判别性二叉树投票的动作识 别方法。
技术介绍
人行为动作识别是计算机视觉领域中前沿的科学研宄之一,在视频处理方面发挥 着非常重要的作用。人行为分析包括对视频图像中人物进行检测、跟踪、目标分类和行为理 解方面,主要通过对人物动作对应像素点变化来确定动作的行为类别。但是由于人在形状、 外观、尺度、视角和姿势的高动态性,识别人的行为就变的很困难,使得这项研宄变得很有 挑战性。 早期的研宄方法是研宄在简单的,静态的背景下的单人视频图像,方法比较简单, 抗干扰能力弱,分析的效果一般。现在正在尝试引进人物特征采样分析的方法来研宄,而且 在动作分类、确定人行为的类别也有了进一步的跟进,但是在低分辨率,人物动作模糊的情 况下,很难有足够的稳定性和准确性。 西安电子科技大学提出的专利申请"一种基于霍夫森林的目标跟踪算法"(专利申 请号201410507656. 2,公开号CN104299243A),通过训练已知目标样本建立霍夫森林,检 测视频序列依次进入已训练霍夫森林,叶结点对目标中心进行投票,获取目标中心位置并 初始化卡尔曼滤波参数,然后与上一帧的目标位置进行阈值比较,如果不符合标准,则通过 卡尔曼滤波器进行目标预测位置。该方法虽然对目标中心进行检测和修正,但是在建立卡 尔曼模型和目标中心均值耗费运行时间,增加算法复杂度,卡尔曼滤波器预测结果往往非 常准确的,如果出现预测失误,会导致目标跟踪失败,而且该方法在人物动作识别方面没有 内容。 上海交通大学提出的专利申请"一种人体动作识别的方法"(专利申请号 201310054812.X,公开号CN103164694A)公开了一种基于目标时空特征提取和半监督分 类器的动作识别方法,在较少的目标样本中,该方法能够实现动作行为的判定,但是算法的 复杂度很高,判断人物动作轮廓,提取时空特征,建立k近邻图,通过拉普拉斯矩阵进行求 解动作类别标签。此方法中的最终特征向量维数过高,求解广义的拉普拉斯矩阵变换复杂 度过高,并不能够实时的对人物动作进行准确判断。
技术实现思路
本专利技术的目的在于提供一种高效的人体动作识别方法,二叉树作为机器学习中的 优秀分类器,稳定性好,二叉树通过收集树的子结点对各个类别投票,选择最多的投票作为 判断结果。 本专利技术的,包括下列步骤: 1构建可判别性二叉树,具体包括下列步骤: 1. 1对训练视频序列进行分类处理,将含有目标的动作类别定义为正样本,对正样 本进行标记,不同的动作类别区别标记;将目标区域外的定义为负样本,负样本中只含有背 景,负样本统一标记; 1. 2人的动作行为在时间和空间上都含有信息,为了准确描述不同人的动作行为, 将训练视频中整套动作在空间和时间上进行分解,其值设置为16x16x5大小的彩色立体块 {Pi=(Ii,ci;di)}, 其中A表示三维立体块;Ii表示第i立体块提取的特征值,【主权项】1. 一种,其特征在于包括下列步骤: 1.1构建可判别性二叉树,具体包括下列步骤: 1.1.1对训练视频序列进行分类处理,将含有目标的动作类别定义为正样本,对正样 本进行标记,不同的动作类别区别标记;将目标区域外的定义为负样本,负样本中只含有背 景,负样本统一标记; 1. 1. 2人的动作行为在时间和空间上都含有信息,为了准确描述不同人的动作行为,将 训练视频中整套动作在空间和时间上进行分解,其值设置为16x16x5大小的彩色立体块{Pi =(Ii,ci;di)}, 其中:Pi表示三维立体块;Ii表示第i立体块提取的特征值,/f)容纳多 通道特征值,"表示在第i个立体块中特征通道fe(1,2,…,F)对应的特征值;Ci表示为 动作类别标签,标记不同数字的立体块代表不同的动作类别,标记数字〇的立体块代表负 样本表示立体块中心到达时空域动作中心的三维矢量值;16x16和5分别表示训练视频 序列的空间信息和时间信息; 1. 1. 3对1. 1. 2步骤中的立体块进行特征提取和标记,立体块特征包括:灰度强度、位 置坐标对时间的导数和位置上的光流值;记录检测序列的立体块类别标记和立体块中心到 三维完整动作中心的矢量值; 1. 1. 4设定二叉树的截止条件:根据构建二叉树的规则,指定树的最大深度dMax和叶子 含有最小立体块的数量1^,当达到树的最大深度dMax或每个叶子集合中的立体块少于最小 立体块的数量Nmin时立刻停止; 1. 1. 5从根结点开始构建二叉树,输入步骤1. 1. 3中提取的立体块三维信息,进行二值 测试,通过比较特征通道f中位置PeR3和qeR3的特征值大小,其中R3表示三维空间, 二值测试定义如下:(1) 其中:t表示特征阈值,特征阈值通过遍历此特征通道中最小值到最大值,即min If(p) <t<maxIf(q),由于给出已知视频序列,minIf(p)和maxIf(q)通过计算求得; If(P)表示在位置中心P时,立体块中特征通道f的特征值,特征值按1. 1. 3步骤选取, 特征通道f?为1.1.2步骤所描述;T (r)表示以两个不同位置p和q为中心的立体块 在特征通道f中特征值的比较值,当特征通道f中以位置P为中心的立体块特征值小于以 位置q为中心的立体块特征值与阈值t的和时,二值比较值取0,当特征通道f中以位置p 为中心的立体块特征值大于或等于以位置q为中心的立体块特征值与阈值t的和时,二值 比较值取1 ; 对所有立体块{Pi= (I而言,随机选取p、q和t值,会产生二值测试集合 {tk},其中k表示集合的数量,二值集合{tk}有两类立体块,一类是特征通道f中特征值的 比较值为〇的立体块集合1,记为(Cl# (//) = 〇},另一类是特征通道f中特征值的比较值为 1的立体块集当前第1页1 2 本文档来自技高网
...
<a href="http://www.xjishu.com/zhuanli/55/CN104809455.html" title="基于可判别性二叉树投票的动作识别方法原文来自X技术">基于可判别性二叉树投票的动作识别方法</a>

【技术保护点】
一种基于可判别性二叉树投票的动作识别方法,其特征在于包括下列步骤:1.1构建可判别性二叉树,具体包括下列步骤:1.1.1对训练视频序列进行分类处理,将含有目标的动作类别定义为正样本,对正样本进行标记,不同的动作类别区别标记;将目标区域外的定义为负样本,负样本中只含有背景,负样本统一标记;1.1.2人的动作行为在时间和空间上都含有信息,为了准确描述不同人的动作行为,将训练视频中整套动作在空间和时间上进行分解,其值设置为16x16x5大小的彩色立体块{Pi=(Ii,ci,di)},其中:Pi表示三维立体块;Ii表示第i立体块提取的特征值,容纳多通道特征值,表示在第i个立体块中特征通道f∈(1,2,…,F)对应的特征值;ci表示为动作类别标签,标记不同数字的立体块代表不同的动作类别,标记数字0的立体块代表负样本;di表示立体块中心到达时空域动作中心的三维矢量值;16x16和5分别表示训练视频序列的空间信息和时间信息;1.1.3对1.1.2步骤中的立体块进行特征提取和标记,立体块特征包括:灰度强度、位置坐标对时间的导数和位置上的光流值;记录检测序列的立体块类别标记和立体块中心到三维完整动作中心的矢量值;1.1.4设定二叉树的截止条件:根据构建二叉树的规则,指定树的最大深度dMax和叶子含有最小立体块的数量Nmin,当达到树的最大深度dMax或每个叶子集合中的立体块少于最小立体块的数量Nmin时立刻停止;1.1.5从根结点开始构建二叉树,输入步骤1.1.3中提取的立体块三维信息,进行二值测试,通过比较特征通道f中位置p∈R3和q∈R3的特征值大小,其中R3表示三维空间,二值测试定义如下:其中:τ表示特征阈值,特征阈值通过遍历此特征通道中最小值到最大值,即min If(p)<τ<max If(q),由于给出已知视频序列,min If(p)和max If(q)通过计算求得;If(p)表示在位置中心p时,立体块中特征通道f的特征值,特征值按1.1.3步骤选取,特征通道f为1.1.2步骤所描述;tB,f,p,q,τ(Γ)表示以两个不同位置p和q为中心的立体块在特征通道f中特征值的比较值,当特征通道f中以位置p为中心的立体块特征值小于以位置q为中心的立体块特征值与阈值τ的和时,二值比较值取0,当特征通道f中以位置p为中心的立体块特征值大于或等于以位置q为中心的立体块特征值与阈值τ的和时,二值比较值取1;对所有立体块{Pi=(Ii,ci,di)}而言,随机选取p、q和τ值,会产生二值测试集合{tk},其中k表示集合的数量,二值集合{tk}有两类立体块,一类是特征通道f中特征值的比较值为0的立体块集合1,记为另一类是特征通道f中特征值的比较值为1的立体块集合2,记为其中,立体块集合1中含有特征值Ij的比较值为0的立体块集合3,记为和比较值为1的立体块集合4,记为每一类立体块都含有特征通道f中特征值的比较值1和0的立体块集;对二值测试集合中的立体块需要进行最佳分类,构建二叉树的过程中,每个子结点都需要分裂左右子结点,当树构建完成时,不同叶结点中有不同的立体块,这些立体块达到最佳分类,树的子结点具体分裂方法:动作类别不确定性用动作类别信息增益ΔH表示,其数学表达式为:ΔH=-|Il||Il|+|Ir|H(Il)-|Il||Il|+|Ir|H(Ir)---(2)]]>其中:Il和Ir分别表示分配到左右子结点的立体块集合,即为在特征通道f中特征值的比较值为1和0的立体块集合;H(·)为熵值pk表示当前子结点立体块动作类别的概率,H(Il)和H(Ir)分别表示左右子结点中立体块动作类别的熵值;计算立体块中心偏移值用ΔD表示,其数学表达式为:ΔD=ΣIl||dil-d‾l||2+ΣIr||dir-d‾r||2---(3)]]>其中:dil和dir分别表示落入左右子结点中第i个立体块矢量积;和分别表示落入左右子结点中立体块矢量积均值;1.1.6在1.1.5步骤中两个测量标准随机选取,当其中一个不确定性达到最小值,子结点达到最优分裂,产生左右子结点,左右子结点各自继续寻求最佳分裂;当达到树的最大深度dMax或者子结点中所含立体块数量小于最小立体块的数量Nmin,即达到1.1.4步骤规定的条件,停止分裂,二叉树构建完成,若没有达到截止条件,继续计算动作类别信息增益ΔH或立体块中心偏移值ΔD;由于特征选取的随机性,将5棵二叉树作为一个二叉树集合;1.1.7在1.1.6步骤构建成的二叉树中,叶结点存储2个信息,一是在训练中到达该叶结点不同动作类别概率值,第L个叶结点存储动作类别c的概率二是立体块中心偏移量的所有集合,第L个叶结点立体块中心矢量积存储的信息将会为检测立体块进行投票;1.1.8根据...

【技术特征摘要】

【专利技术属性】
技术研发人员:王世刚鲁奉军赵晓琳赵文婷卢洋
申请(专利权)人:吉林大学
类型:发明
国别省市:吉林;22

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1