基于字典学习的视频中判别性在线目标跟踪方法技术

技术编号:10311134 阅读:120 留言:0更新日期:2014-08-13 14:15
一种图像处理技术领域的基于字典学习的视频中判别性在线目标跟踪方法,通过手动标定或者已有跟踪结果构建目标的模板,同时获得待跟踪目标的状态;然后构建目标初始状态矩阵,然后进行运动建模,并采样形成候选样本;再将候选样本和模板进行分块,将各块进行稀疏编码,获得对应块的表示系数;将表示系数作为特征输入到相应块的分类器,获得该块各候选样本的判定置信度,将各块的判定置信度随机性抽取K个并求和,遍历所有可能性,取和值最大且在各可能性中被选取次数最多的候选样本,作为当前帧的目标跟踪结果。本发明专利技术能够提高复杂背景和目标外观变化情况下对目标跟踪的准确性和鲁棒性。

【技术实现步骤摘要】

本专利技术涉及的是一种图像处理
的方法,具体是一种。
技术介绍
近年来,视频监控技术得到了广泛的应用。目标跟踪,融合了计算机图像处理、模式识别、人工智能以及自动控制等诸多相关领域的知识与技术,目的在于模拟人类视觉感知功能,赋予机器辨识图像序列中运动目标的能力,为视频内容的高层次分析和理解提供重要的数据依据。复杂环境中目标的稳定和准确跟踪是当前跟踪技术研究与应用急需解决的问题,传统的跟踪方法往往表现不佳。近些年来,一类能够随着目标和环境变化自适应更新跟踪器有关参数的方法,被称为在线目标跟踪,受到了广泛的关注。该类方法能够克服目标姿态变化等内部因素、光照变化以及摄像机视角变换等外部因素对跟踪器的影响,取得了更好的跟踪效果。近年来,基于线性表示假设的稀疏表示和压缩感知技术已经引起了信号处理和机器视觉领域的广泛关注。2011年,X.Mei和H.Ling发表在《IEEE Transaction On PatternAnalysis And Machine Intelligence》上的论文“Robust Visual Tracking and VehicleClassification via Sparse Representation〃将稀疏表示运用于目标跟踪,该方法首先在模板空间下将目标由模板(候选模板与琐碎模板)的线性组合表示,然后用LI正则化模型表示模板的线性组合,最后使用内点法求解模板的系数,将重构误差最小的候选样本作为当前帧的跟踪结果。同年,B.Liu等人发表在《Computer Vision and PatternRecognition (CVPR), 2011IEEE Conference))的论文 “Robust tracking using localsparse appearance model and K-selection”中,提出了生成型在线跟踪方法SPT。该方法基于局部化稀疏表示模型,采用新提出的K - selection方法在线更新用于稀疏编码的基分布模型以形成字典,通过mean-shift和稀疏表示结果在判决图(Voting Map)上进行观测估计用以确定当前帧目标位置,从而将字典学习引入到在线跟踪领域。而从观测建模角度进行分类,在线跟踪方法可以分为生成型方法和判别型方法,相对于前者,后者在背景混乱及目标剧烈运动的环境中具备一定的性能优势。一般性地,跟踪问题可以表述为对目标状态序列演化的估计过程。在原理上,在线目标跟踪遵循贝叶斯状态估计的基本原理,可以归结为序列化的滤波过程,表述为:本文档来自技高网...

【技术保护点】
一种基于字典学习的视频中判别性在线目标跟踪方法,其特征在于,包括以下步骤:步骤1:跟踪器初始化:从待处理视频中,通过手动标定若干帧或者已有跟踪结果构建目标的模板,同时获得模板中待跟踪目标的状态;所述的目标的状态包括:目标矩形框在当前时刻的位置、倾斜角度、尺度、宽高比和偏斜角度,其状态空间为Xt={xt,yt,θt,st,αt,φt},其中:分别对应于标定目标方框的旋转角、缩放尺度、宽高比和偏斜方向;步骤2:在跟踪器完成初始化后,构建目标初始状态矩阵,然后进行运动建模,即相邻时刻目标状态的转移概率模型,并采样形成候选样本;步骤3:将候选样本和模板进行分块,将各块进行稀疏编码,获得对应块的表示系数;将表示系数作为特征组成结构化字典并输入到相应块的分类器,获得该块各候选样本的判定置信度,将各块的判定置信度随机性抽取K个并求和,遍历所有可能性,取和值最大且在各可能性中被选取次数最多的候选样本,作为当前帧的目标跟踪结果;所述的结构化字典通过判别性结构化字典学习方法进行更新。

【技术特征摘要】
1.一种基于字典学习的视频中判别性在线目标跟踪方法,其特征在于,包括以下步骤: 步骤1:跟踪器初始化:从待处理视频中,通过手动标定若干帧或者已有跟踪结果构建目标的模板,同时获得模板中待跟踪目标的状态; 所述的目标的状态包括:目标矩形框在当前时刻的位置、倾斜角度、尺度、宽高比和偏斜角度,其状态空间为Xt= {xt, Yt, Θ t, St, at,Cj5t},其中Jemv,.1T分别对应于标定目标方框的旋转角、缩放尺度、宽高比和偏斜方向; 步骤2:在跟踪器完成初始化后,构建目标初始状态矩阵,然后进行运动建模,即相邻时刻目标状态的转移概率模型,并采样形成候选样本; 步骤3:将候选样本和模板进行分块,将各块进行稀疏编码,获得对应块的表示系数;将表示系数作为特征组成结构化字典并输入到相应块的分类器,获得该块各候选样本的判定置信度,将各块的判定置信度随机性抽取K个并求和,遍历所有可能性,取和值最大且在各可能性中被选取次数最多的候选样本,作为当前帧的目标跟踪结果; 所述的结构化字典通过判别性结构化字典学习方法进行更新。2.根据权利要求1所述的方法,其特征是,所述的已有跟踪结果是指:当首次本文所提算法开始进行跟踪,则采用初始化时获得的过去若干帧手动标定的目标的状态或其它跟踪器跟踪处理的目标的状态作为模板;否则直接采用过去若干帧的目标的状态作为模板。3.根据权利要求1所述的方法,其特征是,所述的采样是指:根据AffineWarping的基本原理,基于仿射参数通过零均值、方差预先定义的正态分布进行,具体为:当相邻时刻目标状态各参数符合高斯分布,满足:&J=AmiAu)*则可按照预先设定的进行采样获得候选样本;其中:p (Xt I Xt^1)为状态转移概率模型,即t时刻的先验概率;xt对应时刻t的目标状态变量...

【专利技术属性】
技术研发人员:郑世宝薛明李宏波丁正彦朱文婕陈宇航
申请(专利权)人:上海交通大学
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1