一种基于深度去噪自动编码器的粒子滤波跟踪方法技术

技术编号:20747135 阅读:43 留言:0更新日期:2019-04-03 10:43
本发明专利技术属于计算机视觉分析技术领域,具体涉及一种基于深度去噪自动编码器的粒子滤波跟踪方法,包括初始化阶段,采用视频第一帧手动标定目标位置,在第一帧跟踪过程和跟踪处理中,需要分别在目标背景和前景附近选择一定数量的正负样本,初始化训练好的网络模型,第二步,进行重要性抽样,第三步,计算观察概率,第四步,更新权重,第五步,判断并选择出权重信息中权重最大的粒子,认为该粒子的即为我们接下来所要跟踪的目标,为下一帧更新跟踪新样本,循环第二步到第五步的过程,直到视频播放完毕,本方法能够有效地区分目标特征和背景,提高了跟踪算法的精度。

【技术实现步骤摘要】
一种基于深度去噪自动编码器的粒子滤波跟踪方法
本专利技术属于计算机视觉分析
,具体涉及一种基于深度去噪自动编码器的粒子滤波跟踪方法。
技术介绍
视觉目标跟踪是计算机视觉和视觉分析的一个重要研究方向。典型的视觉分析需要对感兴趣的对象进行一致且稳定的跟踪。对于单目视觉目标跟踪,众多学者提出了值得借鉴的理论和算法。在实际应用中,由于复杂背景、目标遮挡、目标快速运动、光照变化等因素的影响,该问题仍然面临着巨大的挑战。深度神经网络在目标检测和目标分类方面具有很强的学习能力。深度学习架构更适合学习分类特征而不是特定目标。此外,深层神经网络算法通常需要较长的迭代训练过程才能收敛,难以满足在线学习的实时要求。因此,很难将当前的深度学习网络体系结构扩展到目标跟踪领域。
技术实现思路
为了解决目标跟踪过程中背景复杂、光线变化、目标遮挡等干扰问题,以及现有跟踪算法抗干扰能力较差的问题,本专利技术提供了一种基于深度去噪自动编码器的粒子滤波跟踪方法。本专利技术要解决的技术问题通过以下技术方案实现:一种基于深度去噪自动编码器的粒子滤波跟踪方法,包括:步骤1:训练深度网络模型,通过无监督的逐层贪心训练每一层网络并在训练数据中加入噪声以得到更为稳健的特征表达,通过分类神经网络对这些特征进行有监督的学习,进一步优化网络的参数;步骤2:采用视频第一帧手动标定目标位置,从序列中选取正负训练样本,初始化步骤1中深度网络模型;步骤3:采用重要性抽样粒子集,然后通过训练好的网络模型向前传播每个粒子,并通过分类神经网络计算在线跟踪过程中每个粒子的置信度;步骤4:根据步骤3中粒子置信度计算粒子的观测概率;步骤5:根据步骤4中观察概率更新粒子的权重,以确定目标位置,为下一帧更新跟踪新样本,循环步骤3到步骤5的过程,直到视频播放完毕。进一步的,所述步骤1中深度网络模型由自动降噪编码器叠加,并使用下一层的输出作为上层的输入;所述自动降噪编码器,包括编码器、解码器和隐式层三部分,所述解码器需要根据噪声特性预测原始未损坏的数据,最后输出最接近的原始输入,高斯噪声通常用作衰减矢量,其表达式为:其中,x是没有噪声干扰的原始输入,是噪声污染后的数据,而σ表示自动编码器的正则化程度。进一步的,所述步骤1中训练过程如下:假设针对未标记类别的训练样本集x∈Rd,通过激活函数f将输入x映射到隐藏层以获得z∈Rdz∈fθ(x)=σ(Wx+b)(1)其中,θ={W,b},W是权重矩阵,b是编码层矢量,σ是非线性激活函数,解码器重新映射输入的编码表示以形成重构的yy∈fθ′(h)=σ(W′h+b′)(2)其中,θ′={W′,b′},W′是权重矩阵W的转置,σ是解码的激活函数;自动降噪编码器通过上述过程使y约等于x;假设训练集{(x(1),y(1)),...,(x(m),y(m))}包含m个训练样本,x表示单个样本特征,y表示样本对应的输入,并且采用单个样本(x,y)来定义其成本函数;其中hW,b(x)是对应于网络的样本x的输出值,因此m个样本训练集的成本函数是:λ是减重系数,控制两部分的相对重要性;训练自动降噪编码器的过程是调整训练样本集中参数{θ,θ′}的最小重建误差J(W,b),J(W,b)是一个凸起函数,通常通过迭代方法优化。进一步的,所述分类神经网络包括自动降噪编码器编码部分与k个稀疏约束连接的分类层组成。进一步的,所述步骤1中分类神经网络学习方法如下:设Z是自编码器隐藏层的激活函数。在前向传播阶段,激活函数Z是:z=WTx+b(6)其中,x是输入向量;w是权重;b是偏置(bias)。保持激活函数前K个最大值并将其余所有设置为零:其中,(Γ)c是z的补充,(Γ)c=suppk(z)。稀疏z用于计算网络重建误差:其中,x是训练样本集,W代表权重,b′代表偏置(bias)的转置,权重由激活函数输出的前K个最大值反向传播以重建误差迭代调整。进一步的,所述步骤3中置信度的算法如下:设oi是对应于类ki的神经网络的输出,则输出值的期望是后验概率。E{oi}=P(ki|x)(9)其中,x是网络输入。通常,将最大输出的相应类别作为决策,因此可以从神经网络的后验概率获得置信度,并且将分类神经网络的最大输出作为置信度:c(x)=E{maxoi}(10)进一步的,所述步骤3中重要性抽样方法如下:当新帧图像到达时,根据重要度分布q(st|st-1,y1:t)和运动模型,从t-1时刻的粒子集得到t时刻的n个粒子其中,对应于粒子集的重要性权重的总和St为1;目标状态st由六个仿射参数水平平移、垂直平移、缩放、宽/高比率、旋转和偏斜表示st=(tx,ty,sxy,ra,ar,sa);状态转移的每个维度分布在运动模型中是一个独立的零均值正态分布模型。进一步的,所述步骤4中观察概率计算方法如下:每个粒子通过分类神经网络向前传播以获得其置信度并将最大置信度与设定的阈值τ进行比较,如果重新选择正负训练样本,初始化分类神经网络;如果计算粒子的观测概率,如下:其中yt是指t时刻样本对应输入,是指t时刻的第i个粒子。进一步的,所述步骤5中更新粒子的权重方法为:其中,代表重要性抽样中状态转移的每个维度分布,即为计算所得的粒子概率分布,一般意义分布q(st|st-1,y1:t)采用一阶马尔可夫过程q(st|st-1),即状态变换独立于模型观测,然后将权值更新为:其中表示更新前一时刻的权重,代表上一步计算所得的粒子观测概率,对于每一帧,具有最大权重的粒子是跟踪结果;每个跟踪帧更新一个正样本,接着跟踪下一个正样本;将对应于最大粒子的状态确定为当前车辆外部的帧目标位置本专利技术的有益效果:自动降噪编码器通过无监督的逐层贪心训练和参数优化多层网络结构获得高维复杂输入的分布式特征表示,对于不同的任务,只需要调整网络参数;本方法通过深度去噪的自动降噪编码器,能够有效地区分目标特征和背景;引入分类神经网络,提高了网络的分类能力,提高了跟踪算法的精度,最后,利用粒子滤波用于跟踪目标。附图说明图1是自动降噪编码器原理示意图。图2是分类神经网络结构示意图。图3是室内遮挡现象跟踪结果示意图。图4是室外遮挡现象跟踪结果示意图。图5是光照变化目标跟踪结果示意图。图6是目标模糊目标跟踪结果示意图。具体实施方式下面结合具体实施例对本专利技术做进一步详细的描述,但本专利技术的实施方式不限于此。一种基于深度去噪自动编码器的粒子滤波跟踪方法,包括以下步骤:步骤1:训练深度网络模型,通过无监督的逐层贪心训练每一层网络并在训练数据中加入噪声以得到更为稳健的特征表达,通过分类神经网络对这些特征进行有监督的学习,进一步优化网络的参数;步骤2:采用视频第一帧手动标定目标位置,从序列中选取正负训练样本,初始化步骤1中深度网络模型;步骤3:采用重要性抽样粒子集,然后通过训练好的网络模型向前传播每个粒子,并通过分类神经网络计算在线跟踪过程中每个粒子的置信度;步骤4:根据步骤3中粒子置信度计算粒子的观测概率;步骤5:根据步骤4中观察概率更新粒子的权重,以确定目标位置,为下一帧更新跟踪新样本,循环步骤3到步骤5的过程,直到视频播放完毕。如图1所示,步骤1中深度网络模型由自动降噪编码器叠加,深度自动编码器是一种典型的无监督学习网络,它是一个深度网络模型,由自编码器叠加,并使用下一本文档来自技高网...

【技术保护点】
1.一种基于深度去噪自动编码器的粒子滤波跟踪方法,其特征在于:步骤1:训练深度网络模型,通过无监督的逐层贪心训练每一层网络并在训练数据中加入噪声以得到更为稳健的特征表达,通过分类神经网络对这些特征进行有监督的学习,进一步优化网络的参数;步骤2:采用视频第一帧手动标定目标位置,从序列中选取正负训练样本,初始化步骤1中深度网络模型;步骤3:采用重要性抽样粒子集,然后通过训练好的网络模型向前传播每个粒子,并通过分类神经网络计算在线跟踪过程中每个粒子的置信度;步骤4:根据步骤3中粒子置信度计算粒子的观测概率;步骤5:根据步骤4中观察概率更新粒子的权重,以确定目标位置,为下一帧更新跟踪新样本,循环步骤3到步骤5的过程,直到视频播放完毕。

【技术特征摘要】
1.一种基于深度去噪自动编码器的粒子滤波跟踪方法,其特征在于:步骤1:训练深度网络模型,通过无监督的逐层贪心训练每一层网络并在训练数据中加入噪声以得到更为稳健的特征表达,通过分类神经网络对这些特征进行有监督的学习,进一步优化网络的参数;步骤2:采用视频第一帧手动标定目标位置,从序列中选取正负训练样本,初始化步骤1中深度网络模型;步骤3:采用重要性抽样粒子集,然后通过训练好的网络模型向前传播每个粒子,并通过分类神经网络计算在线跟踪过程中每个粒子的置信度;步骤4:根据步骤3中粒子置信度计算粒子的观测概率;步骤5:根据步骤4中观察概率更新粒子的权重,以确定目标位置,为下一帧更新跟踪新样本,循环步骤3到步骤5的过程,直到视频播放完毕。2.根据权利要求1所述的一种基于深度去噪自动编码器的粒子滤波跟踪方法,其特征在于:所述步骤1中深度网络模型由自动降噪编码器叠加,并使用下一层的输出作为上层的输入;所述自动降噪编码器,包括编码器、解码器和隐式层三部分,所述解码器需要根据噪声特性预测原始未损坏的数据,最后输出最接近的原始输入,高斯噪声通常用作衰减矢量,其表达式为:其中,x是没有噪声干扰的原始输入,是噪声污染后的数据,而σ表示自动编码器的正则化程度。3.根据权利要求1所述的一种基于深度去噪自动编码器的粒子滤波跟踪方法,其特征在于:所述步骤1中训练过程如下:假设针对未标记类别的训练样本集x∈Rd,通过激活函数f将输入x映射到隐藏层以获得z∈Rdz∈fθ(x)=σ(Wx+b)(1)其中,θ={W,b},W是权重矩阵,b是编码层矢量,σ是非线性激活函数,解码器重新映射输入的编码表示以形成重构的yy∈fθ′(h)=σ(W′h+b′)(2)其中,θ′={W′,b′},W′是权重矩阵W的转置,σ是解码的激活函数;自动降噪编码器通过上述过程使y约等于x;假设训练集{(x(1),y(1)),...,(x(m),y(m))}包含m个训练样本,x表示单个样本特征,y表示样本对应的输入,并且采用单个样本(x,y)来定义其成本函数;其中hW,b(x)是对应于网络的样本x的输出值,因此m个样本训练集的成本函数是:λ是减重系数,控制两部分的相对重要性;训练自动降噪编码器的过程是调整训练样本集中参数{θ,θ′}的最小重建误差J(W,b),J(W,b)是一个凸起函数,通常通过迭代方法优化。4.根据权利要求1所述的一种基于深度去噪自动编码器的粒子滤波跟踪方法,其特征在于:所述分类神经网络包括自动降噪编码器编码部分与k个稀疏约束连接的分类层组成。5.根据权利要求1所述的一种基于深度去...

【专利技术属性】
技术研发人员:李良福宋睿
申请(专利权)人:陕西师范大学
类型:发明
国别省市:陕西,61

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1