本发明专利技术公开了一种目标检测跟踪方法和装置,该方法包括:预测目标可能出现的位置,在预设的检测半径内,随机选取若干检测块;将检测块输入特征提取器,提取特征;将提取的特征输入到集合分类器,判断每个检测块中是否包含目标,获取最有可能包含目标的最优检测块,并根据检验结果更新集合分类器的参数;将前一帧图像的目标所在位置作为模板,对最优检测块周围区域进行模板匹配,获取目标在当前帧图像中的准确位置;在前一帧图像的目标所在位置随机选取若干特征点,在当前帧图像中确定每个特征点对应的位置,根据这些特征点在两帧图像中的位移变化,实时跟踪目标。本方法提高了检测跟踪的效率的准确性,并且可以在线学习,长期检测跟踪。
【技术实现步骤摘要】
一种目标检测跟踪方法和装置
本专利技术涉及计算机视觉
,具体涉及一种目标检测跟踪方法和装置。
技术介绍
由于技术的发展、摄像机的广泛应用,视频分析在各行各业也得到了广泛的应用。目前有很多跟踪检测方法,比如早期的基于模板匹配的检测跟踪方法,速度慢且精度低;现在有些在线学习的方法,例如在线检测算法(tld)可以在线学习,但是效果不能够满足应用需求;还有基于机器学习的检测算法,例如基于卷积神经网络(cnn)的目标检测算法,需要经过大量的训练,且不能在线学习,长时间之后,目标可能发生很多形变,会造成跟踪不准。
技术实现思路
本专利技术提供了一种目标检测跟踪方法和装置,以实现可在线学习的检测跟踪,并提高检测跟踪的精度。根据本专利技术的一个方面,本专利技术提供了一种目标检测跟踪方法,包括:预测目标在当前帧图像中可能出现的位置,以该位置为中心,在预设的检测半径内,随机选取若干检测块;将选取的检测块输入特征提取器,提取每个检测块的特征;将每个检测块的特征输入到集合分类器进行分类,判断每个检测块中是否包含目标,获取最有可能包含目标的最优检测块,并根据检验结果更新所述集合分类器的参数;将前一帧图像的目标所在位置作为模板,对所述最优检测块周围区域进行模板匹配,获取目标在当前帧图像中的准确位置;在前一帧图像的目标所在位置随机选取若干特征点,在当前帧图像中确定每个特征点对应的位置,根据这些特征点在两帧图像中的位移变化,实时跟踪目标。根据本专利技术的另一个方面,本专利技术提供了一种目标检测跟踪装置,包括:检测块选取单元,用于预测目标在当前帧图像中可能出现的位置,以该位置为中心,在预设的检测半径内,随机选取若干检测块;特征提取器,用于对所述检测块选取单元选取的检测块,提取每个检测块的特征;集合分类器,用于对所述特征提取器提取的每个检测块的特征进行分类,判断每个检测块中是否包含目标,获取最有可能包含目标的最优检测块,并根据检验结果更新所述集合分类器的参数;位置获取单元,用于将前一帧图像的目标所在位置作为模板,对所述集合分类器获取的最优检测块周围区域进行模板匹配,获取目标在当前帧图像中的准确位置;目标跟踪单元,用于在前一帧图像的目标所在位置随机选取若干特征点,在当前帧图像中确定每个特征点对应的位置,根据这些特征点在两帧图像中的位移变化,实时跟踪目标。本专利技术的有益效果是:本专利技术实施例在预测位置选取检测块,提高了效率;设计专门的特征提取器,提取检测块的有效特征,提高检测跟踪的准确性;提取的特征输入到集合分类器,判断检测块中是否包含目标,选出最优检测块并在其周围区域进行模板匹配,从而检测目标的准确位置,并根据检验结果更新集合分类器的参数,实现在线学习;根据特征点在连续两帧图像中的位移变化,可以实现对目标运动的跟踪。附图说明图1是本专利技术一个实施例提供的一种目标检测跟踪方法的流程图;图2是本专利技术一个实施例中深度卷积神经网络的示意图;图3是本专利技术一个实施例提供的一种目标检测跟踪装置的功能框图。具体实施方式本专利技术的设计构思是:现有的跟踪检测方法各有不足,不能满足应用需求。例如基于模板匹配的检测跟踪方法,速度慢且精度低;在线检测算法虽然可以在线学习,但是效果不能够满足应用需求;基于卷积神经网络的目标检测算法,需要经过大量的训练,且不能在线学习。针对这种情况,本专利技术在预测位置选取检测块,提高了效率;设计专门的特征提取器,提取检测块的有效特征,提高检测跟踪的准确性;再将特征输入到集合分类器,判断检测块中是否包含目标,选出最优检测块并在其周围区域进行模板匹配,从而检测目标的准确位置,并根据检验结果更新集合分类器的参数,实现了在线学习;根据特征点在连续两帧图像中的位移变化,还可以实现对目标运动的跟踪。实施例一图1是本专利技术一个实施例提供的一种目标检测跟踪方法的流程图,如图1所示,本实施例提供的目标检测跟踪方法包括:步骤S110:预测目标在当前帧图像中可能出现的位置,以该位置为中心,在预设的检测半径内,随机选取若干检测块。检测半径r可以根据需要配置。可以根据之前的图像预测目标在当前帧图像的位置,例如当在前两帧图像中包含目标时,根据目标在前一帧图像中的位置以及目标在前两帧图像中的运动情况,即可预测目标在当前帧图像中的可能出现的位置。如果之前的图像中不包含目标,那么用户可以人工指定初始的跟踪位置,或者通过光流法等其他现有的方法确定初始的跟踪位置,作为目标在当前帧图像中可能出现的位置。步骤S120:将选取的检测块输入特征提取器,提取每个检测块的特征。现有的在线学习方法提取的图像特征比较简单,跟踪效果不能满足应用需求。因此在优选实施例中,特征提取器采用深度卷积神经网络,充分利用深度卷积神经网络可以提取有效特征的优点。由于本方案不但需要目标跟踪的精度,还需要有较高的效率,才能够满足应用需求,因此深度卷积神经网络的结构需要尽量简单有效。如图2所示,本实施例中的深度卷积神经网络包括3个卷积层和2个降采样层,卷积核的大小为5*5,选取的检测块为32*32像素。每个检测块输入到深度卷积神经网络中,最终会得到一个对应的54维的特征向量。在利用特征提取器提取检测块的特征之前,需要对深度卷积神经网络进行训练。本实施例建立了一个样本库,样本库中尽量包含目标的各种形状、尺度的图片,目标的选取仅需要任意选择一个同类的目标即可,例如当需要跟踪小汽车时,仅需要任意选择一个小汽车即可,而不必选择某一辆特定的小汽车。利用这个样本库训练深度卷积神经网络的卷积核的参数等,通过训练得到用于提取特征的深度卷积神经网络,用于提取检测块的特征。步骤S130:将每个检测块的特征输入到集合分类器进行分类,判断每个检测块中是否包含目标,获取最有可能包含目标的最优检测块,并根据检验结果更新集合分类器的参数。本实施例中的集合分类器为随机森林分类器,其中包含有n个基本分类器,每个基本分类器包含m个特征比较集,也就是说每颗树有m个判断节点,输入图像的特征与每一个判断节点进行比较,产生0或1,然后将这m个0或1的数连成二进制码,从而获取n个长度为m的二进制数,计算后验概率:P(y|x)=pCounter/(pCounter+nCounter),其中pCounter和nCounter分别是正和负图像片的数目。计算后验概率的过程如下所示:整个集合分类器公有n个基本分类器,也就是有n个后验概率,然后求平均,若某个检测块的后验概率均值大于预设的后验概率阈值,则判断该检测块中包含目标,否则判断该检测块中不包含目标。可以将检测块分为正样本和负样本,正样本为目标块,负样本为背景块。设置目标阈值th和背景阈值th1,将后验概率均值小于背景阈值th1的检测块作为负样本,将后验概率均值大于目标阈值th的检测块作为正样本,更新集合分类器中每个基本分类器的正负样本集,并根据集合分类器中每个基本分类器更新后的正负样本集,更新后验概率阈值。本方法可以广泛的应用到动态背景或者静态背景下的目标检测及跟踪。将所有的检测块计算一遍,找出后验概率最大检测块的作为最优检测块,其包含目标的可能性最大。作为一个具体的实施例,集合分类器包含有15个基本分类器,每个基本分类器包含13个特征比较集。后验概率阈值的初始值设置为0.6,之后会训练优化。目标阈值th取00.65,背景阈值t本文档来自技高网...
【技术保护点】
一种目标检测跟踪方法,其特征在于,所述方法包括:预测目标在当前帧图像中可能出现的位置,以该位置为中心,在预设的检测半径内,随机选取若干检测块;将选取的检测块输入特征提取器,提取每个检测块的特征;将每个检测块的特征输入到集合分类器进行分类,判断每个检测块中是否包含目标,获取最有可能包含目标的最优检测块,并根据检验结果更新所述集合分类器的参数;将前一帧图像的目标所在位置作为模板,对所述最优检测块周围区域进行模板匹配,获取目标在当前帧图像中的准确位置;在前一帧图像的目标所在位置随机选取若干特征点,在当前帧图像中确定每个特征点对应的位置,根据这些特征点在两帧图像中的位移变化,实时跟踪目标。
【技术特征摘要】
1.一种目标检测跟踪方法,其特征在于,所述方法包括:预测目标在当前帧图像中可能出现的位置,以该位置为中心,在预设的检测半径内,随机选取若干检测块;将选取的检测块输入特征提取器,提取每个检测块的特征;将每个检测块的特征输入到集合分类器进行分类,判断每个检测块中是否包含目标,获取最有可能包含目标的最优检测块,并根据检验结果更新所述集合分类器的参数;将前一帧图像的目标所在位置作为模板,对所述最优检测块周围区域进行模板匹配,获取目标在当前帧图像中的准确位置;在前一帧图像的目标所在位置随机选取若干特征点,在当前帧图像中确定每个特征点对应的位置,根据这些特征点在两帧图像中的位移变化,实时跟踪目标。2.如权利要求1所述的方法,其特征在于,所述特征提取器为深度卷积神经网络;在将选取的检测块输入特征提取器,提取每个检测块的特征之前,所述方法还包括:建立一个样本库,所述样本库中包含有目标的多种形状、尺度的图片;利用所述样本库训练所述深度卷积神经网络的卷积核的参数。3.如权利要求1所述的方法,其特征在于,所述集合分类器为随机森林分类器;所述集合分类器包括n个基本分类器,每个基本分类器包含m个特征比较集;所述判断每个检测块中是否包含目标,获取最有可能包含目标的最优检测块,包括:将每个检测块的特征依次输入所述集合分类器中的每个基本分类器,与每个基本分类器的判断节点进行比较,产生0或1,从而获取n个长度为m的二进制数以及对应的n个后验概率;计算每个检测块的n个后验概率的均值,若某个检测块的后验概率均值大于预设的后验概率阈值,则判断该检测块中包含目标,否则判断该检测块中不包含目标;将后验概率均值最大的检测块作为所述最优检测块。4.如权利要求3所述的方法,其特征在于,所述根据检验结果更新所述集合分类器的参数,具体包括:将后验概率均值小于预设的背景阈值的检测块作为负样本;将后验概率均值大于预设的目标阈值的检测块作为正样本;更新所述集合分类器中每个基本分类器的正负样本集;根据所述集合分类器中每个基本分类器更新后的正负样本集,更新所述后验概率阈值。5.如权利要求1所述的方法,其特征在于,所述根据所述若干特征点在两帧图像中的位移变化,跟踪目标的运动情况包括:对所有特征点的位移变化的大小进行排序,获取排序的中值,将不大于所述中值的预设比例的特征点作为当前帧的特征点,并以此...
【专利技术属性】
技术研发人员:王晓曼,
申请(专利权)人:歌尔科技有限公司,
类型:发明
国别省市:山东,37
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。