本发明专利技术公开了一种基于感知哈希特征的视频目标跟踪方法,其特征在于,包括以下步骤:(1)读取待跟踪视频序列的第一帧;(2)在图像中画一恰好将目标包围的矩形框,作为目标框;(3)对视频帧图像进行灰度化处理;(4)提取目标框的局部哈希特征,并对特征进行为运算化处理;(5)读取视频下一帧,并采用同步骤(3)同样的方式对图像进行灰度化处理;(6)在当前帧中,采用倒金字塔候选框搜索方法在上一帧目标相同位置附近获取候选框;(7)采用同步骤(4)相同的方式,提取所有候选框的局部哈希特征;(8)计算所有候选框同上一帧目标框的相似度,选取相似度最大的候选框作为新的目标框,并重复步骤(5)~(7),直至视频结束。
【技术实现步骤摘要】
【专利摘要】本专利技术公开了一种基于感知哈希特征的视频目标跟踪方法,其特征在于,包括以下步骤:(1)读取待跟踪视频序列的第一帧;(2)在图像中画一恰好将目标包围的矩形框,作为目标框;(3)对视频帧图像进行灰度化处理;(4)提取目标框的局部哈希特征,并对特征进行为运算化处理;(5)读取视频下一帧,并采用同步骤(3)同样的方式对图像进行灰度化处理;(6)在当前帧中,采用倒金字塔候选框搜索方法在上一帧目标相同位置附近获取候选框;(7)采用同步骤(4)相同的方式,提取所有候选框的局部哈希特征;(8)计算所有候选框同上一帧目标框的相似度,选取相似度最大的候选框作为新的目标框,并重复步骤(5)~(7),直至视频结束。【专利说明】
本专利技术属于图像处理技术中的视频目标跟踪领域,提出了一种基于局部哈希特征 的视频目标实时跟踪方法。
技术介绍
视频目标跟踪是连续确定视频中目标所在相对位置,并大致指示目标大小的一种 技术。 视频目标跟踪技术涉及到计算机视觉处理、图像序列处理、模式识别以及人工智 能等领域,且其应用极其广泛,比如在商业上的商场、宾馆、住宅区的监控;公共事业上的学 校、医院、机场、车站等公共场所的监控;军事上一些基于机器视觉的制导系统、瞄准系统 等。 视频目标跟踪按照学习模型的不同可大致分为两类,分别为基于离线学习模型和 基于在线学习模型的跟踪算法。 基于离线学习模型的目标跟踪算法,需要大量同类物体的样本进行离线训练学 习,且跟踪的目标受限于学习的目标,因此这种算法没有被广泛的应用,只有在某些特定的 场合,如车辆跟踪、人脸跟踪中作为一种辅助检测的手段。 基于在线学习模型的跟踪算法,是目前视频跟踪领域中的主流算法,其不需要离 线学习样本,而是在跟踪的过程中,学习更新模型的参数,且其跟踪的目标也不限于某一特 定目标,只要在视频初始阶段给出跟踪目标的大致信息即可。算法模型会根据初始阶段标 记得到的大致信息进行学习。在线学习算法的学习模型往往比较简单,所以学习过程也较 为快速。 但是,基于在线学习模型的跟踪算法,几乎都只有在高性能的计算机上才能实现 实时跟踪(即每秒至少处理15帧),这是因为这些算法一般采用HOG、Haar-like、LBP等较为 复杂的局部特征作为学习模型的学习特征,这些特征的提取、运算需要花费较多的时间,因 此这些算法不能很好的移植到一些实用的嵌入式系统中去。 另外,目前绝大部分基于在线学习模型的跟踪算法都属于判别式跟踪算法,这种 算法将跟踪问题看成一个二分类问题,其需要在视频的每帧图像中选取一定的候选框,再 通过学习机从候选框中选出新的跟踪结果。对于候选框的获取方法,目前没有较为简便的 方式,一般都是在跟踪目标附近全遍历,搜索所有可能的候选框,这种方法可以获得大量候 选框,但对于跟踪而言,有许多候选框是冗余的,这会加重算法的运算负担。
技术实现思路
针对现有视频目标跟踪技术中的特征较为复杂,运算量较大的不足之处,本专利技术 提出了一种基于感知哈希特征的视频目标跟踪方法,并对特征进行位运算化处理,实现了 快速、高效的视频目标跟踪。 本专利技术提出的基于感知哈希特征的视频目标跟踪方法主要包括以下步骤: (I)读取待跟踪视频序列的第一帧; (2)在图像中画一恰好将目标包围的矩形框,作为目标框; (3)对视频帧图像进行灰度化处理; (4)提取目标框的局部哈希特征,并对特征进行为运算化处理; (5)读取视频下一帧,并采用同步骤(3)同样的方式对图像进行灰度化处理; (6)在当前帧中,采用倒金字塔候选框搜索方法在上一帧目标相同位置附近获取 候选框; (7)采用同步骤(4)相同的方式,提取所有候选框的局部哈希特征; (8)计算所有候选框同上一帧目标框的相似度,选取相似度最大的候选框作为新 的目标框,并重复步骤(5)~(7 ),直至视频结束。优选地,对于步骤(4)具体包括以下内容: (4-1)感知哈希原理: 感知哈希是从多媒体数据集到感知摘要集的一种单向映射,通过感知哈希函数将 庞大的多媒体对象映射为数据量较小、长度较短的比特序列,将内容相同或相近的多媒体 对象映射为数学相同或相近的哈希值。感知阈值理论告诉我们,人类要想能够感知到不同 的事物,那么该事物所带来的刺激就必须要超过人类的感知阈值,那些未能超过阈值的,则 均被认为是相同"数据",由此可知,感知哈希是允许一定感知误差的,它由传统哈希发展而 来,不但具有传统哈希简洁性、安全性的特点,还极大地提高了哈希的鲁棒性。本专利技术,将感知哈希理论应用到目标跟踪领域,并结合目标跟踪的特点与需求,提 出了基于感知哈希原理的局部哈希特征。局部哈希特征具有而局部哈希特征在跟踪算法中 也能够继承其简洁性、鲁棒性的特点,因此,本专利技术可以实现快速、鲁棒的跟踪算法。 感知哈希特征的提取原理如下: 其中式中P(x,y)表示原图在点(x,y)处的像素值,S(x,y)表 示哈希特征在点(x,y)处的结果值,w表示图像的宽度,h表示图像的高度。 观察图2,可发现感知哈希特征提取的过程中,会删去图像中大部分的低频信息, 只保留图像中的高频信息,即将图像中目标的边缘、轮廓信息保留下来。 同时,原图中每个像素都是由RGB三个通道的像素值组成,每个通道都存有一个长 度为8位的像素值,而结果图中每个像素都只是由一个通道的数据组成,且由一位的0或1表 示,这极大地减少了数据的信息量。 传统的基于感知哈希原理的跟踪是一种模板匹配的方法,即将目标框、候选框缩 小到8*8个像素大小,再比较候选框与上一帧目标框的相似度,选出相似度最高的候选框作 为新的目标框。这种方法虽然简单易实现,但是跟踪的效果较差,尤其是在跟踪目标出现形 变、部分遮挡时,跟踪效果极为不好。产生这种现象的原因是这种8*8的模板删减了太多的 目标特征信息,从而导致不同的候选框图像却可能产生相同的哈希序列。因此,这种方法虽 然有相当好的简洁性,但却不满足跟踪问题中所需求的鲁棒性。 (4-2)局部哈希特征提取 本专利技术为了解决传统的基于感知哈希的跟踪方法鲁棒性较差的问题,在原有感知 哈希原理的基础上,提出了一种基于图像块划分的局部哈希特征。这种特征是在原目标图 像中提取出许多大小为8*8的局部子图像块,分别对每个子图像块提取感知哈希特征,便可 以得到局部哈希特征。 本专利技术将局部子图像块的大小定为8*8原因,是为了更加符合机器运算的规则,为 了更方便的使用机器运算中快速的位运算操作。在后文中,将会有更加详细的关于使用位 运算的方法。 本专利技术在获取局部子图像块的过程中,采用8*8模板在待提取特征图像中平移,每 次平移均可获得一个8*8的子图像块,对于大小为w · h的图像,一共可获取子图像块的个数 为: 其中,a为每次平移的步长,为取整符号。获得多个子图像块后,用上述的哈希特征提取原理对子图像块提取哈希特征。 (4-3)位运算化处理观察附图3b,可发现每个局部哈希特征都是一个含有64个元素的矩阵,且矩阵元 素较为特殊,只含有〇或者1。在机器运算中,其对数据存储的方式也是由0、1组成的二进制序列。本专利技术利用局 部哈希特征矩阵元素只有〇、1的特点,将每个局部哈希特征矩阵按行序排列成一个长度为 64的向量。且在机器运算中存在一种长整型变量也是64位本文档来自技高网...
【技术保护点】
一种基于感知哈希特征的视频目标跟踪方法,其特征在于,包括以下步骤:(1)读取待跟踪视频序列的第一帧;(2)在图像中画一恰好将目标包围的矩形框,作为目标框;(3)对视频帧图像进行灰度化处理;(4)提取目标框的局部哈希特征,并对特征进行为运算化处理;(5)读取视频下一帧,并采用同步骤(3)同样的方式对图像进行灰度化处理;(6)在当前帧中,采用倒金字塔候选框搜索方法在上一帧目标相同位置附近获取候选框;(7)采用同步骤(4)相同的方式,提取所有候选框的局部哈希特征;(8)计算所有候选框同上一帧目标框的相似度,选取相似度最大的候选框作为新的目标框,并重复步骤(5)~(7),直至视频结束。
【技术特征摘要】
【专利技术属性】
技术研发人员:韩守东,陈永志,刘甜甜,陈阳,
申请(专利权)人:华中科技大学,
类型:发明
国别省市:湖北;42
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。