目标获取方法及设备技术

技术编号：13798918 阅读：94 留言：0更新日期：2016-10-07 00:15

本申请提供一种目标获取方法及设备，根据每一视频帧的全局特征得到该视频帧中的各尺度的目标预估位置，对每一视频帧中的所述目标预估位置进行聚类处理得到对应的目标候选区域，及根据每一视频帧中的所有所述目标候选区域，并结合所述目标候选区域的置信度及对应尺度处理，确定该视频帧中的目标实际区域的，能够快速、有效的获取一个或多个目标，尤其能够对多个目标进行精确区分和获取。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及通信及计算机领域，尤其涉及一种目标获取方法及设备。
技术介绍
随着4G时代的到来，移动端的信息传递方式并不仅限于文本和图片，更多地来自于视频。互联网公司也纷纷推出了相关的应用接口，视频信息的获取技术成为近期的研究热点之一。现有的多目标跟踪技术大多应用于雷达、航空领域，包括空间跟踪方法和时间-空间跟踪方法等，其中，空间跟踪方法是单独对每帧图像信号进行处理，利用目标信号在二维空间中的特征跟踪运动目标；时间-空间跟踪方法是同时利用目标在空间域的特征和时间域的运动特性，它又分为对比度跟踪和图像相关跟踪两类。其他的还有基于粒子滤波器的方法，基于均值漂移方法等。现有的多目标跟踪技术的适用场景较为单一，跟踪目标类型较为单一，其原因在于：一方面由于现有的多类分类器的分类精度较低且考虑到运行效率无法使用深度神经网络等复杂分类算法；另一方面由于多目标跟踪不仅需要面对目标和背景的区分问题，还需要面临目标之间的相互区分问题。针对目标跟踪算法而言，以简单的单目标而言，现有的OpenTLD达到了较为稳定的效果，且开放了源代码，但其只针对单目标。而现有的通过CNN建立通用的多类目标模型，在视频第一帧开始时就进行多目标检测，给出各个目标所在的位置，然后利用传统的目标跟踪方法就可以进行跟踪的方案在多目标检测过程中需要消耗大量的计算，而且需要在线下训练庞大的模型，
对于计算和存储的消耗都是巨大的，也很难满足视频中实时应用的要求。
技术实现思路
本申请的目的是提供一种目标获取方法及设备，解决如何对多个目标进行精确区分和获取的问题。有鉴于此，本申请提供一种目标获取方法，包...

【技术保护点】
一种目标获取方法，其中，包括：根据每一视频帧的全局特征得到该视频帧中的各尺度的目标预估位置；对每一视频帧中的所述目标预估位置进行聚类处理得到对应的目标候选区域；根据每一视频帧中的所有所述目标候选区域，并结合所述目标候选区域的置信度及对应尺度处理，确定该视频帧中的目标实际区域。

【技术特征摘要】
1.一种目标获取方法，其中，包括：根据每一视频帧的全局特征得到该视频帧中的各尺度的目标预估位置；对每一视频帧中的所述目标预估位置进行聚类处理得到对应的目标候选区域；根据每一视频帧中的所有所述目标候选区域，并结合所述目标候选区域的置信度及对应尺度处理，确定该视频帧中的目标实际区域。2.如权利要求1所述的方法，其中，根据每一视频帧中的所有所述目标候选区域，并结合所述目标候选区域的置信度及对应尺度处理，确定该视频帧中的目标实际区域之后，所述方法还包括：将两相邻时刻的视频帧中的同一目标实际区域进行比较，判定视频帧中的该目标实际区域是否为无效。3.如权利要求1或2所述的方法，其中，根据每一视频帧的全局特征得到该视频帧中的各尺度的目标预估位置之前，所述方法还包括：对每一视频帧进行大小归一化处理。4.如权利要求1至3中任一项所述的方法，其中，所述全局特征包括全局灰度特征、全局纹理特征、全局颜色特征、全局运动特征中一个或多个。5.如权利要求4所述的方法，其中，每一视频帧的全局灰度特征根据该视频帧的三个颜色通道之和的均值得到。6.如权利要求4所述的方法，其中，每一视频帧的全局纹理特征利用Gabor矩阵或Canny算子的边缘检测算法进行提取。7.如权利要求4所述的方法，其中，每一视频帧的全局颜色特征的提取包括：根据每一视频帧的三个颜色通道得到修正后的红、绿、蓝、黄四个颜色基矩阵；根据红、绿、蓝、黄四个颜色基矩阵得到红绿颜色特征矩阵和蓝黄颜色特征矩阵；将红绿颜色特征矩阵与蓝黄颜色特征矩阵的差值的绝对值作为该视频帧的全局颜色特征。8.如权利要求4所述的方法，其中，每一视频帧的全局运动特征的提取包括：将每一视频帧的灰度特征图与对应前一视频帧的灰度特征图的差值的绝对值作为该视频帧的全局运动特征。9.如权利要求1至8任一项所述的方法，其中，根据每一视频帧的全局特征得到该视频帧中的各尺度的目标预估位置，包括：对每一视频帧的全局特征进行加权和多尺度的频域幅度谱滤波得到该视频帧中的各尺度的目标预估位置。10.如权利要求9所述的方法，其中，对每一视频帧的全局特征进行加权和多尺度的频域幅度谱滤波得到该视频帧中的各尺度的目标预估位置，包括：对每一视频帧的全局特征进行加权得到矩阵多项式；对所述矩阵多项式进行多项式傅里叶变换得到频域多项式矩阵；将所述频域多项式矩阵进行多尺度的幅度谱滤波得到每个尺度的频域；对每个尺度的频域进行反傅里叶变换得到该视频帧中的各尺度的目标预估位置。11.如权利要求10所述的方法，其中，将所述频域多项式矩阵进行多尺度的幅度谱滤波得到每个尺度的频域，包括：根据所述频域多项式矩阵得到对应的幅度谱；采用高斯低通滤波器对所述幅度谱进行预设多尺度的幅度谱滤波得到每个尺度滤波后的幅度谱；根据相位谱和每个尺度滤波后的幅度谱得到滤波后的每个尺度的频域。12.如权利要求1至11任一项所述的方法，其中，对每一视频帧中的所述目标预估位置进行聚类处理得到对应的目标候选区域，包括：根据每一视频帧中的每一尺度的每个目标预估位置得到对应的目标候选区域；判断每个目标候选区域内的像素的个数是否小于预设个数，若是则将该目标候选区域滤除；对每个未滤除的目标候选区域做直方图，并且以直方图计算各个目标候选区域的信息熵作为对应目标候选区域的置信度。13.如权利要求12所述的方法，其中，根据每一视频帧中的每一尺度的每个目标预估位置得到对应的目标候选区域，包括：依次将每一视频帧中的每一尺度的每个目标预估位置作为当前视频帧中的当前尺度的当前目标预估位置，并依次对当前视频帧中的当前尺度的当前目标预估位置作如下处理：将当前视频帧中的当前尺度的当前目标预估位置中的像素标记为未访问过；对当前尺度的当前目标预估位置进行扫描，在当前目标预估位置中找到标记为未访问过且像素值大于预设值的一个像素作为中心像素，将所述中心像素标记为访问过；获取所述中心像素邻域内的标记为未访问过且像素值大于预设值的其它像素，将获取到的标记为未访问过的且像素值大于预设值的其它像素的标记为访问过；初始化一个对应于当前目标预估位置的目标候选区域，将所述中心像素和其邻域内的标记为未访问过的且像素值大于预设值的其它像素加入所述目标候选区域。14.如权利要求1至13任一项所述的方法，其中，目标实际区域根据每一视频帧中的所有所述目标候选区域，并结合所述目标候选区域的置信度及对应尺度处理，确定该视频帧中的目标实际区域，包括对每一视频帧作如下处理：由尺度大到小将每一视频帧中的所有尺度的目标候选区域建立区域树形结构；根据每一视频帧的区域树形结构及其所有目标候选区域的置信度得到每一视频帧中的目标实际区域。15.如权利要求14所述的方法，其中，根据每一视频帧的区域树形结构及其所有目标候选区域的置信度得到每一视频帧中的目标实际区域，包括对每一视频帧的区域树形结构的各个结点区域由尺度大到小进行遍历，并按如下情况迭代获取每一视频帧中的目标实际区域：若当前为父结点区域与子结点区域为单子树，直接选择置信度较大的结点区域作为目标实际区域，并结束迭代；若当前为父结点区域与子结点区域为多子树，且当前父节点区域的置信度均大于两个子节点区域的置信度，选择所述父节点区域作为目标实际区域，并结束迭代；若当前为父结点区域与子结点区域为多子树，且当前两个子节点区域的置信度均大于当前父节点区域的置信度，选择两个子节点区域作为目标实际区域；若当前为父结点区域与子结...

【专利技术属性】
技术研发人员：金炫，
申请(专利权)人：阿里巴巴集团控股有限公司，
类型：发明
国别省市：开曼群岛;KY

全部详细技术资料下载我是这个专利的主人