基于视频中运动先验信息的行人检测方法及装置制造方法及图纸

技术编号:12308402 阅读:103 留言:0更新日期:2015-11-11 17:31
本发明专利技术实施例公开了一种基于视频中运动先验信息的行人检测方法及装置,涉及视频中的行人检测技术领域,解决了现有技术中视频中的行人检测方法复杂度较高、很难实现实时检测的问题。所述方法包括:通过背景差分的方法提取待检测视频中的运动信息;对所述运动信息中的运动目标进行区域聚类,得到运动密集区域块;对所述待检测视频中的视频帧图像依据所述运动密集区域块进行分割处理,分别建立图像金字塔;对所述运动密集区域块的每层图像金字塔进行特征提取,仅提取运动区域及附近像素的特征信息;运用滑窗的方式,检测所述运动密集区域块的每层金字塔图像中的行人,定位行人目标,获取行人检测结果。本发明专利技术的实施例主要用于视频中的行人检测。

【技术实现步骤摘要】

本专利技术涉及视频中的行人检测
,尤其涉及一种基于视频中运动先验信息 的行人检测方法及装置。
技术介绍
目前,图像中行人检测技术的研究是一个热点问题,国外很多学者对此做了大量 的研究,很多高水平的期刊会议上都有很多关于此方面的论文发表。与此同时,行人检测技 术为视频的语义分析提供了重要的数据基础,对于视频监控的智能化和辅助驾驶技术具有 重要的应用价值。 由于行人兼具柔性和刚性物体的特性,在空间上的变化较多样而且剧烈,姿态和 外观变化比较频繁,采集的行人图像很容易受到相互遮挡、穿着、视角和姿态等影响,使得 行人检测技术成为计算机视觉领域的一个研究难点。近些年来,机器学习的方法被引入到 行人检测的研究中来,检测准确率得到了很大的提升,目前主流的行人检测方法都是基于 此原理实现的。但由于机器学习方法的计算复杂度较高,对于单幅图像检测的耗时较长,如 果将该方法直接应用于视频中的行人检测中,很难实现实时的行人检测,限制了该项技术 的广泛应用。视频相当于是多帧连续的图像,与静态图像相比多了帧间信息,为了更好的实 现行人检测在视频中的应用,需要充分利用视频帧间信息,尤其是运动先验信息。 在视频中的行人检测领域,关于运动信息的使用可以分为三类:运动区域先验、运 动特征融合、行人运动特性的检测。 运动区域先验的方式主要是通过运动检测的方法,提取出视频中的运动区域,作 为行人检测的几何先验信息,在运动区域周围进行检测。该方法的行人检测部分与运动信 息的提取过程是相互独立的,相互支持,互不影响。 运动特征融合方法,将运动信息融入了行人检测的特征信息中,将帧间的运动差 异信息用于区分行人目标。该方法一般将帧差法或光流法的结果数据融合到特征中,需要 重新设计特征,对运动的行人检测效果有很大提高。但一般运算比较复杂,很难做到实时, 而且对于帧率较低或者视频中运动目标运动速度较快或极慢的情况,鲁棒性比较差。 行人运动特性的检测,一般是针对行人目标在行走运动过程中的姿态变换特征, 辅助行人检测,研究比较热的方法是基于步态特征的检测,该方法的误检率比较低,另外步 态识别在人的识别领域也有很广泛的应用。该类方法的实现过程比较复杂,而且对视频拍 摄角度要求比较高,遮挡的情况容易造成运动特性信息丢失严重,应用环境比较苛刻。 在实现本专利技术的过程中,专利技术人发现现有技术中至少存在如下技术问题: 现有的视频中的行人检测方法复杂度较高,很难实现实时检测,且准确度不高。
技术实现思路
本专利技术提供的基于视频中运动先验信息的行人检测方法及装置,能够在视频中精 确而快速的检测行人。 一方面,本专利技术提供一种基于视频中运动先验信息的行人检测方法,包括: 通过背景差分的方法提取待检测视频中的运动信息; 对所述运动信息中的运动目标进行区域聚类,得到运动密集区域块; 对所述待检测视频中的视频帧图像依据所述运动密集区域块进行分割处理,分别 建立图像金字塔; 对所述运动密集区域块的每层图像金字塔进行特征提取,仅提取运动区域及附近 像素的特征信息; 运用滑窗的方式,检测所述运动密集区域块的每层金字塔图像中的行人,定位行 人目标,获取行人检测结果。 另一方面,本专利技术提供一种基于视频中运动先验信息的行人检测装置,包括: 运动信息提取单元,用于提取通过背景差分的方法提取待检测视频中的运动信 息; 聚类单元,用于对所述运动信息中的运动目标进行区域聚类,得到运动密集区域 块; 分割单元,用于对所述待检测视频中的视频帧图像依据所述运动密集区域块进行 分割处理,分别建立图像金字塔; 特征提取单元,用于对所述运动密集区域块的每层图像金字塔进行特征提取,仅 提取运动区域及附近像素的特征信息; 定位单元,用于运用滑窗的方式,检测所述运动密集区域块的每层金字塔图像中 的行人,定位行人目标,获取行人检测结果。 本专利技术提供的基于视频中运动先验信息的行人检测方法及装置,通过背景差分 的方法提取待检测视频中的运动信息,对所述运动信息中的运动目标进行区域聚类,得到 运动密集区域块,对所述待检测视频中的视频帧图像依据所述运动密集区域块进行分割处 理,分别建立图像金字塔,对所述运动密集区域块的每层图像金字塔进行特征提取,仅提取 运动区域及附近像素的特征信息,运用滑窗的方式,检测所述运动密集区域块的每层金字 塔图像中的行人,定位行人目标,获取行人检测结果。与现有技术相比,本专利技术将运动区域 分块进行检测,并通过运动先验信息限定特征提取范围和检测的尺度范围,降低行人检测 过程的计算量,并且提升检测过程的精度,降低对背景区域的误检。【附图说明】 为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例描述中所需要使 用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于 本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它 的附图。 图1为本专利技术实施例1提供的基于视频中运动先验信息的行人检测方法的流程 图; 图2示出了本专利技术实施例1中对原图像进行10种变换,3个LUV颜色通道图,1个 梯度幅值变换,6个梯度方向变换; 图3示出了本专利技术实施例1中的背景初始化过程; 图4示出了在运动检测过程,检测出前景图像后,进行形态学滤波,剔除空洞和 "鬼影"现象,并进行大阈值的膨胀处理,将行人的轮廓信息充分包含在运动区域中; 图5示出了本专利技术实施例1中对运动密集区域块分别建立图像金字塔; 图6示出了本专利技术实施例1中10个特征变换图像和不同区域特征显著性效果图; 图7示出了实施例1中非极大值抑制过程,其中,(a)为处理前的检测结果,(b)为 处理后的最终行人定位结果; 图8为本专利技术实施例2提供的基于视频中运动先验信息的行人检测装置的结构示 意图; 图Θ为图8中运动信息提取单元11的结构示意图; 图10为本专利技术另一实施例提供的基于视频中运动先验信息的行人检测装置的结 构示意图。【具体实施方式】 下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完 整地描述,显然,所描述的实施例仅仅是本专利技术一部分当前第1页1 2 3 4 本文档来自技高网
...

【技术保护点】
一种基于视频中运动先验信息的行人检测方法,其特征在于,包括:通过背景差分的方法提取待检测视频中的运动信息;对所述运动信息中的运动目标进行区域聚类,得到运动密集区域块;对所述待检测视频中的视频帧图像依据所述运动密集区域块进行分割处理,分别建立图像金字塔;对所述运动密集区域块的每层图像金字塔进行特征提取,仅提取运动区域及附近像素的特征信息;运用滑窗的方式,检测所述运动密集区域块的每层金字塔图像中的行人,定位行人目标,获取行人检测结果。

【技术特征摘要】

【专利技术属性】
技术研发人员:邓波高晨旭齐超彭甫阳包阳林旺群战茅李海龙
申请(专利权)人:北京系统工程研究所
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1