当前位置: 首页 > 专利查询>浙江大学专利>正文

一种面向视频监控的基于块的背景建模方法技术

技术编号:3860843 阅读:375 留言:0更新日期:2012-04-11 18:40
本发明专利技术公开了一种面向视频监控的基于块的背景建模方法。对于背景建模,过去很多方法由于没有利用像素值在空间上的一致性,计算时需要耗费大量内存。针对这个问题,本发明专利技术提出了一种新颖的基于块的背景建模方法,步骤1:从相应块的颜色聚类数组中查找像素颜色,如果命中,更新该颜色聚类,否则,创建一个新的颜色聚类;步骤2:从当前像素的权值索引数组中查找像素颜色,如果命中,更新该索引,否则,创建一个新索引;步骤3:通过权重确定当前像素类别。同传统的模型相比,该模型极大的减少了对一个像素建模需要的字节数,从而在保证计算速度的同时有效的降低了内存消耗。

【技术实现步骤摘要】

本专利技术涉及计算机视觉系统的背景建模领域,特别是涉及。
技术介绍
从视频中萃取出运动物体是很多计算机视觉系统中首要的一步。实现自动化萃取的一个普遍的方法是减背景(background subtraction),该方法通过一个背景模型来比较每个新帧中运动的像素,然后将这些像素分为不同的类型,即前景,背景。 最简单的背景模型是将每个像素的亮度值看作一个简单的高斯分布,然而,这种单一模式的模型无法对动态背景建模,如随风挥舞的树枝,亮度变化和阴影消除。 Stauffer和Grimson使用混合的高斯模型来表示动态的背景,并使用参数估计技术来更新了该模型。 在处理快速变化的像素时,为了克服由于参数估计错误带来的错误背景的问题,Elgammal,Harwood等人使用了一种非参数化的模型,该模型使用了一个核心的评估器,通过当前像素最近的观测值来确定该像素所属的类别。 近年来,很多研究者提出了基于区域或帧的模型,这些模型将像素看作相互关联的随机变量,通过邻域关系来估算概率。
技术实现思路
本专利技术的目的是提供。 本专利技术采用的技术方案是 1)数据声明及描述 (1)将宽度为W像素、高度为H像素的帧组成的视频分割为正方形的块x,y为帧内行、列坐标,m,n为帧内块的行、列坐标,S为块的宽度,S由视频帧的尺寸决定,以有效的利用空间上的一致性信息; (2)对每一个块,定义一个颜色聚类数组cm,n,该数组包含L个颜色类别 Cm,n={c1,c2,...,cL},m,n为块的行、列坐标; (3)对于每个像素Px,y,定义一个权值索引数组,每个数组由N个索引组成 Ix,y={i1,i2,...,iN},x,y为像素的行、列坐标; 2)模型处理过程 该模型的更新机制如下当一个新的具有不同颜色分类的像素出现时, 步骤1从相应块的颜色聚类数组中查找像素颜色,如果命中,更新该颜色聚类,否则,创建一个新的颜色聚类; 步骤2从当前像素的权值索引数组中查找像素颜色,如果命中,更新该索引,否则,创建一个新索引; 步骤3通过权重确定当前像素类别。 本专利技术具有的有益效果是 同基于像素的模型相比,本专利技术是基于块的模型,以4×4或8×8的块为单位整体的处理像素。拥有相似颜色的不同像素被表示为同一个聚类。通常,由于邻近像素之间的一致性,在一个独立块中聚类的平均个数是有限的。随着获取的样本数增加,这种聚类的正确性也随之增大(与小样本容量相比)。由于动态背景中绝大部分像素的运动只局限于小的区域,该模型也能更快的学习动态背景。结果表明,本专利技术基于块的背景模型有效的达到了降低内存消耗而不牺牲速度的目标。在动态背景的的场景下,该模型检测前景的速度甚至比经典的背景模型MOG更快、更有效并且降低了误报率。 附图说明 附图为模型更新过程图。 具体实施例方式 1)数据声明及描述 (1)将宽度为W像素、高度为H像素的帧组成的视频{Pxy|x∈〔1.W〕.y∈〔1.H〕}分割为正方形的块x,y为帧内行、列坐标,m,n为帧内块的行、列坐标,S为块的宽度,S由视频帧的尺寸决定,以有效的利用空间上的一致性信息; (2)对每一个块,定义一个颜色聚类数组cm,n,该数组包含L个颜色类别 Cm,n={c1,c2,...,cL},m,n为块的行、列坐标; (3)对于每个像素Px,y,定义一个权值索引数组,每个数组由N个索引组成Ix,y={i1,i2,...,iN},x,y为像素的行、列坐标; 2)模型处理过程 该模型的更新机制如附图所示当一个新的具有不同颜色分类的像素出现时; 步骤1从相应块的颜色聚类数组中查找像素颜色,如果命中,更新该颜色聚类,否则,创建一个新的颜色聚类; 步骤2从当前像素的权值索引数组中查找像素颜色,如果命中,更新该索引,否则,创建一个新索引; 步骤3通过权重确定当前像素类别。 所述步骤1的具体过程如下 (1)出现新的像素pt=〔yt,ut,vt〕,pt∈Bm,n,其中yt,ut,vt分别为像素的亮度分量,色度分量,色度分量,t是时间下标; (2)对于Cm,n里的每一个颜色类别(y,u,v,f,p),其中,y为亮度分量Y的平均值,u为色差分量U的平均值,v为色度分量V的平均值,f为样本频率,p为该类别创建的时间;如果找到某个颜色聚类别满足((ut,vt),(u,v))≤ε1并且yt∈y×δ(1,ε2),其中ε1为阀值,取值5~15,ε2也是阀值,取值5/255~15/255, 则更新内容 f=f+1 (3)如果符合条件的类不存在,创建新聚类 (y,u,v)=(yt,ut,vt) f=1 p=t 所述步骤2的具体过程如下 (1)根据步骤一得到的该像素颜色在颜色聚类数组中的索引查找该像素的权值索引数组; (2)若命中,则根据参数α调整权重ww=〔1-α〕×w+α×M,其中,w为该像素在所在类中的权重,当被计算的像素值属于该颜色聚类时,M值为1,否则,其值为0;α为学习参数,取值0.3~0.7; 所述步骤3的具体过程如下 (1)不同颜色的权重每帧都会调整,出现较少的颜色权重会迅速的降低,大多数频繁出现的颜色权重变得很大,这些颜色的权重在所有颜色权重中占支配比例,该比例记为β,β取值为0.6~0.9; (2)对于一个权重索引为w的像素,如果权重大于w的聚类的权重之和占总权重的比例超过β,则该像素被认为是背景;否则,是前景。 本专利技术同混合高斯模型(MOG)测试结果如下 使用标准的MPEG-4测试序列“Hall”和一个在真实道路监控场景中抓取的视频对算法做了测试。表1比较二者内存使用,表2比较二者的处理速度。 表1.专利技术模型同混合高斯模型(MOG)的内存使用比较 表2.专利技术模型同混合高斯模型(MOG)的速度比较 结果表明,本专利技术基于块的背景模型有效的达到了降低内存消耗而不牺牲速度的目标。在动态背景的的场景下,该模型检测前景的速度甚至比经典的背景模型MOG更快、更有效并且降低了误报率。权利要求1.,其特征在于1)数据声明及描述(1)将宽度为W像素、高度为H像素的帧组成的视频分割为正方形的块x,y为帧内行、列坐标,m,n为帧内块的行、列坐标,S为块的宽度,S由视频帧的尺寸决定,以有效的利用空间上的一致性信息;(2)对每一个块,定义一个颜色聚类数组cm,n,该数组包含L个颜色类别Cm,n={c1,c2,...,cL},m,n为块的行、列坐标;(3)对于每个像素px,y,定义一个权值索引数组,每个数组由N个索引组成Ix,y={i1,i2,...,iN},x,y为像素的行、列坐标;2)模型处理过程该模型的更新机制如下当一个新的具有不同颜色分类的像素出现时,步骤1从相应块的颜色聚类数组中查找像素颜色,如果命中,更新该颜色聚类,否则,创建一个新的颜色聚类;步骤2从当前像素的权值索引数组中查找像素颜色,如果命中,更新该索引,否则,创建一个新索引;步骤3通过权重确定当前像素类别。2.根据权利要求1所述的,其特征在于所述步骤1的具体过程如下(1)出现新的像素pt=(yt,ut,vt),pt本文档来自技高网...

【技术保护点】
一种面向视频监控的基于块的背景建模方法,其特征在于: 1)数据声明及描述: (1)将宽度为W像素、高度为H像素的帧组成的视频[P↓[xy]|x*(1,W),y*(1,H)]分割为正方形的块[B↓[m,n]|m∈(1,W/s),n ∈(1,H/s)],x,y为帧内行、列坐标,m,n为帧内块的行、列坐标,S为块的宽度,S由视频帧的尺寸决定,以有效的利用空间上的一致性信息; (2)对每一个块,定义一个颜色聚类数组c↓[m,n],该数组包含L个颜色类别:C↓[m,n] ={c↓[1],c↓[2],…,c↓[L]},m,n为块的行、列坐标; (3)对于每个像素p↓[x,y],定义一个权值索引数组,每个数组由N个索引组成:I↓[x,y]={i↓[1],i↓[2],…,i↓[N]},x,y为像素的行、列坐 标; 2)模型处理过程: 该模型的更新机制如下:当一个新的具有不同颜色分类的像素出现时, 步骤1:从相应块的颜色聚类数组中查找像素颜色,如果命中,更新该颜色聚类,否则,创建一个新的颜色聚类; 步骤2:从当前像素的权值 索引数组中查找像素颜色,如果命中,更新该索引,否则,创建一个新索引; 步骤3:通过权重确定当前像素类别。...

【技术特征摘要】

【专利技术属性】
技术研发人员:陈纯邓小宇卜佳俊杨智吕承飞
申请(专利权)人:浙江大学
类型:发明
国别省市:86[中国|杭州]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1