一种描述和捕获视频对象的方法及设备技术

技术编号:3630753 阅读:276 留言:0更新日期:2012-04-11 18:40
本发明专利技术公开了一种描述和捕获视频对象的方法及设备,通过捕获视频图像,生成视频序列,根据视频序列生成视频对象跟踪序列;根据视频对象跟踪序列及视频序列,生成视频对象描述符。重放视频对象,根据获取的视频对象跟踪序列包括的信息对视频对象进行捕获和跟踪。应用本发明专利技术,由于在构造的视频对象跟踪序列中,通过视频对象区域跟踪编号捕捉和跟踪视频对象,不需要逐帧为每个视频对象建立视频对象描述符,从而减少了视频对象描述符的数量,既能很好地适应智能视频交互的应用需求,又加快了视频资料的检索速度。

【技术实现步骤摘要】

本专利技术涉及视频技术,特别涉及一种描述和捕获视频对象的方法及设备
技术介绍
视频监控(Video Surveillance)技术经过多年的数字化发展,已逐步形成 网络化,为生产监控,如生产线流程监控、安全监控,如火车站、地铁站、 飞机场的安全监控,以及其它监控如病人护理发挥了积极的作用,然而,随 着监控对象的增多以及各对象属性资料信息的更新和增加,如何对大量的视 频监控资料进行方便地管理、检索、视频人机交互、智能再处理,充分发挥 网络化视频监控系统的优势,是目前视频交互系统(Interactive Video System)需要解决的问题。运动图像专家组(MPEG, Moving Picture Experts Group ),即国际标准 化组织和国际电工委员会第一联合技术组第29分委会第11工作组(ISO/IEC JTC1/SC29/WG11 ),负责数字视频、音频和其他媒体的压缩、解压缩、处 理和表示等国际技术标准的制定工作,从1996年IO月开始研究多媒体内容 4笛述才妾口 ( Multimedia Content Description Interface ),也就是MPEG-7,于 2002年形成了国际标准ISO/IEC 15938, First edition,定义了100多个描述 工具,用于描述各种多媒体信息,这些"描述"(包括描述子和描述模式)与 其内容关联,允许快速有效地搜索用户感兴趣的资料,带有MPEG-7数据的 资料可以包含静止图像、图形、3D模型、音频、语音、视频,以及这些元 素如何在多媒体表现中组合的信息,而且,这些通用数据类型的特例还可以 包含面部表情和个人化的特性。MPEG-7支持多种音频和视觉的描述,并根据描述信息的抽象层次,提供一种描述多媒体的方法以便表示不同层次上的用户对信息的需求。以视觉 内容为例,较低抽象层包括颜色、视觉对象、紋理、草图、形状、尺寸、体积、空间、运动(轨道)和位置关系等;高层将给出语义信息如"这是一 个场景 一个鸭子正躲藏在树后并有一个汽车正在幕后通过"。抽象层特征 一般以完全自动的方式提取,而高层特征一般需要通过与用户的交互来实现。MPEG-7特别适用于多媒体检索,包括对视频监控材料的检索,通过搜 索引擎来匹配查询数据和MPEG-7的音视频描述,如对于图形的查询通过 在屏幕上画几条线就能得到类似图形、标识、表意文字(符号)等的一组图 像;又如,对于运动的查询对一组给定的物体,描述在物体之间的运动关 系,就可以得到实现所描述的时空关系的动画列表。目前的随机存取视频系统,比如光盘、硬盘等,具有"播放、停止、快 进、快退、暂停、拖动,,操作模式,可以根据视频节目单来选择需要观看的 视频片段,也可以从指定的时间点来播放,并通过符合MPEG-7的对象描述 可以播放检索结果对应的视频片段。图1为现有描述方法中使用的动态视频对象描述符示意图,参见图1, 为每帧出现的每个对象建立视频对象描述符(Object Descriptor),描述对象 的各种属性,在视频对象描述符里说明其形状、尺寸、分层、持续时间、活 动、活动参数以及其他对象特征。在图1中,对于一个视频序列,每个序列号为一帧,为每帧出现的每个 对象建立一个视频对象描述符,在视频对象描述符里说明对象的轮廓坐标、 对象编号、尺寸、分层、持续时间、活动、活动参数以及其他对象特征。逐 帧的视频对象描述符形成一个视频对象描述文件。举例来说,如果同一个活 动对象在N帧图像中出现,就建立N个视频对象描述符来表示它的跟踪关 系;如果M个活动对象在N帧图象中出现,就建立MxN个^L频对象描述 符来表示它的跟踪关系;在每个视频对象描述符里,记录该对象的轮廓上所有像素点的轮廓坐标、视频对象身份编号、尺寸、分层、持续时间、活动、 活动参数、身份照片、身份参数以及其他对象特征。在进行重放视频序列时, 系统从视频对象描述符里恢复每个对象的轮廓坐标与视频序列的对应关系, 从而实现满足视频监控所需要的人机交互功能。从图1中可以看出,由于对每帧出现的每个对象建立一个视频对象描述 符,每个视频对象描述符都需要描述对象的特征,因此,当视频序列较长, 和/或视频对象较多时,用于描述视频对象的视频对象描述符的数量和尺寸 是非常庞大的,对视频资料的快速检索造成了困难。由于图1中在视频对象描述符里使用轮廓坐标对视频对象进行位置的 定位,需要进行较为复杂的运算处理,占用较多的存储资源,因此, 一种改 进的方法是,利用视频对象的"多边形顶点坐标"或"视频对象窗口坐标" 取代"轮廓坐标",压缩视频对象描述符的尺寸,但用视频对象窗口坐标或 多边形顶点坐标近似描述对象轮廓坐标,在选择视频对象时,如果选4奪的位 置不准确,容易造成操作失误,而且,利用视频对象窗口坐标或多边形顶点 坐标对一见频对象进行跟踪和标注,也显得较粗糙,进一步地,这种改进的方 法只能减少视频对象描述符的尺寸,不能减少视频对象描述符的数量,对视 频资料的快速检索仍然不利。
技术实现思路
本专利技术实施例提供一种描述视频对象的方法,减少视频序列中视频对象 描述符的数量。本专利技术实施例还提供一种捕获视频对象的方法,提高视频序列中视频对 象的检索速度。本专利技术实施例还提供一种描述视频对象的设备,减少视频序列中视频对 象描述符的数量。本专利技术实施例还提供一种捕获视频对象的设备,提高视频序列中视频对 象的4全索速度。为达到上述目的,本专利技术实施例的技术方案具体是这样实现的一种描述视频对象的方法,该方法包含捕获视频图像,生成视频序列,根据视频序列生成视频对象跟踪序列;根据视频对象跟踪序列及视频序列,生成视频对象描述符。 一种捕获视频对象的方法,该方法包括重放视频对象,根据获取的视频对象跟踪序列包括的信息对视频对象进行 捕获和跟踪。一种描述视频对象的设备,该设备包含视频对象捕获模块、视频对象跟 踪模块及视频对象分析模块,其中,视频对象捕获模块,用于捕获视频图像,生成视频序列,将视频序列分 别向视频对象跟踪模块及视频对象分析模块输出;视频对象跟踪模块,用于根据接收的视频序列生成视频对象跟踪序列, 向视频对象分析模块输出;视频对象分析模块,用于根据接收的视频对象跟踪模块输出的视频对象 跟踪序列及视频捕获模块输出的视频序列,生成视频对象描述符。一种捕获视频对象的设备,该设备包含重放控制模块、视频叠加模块 及显示模块,其中,重放控制模块,用于重放视频对象,接收用户选定的视频对象,与视频 对象跟踪序列中包含的视频对象区域位图进行匹配,获取跟踪的视频对象区 域编号,根据跟踪的视频对象区域编号查询视频对象区域索引获取跟踪的视 频对象区域跟踪编号,跟踪后续帧中与视频对象区域跟踪编号相关的视频对 象区域编号,向视频叠加模块输出;视频叠加模块,用于根据接收信息中包含的视频对象区域编号,与视频 序列匹配获取连续的视频对象区域位图,实时标注视频对象区域位图,输出 至显示模块;显示模块,用于实时显示标注的视频对象区域位图。由上述技术方案可见,本专利技术实施例的一种描述和捕获视频对象的方法及 设备,通过捕获视频图像,生成视频序列,根据视频序列确定视频对象区域编号及视频对象区域跟踪编号;根据视频序列、视频对象区域编号及视频对象区 域跟踪编本文档来自技高网
...

【技术保护点】
一种描述跟踪序列的方法,其特征在于,该方法包括: 捕获视频图像,生成视频序列,根据视频序列生成视频对象跟踪序列; 根据视频对象跟踪序列及视频序列,生成视频对象描述符。

【技术特征摘要】

【专利技术属性】
技术研发人员:赵光耀
申请(专利权)人:华为技术有限公司
类型:发明
国别省市:94[中国|深圳]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1