本发明专利技术公开了一种体育视频内容分析方法及装置。所述方法包括步骤:A.建立包括事件层、基元层和特征层的体育视频的多层动态贝叶斯网模型;B.通过对训练数据的学习,获取所述模型中的参数;C.根据所述模型,对体育视频中的特征序列应用贝叶斯推理确定最大概率条件下的各个事件节点的值,从而检测出体育视频中的事件及其之间关系。本发明专利技术的体育视频内容分析方法及装置,能够提高体育视频内容分析的效率。
【技术实现步骤摘要】
一种体育视频内容分析方法及装置
本专利技术涉及视频检索
,特别是涉及一种体育视频内容分析方法 及装置。
技术介绍
体育视频,是指体育比赛的电视转播节目。随着人们对体育比赛的喜爱 程度不断提高,体育比赛节目越来越多,体育视频已成为十分重要的一类视 频信息源。面对海量的体育视频数据,人们真正关心并有可能反复观看的却 只是其中的一小部分。例如一场跳水比赛常常需要持续几个小时,而其中的 精彩部分,运动员从起跳到入水的过程却只有短短十几秒,如何方便快捷地 查询所需体育视频内容成为迫切需要解决的问题。上世纪九十年代以来,出现了基于内容的视频分析和检索。其核心是通 过对视频内容进行计算机处理、分析和理解,建立其结构和语义索引,以方 便用户检索。而体育视频的内容分析主要是通过对体育视频中各种特征的提 取和处理来分析语义信息。常用的特征包括视觉的、听觉的、以及文本的。 视觉特征主要有颜色、形状、紋理和运动等。听觉的特征主要是对比赛相关 声音(如击球声)、观众的欢呼、以及解说员的语音进行处理。文本的特征 则来自于两个方面, 一个是视频画面上出现的文字,另一个是电视信号中的隐藏字幕(Closed Caption)。根据所分析语义的层次,体育视频内容分析从 初级到高级分为三类,即场景分类、精彩提取以及事件检测。场景分类是对体育视频中内容的一个初步划分,例如将视频分为比赛进 行和暂停两类场景,这样用户在观看视频时可以跳过一些比赛暂停的时间。 精彩提取是指识别出体育比赛中的较为重要或人们感兴趣的片断,以构成精 彩集锦。事件检测从狭义上讲,是指检测体育视频中一些领域相关并反复出 现的语义事件,例如跳水比赛中运动员的跳水,足球比赛中的射门等,通过 对这些事件的标注和组织,就可以最终满足大多数用户的查询需求。从广义上讲,事件的本质就是一段具有一定语义的视频片断,这样,场景和精彩片 段也可以认为是某种事件。所以体育视频基本上就是事件的视频,体育视频 内容分析的核心技术实际上也就是对事件及其之间关系的分析。因而,如何提供一种高效的体育视频内容分析方法及装置,即如何有效 地检测出体育视频中的事件及其之间关系,就成为亟待解决的技术问题。
技术实现思路
本专利技术所要解决的技术问题是提供一种体育^L频内容分析方法及装置, 以提高体育视频内容分析的效率。为解决上述问题,本专利技术提供方案如下 一种体育视频内容分析方法,包括步骤A、 建立包括事件层、基元层和特征层的体育^L频的多层动态贝叶斯网 模型;B、 通过对训练数据的学习,获取所述模型中的参数;C、 根据所述模型,对体育视频中的特征序列应用贝叶斯推理确定最大 概率条件下的各个事件节点的值,从而检测出体育视频中的事件及其之间关 系。较佳地,所述模型为多层多模式的动态贝叶斯网模型。 所述多层多模式的动态贝叶斯网模型采用基于基元融合的多模式融合。 较佳地,步骤B中,在训练数据的基元已知时,所述参数直接从训练数 据中统计出来。较佳地,步骤B中,在训练数据的基元数目已知,且其他参数未知时, 采用EM算法进行学习。较佳地,步骤B中,在训练数据的基元未知时,采用随机搜索策略进行 学习。所述随机搜索策略采用MCMC算法实现。 较佳地,步骤B中,采用Boosting方法进行学习。 所述采用boosting方法进行学习具体包括初始化训练数据的权重;根据权重训练一个动态贝叶斯网;对训练数据 进行分类;修改权重,根据修改后的权重训练一个动态贝叶斯网,并重复本步骤多次;将所有动态贝叶斯网的学习结果加权平均。较佳地,在所述方法中,基于决策树进行特征选择。所述基于决策树进行特征选择具体包括建立包含所有可能的特征的特征池;根据训练数据,自动建立基元识别的决策树分类器;根据所建立的决策树分类器进行特征选择。 一种体育视频内容分析装置,包括模型建立模块,用于建立包括事件层、基元层和特征层的体育视频的多 层动态贝叶斯网模型;训练模块,用于通过对训练数据的学习,获取所述模型中的参数;事件检测模块,用于根据所述模型,对体育视频中的特征序列应用贝叶 斯推理确定最大概率条件下的各个事件节点的值,从而检测出体育视频中的 事件及其之间关系。较佳地,所述模型为多层多模式的动态贝叶斯网模型。所述多层多模式的动态贝叶斯网模型采用基于基元融合的多模式融合。本专利技术的体育视频内容分析方法及装置,通过建立动态贝叶斯网模型, 有效的分析事件及其之间的关系和结构,并有效的融合了多模式特征分析, 从而提高了体育视频内容分析的效率。本专利技术的体育视频内容分析方法及装 置,可以直接运用到数字电视、视频点播、视频资料库等实际应用中,不仅 能为普通观众欣赏体育比赛节目带来方便,也为教练、运动员等体育专业人 士进行资料查询和辅助教学提供了有效的工具。附图说明图1为本专利技术较佳实施例的体育视频内容分析方法的示意图2为本专利技术较佳实施例的体育视频内容分析方法中所建立的多层动 态贝叶斯网模型示意图3为本专利技术另一较佳实施例的体育视频内容分析方法中所建立的多 层多模式的动态贝叶斯网模型示意图4为本专利技术较佳实施例中釆用Boosting方法训练多个动态贝叶斯网 模型的示意图;图5为本专利技术较佳实施例的体育视频分析装置的结构示意图。具体实施方式为使本专利技术的目的、技术方案和优点更加清楚,下面将结合附图及具体实施例对本专利技术进行详细描述。请参照图1,本专利技术较佳实施例的体育视频内容分析方法包括 步骤IOI、建立包括事件层、基元层和特征层的体育视频的多层动态贝叶斯网模型;步骤102、通过对训练数据的学习,获取所述模型中的参数; 步骤103、根据所述模型,对体育视频中的特征序列应用贝叶斯推理确定最大概率条件下的各个事件节点的值,从而检测出体育视频中的事件及其之间关系。动态贝叶斯网是一类概率图模型(Probabilistic Graph Model),表示为随 时间增长的有向无环图,它是在贝叶斯网(Bayesian Network)和隐马尔科 夫模型(Hidden Markov Model)的基础上发展起来的。作为一种处理时序信 号的统计工具,动态贝叶斯网提供了一个将已有的先-睑知识与训练数据集的 潜在知识相结合进行事件检测的有效方法。与常用的贝叶斯网、隐马尔科夫 模型相比,动态贝叶斯网具有更强大的表达能力。和贝叶斯网相比,它通过 考虑各个时刻间的转移概率能够更好的处理时间序列信号;和隐马尔科夫模 型相比,它在每个时刻上允许有多个随机变量而不仅仅是一个隐藏状态变量。在体育视频中^r测事件之所以十分困难,其原因在于事件具有比较高层 的语义,例如足球比赛中的射门、角球、任意球等。直接从底层特征来得到 事件的高层语义无疑是低效和困难的。在本专利技术的较佳实施例中,把事件看 成是由一些基元组成的过程,这些基元再由底层特征来区分就比较有效了 。 以足球比赛为例,可以定义五种场景作为足珅^见频中事件的基元,这五种场 景分别为特写、中景、中场、前场和禁区。事件的发生可以归结为一定场景 之间的变化,如一个典型角球事件表现为禁区场景以及之前的一些角球准备 阶段中的特写和中景镜头。尽管不同的足球视频有不同的比赛内容,但是为 了方便观众对比赛的观赏和理解,上述拍摄模式基本都是一致的。请参照图2,本专利技术较佳实施例的体育视频内容分析本文档来自技高网...
【技术保护点】
一种体育视频内容分析方法,其特征在于,包括步骤: A、建立包括事件层、基元层和特征层的体育视频的多层动态贝叶斯网模型; B、通过对训练数据的学习,获取所述模型中的参数; C、根据所述模型,对体育视频中的特征序列应用贝叶斯推理确定最大概率条件下的各个事件节点的值,从而检测出体育视频中的事件及其之间关系。
【技术特征摘要】
【专利技术属性】
技术研发人员:韩庆军,
申请(专利权)人:韩庆军,
类型:发明
国别省市:11[]
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。