本发明专利技术公开了一种通过从对应于视频节目的视频流(200)中选择各个部分(202-214)来建立相关视频片段(302-314)的集合(300)的方法。所述相关视频片段(302-314)的集合(300)可以用作视频预告片或者视频摘要。因此,所述相关视频片段的集合的持续时间与视频节目的持续时间相比相对较短。该方法包括:检索对应于该视频节目的相关图像(222-234)的另一个集合(201);基于一个比较从该视频流中选择第一视频图像,该比较是基于该另一个集合(201)当中的第一个相关图像(222)和该第一视频图像;以及基于所选择的第一视频图像建立第一个(302)相关视频片段(302-314)。
【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及一种通过从对应于视频节目的视频流中选择各个部分来建立相关视频片段的集合的方法,所述相关视频片段的集合的第一持续期间与视频节目的第二持续期间相比相对较短。本专利技术还涉及一种用于通过从对应于视频节目的视频流中选择各个部分来建立相关视频片段的集合的视频片段编辑单元,所述相关视频片段的集合的第一持续期间与视频节目的第二持续期间相比相对较短。本专利技术还涉及一种视频存储系统,包括-接收单元,用于接收视频流;-存储装置,用于存储该视频流和从该视频流中选择的相关视频片段的集合;以及-视频片段编辑单元,用于如上所述地建立所述相关视频片段的集合。本专利技术还涉及一种由计算机装置加载的计算机程序产品,其包括通过从对应于视频节目的视频流中选择各个部分来建立相关视频片段的集合的指令,所述相关视频片段的集合的第一持续期间与视频节目的第二持续期间相比相对较短,该计算机装置包括处理装置和存储器。在人们的起居室中可以被访问和消费的音频-视频信息的数量日益增多。未来电视接收机和个人计算机提供的技术和功能的集中进一步加速了这个趋势。为了选择感兴趣的音频-视频信息,用户需要工具来帮助提取相关的音频-视频信息,并且在大量可获得的音频-视频信息中有效地导航。为了允许用户对于已记录的音频-视频信息得到快速的总览并且决定是否观看一个完整的已记录的视频节目,一个令人感兴趣的特征是视频预告片的自动生成。当视频节目已被记录或正被记录时,已记录的视频节目被分析以便从视频流中选择相关视频片段。通过随后显示所述相关视频片段,可以向用户提供对于已记录的视频节目的良好的总览。在开头段落中描述的这种方法的一个实施例可以从R.Lienhart等人的文章“Video Abstracting(视频提取)”(Communications of theACM,40(12),第55至62页,1997)中获知。这篇文章公开了视频数据可以被模型化为四层。在最低层中,视频数据由一组帧组成;在下一较高层中,各帧被分组为镜头或连续的摄影机记录,并且连续的镜头基于故事讲述的相关性而被集合为场景。所有的场景一起构成视频。剪辑的概念被描述为将帧序列选择为摘要的元素;视频摘要因此由剪辑的集合组成。该已知的方法包括三个步骤对视频内容的分割和分析、剪辑选择以及剪辑组合。该分析步骤的目的是为了检测特别的事件,诸如主要演员的特写镜头、炮火、爆炸和文字。该已知方法的缺点在于它相对复杂并且不够鲁棒。本专利技术的一个目的是提供开头段落中描述的那种方法,其相对容易并且得到相对高质量的相关视频片段的集合。本专利技术的目的的实现在于该方法包括-检索对应于视频节目的相关图像的另一个集合;-基于一个比较从视频流中选择第一视频图像,该比较是基于该另一个集合当中的第一个相关图像和该第一视频图像;以及-基于所选择的第一视频图像建立第一个相关视频片段。换句话说,相关视频片段的集合的建立是基于另一个集合,也就是对应于同一视频节目的相关图像的另一个集合。一种吸引观众观看、购买或者下载某一视频节目的通用的销售技术是预告片(trailer),也就是相关图像的另一个集合。预告片是被设计成引起消费者好奇并且增加他们对于特定内容的兴趣的某一视频节目的简短的开胃品。它们充当所制作的电影、电视节目和各类摄影作品的广告。它们通常用明码广播,而且对它们的下载是免费的并且是被鼓励的。用户习惯于在购买或观看某一视频节目之前观看预告片。实际上,当预告片可被用于对视频节目进行列表时,电子节目指南(EPG)使用预告片。图像仅仅意味着视觉信息,但是可选择地也意味着视觉和音频信息的组合,也就是说仅仅意味着像素矩阵或者意味着像素矩阵与它们的音频轨道的组合。所述匹配(也就是所述比较)可以仅仅基于视觉信息、仅仅基于音频信息或者基于音频和视觉信息两者。视频预告片的重要性甚至已经被关于元数据标准化的国际工业论坛和被称为TV Anytime的EPG所认可。TV Anytime标准对一种机制进行标准化,以便允许广播商将视频节目的预告片与全长度视频节目的实际广播联系起来。这样,消费系统就可以不费任何努力地记录预告片和相关的视频节目。可选择地,从因特网下载预告片。从因特网下载的或者被嵌入在EPG服务中的预告片通常具有较低的分辨率并且其质量比对应于视频节目的全长度视频流差很多。另外,这些预告片通常很短。使用本专利技术的方法可以建立相关视频片段的集合,也就是基于较低质量和/或较短长度的所检索的预告片并且基于视频流的视频节目的增强的预告片或者增强的视频摘要。最后,新建立的相关视频片段的集合例如可以被用于浏览可获得的已记录视频节目的集合。在根据本专利技术的方法的一个实施例中,所述比较包括基于指纹确定第一图像的第一标识、确定该第一视频图像的第二标识以及建立该第一标识和该第二标识之间的对应。指纹通常也称作签名或散列(hash),其是信号的最相关的感觉特征的简明摘要。不像极端脆弱的密码散列(翻转源数据的单个比特通常将导致完全不同的散列),在这里指纹应被理解为是鲁棒的。也就是说,如果源信号在感觉上是相似的,那么相应的指纹也是非常相似的。因此,指纹被用于标识音频-视频内容。产生用于多媒体对象的指纹的方法的一个例子在欧洲专利申请号01200505.4(代理人卷号PHNL010110)以及Jaap Haitsma、Ton Kalker和Job Oostveen的文章“Robust Audio Hashing For ContentIdentification(用于内容标识的鲁棒的音频散列)”(InternationalWorkshop on Content-Based Multimedia Indexing,Brescia,2001年9月)中进行了描述。下列文章也描述了类似的技术。N.Dimitrova、Y.Chen、L.Nikolovska的“Visual Associations in Deja Video(Deja视频中的视觉关联)”(Asian Conference on Computer Vision,台北,2000年1月);Oostveen J.C.、Kalker A.A.C.、Haitsma J.A.的“Featureextraction and a database strategy for video fingerprinting(用于视频指纹的特征提取和数据库策略)”(5thinternational conference on recentadvances in visual information systems,新竹,2002年)。指纹可能涉及图像中的对象的数量和尺寸。可选地,指纹涉及面部的存在。在根据本专利技术的方法的另一实施例中,所述比较是基于视觉特征。其选项例如有颜色直方图、纹理直方图、成形描述符。可选择地,其它类型的比较也可以被使用,其例如是基于计算图像之间的差异。典型地,相关图像的另一个集合的图像的空间分辨率低于视频流的图像的分辨率。为了比较来自该集合和视频流的对应图像,通过将视频流的图像缩减为所述相关图像的空间分辨率来计算中间图像。随后,这些中间图像被用于比较。优选地,通过计算绝对像素值差异来执行基于像素差异的比较。像素值指的是亮度和/或颜色。可选择地,所述本文档来自技高网...
【技术保护点】
一种通过从对应于视频节目的视频流(200)中选择各个部分(202-214)来建立相关视频片段(302-314)的集合(300)的方法,所述相关视频片段(302-314)的集合(300)的第一持续时间与该视频节目的第二持续时间相比相对较短,该方法包括:-检索对应于该视频节目的相关图像(222-234)的另一个集合(201);-基于一个比较从该视频流中选择第一视频图像,该比较是基于该另一个集合(201)当中的第一个相关图像(222)和该第一视频图像的;以及 -基于所选择的第一视频图像建立第一个(302)相关视频片段(302-314)。
【技术特征摘要】
【国外来华专利技术】...
【专利技术属性】
技术研发人员:L阿格尼霍特里,M巴比里,
申请(专利权)人:皇家飞利浦电子股份有限公司,
类型:发明
国别省市:NL[荷兰]
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。