一种将单个新闻报导特征化(220)并基于该特征从多个报导中识别(230)共同的新闻报导的方法和系统。优选使用基于不同版本报导的共同结构的一种结构,为该共同的新闻报导创建(240-280)复合报导。从不同版本的报导中选择视频片段(110)以包含在该复合报导中,其中根据该视频片段(110)的视频和音频内容的已确定的排名(260,270)来选择视频片断(110)。
【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及视频图像处理领域,特别涉及用于分析来自各种来源 的视频新闻报导以识别共同报导,并创建来自各种来源的复合视频报 导的系统和方法。
技术介绍
不同的新闻来源通常从不同视角呈现相同的新闻报导。这些不同 的视角可能基于不同的政治观点或其他因素。例如,相同的事件可以 由一个来源以赞成的方式呈现,而由另一个来源以不赞成的方式呈 现,这取决于事件的结果对于特定的政治团体是有利的还是不利的。 类似地,所呈现的事件的特定方面可以在基于学术的新闻来源和基于 大众兴趣的新闻来源之间有所区别。以类似的方式,来自相同来源的 相同报导可能以不同的方式呈现,这例如取决于该报导是在新闻节目 的娱乐新闻时段期间播放还是在财经新闻时段播放。有一些方法和系统可用于区别各个新闻报道,识别并将这些报道 分类,并且基于用户的偏好过滤这些报道以呈现给用户。然而,报导 的每次呈现通常都是对具有其自己特定视角的已经记录的报导的回 放,如同它被接收到时一样。寻找同一报导的多种呈现可能是一个非常耗时的过程。如果用户 使用常规的系统来访问多个来源以基于用户的 一般偏好来找到报导, 结果通常是来自所有来源的混合报导的洪水,,。当用户找到特定兴 趣所在的报导时,用户识别与该报导相关的关键词或短语,然后使用 所关注报导的该关键词或短语提交对于来自各种来源的新闻报导的另 一个搜索。由于这一来自所有来源的报导的混合,用户也许难以过滤 所有选择,从而将所关注的报导从不关注的报导中区分开来,尤其是 不清楚可获得的选择中哪些仅仅是来自不同来源的相同报导(不关注 的)的选择。此外,根据用户的技巧和/或搜索引擎的质量,基于用户 定义的关鍵词和短语的搜索可能导致对可获得报导的过度过滤或过滤 不足,以使得可能无法为用户呈现他所期望的某些视角,或者为用户短语相匹配的不同报导。
技术实现思路
本专利技术的目的是提供一种从各种报导来源中有效地识别共同报导 的方法和系统。本专利技术的另一目的是根据不同版本的相同报导合成一 种复合新闻报导。本专利技术的另一目的是有效地构造复合新闻报导以易 于理解。这些和其他目的是通过这样的方法和系统实现的,即,将单独的 新闻报导特征化并基于该特征化从各种报导中识别共同的新闻报导。 优选地使用基于不同版本报导的共同结构的结构,为这种共同新闻报 导创建复合报导。从不同版本的报导中选择用于包含在该复合报导中 的片段,该选择是基于该片段的视频和音频内容的已确定的等级进行 的。附图说明参考附图,进一步详细地并通过示例的方式来解释本专利技术,其中 图1示出了根据本专利技术的报导合成系统的示例框图。 图2示出了根据本专利技术的报导合成系统的示例流程图。 在通篇附图中,相同的附图标记表示相同的元件,或执行基本相同功能的元件。所包含的附图仅用于说明,而并非意图限制本专利技术的范围。具体实施方式图1示出了根据本专利技术的报导合成系统的框图。通过读取器120 访问多个视频片段110。在本专利技术的典型实施例中,视频片段110对应 于所记录的新闻剪辑。可选的是,这些片段110可以位于包含连续视 频记录的磁盘驱动上,该视频记录诸如TiVo记录,使用本领域中 常见的技术可以从中区分单独的视频片段110。视频片段110也可以存储在跨越多个设备延伸的分布式存储器系统或数据库中。例如, 一些 或所有片段110可以位于因特网站点上,而读取器120包括访问因特 网的能力。通常,视频片段110包括图像和声音,为了便于引用将图 像和声音称为视频内容和音频内容,然而,根据内容,某些视频片段110可以仅包含图像或仅包含声音。本文中使用的术语视频片段110 —般意义上包括图像或声音或两者都包括。将特征化器130配置用于分析视频片段110,以便将每个片段特征 化,并且可选的是将每个片段内的子片段特征化。该特征化包括为报 导片段创建呈现项目,包括如下的这些项日期、新闻来源、主题、 姓名、地点、组织、关键字、演讲者的姓名/头衔等等。此外,该特征 化可以包括视觉内容的特征化表示,诸如颜色的柱状图、形状的位置、 情景的类型等等,和/或音频内容的特征化表示,诸如音频是否包括语 音、沉默、音乐、噪声等等。将比较器140配置用于基于每个片段110的特征化表示,来识别 与相同报导的不同版本相对应的片段110。例如,包含共同情景、和/ 或引用共同地点名称、和/或包括共同关键词或短语等等的来自不同新 闻来源的片段110很可能是涉及共同报导的片段110,并且将被识别为 一组报导片段。因为片段110可能与多个报导相关联,所以在涉及一 个报导的组中包含片段110并不排除将它包含在涉及另一报导的组 中。将编写器150配置用于组织涉及每个报导的片段的组,以形成反 映各种片段的报导的呈现。编写器150的这些性能和特征将取决于本 专利技术的特定实施例。在本专利技术直接的实施例中,编写器150采用例如从该组中的一个 或多个片段导出的标题以及有助于访问该组中的片段的索引,来创建报导的标识符。优选地,使用连接到片段iio的链接来形成这种索引,以便用户可以容易地点击并查看,,每个片段。在本专利技术更综合的实施例中,将编写器150配置用于由该组的片 段110来创建复合视频,如下详细所述。典型地,从报导的引言到更 详细情景的呈现,进而到报导的结束语,来自各种来源的新闻报导的 片段对于片段110中的材料呈现而言不仅展现出共同的内容,还展现 出共同的结构。单纯的连接来自各种来源的片段110将会导致来自每 个来源的每个引言报导的情景结束语序列的重复,这种结构 重复可能是脱节的,并且可能缺乏聚合性。在本专利技术该方面的优选实 施例中,将编写器150配置用于选择和组织来自组的片段110,以便形 成符合源材料的通用结构的复合视频。这就是说,使用上述示例的结构,复合视频将包含引言,接着是详细的情景,随后是结束语。这三 个结构性部分(引言、情景、结束语)中的每一个将基于该组中的各种部分110的相应子部分,如下进一步详述。本领域普通技术人员将认识到,可以将编写器150配置用于创建 位于上述讨论的示例性直接和综合实施例中的特征范围之间或特征范 围之外的呈现,以及这种特征的任选组合。例如,也可以将创建聚合 性复合报导的编写器150的实施例配置用于独立地或者在呈现该复合 报导的同时借助交互式提供对单个片段的索引化的访问。以类似方 式,其中编写器150仅提供对于片段的索引化访问的这种系统的实施例可以包括与介质播放器的链接,该介质播放器配置用于顺序地呈现 来自给定片段列表的视频。将呈现器150配置用于接收来自编写器150的呈现,并将其呈现 给用户。呈现器150可以是常规的介质回放设备,或者可以将它与该 系统集成以有助于访问各种特征以及系统的选项,特别是由编写器l50 提供的交互式选项。图1的系统优选还包括通常用于视频处理和选择系统的其他部件 和性能,但为了易于理解本专利技术的显著方面而并未示出。例如,可以 将该系统配置用于管理为该系统提供片段110的来源的选择,和/或可以将该系统配置用于管理呈现给用户的报导选择的呈现。以类似方 式,该系统优选地包括配置用于基于用户的偏好、基于片段的特征化 和/或每个报导的复合特征化来过滤片段或报导的一个或多个过滤器。图2示出了根据本专利技术的报导合成系统的示例流程图。如上所述, 本文档来自技高网...
【技术保护点】
一种系统,包括: 读取器(120),其配置用于提供对多个视频片段(110)的访问, 特征化器(130),可操作地耦合到读取器(120),其配置用于将所述多个视频片段(110)的每个片段进行特征化, 比较器(140),可操作地耦合到特征化器(130),其配置用于比较每个片段的特征以识别多个版本的共同报导。
【技术特征摘要】
【国外来华专利技术】US 2005-3-31 60/666,919;US 2005-7-21 60/701,5271.一种系统,包括读取器(120),其配置用于提供对多个视频片段(110)的访问,特征化器(130),可操作地耦合到读取器(120),其配置用于将所述多个视频片段(110)的每个片段进行特征化,比较器(140),可操作地耦合到特征化器(130),其配置用于比较每个片段的特征以识别多个版本的共同报导。2. 权利要求l的系统,还包括呈现器(160),可操作地耦合到比较器(140)和读取器(120),其配置用于基于所述多个版本的共同报导来提供呈现。3. 权利要求2的系统,还包括编写器(150),可操作地耦合到比较器(140)和读取器(120), 其配置用于基于所述多个版本的视频片段(110)的内容来创建该呈现。4. 权利要求3的系统,其中将编写器(150)配置用于基于视频片段(110)的视频和音频内 容为视频片段(110)的内容进行排名(260, 270)。5. 权利要求3的系统,其中 将编写器(150)配置用于基于所述多个版本的视频片段(110)的内容的一个或多个结构确 定(250)共同结构,以及基于该共同结构创建(280)该呈现。6. 权利要求5的系统,其中将编写器(150)进一步配置用于基于视频片段(110)的视频内 容和音频...
【专利技术属性】
技术研发人员:L阿格尼霍特里,N迪米特罗瓦,M巴比里,A汉贾利克,
申请(专利权)人:皇家飞利浦电子股份有限公司,
类型:发明
国别省市:NL[荷兰]