用于处理视听内容的描述的方法和系统技术方案

技术编号:3606536 阅读:157 留言:0更新日期:2012-04-11 18:40
说明了一种用于处理视听内容的描述的方法和设备(图4)。按照一个实施例,创建视听内容的一个描述(104),定义关于该视听内容的描述的重用的信息。进一步,将该视听内容的描述和重用信息存储在一个描述性数据储存库(104)中,以便随后能重用这个描述。(*该技术在2022年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利技术涉及多媒体数据处理,更具体来说,涉及根据语义描述的多媒体数据处理。
技术介绍
动画专家组(MPEG)开发关于视听内容的标准。MPEG标准方案的一个组成部分包括MPEG-7标准,其目的是提供用户可能感兴趣的视听内容的描述。特别地,开发MPEG-7标准是为了标准化描述视听内容的信息。MPEG-7标准可被用于各种领域,包括视听事项(items)的存储和从数据库的检索,广播媒体选择,远程购物,多媒体表示、因特网上的个性化新闻服务,等等。按照MPEG-7标准,视听内容的描述由描述符(descriptors)和描述规则(description schemes)组成。描述符表示视听内容的特征,并定义每个特征表示的语法和语义。描述规则(DS)规定它们的组成部分(components)之间的关系的结构和语义。这些组成部分既可以是描述符也可以是描述规则。可以在一个树中或在一个图(graph)中组织一个描述规则的概念方面(conceptual aspects)。该图结构由一个代表一个描述规则的各元素(elements)的节点集合和一个规定各节点之间关系的边集合定义。视听内容的描述(即描述符和描述规则)被划分为分段(segment)描述和语义(semantic)描述。分段描述从视听内容的结构的角度描述视听内容。就是说,这些描述是围绕代表视听内容的物理的空间、时间或时空的组成部分的分段构造的。每个分段可以由基于信号的特征(颜色、纹理、形状、运动、声频特征等等)和一些初级(elementary)语义信息描述。语义描述从概念的观点描述视听内容,就是说,语义描述描述视听内容的实际含义而不是它的结构。分段描述和语义描述由一个连接(links)集合联系起来,这允许在内容结构和语义这二者一起的基础上对视听内容进行描述。这些连接将不同的语义概念与由分段描述所描述的视听内容内的实例(instances)联系起来。当前的语义描述的描述能力有限,因为它们描述特定的语义实体(entities),而不标识这些特定的语义实体与其它有关的语义实体之间的关系。例如,当前的语义描述的模型包括各种语义实体的多个描述规则,这些语义实体诸如是事件、对象、状态、抽象概念等。一个事件DS描述一个有意义的时间定位(temporal localization)。例如,一个事件DS可以与现实世界或媒体中的一个具体实例(例如婚礼)相关联。一个对象DS在语义上描述一个特定对象(例如一个在一个图像中表示的汽车)。一个状态DS标识(例如一个对象或事件的)实体在给定的空间位置中或在给定的媒体位置中在给定的时间的语义特性(semantic properties)。一个概念DS描述不是通过从具体对象和事件中抽象(abstraction)而生成的抽象元素(abstract elements)。诸如自由或神秘等概念是概念描述所描述的实体的典型例子。以上描述规则描述特定实体。然而,一个描述如果只由它自己描述一个个别实体,则不可能是完整的。多数人类描述和通信都是通过把信息集中在一起而完成的,在任何交流中,信息都很少得到完全的描述。言谈中存在着暗示,使双方建立适度相容的或相似的心态(mentalmodels),在这个上下文中讨论所要讨论的信息。所以,一个描述要精确地和完全地描述内容,必须含有各种与该内容相关的额外信息。这个额外信息可包括背景信息、上下文信息、标识所描述的内容与其它实体之间的关系的信息、等等。此外,当前不存在用于产生暗喻和比喻的描述的机制。一个传统的意见是,语义描述只应描述视听内容,因此不需要产生暗喻描述。然而,人类一直在用暗喻和比喻而没有意识到在这样用。诸如“feelinglike a fish out of water”(觉得如虎行平地)、“getting close tothe deadline”(接近期限)、“flying like a bird”(如鸟飞翔)之类的暗喻和比喻是人类沟通中固有的。因此,把暗喻和比喻的描述从可能的描述清单中排除是不合乎要求的。此外,当前的语义描述是静态的。当由一个现有的语义描述所描述的材料改变时,就必须重新执行产生一个描述的过程,以生成一个描述该改变的材料的新的语义描述。因此,需要一种用于生成能够完整、准确地描述视听的或其它的任何语义情景的语义描述的工具。这样一个工具也应能生成动态地反映被描述的材料的变化的描述。
技术实现思路
说明一种用于处理视听内容的描述的方法和设备。按照一个实施例,创建视听内容的一个描述,并定义关于该描述的重用(reuse)的信息。进一步将该视听内容的描述和对应的重用信息存储在一个描述数据的储存库中,使这个描述随后能被重用。附图说明通过各附图中图示的例子非限定性地解释本专利技术。附图中相同的标注号指类似的元件。图1和2是用于生成精神空间(mental spaces)的现有技术实施例;图3表示视听内容的语义描述的各种结构形式的层次(hierarchy);图4是用于处理视听内容的语义描述的系统的一个实施例的框图;图5是用于提供视听内容的分布式描述的一个实施例的流程图;图6是用于重用视听内容的描述的一个实施例的流程图;图7是视听内容的描述的动态重用的一个实施例的流程图;图8表示一个示例性的语义镶嵌组合体(semantic mosaic);和图9是一个计算机系统的一个实施例的框图。具体实施例方式说明一种用于处理视听内容的描述的方法和设备。在以下详细说明中,为了能彻底理解本专利技术,陈述了许多具体的细节。然而,对于所属
的熟练人员来说,显然也可以脱离这些具体细节而实施本专利技术。在有些例子中,对众所周知的结构和装置用框图的形式表示,而不是详细地表示,以免不突出本专利技术。接下来的详细说明的有些部分,是以对计算机存储器内的数据位的操作的算法和符号表示的形式给出的。这些算法说明和表示,是数据处理
中的熟练人员用来最有效地向该领域中的其他熟练人员传达他们的工作实质的工具。这里,算法一般被设想成一个产生一个期望的结果的自相容的(self-consistent)步骤序列。步骤是那些要求对物理量进行物理操作的步骤。一般来说,尽管并非必要,这些量采取的是能被存储、传送、组合、比较和以其它方式被操作的电或磁信号的形式。已经证明,主要是为了普通使用,将这些信号称为位、值、元素(elements)、符号、字符、项(terms)、数字等等是方便的。不过应当记住,所有这些或类似的术语应当要与适当的物理量相关联,并且仅仅是应用于这些量的方便标记。在以下讨论中除非另外地特别声明或显而易见,假设在整个说明书中,使用了诸如“处理”或“计算”或“确定”或“显示”等等的术语的讨论,指的是计算机系统或类似的电子计算装置的操作(action)或过程,该操作或过程处理在计算机系统的寄存器或存储器内的以物理(电子)量表现的数据并将其转换成在计算机系统存储器或寄存器或其它的这种信息存储、传输或显示装置内的以物理(电子)量类似表现的其它数据。本专利技术也涉及用于执行本文中所述操作的设备。这个设备可以按照所需用途被专门地构造,也可以包含一个通用计算机,该通用计算机被存储在该计算机中的计算机程序有选择地启动或重新配置。这样一个计算机程序可以被存储在一个计算机可读存储介质中,本文档来自技高网
...

【技术保护点】
一种处理视听内容的描述的方法,该方法包含:    创建视听内容的一个第一描述(504);    定义关于第一描述的重用的信息(506);和    将第一描述和关于第一描述的重用的信息存储(508)在一个描述性数据储存库(104)中,以便随后能重用第一描述。

【技术特征摘要】
...

【专利技术属性】
技术研发人员:HK里辛三世A塔巴塔拜
申请(专利权)人:索尼电子有限公司
类型:发明
国别省市:US[美国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1