为媒体内容管理系统索引数字信息信号的方法和设备技术方案

技术编号:2880630 阅读:214 留言:0更新日期:2012-04-11 18:40
提供用于从多媒体信息产生标准描述记录的系统和方法。本发明专利技术使用基本的实体-关系模型于Generic AVDS,它把实体,实体属性,和关系分类成相应的类型以便描述可视数据。它也涉及将实体关系分类成语法和语义属性。语法属性可归类成不同的层:类型/技术,全局分布,局部结构,和全局组成。语义属性能归类成不同的层:普通对象,普通场景,特定对象,特定场景,抽象对象,和抽象场景。本发明专利技术还使用将实体关系分类为语法和语义类别的分类。语法关系能归类成空间的,时间的,和可视类别。语义关系能归类成词法的和表述的类别。(*该技术在2020年保护过期,可自由使用*)

【技术实现步骤摘要】
对有关专利申请的参考本专利申请是基于1999年7月3日归档的60/142,325号美国暂时的专利申请,并要求对其的优先权。本专利技术的背景I、本专利技术的领域。本专利技术涉及用于描述多媒体信息的技术,更具体地是涉及到描述视频和图象信息,或声频信息的技术,以及这种信息的内容。所揭示的技术用于数字数据信号(如多媒体信号)的对内容敏感的索引和分类。II、有关技术的描述随着全球因特网的成熟及区域网及局域网的广泛应用,数字多媒体信息已变得越来越为消费者及商业所接受。因此开发那些处理,过滤,搜索及组织数字多媒体信息,使得能从越来越庞大的原始信息中筛选有用信息的系统变得越来越重要。在撰文当前专利申请时,已存在允许消费者/或商业搜索文本信息的解决方安葬。确实,如由yahoo.com,goto.com,excite.com等提供的许多基于文本的搜索引擎在万维网(www)上可以得到并存在于大多数被访问的web网站中,这表明对那样的信息提取技术有大量的需求。不幸的是对多媒体内容不是那样,因为对这样的对象不存在公认的描述方法。数字图形和视频的最近迅速增加为那些在搜索内容时有大量资源的最终用户带来了新的机遇。可视信息从许多不同的来源以许多不同的格式在各个不同的方面到处可得到。这是个优点,但同时也是挑战,因为用户在搜索这种内容时不能审阅大量数据。因此,必须让用户能有效地浏览内容,或根据他们特定的需要实现询问。但是为了在一个数字库中提供那样的功能,重要的是理解这些数据并合适地索引它。必须构造索引,并必须根据用户想如何访问这种信息来构造。在传统的方法中,使用文本标记于索引,一个编目人员手工指定一组关键字或表达式来描述一个图形。然后用户能实现基于文本的询问或通过手工指定的编目浏览。与基于文本方法相反,在基于内容检索方面的现代技术将目光集中在基于它们可视内容的索引图象。用户能通过样本(如象此样本的图象)或用户设计图(如象此设计图的图象)实现询问。更现代的工作试图根据它们的内容自动分类图象一个系统分类每个图象并指定一个标签(如室内,室外,包含一面,等)。在两个范例中有分类的议题,尤其在基于内容的检索方面,这经常被忽视。在合适的索引可视信息方面的主要困难可以归纳如下(1)在单个图形中有大量的信息(如索引什么?),和(2)可能有不同层次的描述(如如何索引?)。例如,考虑穿着一套制服的男士的画象。可能用术语“制服”或“男士”来标签此图象。术语“男士”转而能引出多个层次的信息概念上,(如在字典中男士的定义)物理上(大小,重量)和视觉上的(头发颜色,衣服)及其他。因此,一个分类标签包含明显的(如在图象中的人是男士而非女士),和隐含的或不确定信息(如单从那个术语不可能知道那个男士穿什么)。在这方面,过去的尝试是提供多媒体数据库,它允许用户使用包含在图形中的视频对象中的如颜色,纹理和形状那样的特征搜索图形。但是,在20世纪末仍然不可能实现搜索因特网上或大多数区域网或局域网上的多媒体内容,因为不存在这方面内容的广泛共识的描述。此外,对多媒体内容搜索的要求不限于数据库,并扩展到如数字广播电视和多媒体电话那样的其他应用中。通过运动图形专家组(Motion Picture Expert Group-“MPEG”)的MPEG-7的标准化的努力,一个开发此标准的工业界的试图已经形成一个多媒体描述架构。在1996年10月开始,MPEG-7致力于标准化多媒体数据的内容描述,以便于针对内容的应用,如多媒体搜索,过滤,浏览和综合。MPEG-7标准为对象的更完全的描述包含在国际标准化组织(International Organisation forStandardisation)文档ISO/IEC JTC1/SC29/WG11 N2460(1998.10)中,其内容在这是包含作为参考。MPEG-7标准具有的目标是规定描述符以及用于描述符和它们关系的结构(称之为“描述型式”)的一组标准集以描述各种类型的多媒体信息。MPEG-7也提出定义其他描述符及对这些描述符和它们的关系的“描述型式”的标准化方法。此描述,即描述符及描述型式的结合应与内容本身有关联,以允许快速并有效地搜索及过滤用户感兴趣的东西。MPEG-7还建议标准化一个语言,来规定描述型式,即描述定义语言(Description Definition Language--“DDL”),和用于二进制编码多媒体内容描述的型式。在撰文当前专利申请时,MPEG征求技术投标,它将优化的实现必要的描述型式,用于将来集成到MPEG标准中去。为了提供那样的优化描述型式,考虑3个不同的多媒体应用的方面。它们是分布式处理情况,内容交换情况,和允许个性化观看多媒体内容的格式。关于分布式处理,描述型式必须提供多媒体内容的互换描述的能力,而与能进行多媒体内容分布式处理的任何平台,任何销售商及任何应用无关。可互操作的内容描述的标准化意味着,从各种来源来的数据能加入到各种分布或应用中,如多媒体处理器,编辑器,检索系统,过滤工具等。这些应用中的某些可以从第三方提供,产生一个能用此多媒体数据的标准化描述工作的多媒体工具的提供者的子工业。用户应能访问各个内容提供者的网站来下载内容和由某些低层或高层处理获得的有关的索引数据,并进而访问若干工具提供者的网站来下载工具(如Java应用小程序),以便按照用户的个人兴趣以特别的方法处理异种数据描述,这种多媒体工具的一个例子是视频编辑器。如果与每个视频相关的描述是MPEG-7相容的,MPEG-7相容的视频编辑器能管理和处理来自各种来源的视频内容。每个视频可以带有变化的描述细节程度,如摄影机运动,场景剪辑,标准及物体分段。从可互操作的内容描述标准得益非浅的第二情况是在各异种多媒体数据库之间交换多媒体内容。MPEG-7致力于提供表示,交换,翻译和重复使用多媒体内容的现有描述的方法。当前,TV广播提供者,无线电广播提供者和其他内容提供者管理并存储巨量多媒体内容。此内容目前使用文本信息和专用的数据库人工描述。没有可互操作性的内容描述,内容的使用者需要投资人力来将由每个广播者使用的描述手工翻译成它们自己适用的型式。如果所有的内容提供者包含同样的型式的内容描述型式,多媒体内容描述的互换是可能的。最后,应用该描述型式的多媒体播放者及观看者必须为用户提供创新的能力如由用户配置进行数据的多重观看。用户应能改变显示配置而不需要从内容的广播者以不同的程式再次下载数据。上述的例子仅暗示了对于根据MPEG-7以标准方式提供的构造丰富的数据的可能的使用。不幸的是,当前尚无现成的技术能大体上满足分布式处理,内容改变或个性化观看等情况。尤其是,现有的技术不能根据一般的特征或语义关系提供捕捉嵌入在多媒体信息中的内容的技术或提供组织这种内容的技术。因此需要对一般的多媒体信息的有效的内容描述型式的技术。在MPEG汉城会议(1999年3月)期间,根据DS1(静止图象),DS3++(多媒体),DS4(应用),尤其是根据MPEG-7 Evaluation AHL(Lancaster,U.K.1999年2月)(AHG on MPEG-7 Evaluation Logistics,“Report of the Ad-hoc Groupon MPEG-7 Evalu本文档来自技高网...

【技术保护点】
一种索引多个数字信息信号的方法,其特征在于包括下列步骤:(a)对每个信号(i)对信号内容定义多个索引层;(ii)选择至少一个所述的索引层;(iii)从与每个所述的选定的索引层有关的信号中提取特征;(b)对每个信号分类(信 号之间)在同一选定的索引层的所述提取的特征之间的关系;和(c)对该信号将所述的提取的特征及关系组织到较高层的描述结构中。

【技术特征摘要】
...

【专利技术属性】
技术研发人员:A贝尼特兹A贾米斯张世富JR史密斯李中生
申请(专利权)人:纽约市哥伦比亚大学托管会IBM公司
类型:发明
国别省市:US[美国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1