当前位置: 首页 > 专利查询>微软公司专利>正文

基于图像内容的自动标记生成制造技术

技术编号:10236749 阅读:180 留言:0更新日期:2014-07-18 21:52
提供了从具有可辨认对象的图像的照片(或视频)中自动提取数据和给照片(或视频)自动加标记的方法。图像识别与包括地理和日期/时间信息的所提取元数据的组合被使用来找出和识别照片或视频中的对象。在找到对于所识别的对象的匹配的标识符后,用与所识别的对象相关联且相对应的一个或多个关键字给照片或视频自动加标记。

【技术实现步骤摘要】
【国外来华专利技术】【专利摘要】提供了从具有可辨认对象的图像的照片(或视频)中自动提取数据和给照片(或视频)自动加标记的方法。图像识别与包括地理和日期/时间信息的所提取元数据的组合被使用来找出和识别照片或视频中的对象。在找到对于所识别的对象的匹配的标识符后,用与所识别的对象相关联且相对应的一个或多个关键字给照片或视频自动加标记。【专利说明】基于图像内容的自动标记生成
技术介绍
随着数码相机变得越来越普遍,以及数字存储装置变得越来越便宜,在用户的收集(collection)(或库)中的相片(“照片”)和视频的数目也将呈指数级增加。对那些照片进行归类是费时的,而且让用户快速找出他们生活中特定时刻的图像是一种挑战。当前,在数码照片的整理、保存和搜索中使用标记作为辅助。加标记涉及到给数字数据指派关键字的过程。然后可以按照关键字或‘标记’来组织数字数据。例如,数码照片的主题可被使用来创建关键字,然后这些关键字可以作为一个或多个标记而与该数码照片相关联。虽然标记可以人工地加到特定的数码照片上以帮助照片的归类和搜索,但当前只有几种加到照片的自动标记。例如,大多数相机给数码照片指派日期和时间的自动标记。另夕卜,越来越多的相机正包括地理位置来作为照片的自动标记的一部分。最近,已经开发了软件解决方案来提供对于照片中的人的自动识别(并且匹配于特定的身份)。然而,用户当前只限于通过日期、地理、人标记和人工添加的标记来查询照片。
技术实现思路
提供了用于给数码照片和视频自动指派标记的方法。不是仅仅具有可由相机自动指派给照片的、来自提供日期、时间和地理位置的元数据的标记,而是可以从照片或视频中自动提取附加信息,并且可以把与该附加信息相关联的关键字或代码作为标记自动指派给该照片或视频。这个附加信息可包括不能直接从图像和与图像相关联的元数据明显地得到的信息。例如,从图像中可以提取关于某些条件的信息,包括但不限于天气、地理地标、建筑地标和显著的环境特征。在一个实施例中,照片的时间和地理位置元数据被使用来提取对于该特定的位置和时间的天气。所述提取可以通过查询天气数据库以确定对于在拍摄照片时的特定位置和时间的天气而被执行。在另一个实施例中,照片的地理位置元数据和图像识别被使用来提取地理和建筑地标。在再一个实施例中,图像识别被使用来从图像提取显著的环境特征(包括背景、色彩、色调和亮度)和已知的物理对象,且根据所提取的特征和对象把标记自动指派给照片。按照一个实施例,当在某个照片中识别一个或多个确定的条件时,关键字或对象标识符的数据库可被提供来用作为标记。当一个特定的条件被识别时,与该特定的条件相关联的一个或多个关键字或对象标识符被自动指派为对于该照片的标记。之前与特定的照片相关联的标记可被使用来生成附加标记。例如,日期信息可被使用来生成与该日期相关联的带有关键字的标记,诸如季节、学校学期、假期和有报道价值的事件。在另一个实施例中,所识别的对象可以通过知名度进行排名,且该排名被反映为附加标记。另外,在辨认所识别的对象时使用的数据库可包括各种水平的特异性(specificity) / 粒度(granularity)。本概要被提供来以简化的形式介绍概念的选择,这些概念还将在下面的详细说明中进行描述。本概要既不打算确认所要求保护的主题的关键特征或必要特征,也不打算被使用来限制所要求保护的主题的范围。【专利附图】【附图说明】图1图示按照本专利技术的某些实施例的自动标记生成过程。图2图示按照本专利技术的某些实施例的图像识别过程。图3显示按照本专利技术的某些实施例的自动标记生成过程的流程。图4图示按照本专利技术的实施例的、用于自动标记生成过程的、通过从照片中提取建筑地标而生成标记的过程。图5图示按照本专利技术的实施例的、用于自动标记生成过程的、通过从照片中提取地理地标而生成标记的过程。【具体实施方式】描述了用于进行与照片相关联的一个或多个标记的自动生成的技术。自动添加标记可以发生在数码照片(或视频)被装载到或以别的方式传送到可被存储在本地、远端或分布式数据库的照片集时。在其它实施例中,自动添加标记可以在用户发起时发生,以便给现有的照片加标记。图像可包括但不限于在照片或视频帧中所出现的对象、形状和特征的视觉代表。按照某些实施例,图像可以由数码相机捕获(以照片的形式或作为视频的一部分),并且它可以以由数码相机的图像传感器定义的像素的形式被实现。在一些实施例中,术语“照片图像”在这里被用来指数码照片的图像,与照片所关联的元数据或其它元素相对,并且它可以与术语“图像”互换使用,而不背离本专利技术的某些实施例的范围。术语“照片”、“图像”和“照片图像”的意义从它们的上下文中将容易理解。在某些实施例中,当在这里被使用时,图像可以是指由数码相机的图像传感器得到的电数值的视觉代表。图像文件(和数码照片文件)可以是指计算机可读的并且在存储设备中可存储的图像的形式。在某些实施例中,图像文件可包括但不限于.jpg、, gif和.bmp文件。图像文件可以被重建,以便在例如显示设备或衬底上(例如,通过打印在纸上)提供视觉代表(“图像”)。虽然某些示例性实施例可能是参照照片描述的,但应当理解,这些实施例也可以适用于任何图像(甚至于不是由相机捕获的那些图像)。而且,本主题技术可应用于静止图像(例如,相片)和运动图像(例如,视频),并且可把音频成分包括到文件。被写入到数码照片文件中的元数据常常包括标识谁拥有该照片(包括版权和联系信息)和创建该文件的相机(和设置)的信息,以及说明性信息,诸如用于使得文件在用户的计算机上和/或在互联网上可搜索的、关于照片的关键字。某些元数据由相机编写,而其它元数据在数码照片文件从相机、存储器设备或另外的计算机转送到计算机(或服务器)后,由用户人工输入或由软件自动输入。按照本专利技术的某些实施例,图像及其元数据被使用来生成附加元数据。附加元数据是通过从图像和用于图像的元数据进行提取或推断而被生成的。用于图像的元数据可包括拍摄图像的地理位置和日期,以及与图像相关联的、可得到的任何其它信息。用于图像的元数据可以是图像本身的一部分或可以分开地提供。当元数据是图像本身的一部分时,在图像的数字文件被使用来生成附加元数据之前,首先从图像的数字文件提取数据。附加元数据一旦被生成就可以回过来与原先的图像相关联或被使用于其它用途。提取的和/或创建的元数据和附加元数据可以作为标记而与原先的图像相关联。一种类型的标记是关键字标记。关键字标记可以结合对一个或多个图像执行操作而被使用,诸如像根据具有匹配于特定准则的关键字的标记而归类、搜索和/或检索图像文件。图1图示按照本专利技术的某些实施例的自动标记生成过程。参照图1,接收具有图像及其对应的元数据的照片100。本专利技术的实施例的自动加标记过程可以在接收到照片后自动开始。例如,所述过程可以在用户上载照片图像文件到照片共享站点后开始。作为另一个例子,所述过程可以在用户把照片从相机装载到用户的计算机后开始。作为再一个例子,用户的移动电话可包括用于自动标记生成的应用,其中加标记过程可以在通过使用移动电话的相机来捕获图像或选择所述应用后开始。在接收照片后,提取与照片相关联的元数据110。元数据的提取可包括读取和分析与照片相关联的元数据的具体类型。可被提取的元数据的类型可包括但不限于:可本文档来自技高网...

【技术保护点】
一种自动标记生成的方法,包括:从与图像相关联的图像文件中提取元数据,所述元数据包括与该图像被捕获的位置有关的地理信息,以及任选地还包括与该图像被捕获的时间有关的日期和时间信息;执行图像识别,以便辨认图像中的一个或多个对象、形状、特征或纹理;用与所述一个或多个对象、形状、特征或纹理有关的信息或代码自动给图像加标记;通过以下步骤确定所述一个或多个对象、形状、特征或纹理中的被辨认的对象或形状的对应细节:  使用与该被辨认的对象或形状有关的信息或代码以及该地理信息来查询至少一个数据库,以便将该被辨认的对象或形状以及该图像被捕获的位置与该对象或形状以及该图像被捕获的位置有关的对应细节进行匹配,或  使用与该被辨认的对象或形状有关的信息或代码以及该日期和时间信息来查询至少一个数据库,以便将该被辨认的对象或形状以及该图像被捕获的时间与该对象或形状以及该图像被捕获的时间有关的对应细节进行匹配,或  使用与该被辨认的对象或形状有关的信息或代码以及该地理信息与日期和时间信息来查询至少一个数据库,以便将该被辨认的对象或形状以及该图像被捕获的位置和该图像被捕获的时间与该对象或形状以及该图像被捕获的位置和该图像被捕获的时间有关的对应细节进行匹配;以及用与所述对应细节有关的信息或代码自动给该图像加标记。...

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:JE米兰达斯泰纳
申请(专利权)人:微软公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1