搜索多幅存储的数字图像。依照搜索查询检索图像(步骤204)。依照图像内容的预定特性对检索的图像进行聚类(步骤208)。根据预定准则对聚类分级(步骤210)。依照分级的聚类返回搜索结果(步骤212)。
【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及用于搜索多幅存储的数字图像的方法和设备。
技术介绍
诸如图像和视频之类的多媒体内容的检索引起了全球的兴趣。归因于大量的可用 多媒体内容,高效的检索方法对于消费和商业市场都是必要的。图像搜索引擎的使用已经 变成查找和检索图像的流行方法。通常,这样的系统依赖于用文本对图像加标签(tag)。该 文本主要由从包含图像的文档中提取的文件名或文本组成。由于图像检索几乎仅仅依赖于伴随图像的文本特征,因而图像检索过程可能有问 题。例如,这样的文本信息不总是可靠的并且在许多情况下该信息是“含噪声的”信息。例 如,在网站中,根据图像被添加到系统的顺序任意地选择图像的文件名。此外,从其中文本 提及不一定与伴随图像中显示的对象有关的许多不同对象的页面中提取相关文本信息是 困难的。例如,文本可能提及伴随图像中没有显示的许多不同的人。此外,一些姓名非常常见并且因而用户难于找到他们记住的个人的图像。例如,在 因特网上,出现在许多网页上的人级别高于出现在非常少的网页上的相同姓名的人。这使 得找到具有常见姓名或者其姓名也属于名人的人的图像成为不可能。因此,现有的图像检索方法经常返回不精确的搜索结果。此外,大量的结果被返 回,使得用户难于改进(refine)和获得可用的结果。因此,希望的是具有产生精确和一致 的结果并且提供改进的搜索结果的搜索引擎。
技术实现思路
本专利技术寻求提供一种产生精确和一致的搜索结果并且允许进一步改进这些结果 的系统。依照本专利技术的一个方面,这是通过用于搜索多幅存储的数字图像的方法来实现 的,该方法包括步骤依照搜索查询检索图像;依照图像内容的预定特性对所述检索的图 像进行聚类;根据预定准则对聚类分级(rank);以及依照分级的聚类返回搜索结果。所述 搜索查询可以包括例如个人的姓名或者另一文本。依照本专利技术的另一个方面,这也通过用于搜索多幅存储的数字图像的设备来实 现,该设备包括检索装置,其用于依照搜索查询检索图像;聚类装置,其用于依照图像内 容的预定特性对所述检索的图像进行聚类;分级装置,其用于根据预定准则对聚类分级; 以及输出装置,其用于依照分级的聚类返回搜索结果。所述搜索查询可以包括例如个人的 姓名或者另一文本。通过这种方式,返回精确的搜索结果,因为图像依照其内容而被聚类。此外,搜索 结果被改进,因为它们依照预定准则而被分级。结果,返回的结果更加特定于搜索查询并且 更容易解释。数字图像可以是视频数据流、诸如照片之类的静止数字图像、网站或者具有元数据的图像等等。所述预定特性可以是对象的预定特征,例如个人的预定脸部特征。检索的图像可 以通过使用脸部检测的结果并且对包含具有相同/相似脸部特征的脸部的检索的图像进 行聚类而被聚类。通过这种方式,可以找到特定个人的图像。可替换地,检索的图像可以依 照其场景内容,例如通过对林地场景的图像聚类以及对城市场景的图像聚类而被聚类。可 替换地,检索的图像可以依照图像中包含的对象或动物类型或者任何其他预定的内容特性 来聚类。所述预定准则可以是聚类的大小,并且分级的步骤可以包括按照聚类的大小顺序 对聚类分级,例如最大的第一,或者它们可以依照用户偏好或者依照访问历史来分级,使得 最受欢迎的或最近的首先被显示。按照这种方式,通过将其分级得高于不太相关的聚类而 赋予最相关的聚类更多的权重。这提供了更加改进的搜索。可以通过显示所述聚类的至少一个的代表性图像而返回搜索结果。这些显示的代 表性图像可以伴随有与显示的图像有关的文本或音频数据。当选择显示的代表性图像时, 可以显示与选择的代表性图像关联的聚类中的所有图像。通过这种方式,向用户呈现出代 表性图像形式的精简的菜单。用户只需浏览少量显示的代表性图像以便找到与其搜索查询 有关的图像。这在提供用于观看和解释结果的简单而高效的方法方面实现了进一步的改 进。所述聚类的分级可以根据选择的显示的代表性图像而进行调节。通过这种方式, 进一步改进了结果以便向用户提供依照用户的兴趣分级的图像。附图说明为了更完整地理解本专利技术,现在参照结合附图进行的以下描述,在附图中图1为依照本专利技术实施例的用于搜索多幅存储的数字图像的设备的简化示意图; 以及图2为依照本专利技术实施例的用于搜索多幅存储的数字图像的方法的流程图。 具体实施例方式参照图1,设备100包括数据库102,其输出连接到检索装置104的输入。检索装 置104可以例如是搜索引擎,比如web或桌面搜索引擎。检索装置104的输出连接到检测 装置106的输入。检测装置106的输出连接到聚类装置108的输入。聚类装置108的输出 连接到分级装置110的输入。分级装置110的输出连接到输出装置112的输入并且输出装 置114的输出反过来连接到分级装置110的输入。用户输入可以经由选择装置114提供给 输出装置112。参照图1和图2,在操作中,将搜索查询输入到检索装置104 (步骤202)。检索装 置104有权访问数据库102。数据库102是索引,其是对原始数据的引用(例如网站url) 和描述性信息(例如元数据)的列表。原始数据可以包括例如数字图像,比如视频数据流 或者静止数字图像(例如照片)。检索装置104可以不断地为新的数字图像搜索例如web。 检索装置104不断地对这些新的数字图像编索引并且将这些新的编索引的数字图像添加 到具有有关描述性信息的数据库102。当输入搜索查询时,检索装置104对数据库102中的文本执行搜索并且依照搜索查询检索图像(步骤204)。检索的图像输入到检测装置106。检测装置106可以例如是脸部检测器。可替换 地,检测装置106可以是场景内容检测器或者检测对象形状或动物类型等的检测器。在脸 部检测器的情况下,检测装置106在检索的图像内检测脸部(步骤206)。这可以通过在 检索的图像内检测包含脸部的区域并且在检索的图像中找到所有脸部的位置和大小来实 现。检测图像中的脸部的方法称为脸部检测。例如在“Rapid object detection using a boosted cascade of simple features", P. Viola, and M. Jones,IEEE Computer Society Conference on Computer Vision and Pattern Recognition, 2001 中公开了脸部检测方 法的一个实例。个人的身份可以基于个人的脸部在图像中的外貌来确定。这种标识个人 的方法称为脸部识别。例如在“Comparison of Face Matching Techniques under Pose Variation", B.Kroon, S.Boughorbel, and A. Hanjalic, ACM Conference on Image and Video Retrieval, 2007中公开了脸部识别方法的一个实例。检测装置106将检索的图像和检测的脸部输出到聚类装置108。可替换地,检测装置106可以事先为检索装置104编索引的每幅数字图像执行检 测。通过这种方式,检索装置104连续地为新的数字图像搜索web,对找到的任何新的数字 图像编索引,并且检测装置106对每一幅编索引的数字图像执行检测。数据库102本文档来自技高网...
【技术保护点】
一种用于搜索多幅存储的数字图像的方法,该方法包括步骤: 依照搜索查询检索图像; 依照图像内容的预定特性对所述检索的图像进行聚类; 根据预定准则对聚类分级;以及 依照分级的聚类返回搜索结果。
【技术特征摘要】
【国外来华专利技术】...
【专利技术属性】
技术研发人员:B克鲁恩,S布戈尔贝尔,M巴尔比里,
申请(专利权)人:皇家飞利浦电子股份有限公司,
类型:发明
国别省市:NL[荷兰]
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。