获取多幅图像的描述信息的方法及装置与图像匹配方法制造方法及图纸

技术编号:7898364 阅读:203 留言:0更新日期:2012-10-23 04:29
一种获取多幅图像的描述信息的方法及装置与图像匹配方法。获取多幅图像的描述信息的方法包括:针对多幅图像中的每幅图像进行特征点检测,以得到每幅图像的多个特征点;针对每幅图像,根据基于检测到的多个特征点得到的该图像的多个第一局部特征描述子和基于各图像的多个第一局部特征描述子得到的多个第一视觉单词来生成该图像的0级描述信息;以及针对每幅图像执行以下步骤:对该图像进行第n-1次分割,以得到该图像的多幅n-1级子图像;以及根据基于相应特征点所在的n-1级子图像得到的该图像的多个第n局部特征描述子和基于各图像的多个第n局部特征描述子得到的多个第n视觉单词来生成该图像的n-1级描述信息,其中n=2,3,......,K+1,以及K为正整数。

【技术实现步骤摘要】

本专利技术总体上涉及图像处理的
,更具体而言,涉及获取图像的描述信息的方法以及装置。
技术介绍
随着信息技术的发展,大规模数据库越来越多的出现在多媒体应用领域,比如图像文件管理,工业图像/视频监管,医学图像诊断等等。针对大规模数据库的快速图像检索和识别也随之成为一个重要的研究课题。传统的基于“词袋”(Bag-of-words)的图像描述方法在解决这一问题上有良好的表现,并且得到普遍应用。例如,C. Wallraven等人的“Recognition with localfeatures the kernel recipe”,In Proc. ICCV, volume I, pages 257-264, 2003 中介绍了 这种基于“词袋”的图像描述方法。它从大量图像局部特征中抽取出具有代表性的“视觉单词”(visual words),并且采用图像中这些视觉单词出现的频率来描述该图像。同时为了克服该特征在空间信息的描述受限,人们提出了基于图像多层空间结构的描述方法。例如,K. Grauman 等人的 “Pyramid matchkernels !Discriminative classification with setsof imagefeatures”,In. Proc. ICCV, 2005中公开了一种用空间金字塔形式描述图像的方法。然而,由于这些方法对每一个特征点均只计算一个局部特征描述子,所以认为生成的是静态视觉单词,这样的视觉单词不一定都适用于描述不同空间层次上的图像特征。
技术实现思路
鉴于现有技术中存在的上述问题,本专利技术的一个目的是提供一种新颖的基于动态词袋的多层图像描述方法,其能够在不同空间层次上准确地描述图像。本专利技术的另一目的是提供一种图像匹配方法,其能够实现图像的灵活匹配。按照本专利技术的一方面,提供了一种获取多幅图像的描述信息的方法。该方法包括检测步骤,针对多幅图像中的每幅图像进行特征点检测,以得到每幅图像的多个特征点;用于获取多幅图像的0级描述信息的第一获取步骤,针对每幅图像,根据基于该图像的各特征点得到的该图像的多个第一局部特征描述子和基于各图像的多个第一局部特征描述子得到的多个第一视觉单词来生成该图像的0级描述信息;及用于获取多幅图像的n-1级描述信息的第n获取步骤,针对每幅图像执行以下步骤第n-1分割子步骤,对该图像进行第n-1次分割,以得到该图像的多幅n-1级子图像;以及第n获取子步骤,根据基于该图像的各特征点得到的该图像的多个第n局部特征描述子和基于各图像的多个第n局部特征描述子得到的多个第n视觉单词来生成该图像的n-1级描述信息,其中该图像的各个第n局部特征描述子根据相应特征点所在的n-1级子图像得到,其中n = 2,3,...,K+1,以及K为正整数。按照本专利技术的另一方面,提供了一种图像匹配方法。该方法包括通过把输入的图像与多幅图像的各图像分别进行匹配来获得多个相似度,每个相似度的获得包括把输入的图像的0级描述信息直到K级描述信息分别与所述多幅图像中的相应图像的0级描述信息直到K级描述信息进行比较,以得到包括从0级匹配度直到K级匹配度的多个匹配度;以及根据所述多个匹配度的加权和来得到该相似度,其中K为正整数,其中根据本专利技术所述的方法获取多幅图像的各图像的0级描述信息直到K级描述信息,根据基于输入的图像中包含的多个特征点得到的输入的图像的多个0级局部特征描述子和所述多个第一视觉单词来获取输入的图像的0级描述信息,通过针对输入的图像执行以下步骤来获取输入的图像的n-1级描述信息,n = 2, 3,. . .,K+1 :对输入的图像进行第n-1次分割,以得到多幅n-1级子图像;及根据基于输入的图像的各特征点得到的输入的图像的多个n级局部特征描述子和所述多个第n视觉单词来生成输入的图像的n-1级描述信息,其中各个n级局部特征描述子根据相应特征点所在的输入的图像的n-1级子图像得到,并且仅当所述0级匹配度大于等于预定阈值时才进行I级描述信息的比较,以及仅当n-1级匹配度大于等于所述预定阈值时才进行n级描述信息的比较。按照本专利技术的又一方面,提供了一种获取多幅图像的描述信息的装置。包括检测单元,配置成针对多幅图像中的每幅图像进行特征点检测,以得到每幅图像的多个特征点;用于获取多幅图像的0级描述信息的第一获取单元,配置成针对每幅图像,根据基于该图像的各特征点得到的该图像的多个第一局部特征描述子和基于各图像的多个第一局部特征描述子得到的多个第一视觉单词来生成该图像的0级描述信息;及用于获取多幅图像的n-1级描述信息的第n获取单元,包括第n_l分割子单元,配置成针对每幅图像进行第n-1次分割,以得到该图像的多幅n-1级子图像;以及第n获取子单元,配置成针对每幅图像,根据基于该图像的各特征点得到的该图像的多个第n局部特征描述子和基于各图像的多个第n局部特征描述子得到的多个第n视觉单词来生成该图像的n-1级描述信息,其中该图像的各个第n局部特征描述子根据相应特征点所在的n-1级子图像得到,其中n = 2,3,...,K+1,以及K为正整数。按照本专利技术的再一方面,提供了一种存储有机器可读取的指令代码的程序产品,所述指令代码由机器读取并执行时,可执行如上所述的根据本专利技术实施例的获取多幅图像的描述信息的方法。按照本专利技术的又一方面,提供了一种承载有如上所述的程序产品的存储介质。与传统方法对每个特征点仅得到一个局部特征描述子不同,本专利技术对每个特征点产生一系列的描述子。因此,可以实现在不同空间层次上准确地描述图像。此外,可以按照从粗糙层到精细层的顺序进行图像匹配,并且仅当m-1层上两幅图像的匹配度大于预定阈值时,才进行m层上的图像匹配。因此,可以实现图像的灵活匹配。附图说明参照下面结合附图对本专利技术实施例的说明,会更加容易地理解本专利技术的以上和其它目的、特点和优点。在附图中,相同的或类似的技术特征或部件将采用相同或类似的附图标记来表示。图I是示出了根据本专利技术一个实施例的获取多幅图像的描述信息的方法的流程简图;图2是示出了用于实现图I所示第n获取步骤的一个具体示例的流程简图;图3是示出了某幅图像的两级描述信息的示意图;图4是示出了根据本专利技术的一个实施例的进行图像匹配的方法的流程简图;图5是示出了根据本专利技术的一个实施例的获取多幅图像的描述信息的装置的简 化框图;以及图6是示出可用于实施根据本专利技术实施例的方法和装置的计算机的示意性框图。具体实施例方式下面参照附图来说明本专利技术的实施例。在本专利技术的一个附图或一种实施方式中描述的元素和特征可以与一个或多个其它附图或实施方式中示出的元素和特征相结合。应当注意,为清楚的目的,附图和说明中省略了与本专利技术无关的、本领域普通技术人员已知的部件和处理的表示和描述。在本专利技术的实施例中,为了获得足够丰富的图像特征信息,对图像进行多层划分,在每一空间层上都计算局部特征描述子,针对从粗糙到精细的各个空间层分别根据相应的局部特征描述子生成各自的视觉单词,并且利用各个空间层上相应的视觉单词获得有效的多层图像描述。图I是示出了根据本专利技术一个实施例的获取多幅图像的描述信息的方法100的流程简图。如图I所示,首先,在检测步骤SllO中,针对多幅图像中的每幅图像进行特征点检测,以得到每幅图本文档来自技高网...

【技术保护点】
一种获取多幅图像的描述信息的方法,包括:检测步骤,针对多幅图像中的每幅图像进行特征点检测,以得到每幅图像的多个特征点;用于获取多幅图像的0级描述信息的第一获取步骤,针对每幅图像,根据基于该图像的各特征点得到的该图像的多个第一局部特征描述子和基于各图像的多个第一局部特征描述子得到的多个第一视觉单词来生成该图像的0级描述信息;及用于获取多幅图像的n?1级描述信息的第n获取步骤,针对每幅图像执行以下步骤:第n?1分割子步骤,对该图像进行第n?1次分割,以得到该图像的多幅n?1级子图像;以及第n获取子步骤,根据基于该图像的各特征点得到的该图像的多个第n局部特征描述子和基于各图像的多个第n局部特征描述子得到的多个第n视觉单词来生成该图像的n?1级描述信息,其中该图像的各个第n局部特征描述子根据相应特征点所在的n?1级子图像得到,其中n=2,3,...,K+1,以及K为正整数。

【技术特征摘要】

【专利技术属性】
技术研发人员:曹琼刘汝杰于浩杉村昌彦上原祐介
申请(专利权)人:富士通株式会社
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1