获取多幅图像的描述信息的方法及装置与图像匹配方法制造方法及图纸

技术编号：7898364 阅读：213 留言：0更新日期：2012-10-23 04:29

一种获取多幅图像的描述信息的方法及装置与图像匹配方法。获取多幅图像的描述信息的方法包括：针对多幅图像中的每幅图像进行特征点检测，以得到每幅图像的多个特征点；针对每幅图像，根据基于检测到的多个特征点得到的该图像的多个第一局部特征描述子和基于各图像的多个第一局部特征描述子得到的多个第一视觉单词来生成该图像的0级描述信息；以及针对每幅图像执行以下步骤：对该图像进行第n-1次分割，以得到该图像的多幅n-1级子图像；以及根据基于相应特征点所在的n-1级子图像得到的该图像的多个第n局部特征描述子和基于各图像的多个第n局部特征描述子得到的多个第n视觉单词来生成该图像的n-1级描述信息，其中n＝2，3，......，K+1，以及K为正整数。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术总体上涉及图像处理的
，更具体而言，涉及获取图像的描述信息的方法以及装置。
技术介绍
随着信息技术的发展，大规模数据库越来越多的出现在多媒体应用领域，比如图像文件管理，工业图像/视频监管，医学图像诊断等等。针对大规模数据库的快速图像检索和识别也随之成为一个重要的研究课题。传统的基于“词袋”(Bag-of-words)的图像描述方法在解决这一问题上有良好的表现，并且得到普遍应用。例如，C. Wallraven等人的“Recognition with localfeatures the kernel recipe”，In Proc. ICCV, volume I, pages 257-264, 2003 中介绍了这种基于“词袋”的图像描述方法。它从大量图像局部特征中抽取出具有代表性的“视觉单词”(visual words)，并且采用图像中这些视觉单词出现的频率来描述该图像。同时为了克服该特征在空间信息的描述受限，人们提出了基于图像多层空间结构的描述方法。例如，K. Grauman 等人的 “Pyramid matchkernels !Discriminative classification with setsof imagefeatures”，In. Proc. ICCV, 2005中公开了一种用空间金字塔形式描述图像的方法。然而，由于这些方法对每一个特征点均只计算一个局部特征描述子，所以认为生成的是静态视觉单词，这样的视觉单词不一定都适用于描述不同空间层次上的图像特征。
技术实现思路
鉴于现有技术中存在的上述问题，本专利技术的一个目的是提供...

【技术保护点】
一种获取多幅图像的描述信息的方法，包括：检测步骤，针对多幅图像中的每幅图像进行特征点检测，以得到每幅图像的多个特征点；用于获取多幅图像的0级描述信息的第一获取步骤，针对每幅图像，根据基于该图像的各特征点得到的该图像的多个第一局部特征描述子和基于各图像的多个第一局部特征描述子得到的多个第一视觉单词来生成该图像的0级描述信息；及用于获取多幅图像的n？1级描述信息的第n获取步骤，针对每幅图像执行以下步骤：第n？1分割子步骤，对该图像进行第n？1次分割，以得到该图像的多幅n？1级子图像；以及第n获取子步骤，根据基于该图像的各特征点得到的该图像的多个第n局部特征描述子和基于各图像的多个第n局部特征描述子得到的多个第n视觉单词来生成该图像的n？1级描述信息，其中该图像的各个第n局部特征描述子根据相应特征点所在的n？1级子图像得到，其中n＝2，3，...，K+1，以及K为正整数。

【技术特征摘要】

【专利技术属性】
技术研发人员：曹琼，刘汝杰，于浩，杉村昌彦，上原祐介，
申请(专利权)人：富士通株式会社，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人