一种基于区域潜在语义特征的自然场景图像分类方法技术

技术编号：2925168 阅读：471 留言：0更新日期：2012-04-11 18:40

本发明专利技术公开了一种基于区域潜在语义特征的自然场景图像分类方法，目的是利用图像的区域潜在语义信息和该信息在空间的分布规律来进行自然场景图像分类。技术方案是先建立自然场景图像分类代表集；然后对自然场景图像分类代表集中的图像进行采样点ＳＩＦＴ特征提取，生成通用视觉词汇表；再在自然场景图像分类代表集上生成图像区域潜在语义模型；接着对任意一幅图像提取图像区域潜在语义特征；最后生成自然场景分类模型，根据自然场景分类模型对图像的区域潜在语义特征进行分类。本发明专利技术引入了区域潜在语义特征，不仅描述了图像分块的区域信息而且还包含图像分块在空间的分布信息，相比于其他方法能得到更高的准确率，且不需要人工标注，自动化程度高。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及多媒体信息处理
里关于图像分类的方法，尤其是一种通过提取图像的区域潜在语义特征来实现对自然场景图像进行分类的方法，是一种综合考虑了图像区域所包含的信息以及这些区域信息在图像的空间分布来进行自然场景图像分类的方法。
技术介绍
互联网的快速发展、信息存储与传输技术的发展以及数码设备的普及带来图像数据的爆炸性增长，这就对如何进行大量图像数据的检索与狡U览提出了新的技术挑战。面对数量如此巨大的图像数据，传统的依靠人工来对图像进行分类的管理方式因为需要耗费大量的人力资源而变得不可行。因此，如何利用计算机将图像自动分类到一些预定义的类别中就成为其中的一个关键问题。由于自然场景图像在人们的曰常生活中十分常见，数量也十分巨大，因此对于自然场景图像的分类问题的研究就成为了当前计算机视觉和多媒体信息管理领域的一个热点问题。传统的自然场景图像分类方法通常使用色彩、纹理和形状等图像底层物理特征来直接与各种分类方法相结合，从而实现对图像的分类。采用底层物理特征的一个主要问题在于底层物理特征往往只反映图像在物理感知层次上的特点，而不是人们所关注的认知层面的内容。近年来，为了克服底层物理特征与人类认知语义之间的鸿沟，使用中间语义特征来对自然场景建模的方法得到了广泛的关注。Oliva和Torralba使用一组视觉感知属性来描述场景的主要空间结构，他们定义了自然度、宽阔度、粗糙度、伸展度和险峻度等视觉感知属性，通过分析底层特征来得到这些视觉感知属性。Vogel等人则首先将局部图像区域分类到一些预定义的语义概念中，然后根据这些语义概念在图...

【技术保护点】
一种基于区域潜在语义特征的自然场景图像分类方法，其特征在于包括以下步骤：第一步，建立自然场景图像分类代表集，方法是：１．１、根据使用需要定义Ｎ个自然场景图像类别，类别编号为１～Ｎ，Ｎ为自然数；１．２、对每个自然场景图像类别随机选择５０－２００幅图像作为该类别的图像分类代表；１．３、将所有Ｎ类的自然场景图像分类代表作为自然场景图像分类代表集；第二步，对自然场景图像分类代表集中的图像进行采样点ＳＩＦＴ特征即尺度不变特征提取，生成通用视觉词汇表，方法是：２．１、对于自然场景图像分类代表集中的每幅图像采用网格采样方法进行网格采样，得到每幅图像的网格采样点ＳＰ，方法是：对输入图像Ｉｇ按Ｍ×Ｍ像素大小的网格进行采样，其中Ｍ为２的整数次幂；２．２、对每幅图像的每一个网格采样点ＳＰ，采用ＳＩＦＴ特征提取方法提取ＳＩＦＴ特征：在采样点ＳＰ周围Ｐ×Ｐ像素大小的区域上计算梯度方向直方图得到ＳＩＦＴ特征，该ＳＩＦＴ特征是一个１２８维向量，Ｐ为自然数，取值范围为８－２０；２．３、使用Ｋ均值聚类算法对自然场景图像分类代表集上的所有网格采样点的ＳＩＦＴ特征进行聚类，每个聚类中心的取值对应一个视觉词汇，保存这Ｋ个聚类...

【技术特征摘要】

【专利技术属性】
技术研发人员：吴玲达，谢毓湘，曾璞，杨征，栾悉道，文军，陈丹雯，
申请(专利权)人：中国人民解放军国防科学技术大学，
类型：发明
国别省市：43[中国|湖南]

全部详细技术资料下载我是这个专利的主人