一种基于子空间聚类的数据处理方法技术

技术编号：12482300 阅读：71 留言：0更新日期：2015-12-10 19:21

本发明专利技术公开了一种基于子空间聚类的数据处理方法，包括步骤：对于需要进行子空间聚类的全部数据，提取其中的特征点；对所提取的全部特征点归一化处理，获得特征点矩阵；为经过归一化处理的每个特征点x建立一个近邻集Ω；根据每个特征点x的近邻集Ω，构建全部特征点间的相似度矩阵W；计算全部特征点间的相似度矩阵W对应的拉普拉斯矩阵L，并对每个拉普拉斯矩阵L进行谱聚类分割，获得每个特征点的类别标号，实现对全部数据的子空间聚类处理。本发明专利技术公开的一种基于子空间聚类的数据处理方法，其在保证高精度的同时，高效地对大规模数据进行聚类处理，满足大规模数据处理需求，很好地适用于图像处理、计算机视觉和图像运动分割等数据处理领域。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及模式识别、数字图像处理等数据处理
，特别是涉及一种基于子空间聚类的数据处理方法。
技术介绍
目前，聚类分析是数据挖掘领域中的关键技术之一。高维数据聚类是聚类分析技术的难点和重点，子空间聚类是实现高维数据集聚类的有效途径，它是在高维数据空间中对传统聚类算法的一种扩展，其思想是将搜索局部化在相关维中进行。子空间聚类技术因其在现实生活中的适用性而在图像分割、运动分割、人脸聚类、图像压缩与表示等方面具有广泛的应用。子空间聚类的目的是是寻找位于混合高维空间中的聚类，其基本假设是高维空间中的点往往分布于多个不同的低维子空间中，而每个低维子空间即为一个类。对于基于谱聚类的子空间聚类方法，目前由于其优异的性能而备受关注，国内外领先的子空间聚类算法大多属于这一类。基于谱聚类的子空间聚类方法通常分为两个步骤：首先对输入的特征点计算一个亲和力矩阵，用于度量特征点之间的相关性；然后对此亲和力矩阵应用谱聚类算法得到聚类分割结果。基于谱聚类的子空间聚类算法主要差异在于不同的亲和力矩阵构建方法。而亲和力矩阵的构建方法可以分为两类，第一类方式是：将每个特征数据表示为其他特征数据的线性组合，从而将这些线性组合稀疏作为亲和力的度量。求解这种线性组合的过程往往依赖于最优化理论，因此这种方法被称为基于最优化的亲和力矩阵构建方法。第二类构建亲和力矩阵的方法则不经过优化过程，而是使用贪婪算法直接为每个特征数据选择一批相近特征数据作为其近邻集，然后以特征数据是否在其近邻集内的所属关系来构建亲和力矩阵。这类方法的计算过程相比基于最优化的方...

【技术保护点】
一种基于子空间聚类的数据处理方法，其特征在于，包括以下步骤：第一步：对于需要进行子空间聚类的全部数据，提取其中的特征点；第二步：对所提取的全部特征点进行归一化处理，获得特征点矩阵；第三步：为经过归一化处理的每个特征点x建立一个近邻集Ω，每个所述近邻集Ω包含与其所归属特征点x所在的子空间距离最近的、预设数量的样本特征点；第四步：根据每个特征点x的近邻集Ω，对应构建全部特征点间的相似度矩阵W；第五步：计算全部特征点间的相似度矩阵W对应的拉普拉斯矩阵L，并对每个拉普拉斯矩阵L进行谱聚类分割，获得每个特征点的类别标号，实现对全部数据的子空间聚类处理。

【技术特征摘要】

【专利技术属性】
技术研发人员：孙哲南，谭铁牛，宋凌霄，张曼，赫然，
申请(专利权)人：天津中科智能识别产业技术研究院有限公司，
类型：发明
国别省市：天津;12

全部详细技术资料下载我是这个专利的主人