一种基于Grassmann流形的数据聚类分析方法,涉及一种数据聚类分析方法,所述方法为一种用于视频图像序列的融合双边滤波的协方差跟踪方法;输入个数据点,待聚类数目k;基于Grassmann流形上两点之间的距离公式,计算数据点之间的距离,将原数据点划分到第类输出数据点的划分。该方法不仅对能够分布在不同子空间上的数据进行有效聚类,而且能够对具有复杂几何结构的数据集合进行分析,在流形空间上进行有效聚类,提高聚类的准确性。
【技术实现步骤摘要】
本专利技术涉及一种数据聚类分析方法,特别是涉及一种基于Grassmann流形的数据 聚类分析方法。
技术介绍
随着大数据时代的到来,对海量的复杂数据进行有效分析是成功解决诸多问题的 关键。比如在人脸识别、图像分类以及图像分割、运动分割等计算机视觉问题和模式识别问 题中,要求准确地对所提取数据的几何结构进行分析。这些数据具有复杂的结构,它们可能 存在于不同的子空间上,这些子空间或是相互独立,或相互关联。并且这些数据的几何结构 已经不在平直的欧式空间上,而是服从某些流形空间。因此基于子空间或流形空间能够更 准确地分析数据的几何结构,从而解决复杂数据聚类分析等问题。Grassmann流形是李群流 形中的一种熵流形,不仅具有光滑曲面的空间表达方式,且具有更为适合度量数据点之间 距离的特性,可以使聚类结果更加准确,所以本申请提出基于Grassmann流形的数据聚类 分析方法。
技术实现思路
本专利技术的目的在于提供,该方法不 仅对能够分布在不同子空间上的数据进行有效聚类,而且能够对具有复杂几何结构的数据 集合进行分析,在流形空间上进行有效聚类,提高聚类的准确性。 本专利技术的目的是通过以下技术方案实现的: ,为一种用于视频图像序列的融合双边 滤波的协方差跟踪方法。所述方法按如下步骤进行: 步骤1 : 输入·个数据点待聚类数目k; 步骤2 : 基于Grassmann流形上两点之间的距离公式计算数 据点之间的距离,构造相似性矩阵 其中P和q为Grassmann流形上的两个点,p和q之间的主角度为6?:.…,民。 步骤 3 : 构造拉普拉斯矩阵L=D 1/2SD 1/2,其中D为对角矩阵, 步骤 4 : 求拉普拉斯矩阵L的k个最大特征值对应的特征向量,并且构造矩阵其中物为列向量。步骤 5 : 单位化P的行向量,得到矩阵:置,其中步骤 6 : 将丨P的每一行看成是空间内的一点,使用κ均值算法对其进行分类。 步骤 7: 如果嘗的第I:行属于第j类,则将原数据点也划分到第J类输出数据点的划分 本专利技术的优点与效果是: 1.本专利技术使用Grassmann流形上的距离度量,能够更准确地计算数据点间的距离,提 高聚类的准确性。 2.本专利技术可以对分别存在于独立子空间或是子空间不独立情况下的数据结合进 行有效聚类。 3.本专利技术能够对流形空间数据集合进行有效聚类。【附图说明】 图1示出了基于Grassmann流形的数据聚类分析方法的具体步骤; 图2示出了具有子空间结构的待分类数据集合; 图3示出了图2数据集合的分类结果; 图4示出了一种具有流形结构的待分类数据集合; 图5示出了图4数据集合的分类结果; 图6示出了一种具有流形结构的待分类数据集合; 图7示出了图6数据集合的分类结果。【具体实施方式】 下面结合实施例对本专利技术进行详细说明。 实施例1 : 步骤1 : 输入200个数据点待聚类数目2 ;(每个数据点为100维的列向量,200个 数据点组成100*200的矩阵) 步骤2 : 基于Grassmann流形上两点之间的距离公式,计算数据点之间的距离,构造相似性矩 阵 步骤 3 : 构造拉普拉斯矩阵L=D 1/2SD 1/2,其中D为对角矩阵, 步骤 4: 求拉普拉斯矩阵L的2个最大特征值对应的特征向量,并且构造矩阵其中为列向量。 步骤 5: 单位化::r的行向量,得到矩阵:隊,其中: 步骤 6 : 将y的每一行看成是R2空间内的一点,使用K均值算法对其进行分类。 步骤 7: 如果F的第I:行属于第;|类,则将原数据点::?也划分到第J类输出数据点的划分 结果如下:注:表中数据1代表第一类_1,2代表第二类。第1行第1列数值为输入的第一个 元素所对应的类别标签,第1行第2列对应第二个数据所在类别,以此类推,一共有200列 实施例2: 输入附图2所示数据点,待聚类数目2 ; 步骤2 : 基于Grassmann流形上两点之间的距离公式,计算数据点之间的距离,构造相似性矩 阵 步骤 3 : 构造拉普拉斯矩阵L=D 1/2SD 1/2,其中D为对角矩阵, 步骤 4 : 求拉普拉斯矩阵L的2个最大特征值对应的特征向量,并且构造矩阵其中_:|$:为列向量。 步骤 5 : 单位化F的行向量,得到矩阵|r,其中:: 步骤 6 : 将:Γ的每一行看成是R2空间内的一点,使用K均值算法对其进行分类。 步骤 7 : 如果,的第;I行属于第j类,则将原数据点也划分到第i类输出数据点的划分 如附图3所示。 实施例3 : 输入附图4所示数据点,待聚类数目2 ; 步骤2 : 基于Grassmann流形上两点之间的距离公式,计算数据点之间的距离,构造相似性矩 阵 步骤 3 : 构造拉普拉斯矩阵L=D 1/2SD 1/2,其中D为对角矩阵, 步骤 4 : 求拉普拉斯矩阵L的2个最大特征值对应的特征向量,并且构造矩阵其中?%为列向量。 步骤 5 : 单位化.P的行向量,得到矩阵:蒙,其中 步骤 6: 将的每一行看成是R2空间内的一点,使用K均值算法对其进行分类。 步骤 7 : 如果F的第:I:行属于第I类,则将原数据点·#也划分到第J类输出数据点的划分 轉#;!:。分类结果如附图5所示。 实施例4: 输入附图6所示数据点,待聚类数目3 ; 步骤2 : 基于Grassmann流形上两点之间的距离公式,计算数据点之间的距离,构造相似性矩 阵: 步骤 3 : 构造拉普拉斯矩阵L=D 1/2SD 1/2,其中D为对角矩阵, 步骤 4 : 求拉普拉斯矩阵L的2个最大特征值对应的特征向量,并且构造矩阵其中?%为列向量。 步骤 5 : 单位化:梦:的行向量,得到矩阵:着,其中 步骤 6 : 将f的每一行看成是R2空间内的一点,使用K均值算法对其进行分类。 步骤 7 : 如果嘗的第:?:行属于第:^!类,则将原数据点·^也划分到第』类,输出数据点的划分 轉#;!:。分类结果如附图7所示。【主权项】1. ,其特征在于,所述方法为一种用于 视频图像序列的融合双边滤波的协方差跟踪方法;按如下步骤进行: 步骤1: 输入个数据点丨xjJLi,待聚类数目k;步骤2: 基于Grassmann流形上两点之间的距离公式 ,计算数 据点之间的距离,构造相似性矩阵; 其中ρ和q为Grassmann流形上的两个点,ρ和q之间的主角度为γ;步骤3 : 构造拉普拉斯矩阵L=D1/2SD1/2,其中D为对角矩阵, 步骤4 :求拉普拉斯矩阵L的k个最大特征值对应的特征向量并且构造矩阵 步骤5 : 单位化的行向量,得到矩阵:f,其中 步骤6: 将y的每一行看成是空间内的一点,使用K均值算法对其进行分类; 步骤7 : 如果|T的第行属于第j类,则将原数据点:1?也划分到第|类输出数据点的划分【专利摘要】,涉及一种数据聚类分析方法,所述方法为一种用于视频图像序列的融合双边滤波的协方差跟踪方法;输入个数据点,待聚类数目k;基于Grassmann流形上两点之间的距离公式,计算数据点之间的距离,将原数据点划分到第类输出数据点的划分。该方法不仅对能够分布在不同子空间上的数据进行有效聚类,而且能够对具有复杂几何结构的数据集合进行分析,在流形空间上进行有效聚类,提高聚类的准确性。【IPC分类】G06K本文档来自技高网...
【技术保护点】
一种基于Grassmann流形的数据聚类分析方法,其特征在于,所述方法为一种用于视频图像序列的融合双边滤波的协方差跟踪方法;按如下步骤进行:步骤1:输入个数据点,待聚类数目k;步骤2:基于Grassmann流形上两点之间的距离公式,计算数据点之间的距离,构造相似性矩阵;其中p和q为Grassmann流形上的两个点,p和q之间的主角度为;步骤3: 构造拉普拉斯矩阵L=D‑1/2SD‑1/2,其中D为对角矩阵,;步骤4:求拉普拉斯矩阵L的k个最大特征值对应的特征向量,并且构造矩阵,其中为列向量;步骤5:单位化的行向量,得到矩阵,其中;步骤6:将的每一行看成是空间内的一点,使用K均值算法对其进行分类;步骤7:如果的第行属于第类,则将原数据点也划分到第类输出数据点的划分。
【技术特征摘要】
【专利技术属性】
技术研发人员:谢英红,韩晓微,涂斌斌,
申请(专利权)人:沈阳大学,
类型:发明
国别省市:辽宁;21
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。