一种基于核k均值耦合图和强化张量学习的多核聚类方法技术

技术编号:39007777 阅读:15 留言:0更新日期:2023-10-07 10:39
本发明专利技术涉及一种基于核k均值耦合图和强化张量学习的多核聚类方法,对数据进行高阶相似关系学习,特别针对具有非线性结构的数据,包括以下步骤:输入待分析数据;利用核技巧对数据进行预处理;利用核k

【技术实现步骤摘要】
一种基于核k均值耦合图和强化张量学习的多核聚类方法


[0001]本专利技术涉及计算机视觉和模式识别
,尤其涉及图学习和张量学习,是一种基于核k均值耦合图和强化张量学习的多核聚类方法。

技术介绍

[0002]聚类在机器学习、数据挖掘和人工智能中广泛应用的一种技术,其目的是根据样本之间的相似性,将一组没有任何先验信息的样本划分为多个簇类。随着工业4.0或工业物联网(IIoT)的发展,越来越多的数据具有复杂的结构关系,不能实现线性分割,将此类数据称为“非线性数据”。为了有效地处理这些数据,单核学习(SKL)得到了广泛的研究,因为它能将原始数据投影到高维的核希尔伯特空间(RKHS)中实现线性可分。但是,在实际应用中基于单核的聚类方难以对每个数据集进行核函数的选择和参数的调谐,限制了单核聚类方法的适用性。最近,由于多核聚类(MKC)只需要学者提前预定义一组基核,然后自动融合基核,避免了核函数的选择和核参数的调谐,引起了越来越多的关注。目前,主流的方法MKC可以划分为:基于k

均值的多核聚类方法和基于谱聚类的多核聚类方法。
[0003]基于k

均值的多核聚类方法旨在通过组合给定的多个基核获得共识核,然后对共识核进行核k

均值,得到最终的聚类结果。常用的方法有:通过自适应加权基核形成共识核、利用L2,1范数提出鲁棒的核k

均值基于、搜索线性组合核的近邻核为共识核等。基于谱聚类的多核聚类方法旨在挖掘数据之间的相似性,然后构造相似图用于谱聚类得到最终聚类结果。常用的方法有:考虑数据的局部结构构图、考虑全局和局部结构构图、使用范数约束增减相似图的鲁棒性等。上述两大主流方法受到了广泛的研究,但是它们存在如下问题:前者侧重于共识核的学习,得到的聚类指标矩阵不能反映数据点的相似性,难以考虑所有预定义的基核的高阶亲和性;后者要求学习得到一个高质量的相似图支撑后续聚类。因此,合理的整合谱聚类和k

均值聚类的优点,扬长避短,充分挖掘数据的潜在高阶关系,构造高质量的相似图是目前处理非线性数据的多核聚类面临的难点问题之一。

技术实现思路

[0004]本专利技术为解决目前多核聚类方法侧重共识核的学习,忽略了高阶相似性的学习,以及基于谱聚类的方法难以学习得到一个高质量相似图,导致聚类性能下降的问题,提出了基于核k

均值耦合图和强化张量学习的多核聚类方法。
[0005]为实现以上专利技术目的,而采用的技术手段是:基于核k

均值耦合图和强化张量学习的多核聚类方法,包括以下步骤:S1、输入待分析数据;S2、利用核映射,对待分析数据进行预处理;S3、建立基于核K

均值耦合图和强化张量学习的多核聚类模型;S4、采用交替优化的方法求解多核聚类模型,计算得到相似图的张量表示;S5、计算相似图并进行谱聚类,得到最终聚类结果。
[0006]上述方案中,首先输入待分析数据,然后通过多个非线性映射将其投影到高维的希尔伯特核空间中,得到多个基核矩阵并实现线性可分,完成待分析数据的预处理工作;然后构建基于核k

均值耦合图和强化张量学习的多核聚类模型,主要利用结合了k

均值和谱聚类优点的核k

均值耦合图学习方法,求解每个核矩阵对应的候选相似图并利用强化张量学习将多个候选相似图堆叠为张量,考虑高阶相似性的同时给予张量加权S

p范数使其具有低秩性质;最后采用交替优化的方法求解聚类模型,得到张量并计算张量的前向切片的平均值作为用于谱聚类的相似图;最后,将相似图用于谱聚类得到聚类结果。
[0007]进一步,所述步骤S1的具体为:输入待分析数据,根据所输入的待分析数据集构造数据矩阵,其中d是样本的特征数量,n是样本的数量,所有样本包含于样本空间中即。
[0008]进一步,所述步骤S2的具体为:S2.1.将样本通过一组非线性映射投影到高维的希尔伯特核空间,实现线性可分。其中是第m个非线性映射;m表示非线性映射的数量。
[0009]S2.2.在S2.1非线性映射的过程中,通过计算,获得m个基核矩阵kr,其中r=1,2,3......m。
[0010]进一步,所述步骤S3的具体为:S3.1.利用核k

均值耦合图学习方法,学习基核对应的相似图,其模型如下:其模型如下:其中,K是核矩阵;S是学习得到的相似图,具有块对角属性;是平衡参数;第二项是利用L1范数对相似图S施加稀疏约束;约束条件确保学习得到的相似图S具有稀疏性质和低秩性质,使相似图对噪声核和遮挡具有鲁棒性。
[0011]S3.2.利用强化张量学习,将多个基核对应的候选相似图堆叠为张量,并施加S

p范数,其模型如下:其模型如下:其中,是堆叠后的张量;是堆叠多个候选相似图为张量的过程;||.||w,sp是加权S

p范数,对张量的低秩约束。
[0012]S3.3.整合S3.1和S3.2,得到基于核K

均值耦合图学习和强化张量学习的多核聚类模型,其模型如下:其模型如下:其模型如下:其模型如下:其中,α和β是平衡参数;前两项是对m个基核进行核k

均值耦合图学习获得候选相似图的过程,第三项是利用强化张量学习进一步学习候选相似图的高阶相似性的过程。
[0013]进一步,所述步骤S4的具体为:S4.1.根据S3给出的多核聚类模型,采用交替优化的方法进行求解。首先引入辅助变量Z(r)和,将目标函数转换为:将目标函数转换为:将目标函数转换为:将目标函数转换为:将目标函数转换为:其中,α和β是平衡目标函数中的第二项和第三项权重的平衡参数;和是拉格朗日乘子;第三项和第四项的表示含义为,其中< ,>表示矩阵或张量输入的内积或t

积;S4.2.固定目标函数中的其余变量,更新S:更新S:更新S:S4.3.固定目标函数中的其余变量,更新Z:S4.4.固定目标函数中的其余变量,更新:S4.5.更新拉格朗日乘子:S4.5.更新拉格朗日乘子:S4.5.更新拉格朗日乘子:S4.6.重复执行上述步骤S4. 2到S4.5,直到满足,此时得到张量。
[0014]进一步,所属步骤S5具体如下:S5.1.利用S4.6中的的最优张量构造相似图:其中,表示张量的第k个前向切片;m是前向切片的个数。
[0015]S5.2..将相似图输入到谱聚类算法中,得到聚类结果,模型表示如下:其中,,S是S5.1中学习得到的相似图,D是一个对角矩阵,对角元素计算为;对Ls进行奇异值分解,选取前c个最小的特征值对应的特征向量f组成聚类指示矩阵F,即最终的聚类结果。
[0016]为了评估基于核k

均值耦合图和强化张量学习的多核聚类方法的性能,对三个常
用的评估指标进行了计算,分别是聚类精度(ACC)、归一化互信息(NMI)和精度本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于核k均值耦合图和强化张量学习的多核聚类方法,其特征在于,包括以下步骤:S1、输入待分析数据;S2、利用核映射,对待分析数据进行预处理;S3、建立基于核K均值耦合图和强化张量学习的多核聚类模型;S4、采用交替优化的方法求解多核聚类模型,计算得到相似图的张量表示;S5、计算相似图并进行谱聚类,得到最终聚类结果。2.根据权利要求1所述的基于核k均值耦合图和强化张量学习的多核聚类方法,其特征在于,所述步骤S1包括:输入待分析数据,根据输入的待分析数据构造数据矩阵,其中d是样本的特征数量,n是样本的数量,所有样本包含于样本空间中即。3.根据权利要求1所述的基于多核k均值耦合图和强化张量学习的聚类方法,其特征在于,所述步骤S2包括:S2.1.将样本通过一组非线性映射投影到高维的希尔伯特核空间,实现线性可分。其中是第m个非线性映射;m表示非线性映射的数量。S2.2.在S2.1非线性映射的过程中,通过计算,获得m个基核矩阵Kr,其中r=1,2,3......m。4.根据权利要求1所述的基于核k均值耦合图和强化张量学习的多核聚类方法,其特征在于,所述步骤S3包括:S3.1.利用核k

均值耦合图学习方法,学习基核对应的相似图,其模型如下:其中,K是核矩阵;S是学习得到的相似图,具有块对角属性;是平衡参数;第二项是利用L1范数对相似图S施加稀疏约束;约束条件确保学习得到的相似图S具有稀疏性质和低秩性质,使相似图对噪声核和遮挡具有鲁棒性。S3.2.利用强化张量学习,将多个基核对应的候选相似图堆叠为张量,并施加S

p范数,其模型如下:其中,是堆叠后的张量;是堆叠多个候选相似图为张量的过程;||.||w,sp是...

【专利技术属性】
技术研发人员:任珍文游佳莉戴健朱松柏祝本明史慧芳尤晓建李浩然
申请(专利权)人:西南科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1