从原始图像学习的图卷积聚类方法及装置制造方法及图纸

技术编号:34482738 阅读:20 留言:0更新日期:2022-08-10 08:59
从原始图像学习的图卷积聚类方法及装置,对预先提供的图的质量要求不高,模型学习的灵活性更强,对各种复杂的聚类应用的鲁棒性更好。方法包括:(1)采用深度自动编码器DAE学习原始图像中判别力强的数据表示,探索数据的潜在属性信息;(2)从原始图中学习具有低秩和稀疏结构的自适应图;引入图的拉普拉斯约束,同时学习最优的图关系和数据的判别表示;(3)进行自监督的聚类,自监督节点表示的学习,在聚类中使用软赋值分布作为聚类标签。类中使用软赋值分布作为聚类标签。类中使用软赋值分布作为聚类标签。

【技术实现步骤摘要】
从原始图像学习的图卷积聚类方法及装置


[0001]本专利技术涉及图像处理的
,尤其涉及一种从原始图像学习的图卷积聚类方法,以及一种从原始图像学习的图卷积聚类装置。

技术介绍

[0002]聚类是探索样本间相关性的一项基本而重要的任务。其目的是根据数据表示的内在相似性关系将样本分组为不相交的聚类。由于区分表示的学习能力强,许多基于自编码器的深度聚类和基于图卷积网络的聚类方法得到了广泛的研究,并取得了很好的性能。
[0003](1)基于自编码器的深度聚类
[0004]由于卷积网络具有较强的表示学习能力,深度聚类方法引起了广泛的关注,并取得了显著的性能。深度聚类方法的核心是学习原始数据的一种判别性表示。自动编码器(AE)是一种用于无监督聚类任务的基本和常用的聚类学习框架。例如,基于AE框架,深度嵌入式聚类(DEC)和改进的DEC(IDEC)设计了一个聚类目标KL散度损失来指导数据表示学习,提高了表示的可分性。然后,一些基于DEC/IDEC的方法被提出用于解决目前方法中存在的缺点。此外,为了处理多视数据,许多基于AE的多视深度聚类方法被设计,充分利用互补的多视信息来提高聚类性能。不幸的是,这些方法仅仅关注从数据属性特征中学习有效的表示,而忽略了固有的拓扑图信息。
[0005](2)基于图卷积网络的聚类
[0006]最近,基于图卷积操作,一些基于图卷积网络(GCN)的深度聚类方法被提出,为了学习能够编码图结构信息的表示。具体来说,图自编码器(GAE)将图的卷积操作嵌入到AE框架中,其目的是学习无监督任务的图结构表示。基于变分AE,变分图自动编码器(VGAE)自然地被提出。此外,对抗性正则化的GAE(ARGAE)被提出来,它在GAE中设计了一个对抗性的约束,以增强表征的鲁棒性。进一步地,提出了结构深度聚类网络(SDCN),通过统一GCN和DEC框架来合并属性信息和结构信息。而且,SDCN获得了迄今为止最显著的聚类性能。但是,图卷积操作平等地对待每个节点的不同邻居,而忽略了节点的差异性。
[0007]为了更好地区分邻居节点对目标节点的重要性,图注意力卷积网络(GAT)被提出来。在此基础上,研究人员提出了一些基于GAT的聚类方法,并取得了优越的性能。例如,深度图注意嵌入聚类(DAEGC)方法将图注意机制与自动编码器集成,并引入自监督模块,直接获得聚类标签。然后,通过考虑了学习节点表示和原始数据表示之间的分布一致性,设计SGCPD模型来改进图卷积聚类方法。
[0008]基于图的聚类通过使用拓扑图结构来学习底层数据的表示。近年来,基于图卷积网络(GCN)的聚类方法得到了广泛的关注,并取得了良好的性能。但是,它的性能严重地取决于预先提供的图的质量,这通常是由预定义的模型(如k

最近邻)决定。因此,由于噪声和固定的图限制了模型学习的灵活性,图可能不准确。

技术实现思路

[0009]为克服现有技术的缺陷,本专利技术要解决的技术问题是提供了一种从原始图像学习的图卷积聚类方法,其对预先提供的图的质量要求不高,模型学习的灵活性更强,对各种复杂的聚类应用的鲁棒性更好。
[0010]本专利技术的技术方案是:这种从原始图像学习的图卷积聚类方法,包括以下步骤:
[0011](1)采用深度自动编码器DAE学习原始图像中判别力强的数据表示,探索数据的潜在属性信息;
[0012](2)从原始图中学习具有低秩和稀疏结构的自适应图;引入图的拉普拉斯约束,同时学习最优的图关系和数据的判别表示;
[0013](3)进行自监督的聚类,自监督节点表示的学习,在聚类中使用软赋值分布Q
Z
作为聚类标签。
[0014]本专利技术在优化过程中学习具有低秩和稀疏结构的自适应图,它比固定图能更好地编码数据的结构信息;然后,为了探索数据的局部连通性,引入了图的拉普拉斯约束,因此可以同时学习最优的图关系和数据的判别表示,从而提高了本模型的灵活性;通过设计一个自监督的聚类模块,可以自监督节点表示的学习,从而探索更好的聚类结构;因此本方法对预先提供的图的质量要求不高,模型学习的灵活性更强,对各种复杂的聚类应用的鲁棒性更好。
[0015]还提供了一种从原始图像学习的图卷积聚类装置,该装置包括:
[0016]深度自动编码器模块DAE,其配置来学习判别力强的数据表示,探索数据的潜在属性信息;
[0017]动态图嵌入模块AGE,其配置来从原始图中学习具有低秩和稀疏结构的自适应图;引入了图的拉普拉斯约束,同时学习最优的图关系和数据的判别表示;
[0018]自监督聚类模块,其配置来进行自监督的聚类,自监督节点表示的学习,在聚类中使用软赋值分布Q
Z
作为聚类标签。
附图说明
[0019]图1示出了根据本专利技术的从原始图像学习的图卷积聚类方法的流程图。
[0020]图2示出了根据本专利技术的从原始图像学习的图卷积聚类装置的框架图。
具体实施方式
[0021]如图1所示,这种从原始图像学习的图卷积聚类方法,包括以下步骤:
[0022](1)采用深度自动编码器DAE学习原始图像中判别力强的数据表示,探索数据的潜在属性信息;
[0023](2)从原始图中学习具有低秩和稀疏结构的自适应图;引入图的拉普拉斯约束,同时学习最优的图关系和数据的判别表示;
[0024](3)进行自监督的聚类,自监督节点表示的学习,在聚类中使用软赋值分布Q
Z
作为聚类标签。
[0025]本专利技术在优化过程中学习具有低秩和稀疏结构的自适应图,它比固定图能更好地编码数据的结构信息;然后,为了探索数据的局部连通性,引入了图的拉普拉斯约束,因此
可以同时学习最优的图关系和数据的判别表示,从而提高了本模型的灵活性;通过设计一个自监督的聚类模块,可以自监督节点表示的学习,从而探索更好的聚类结构;因此本方法对预先提供的图的质量要求不高,模型学习的灵活性更强,对各种复杂的聚类应用的鲁棒性更好。
[0026]优选地,所述步骤(1)中,假设DAE包含个编码器层,假设给定第(l

1)

th层表示第l层编码器通过以下非线性操作学习新的表示:
[0027][0028]其中为变换矩阵,为相应的偏差,φ为非线性激活函数;H
(0)
表示原始特征X;
[0029]经过L编码器学习过程,学习潜在和判别表示DAE的解码器对的原始数据进行对称重构,解码器操作被定义为:
[0030][0031]其中和分别为变换矩阵和解码器学习过程中的偏差,
[0032]目标函数的自然定义如下:
[0033][0034]其中为重建的数据特征。
[0035]优选地,所述步骤(2)中,自适应地学习一个邻接图矩阵S具体的结构和性质接近于原始的图结构A:
[0036][0037]s.t.S=S
T
,S∈[0,1]N
×
N本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.从原始图像学习的图卷积聚类方法,其特征在于:该方法包括以下步骤:(1)采用深度自动编码器DAE学习原始图像中判别力强的数据表示,探索数据的潜在属性信息;(2)从原始图中学习具有低秩和稀疏结构的自适应图;引入图的拉普拉斯约束,同时学习最优的图关系和数据的判别表示;(3)进行自监督的聚类,自监督节点表示的学习,在聚类中使用软赋值分布Q
Z
作为聚类标签。2.根据权利要求1所述的从原始图像学习的图卷积聚类方法,其特征在于:所述步骤(1)中,假设DAE包含个编码器层,假设给定第(l

1)

th层表示第l层编码器通过以下非线性操作学习新的表示:其中为变换矩阵,为相应的偏差,φ为非线性激活函数;H
(0)
表示原始特征X;经过L编码器学习过程,学习潜在和判别表示DAE的解码器对的原始数据进行对称重构,解码器操作被定义为:其中和分别为变换矩阵和解码器学习过程中的偏差,目标函数的自然定义如下:其中为重建的数据特征。3.根据权利要求2所述的从原始图像学习的图卷积聚类方法,其特征在于:所述步骤(2)中,自适应地学习一个邻接图矩阵s具体的结构和性质接近于原始的图结构A:s.t.S=S
T
,S∈[0,1]
N
×
N
ꢀꢀꢀꢀ
(5)其中,λ>0是一个平衡的参数,第一项保证新的邻接连接矩阵S不偏离原始图矩阵A。4.根据权利要求2所述的从原始图像学习的图卷积聚类方法,其特征在于:所述步骤(2)中,将统一的自适应图学习模型的目标函数表示为:s.t.S=S
T
,S∈[0,1]
N
×
N
ꢀꢀꢀꢀ
(6)其中,α和β为超参数,平衡稀疏项和低秩项的贡献,表示学习一个邻接图矩
阵S的结构和性质接近于原始的图结构A,α||S||1表示通过最小化矩阵S的l1范数来追求稀疏结构,β||S||
*
表示最小化矩阵S的核范数来追求低秩结构。5.根据权利要求4所述的从原始图像学习的图卷积聚类方法,其特征在于:所述步骤(2)中,将统一的自适应图学习模型的目标函数表示为:s.t.S=S
T
,S∈[0,1]
N
×
N
ꢀꢀꢀꢀ
(10)其中,A为原始的图结构,S为学习到的邻接矩阵,N为节点数,X为节点属性特征,α,β和λ为超参数,平衡了稀疏项,低秩项和平滑项的贡献,L
S
=D

S是S的图拉普拉斯矩阵,使用归一化的拉普拉斯矩阵代替L
S
。6.根据权利要求5所述的从原始图像学习的图卷积聚类方法,其特征在于:所述步骤(2)中,当学习邻接矩阵S时,定义动态图嵌入模块...

【专利技术属性】
技术研发人员:尹宝才赵珈艺孙艳丰
申请(专利权)人:北京工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1