System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于动态锚点的快速深度多视图子空间聚类方法技术_技高网

一种基于动态锚点的快速深度多视图子空间聚类方法技术

技术编号:43786556 阅读:2 留言:0更新日期:2024-12-24 16:20
本发明专利技术公开了一种基于动态锚点的快速深度多视图子空间聚类方法,包括:获得多视图样本数据,将多视图样本数据输入预训练网络模型中进行重构及处理,初步获取各视图锚点特征,并更新自编码器和动态锚点网络参数;基于预训练网络模型,构建微调网络,学习各视图稀疏表示关系矩阵,利用自权重网络自适应为各视图稀疏表示关系矩阵分配权重,获得各视图加权稀疏表示关系矩阵,对各视图加权稀疏表示关系矩阵进行融合,获得多视图共识稀疏表示关系矩阵,并通过快速谱聚类方法获得最终聚类结果。本发明专利技术将现有方法空间时间复杂度关于样本数量的二次方和三次方降至为线性开销,实现多视图数据的高效聚类。

【技术实现步骤摘要】

本专利技术涉及多视图聚类,尤其涉及一种基于动态锚点的快速深度多视图子空间聚类方法


技术介绍

1、在“数据石油时代”,从海量数据中挖掘重要信息,使数据产生价值,可推动人工智能、大数据、经济与社会发展的有机融合。聚类分析作为一种典型的数据挖掘方法,是无标签数据处理的关键技术,为人类社会活动提供高质量的数据分析支撑。随着信息技术快速发展,爆炸式增长的数据呈现高维度、非线性、高复杂度等特性,并且伴随着信息采集手段与数据类型的多样化,同一对象的数据通常可由不同的传感器、媒介系统、相机、特征提取器等获取,构成了具有多态性、多源性、多特征性以及高维非线性等特点的多视图数据。高维非线性复杂的多视图数据使得传统聚类方法已不能满足实际应用需求,也对基于线性映射函数或浅层模型的聚类方法提出了新的挑战。随着人工智能技术的快速发展,借助深度学习强大的非线性表示能力和有效特征提取能力,将深度学习用于聚类任务已取得了很好的应用效果,但因其“黑箱子”操作,使得其饱受诟病,而结合具有线性代数、信号处理等坚实理论基础的高维数据有效处理技术—子空间聚类,可以在一定程度上弥补其理论支撑不足的缺点。

2、深度多视图子空间聚类方法利用深度神经网络提取其有效特征表示,在一定程度上去除数据中的冗余信息和噪声;再基于特征空间通过构建自表示学习网络,学习获得具有一致性和互补性的多视图共识自表示系数矩阵,揭示数据样本之间的表示关系;最后基于共识自表示系数矩阵计算相似度矩阵,使用谱聚类完成多视图数据类簇划分。虽然现有深度多视图子空间聚类算法对挖掘多视图一致性和互补性提供了一些解决方案,并取得了优越的聚类性能,但是这些方法基于自表示特性,利用全部数据样本特征表示学习多视图共识自表示系数矩阵,通过自表示系数矩阵构建相似度矩阵,执行谱聚类完成最终数据划分,其空间和时间复杂度分别为样本数量n的和使得现有方法应用于大规模数据分析非常受限。

3、在传统多视图子空间聚类领域提出基于锚点的方法,应用图论中二部图学习以及稀疏表示思想,构建数据锚点和数据样本之间的稀疏表示关系,避免学习数据自表示关系带来的内存高需求,但此类方法基于线性映射函数构建多视图稀疏表示关系,对于非线性数据适用度不高,并且还存在以下缺陷:(1)利用随机采样、均匀采样等从多视图数据中获取数据锚点,对于源数据不具有代表性,会造成数据结构信息丢失,使得基于锚点的稀疏表示关系矩阵不能完全反映多视图数据之间的相似关系;(2)利用k-means聚类算法获取的锚点样本虽然能有效代表多视图数据,但k-means选取的锚点基于样本数据空间局部信息容易混入噪声,同时会额外增加算法时间复杂度;(3)并且,大多数基于锚点的传统多视图子空间聚类方法其锚点在聚类过程之前选择确定,在后续聚类过程中固定不变,与构建稀疏表示系数矩阵分离,对聚类性能将产生不利影响;(4)另外,在获取稀疏表示关系矩阵后,大多数基于锚点的传统多视图子空间聚类方法仍然利用一般谱聚类实现数据样本类簇划分,依旧具有较高时间复杂度。


技术实现思路

1、为解决上述技术问题,本专利技术提出了一种基于动态锚点的快速深度多视图子空间聚类方法,目的在于提升深度多视图子空间聚类方法的效率并扩展应用于大规模数据,突破数据子空间自表示特性的限制,避免基于采样锚点不具数据代表性以及基于k-means锚点带来的额外时间开销等缺点,并且克服选择固定锚点与聚类过程相分离的缺陷。

2、为实现上述目的,本专利技术提供了一种基于动态锚点的快速深度多视图子空间聚类方法,包括:

3、获得多视图样本数据,将所述多视图样本数据输入预训练网络模型中进行重构及处理,初步获取各视图锚点特征,并更新自编码器和动态锚点网络参数,其中,所述预训练网络模型由深度自编码器和动态锚点学习网络组成;

4、基于所述预训练网络模型,构建微调网络,学习各视图稀疏表示关系矩阵,利用自权重网络自适应为所述各视图稀疏表示关系矩阵分配权重,获得各视图加权稀疏表示关系矩阵,对所述各视图加权稀疏表示关系矩阵进行融合,获得多视图共识稀疏表示关系矩阵;

5、对所述多视图共识稀疏表示关系矩阵通过快速谱聚类方法获得最终聚类结果。

6、优选地,获得所述多视图样本数据包括:

7、获取多视图公开数据集,选取样本数量多样、类别多样且细节丰富的多视图数据,然后对所述多视图数据中的矩阵类型数据进行归一化处理,并将全部多视图数据处理为一个批次数据,获得所述多视图样本数据。

8、优选地,初步获取所述各视图锚点特征,并更新自编码器和动态锚点网络参数,包括:

9、通过所述深度自编码器对所述样本数据进行重构,获得每个视图的有效潜在特征表示;

10、基于预定义的锚点特征,利用所述动态锚点学习网络反向映射重构所述有效潜在特征表示,并经过端到端训练,获取所述各视图锚点特征,并更新自编码器和动态锚点网络参数。

11、优选地,构建所述微调网络,学习各视图稀疏表示关系矩阵,包括:

12、基于所述锚点特征和所述有效潜在特征表示设计全连接稀疏表示学习层;

13、在所述深度自编码器与所述动态锚点学习网络之间嵌入所述全连接稀疏表示学习层,构建所述微调网络;

14、通过所述微调网络动态更新视图锚点特征并学习各视图稀疏表示关系矩阵。

15、优选地,获得所述各视图加权稀疏表示关系矩阵,包括:

16、基于各视图稀疏表示关系矩阵构建稀疏表示张量,利用全局平均池化沿通道维度对所述稀疏表示张量进行压缩操作,获得每个通道即各稀疏表示关系矩阵的全局描述因子;

17、对所述各稀疏表示关系矩阵的全局描述因子,采用两层无偏置全连接网络捕获视图自表示系数矩阵之间的关系,并将其激励至0到1之间的权重;

18、利用所述权重重新度量所述稀疏表示张量,获得自权重后的稀疏表示张量;

19、沿通道维度拆分所述自权重后的稀疏表示张量,获得所述各视图加权稀疏表示关系矩阵。

20、优选地,利用拼接机制对所述各视图加权稀疏表示关系矩阵进行融合,具体为:

21、

22、式中,cs为多视图共识稀疏表示关系矩阵,为各视图加权稀疏表示关系矩阵,v为视图数量。

23、优选地,获得所述最终聚类结果,包括:

24、对所述多视图共识稀疏表示关系矩阵进行截断奇异值分解,计算左奇异向量矩阵,基于所述左奇异向量矩阵采用k-means完成多视图数据类簇划分,获得所述最终聚类结果。

25、优选地,计算所述左奇异向量矩阵的方法为:

26、令

27、式中,cs为多视图共识稀疏表示关系矩阵,λ的对角元素为cs的每列之和;

28、对进行svd分解:

29、式中,为左奇异向量矩阵;为奇异值矩阵;为右奇异向量矩阵。

30、与现有技术相比,本专利技术具有如下优点和技术效果:

31、本专利技术突破了基于自表示特性的深度多视图本文档来自技高网...

【技术保护点】

1.一种基于动态锚点的快速深度多视图子空间聚类方法,其特征在于,包括:

2.根据权利要求1所述的基于动态锚点的快速深度多视图子空间聚类方法,其特征在于,获得所述多视图样本数据包括:

3.根据权利要求1所述的基于动态锚点的快速深度多视图子空间聚类方法,其特征在于,初步获取所述各视图锚点特征,并更新自编码器和动态锚点网络参数,包括:

4.根据权利要求1或3所述的基于动态锚点的快速深度多视图子空间聚类方法,其特征在于,构建所述微调网络,学习各视图稀疏表示关系矩阵,包括:

5.根据权利要求1所述的基于动态锚点的快速深度多视图子空间聚类方法,其特征在于,获得所述各视图加权稀疏表示关系矩阵,包括:

6.根据权利要求5所述的基于动态锚点的快速深度多视图子空间聚类方法,其特征在于,利用拼接机制对所述各视图加权稀疏表示关系矩阵进行融合,具体为:

7.根据权利要求1所述的基于动态锚点的快速深度多视图子空间聚类方法,其特征在于,获得所述最终聚类结果,包括:

8.根据权利要求7所述的基于动态锚点的快速深度多视图子空间聚类方法,其特征在于,计算所述左奇异向量矩阵的方法为:

...

【技术特征摘要】

1.一种基于动态锚点的快速深度多视图子空间聚类方法,其特征在于,包括:

2.根据权利要求1所述的基于动态锚点的快速深度多视图子空间聚类方法,其特征在于,获得所述多视图样本数据包括:

3.根据权利要求1所述的基于动态锚点的快速深度多视图子空间聚类方法,其特征在于,初步获取所述各视图锚点特征,并更新自编码器和动态锚点网络参数,包括:

4.根据权利要求1或3所述的基于动态锚点的快速深度多视图子空间聚类方法,其特征在于,构建所述微调网络,学习各视图稀疏表示关系矩阵,包括:

5....

【专利技术属性】
技术研发人员:王娇吴斌张红英楚红雨周云辉
申请(专利权)人:西南科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1