一种子空间聚类方法、装置、设备及存储介质制造方法及图纸

技术编号:34514460 阅读:14 留言:0更新日期:2022-08-13 21:01
本实施例提供一种子空间聚类方法、装置、设备及存储介质,该方法包括:通过预设神经网络模型对原始数据特征进行特征提取、自表示处理、解码处理等操作得到目标损失函数,其中,是利用核范数对预设的自表示系数矩阵施加低秩先验以进行自表示处理。通过目标损失函数对神经网络模型进行训练,从训练好的卷积自编码网络模型中提取目标自表示系数矩阵,进一步得到目标相似度矩阵,然后利用聚谱类算法对目标相似度矩阵进行分割得到子空间聚类结果。本申请基于核范数与卷积自编码网络模型实现对自表示系数矩阵的学习,进而得到准确性更高的相似度矩阵,最后得到准确性更高的子空间聚类结果,本申请的方法能够提升子空间聚类的准确率。率。率。

【技术实现步骤摘要】
一种子空间聚类方法、装置、设备及存储介质


[0001]本申请涉及模式识别
,尤其涉及一种子空间聚类方法、装置、设备及存储介质。

技术介绍

[0002]随着科技的不断发展,世界愈加信息化。人们获取数据的方式变得多样化,各种形式的数据(例如文本、图像、音频、视频等等)时时刻刻都在不断产生。可以说,这些海量的数据在人们生活的各个方面都起着十分重要的作用。对大规模数据的分析与处理已经成为当前科学研究领域的重要部分。
[0003]如何有效且高效地处理实际生活中多源异构的高维数据,成为聚类领域的一个挑战。子空间聚类旨在样本没有标签信息的前提下,根据样本的相似性将样本分成不同的群集并找到一个低维的子空间表示,主要分两步:首先,构建相似度矩阵来描述数据集之间的关系;然后,在相似度矩阵上应用聚类算法以获得最终聚类结果。因此,相似度矩阵的质量在很大程度上决定了聚类性能。但传统的子空间聚类方法无法将数据潜在表示的获得和聚类过程相结合,不能够充分利用局部潜在的信息,构建的相似度矩阵准确性不高,导致聚类结果不佳。

技术实现思路

[0004]本申请实施例的主要目的在于提出一种子空间聚类方法、装置、设备及存储介质,能够。
[0005]为实现上述目的,本申请实施例的第一方面提出了一种子空间聚类方法,包括:
[0006]获取原始数据特征;
[0007]通过预设神经网络模型的编码模块对所述原始数据特征进行特征提取,以得到潜在数据特征;
[0008]通过预设神经网络模型的自表示模块对所述潜在数据特征进行自表示处理,得到目标数据特征,其中,利用核范数对预设的自表示系数矩阵进行低秩约束处理,得到初步自表示系数矩阵,所述自表示模块通过所述初步自表示系数矩阵对所述潜在数据特征进行自表示处理;
[0009]通过预设神经网络模型的解码模块对所述潜在数据特征进行解码处理,以得到恢复数据特征;
[0010]根据所述初步自表示系数矩阵、所述原始数据特征、所述潜在数据特征、所述目标数据特征、所述恢复数据特征构建目标损失函数;
[0011]根据所述目标损失函数对所述神经网络模型进行训练,以得到目标自表示系数矩阵;
[0012]利用预设算法对所述目标自表示系数矩阵进行处理,得到目标相似度矩阵;
[0013]利用聚谱类算法对所述目标相似度矩阵进行分割,得到子空间聚类结果。
[0014]在一些实施例,所述利用核范数对预设的自表示系数矩阵进行低秩约束处理,得到初步自表示系数矩阵,包括:
[0015]利用核范数对所述自表示系数矩阵进行低秩约束处理,得到低秩系数矩阵;
[0016]对所述低秩系数矩阵进行奇异值分解,得到多个奇异值分量;
[0017]若存在至少一个所述奇异值分量大于1,利用γ

范数对所述自表示系数矩阵进行低秩约束处理,得到初步自表示系数矩阵。
[0018]在一些实施例,所述根据所述初步自表示系数矩阵、所述原始数据特征、所述潜在数据特征、所述目标数据特征、所述恢复数据特征构建目标损失函数,包括:
[0019]根据所述初步自表示系数矩阵得到初步相似度矩阵;
[0020]根据所述初步相似度矩阵、所述原始数据特征、所述恢复数据特征得到第一目标损失函数;
[0021]根据所述初步相似度矩阵、所述潜在数据特征、所述目标数据特征得到第二目标损失函数;
[0022]根据所述第一目标损失函数、所述第二目标损失函数得到目标损失函数。
[0023]在一些实施例,所述根据所述初步相似度矩阵、所述原始数据特征、所述恢复数据特征得到第一目标损失函数,包括:
[0024]根据所述原始数据特征、所述恢复数据特征得到第一聚类损失函数;
[0025]根据所述初步相似度矩阵对所述第一聚类损失函数进行重构表示,得到第一目标损失函数。
[0026]在一些实施例,所述根据所述初步相似度矩阵对所述第一聚类损失函数进行重构表示,得到第一目标损失函数,包括:
[0027]根据所述初步相似度矩阵对所述第一聚类损失函数进行重构表示,得到第一重建目标损失函数;
[0028]根据预设的拉普拉斯约束对所述第一重建目标损失函数进行正则化,得到第一目标损失函数。
[0029]在一些实施例,所述根据所述初步相似度矩阵、所述潜在数据特征、所述目标数据特征得到第二目标损失函数,包括:
[0030]根据所述潜在数据特征、所述目标数据特征得到第二聚类损失函数;
[0031]根据所述初步相似度矩阵对所述潜在数据特征进行重构表示,得到相似匹配函数;
[0032]根据所述第二聚类损失函数、所述相似匹配函数得到第二重建目标损失函数;
[0033]根据预设的拉普拉斯约束对所述第二重建目标损失函数进行正则化,得到第二目标损失函数。
[0034]在一些实施例,所述利用预设算法对所述目标自表示系数矩阵进行处理,得到目标相似度矩阵,包括:
[0035]获取目标自表示系数矩阵R,令矩阵
[0036]计算矩阵Sg的奇异值分解,得到Sg=UΣV
T

[0037]令得到目标相似度矩阵A=[PP
T

,其中m=k*d+1,K为聚类数目,d为
原始数据特征的维度。
[0038]本申请实施例的第二方面提出了一种子空间聚类装置,包括:
[0039]获取模块,用于获取原始数据特征;
[0040]编码处理模块,用于通过预设神经网络模型的编码模块对所述原始数据特征进行特征提取,以得到潜在数据特征;
[0041]自表示处理模块,用于通过预设神经网络模型的自表示模块对所述潜在数据特征进行自表示处理,得到目标数据特征,其中,利用核范数对预设的自表示系数矩阵进行低秩约束处理,得到初步自表示系数矩阵,所述自表示模块通过所述初步自表示系数矩阵对所述潜在数据特征进行自表示处理;
[0042]解码处理模块,用于通过预设神经网络模型的解码模块对所述潜在数据特征进行解码处理,以得到恢复数据特征;
[0043]构建目标损失函数模块,用于根据所述初步自表示系数矩阵、所述原始数据特征、所述潜在数据特征、所述目标数据特征、所述恢复数据特征构建目标损失函数;
[0044]模型训练模块,用于根据所述目标损失函数对所述神经网络模型进行训练,以得到目标自表示系数矩阵;
[0045]目标相似度矩阵获得模块,用于利用预设算法对所述目标自表示系数矩阵进行处理,得到目标相似度矩阵;
[0046]子空间聚类模块,用于利用聚谱类算法对所述目标相似度矩阵进行分割,得到子空间聚类结果。
[0047]本申请实施例的第三方面提出了一种计算机设备,所述一种计算机设备包括存储器和处理器,其中,所述存储器中存储有计算机程序,所述计算机程序被所述处理器执行时所述处理器用于执行如本申请第一方面实施例任一项所述的一种子空间聚类方法。
...

【技术保护点】

【技术特征摘要】
1.一种子空间聚类方法,其特征在于,包括:获取原始数据特征;通过预设神经网络模型的编码模块对所述原始数据特征进行特征提取,以得到潜在数据特征;通过预设神经网络模型的自表示模块对所述潜在数据特征进行自表示处理,得到目标数据特征,其中,利用核范数对预设的自表示系数矩阵进行低秩约束处理,得到初步自表示系数矩阵,所述自表示模块通过所述初步自表示系数矩阵对所述潜在数据特征进行自表示处理;通过预设神经网络模型的解码模块对所述潜在数据特征进行解码处理,以得到恢复数据特征;根据所述初步自表示系数矩阵、所述原始数据特征、所述潜在数据特征、所述目标数据特征、所述恢复数据特征构建目标损失函数;根据所述目标损失函数对所述神经网络模型进行训练,以得到目标自表示系数矩阵;利用预设算法对所述目标自表示系数矩阵进行处理,得到目标相似度矩阵;利用聚谱类算法对所述目标相似度矩阵进行分割,得到子空间聚类结果。2.根据权利要求1所述的一种子空间聚类方法,其特征在于,所述利用核范数对预设的自表示系数矩阵进行低秩约束处理,得到初步自表示系数矩阵,包括:利用核范数对所述自表示系数矩阵进行低秩约束处理,得到低秩系数矩阵;对所述低秩系数矩阵进行奇异值分解,得到多个奇异值分量;若存在至少一个所述奇异值分量大于1,利用γ

范数对所述自表示系数矩阵进行低秩约束处理,得到初步自表示系数矩阵。3.根据权利要求1所述的一种子空间聚类方法,其特征在于,所述根据所述初步自表示系数矩阵、所述原始数据特征、所述潜在数据特征、所述目标数据特征、所述恢复数据特征构建目标损失函数,包括:根据所述初步自表示系数矩阵得到初步相似度矩阵;根据所述初步相似度矩阵、所述原始数据特征、所述恢复数据特征得到第一目标损失函数;根据所述初步相似度矩阵、所述潜在数据特征、所述目标数据特征得到第二目标损失函数;根据所述第一目标损失函数、所述第二目标损失函数得到目标损失函数。4.根据权利要求3所述的一种子空间聚类方法,其特征在于,所述根据所述初步相似度矩阵、所述原始数据特征、所述恢复数据特征得到第一目标损失函数,包括:根据所述原始数据特征、所述恢复数据特征得到第一聚类损失函数;根据所述初步相似度矩阵对所述第一聚类损失函数进行重构表示,得到第一目标损失函数。5.根据权利要求4所述的一种子空间聚类方法,其特征在于,所述根据所述初步相似度矩阵对所述第一聚类损失函数进行重构表示,得到第一目标损失函数,包括:根据所述初步相似度矩阵对所述第一聚类损失函数进行重构表示,得到第一重建目标损失函数;
根据预设的拉普拉斯约束对所述第一重建目标损失函数进...

【专利技术属性】
技术研发人员:陈勇勇程磊花忠云
申请(专利权)人:哈尔滨工业大学深圳
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1