多视图聚类方法、装置、计算机设备及存储介质制造方法及图纸

技术编号:34951298 阅读:40 留言:0更新日期:2022-09-17 12:28
本申请公开了一种多视图聚类方法,应用于图像处理技术领域,用于提高多视图聚类的聚类效果。本申请提供的方法包括:获取目标多视图数据,将所述目标多视图数据输入到预设的映射关系提取网络,得到非线性映射信息;通过预设的张量分解方式,基于所述非线性映射信息,生成所述目标多视图数据的共享描述信息;根据预设聚类方法,对所述共享描述信息进行聚类,得到初始聚类结果;基于所述初始聚类结果计算聚类结果分布信息,并通过所述聚类结果分布信息,对所述初始聚类结果进行优化,得到目标聚类结果。类结果。类结果。

【技术实现步骤摘要】
多视图聚类方法、装置、计算机设备及存储介质


[0001]本申请涉及图像处理
,尤其涉及一种多视图聚类方法、装置、计算机设备及存储介质。

技术介绍

[0002]实际应用中,由于设备或者环境等因素影响,数据丢失造成数据不完备的现象时常发生。通过从不同来源、不同方位收集数据形成多视图数据,通过多视图数据进行聚类,以此从多个角度获取对同一物体的表示。
[0003]为了更深层次地探索同一物体的全面信息,挖掘视图与视图之间的互补性与一致性关系,现有方法通过多视图聚类方法,获得多视图之间的关联信息。
[0004]但是,传统的多视图聚类方法在基于数据集是完整的前提下进行多视图聚类,无法直接处理缺失信息,无法根据缺失信息获取关联信息,因此聚类效果不够理想,降低了多视图聚类的准确性。

技术实现思路

[0005]本申请提供一种多视图聚类方法、装置、计算机设备及存储介质,以提高多视图聚类的聚类效果。
[0006]一种多视图聚类方法,包括:
[0007]获取目标多视图数据,将所述目标多视图数据输入到预设的映射关系提取网络,得到非线性映射信息;
[0008]通过预设的张量分解方式,基于所述非线性映射信息,生成所述目标多视图数据的共享描述信息;
[0009]根据预设聚类方法,对所述共享描述信息进行聚类,得到初始聚类结果;
[0010]基于所述初始聚类结果计算聚类结果分布信息,并通过所述聚类结果分布信息,对所述初始聚类结果进行优化,得到目标聚类结果。
[0011]一种多视图聚类装置,包括:
[0012]映射信息提取模块,用于获取目标多视图数据,将所述目标多视图数据输入到预设的映射关系提取网络,得到非线性映射信息;
[0013]描述信息获取模块,用于通过预设的张量分解方式,基于所述非线性映射信息,生成所述目标多视图数据的共享描述信息;
[0014]聚类模块,用于根据预设聚类方法,对所述共享描述信息进行聚类,得到初始聚类结果;
[0015]优化模块,用于基于所述初始聚类结果计算聚类结果分布信息,并通过所述聚类结果分布信息,对所述初始聚类结果进行优化,得到目标聚类结果。
[0016]一种计算机设备,包括存储器、处理器以及存储在所述存储器中并在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述多视图聚类方法的步
Group Audio Layer III,动态影像专家压缩标准音频层面3)、MP4(Moving Picture Eperts Group Audio Layer IV,动态影像专家压缩标准音频层面4)播放器、膝上型便携计算机和台式计算机等等。
[0029]服务器105可以是提供各种服务的服务器,例如对终端设备101、102、103上显示的页面提供支持的后台服务器。
[0030]需要说明的是,本申请实施例所提供的多视图聚类方法由服务器执行,相应地,多视图聚类装置设置于服务器中。
[0031]应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的,根据实现需要,可以具有任意数目的终端设备、网络和服务器,本申请实施例中的终端设备具体可以对应的是实际生产中的应用系统。
[0032]在一实施例中,如图2所示,提供一种多视图聚类方法,以该方法应用在图1中的服务器为例进行说明,包括如下步骤:
[0033]S10,获取目标多视图数据,将目标多视图数据输入到预设的映射关系提取网络,得到非线性映射信息。
[0034]具体的,多视图数据是指通过多组特征对具体事物进行描述的数据,每一组特征称为一个视图。目标多视图数据指的是用于进行聚类的数据,有多组特征视图构成。
[0035]目标多视图数据属于不完备的多视图数据,不完备指的是每个视图数据中存在缺失特征。
[0036]需要说明的是,本实施例针对不完备的多视图数据进行聚类,在对目标多视图数据的处理过程中,能够提取出目标多视图数据中的缺失信息。
[0037]具体步骤是:获取目标多视图数据,将目标多视图数据输入到预设的映射关系提取网络中,通过预设的映射关系提取网络的生成器,提取出目标多视图数据的非线性映射信息。
[0038]目标多视图数据中包括多个视图数据,预设的映射关系提取网络需要针对每个视图数据,进行特征提取,得到非线性映射信息。
[0039]非线性映射信息表示了同一数据点在各个视图数据之间的对应关系。
[0040]预设的映射关系提取网络能够针对各个视图数据之间的映射关系,生成目标多视图数据的缺失信息,并且能够保留各个视图数据之间的多样性。
[0041]S20,通过预设的张量分解方式,基于非线性映射信息,生成目标多视图数据的共享描述信息。
[0042]具体的,预设的张量分解方式为基于加权张量奇异值分解。对非线性映射信息进行张量分解,生成目标多视图数据的共享描述信息。
[0043]共享描述信息能够统一表述目标多视图数据中各个数据对象的表达。
[0044]各个视图数据输入到预设的映射关系提取网络中得到的特征数据,根据特征数据提取出非线性映射信息。再根据特征数据构建张量,张量可根据如下公式表达:
[0045]Z

∈R
N*V*N
[0046]其中,Z

表示张量,R表示特征数据,N表示样本个数,V表示视图个数。
[0047]通过预设的张量分解方式,对构建的张量进行分解,生成共享描述信息,共享描述信息可根据如下公式表示:
[0048]C

∈R
N*V*N
[0049]其中,C

表示目标多视图数据的共享描述信息。
[0050]通过张量分解,提取隐藏在目标多视图数据中的互补信息和高阶信息,作为共享描述信息。
[0051]S30,根据预设聚类方法,对共享描述信息进行聚类,得到初始聚类结果。
[0052]具体是,获取聚类时的类别数信息,通过预设的聚类方法对共享描述信息和类别数信息进行聚类,得到初始聚类结果。
[0053]初始聚类结果指的是根据类别数信息进行聚类之后的聚类簇。在聚类过程中,按照相似度规则划分聚类簇,得到初始聚类结果。
[0054]S40,基于初始聚类结果计算聚类结果分布信息,并通过聚类结果分布信息,对初始聚类结果进行优化,得到目标聚类结果。
[0055]具体的,根据聚类得到的初始聚类结果,计算聚类结果分布信息,根据聚类结果分布信息对初始聚类结果进行优化,得到目标聚类结果。
[0056]聚类结果分布信息用于表示初始聚类结果的分布情况,具体是计算初始聚类结果的正态分布情况。
[0057]在本实施例中,采用t分布方式计算得到初始聚类结果的聚类结果分布信息,t分布又称student

s distribution,用于根据小样本来估计呈正态分布且方差未知的总体的均值。...

【技术保护点】

【技术特征摘要】
1.一种多视图聚类方法,其特征在于,包括:获取目标多视图数据,将所述目标多视图数据输入到预设的映射关系提取网络,得到非线性映射信息;通过预设的张量分解方式,基于所述非线性映射信息,生成所述目标多视图数据的共享描述信息;根据预设聚类方法,对所述共享描述信息进行聚类,得到初始聚类结果;基于所述初始聚类结果计算聚类结果分布信息,并通过所述聚类结果分布信息,对所述初始聚类结果进行优化,得到目标聚类结果。2.根据权利要求1所述的多视图聚类方法,其特征在于,所述获取目标多视图数据,将所述目标多视图数据输入到预设的映射关系提取网络,得到非线性映射信息包括:通过自编码网络和循环一致网络构建预设的映射关系提取网络;通过所述预设的映射关系提取网络的编码器提取所述目标多视图数据中每个视图数据的特征数据;根据所述循环一致网络对每个视图数据的所述特征数据进行映射关系提取,得到非线性映射信息。3.根据权利要求2所述的多视图聚类方法,其特征在于,在通过所述预设的映射关系提取网络的编码器提取所述目标多视图数据中每个视图数据的特征数据之后,所述方法还包括:通过所述预设的映射关系提取网络的生成器,基于所述特征数据,得到每个视图数据的生成数据;通过判别器判断所述每个视图数据和所述生成数据的缺失信息;根据所述缺失信息,调整所述生成器的参数。4.根据权利要求1所述的多视图聚类方法,其特征在于,所述通过预设的张量分解方式,基于所述非线性映射信息,生成所述目标多视图数据的共享描述信息包括:获取所述非线性映射信息中每个视图数据的特征数据;将所有视图数据的所述特征数据构建得到张量信息;通过T

SVD对所述张量信息进行分解,得到所述共享描述信息。5.根据权利要求4所述的多视图聚类方法,其特征在于,在通过T

SVD对所述张量信息进行分解,得到所述共享描述信息之后,所述方法还包括:通过低秩张量约束方法...

【专利技术属性】
技术研发人员:王铬李钦郝艳艳
申请(专利权)人:河南工业贸易职业学院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1