一种基于秩约束自表示的图像聚类方法及装置制造方法及图纸

技术编号:38006634 阅读:15 留言:0更新日期:2023-06-30 10:23
本发明专利技术公开了一种基于秩约束自表示的图像聚类方法及装置,该方法包括:获取图像数据并对其进行预处理得到图像样本;通过自编码神经网络模型的编码模块对图像样本进行特征提取,得到对应的图像特征,通过解码模块对图像特征进行重构,得到重构图像样本;基于图像样本、图像特征、重构图像样本建立重构误差和自表示误差,针对自表示误差中的自表示矩阵建立刻画其块对角结构目标,其中通过对自表示矩阵的秩约束保证其连通性,从而得到优化目标;通过交替更新自编码神经网络模型的参数和自表示矩阵求解优化目标;将求解得到的自表示矩阵经过后处理得到邻接矩阵;利用谱聚类算法对邻接矩阵进行计算分割,实现图像样本的聚类,从而实现图片识别。而实现图片识别。而实现图片识别。

【技术实现步骤摘要】
一种基于秩约束自表示的图像聚类方法及装置


[0001]本专利技术属于模式识别及计算机
,尤其涉及一种基于秩约束自表示的图像聚类方法及装置。

技术介绍

[0002]随着人工智能的发展,图像识别技术在刷脸支付、驾驶环境分析、超市自动结算等诸多场景中有愈发广泛的应用。图像识别的重要任务之一是将图像按照其中内容进行分组。例如,将分属于同一个人的图像划分为一类,即可实现人脸识别。得益于深度学习技术的发展,这一任务在图像数据拥有足够标签时,能够有效解决。然而,实际中的很多数据往往难以甚至无法获得其标签,这使得对无标签图像进行分组,即图像聚类任务,受到关注。
[0003]常见的聚类方法包括以下三类:第一类方法基于数据的空间聚集属性。例如,假设同类样本聚集在一个中心周围的K均值算法,和假设同类样本连续且密集地分布在一定区域内的DBSCAN算法。第二类是子空间聚类方法,主要解决同类样本分散地分布在一个线性子空间内的情形。第三类是将神经网络和子空间聚类相结合的深度子空间方法,该方法放松了子空间聚类对线性子空间的要求,可以处理分布在非线性子空间(即流形)中的样本。
[0004]由于受到光照、角度等多种因素的影响,同类甚至同个对象的图像数据往往分布得非常分散。例如,同个人在不同光照下的人脸图像近似分布在一个九维的线性空间内,而非聚集在一起。类内的差异性使得子空间和深度子空间聚类方法更适用于图像聚类的场景。这两类方法的核心是找到类间可分且类内连通的自表示矩阵。为保证自表示矩阵的结构,子空间和深度子空间方法要求不同类样本所在子空间相互独立,或者不同类样本通过神经网络提取的特征所在子空间相互独立。然而,由于待识别对象(例如不同人的脸)之间的相似性,实际中的图像数据在部分特征上是相似的。这导致子空间独立假设过强,无法适用实际图像聚类场景。针对以上现状,迫切需要一种针对图像数据的特点的聚类方法,以克服在当前图像聚类应用中的不足。

技术实现思路

[0005]图像数据特有的类内分布分散、类间同质性强等特点,导致现有通用聚类方法在图像聚类任务中效果有限。本申请以深度子空间聚类方法为基础,通过改变其约束自表示矩阵连通性的方式,提出一种基于秩约束自表示的图像聚类方法及装置,放松现有技术对子空间独立性的要求,改善图像聚类精度。
[0006]根据本申请实施例的第一方面,提供一种基于秩约束自表示的图像聚类方法,包括:
[0007](1)获取图像数据并对其进行预处理,将预处理后的图像作为输入的图像样本,其中是总样本数;
[0008](2)通过自编码神经网络模型的编码模块对所述图像样本进行特征提取,得到对应的图像特征,通过解码模块对所述图像特征进行重构,得到重构图像样本;
[0009](3)基于所述图像样本和重构图像样本建立重构误差,基于所述图像特征建立自表示误差,针对自表示误差中的自表示矩阵建立刻画其块对角结构的目标,其中在块对角结构中,通过对自表示矩阵的秩约束保证其连通性,综合所述重构误差、自表示误差和块对角结构目标得到优化目标;
[0010](4)通过交替更新所述自编码神经网络模型的参数和所述自表示矩阵求解所述优化目标;
[0011](5)将求解得到的自表示矩阵经过后处理得到邻接矩阵;
[0012](6)利用谱聚类算法对所述邻接矩阵进行计算分割,实现所述图像样本的聚类,从而实现图片识别。
[0013]进一步地,所述编码模块为多层卷积编码器或多层感知机,所述解码模块为与所述编码模块对称的多层卷积编码器或多层感知机。
[0014]进一步地,所述优化目标为:
[0015][0016][0017]其中,,是第个图像样本,是以为网络参数的编码模块,是以为网络参数的解码模块,是第一度量函数,是由所述编码模块所提取的特征按列排成的矩阵,表示第二度量函数,是给定的超参数,是阶的自表示矩阵,是的对角元,是所有N阶对称半正定矩阵,为矩阵的秩。
[0018]进一步地,若图像样本所在线性空间或流形的维数信息已知,则取参数为各类样本所在线性空间或流形的维数之和;若图像样本所在线性空间或流形的维数信息未知,则通过进行估计,其中为数据集中显著奇异值的个数,为图像样本的类别数量。
[0019]进一步地,步骤(4)包括:
[0020](4.1)根据的限制,将阶自表示矩阵矩阵改写为大小分别为和的矩阵之积,实现秩约束的等价表示;
[0021](4.2)初始化神经网络参数和和自表示矩阵;
[0022](4.3)基于梯度下降法及其变体交替更新神经网络参数和自表示矩阵,直至迭代收敛。
[0023]进一步地,步骤(5)包括:
[0024](5.1)给定超参数;
[0025](5.2)对自表示矩阵C的每一列进行稀疏化,对每个i,将列中最小的k个元素置为0得到使得,将稀疏化后的矩阵记为;
[0026](5.3)对进行奇异值分解得到,其中是对角阵,其对角元是的奇异值,W和V是的左、右奇异向量按列排成的矩阵,丢掉小于的奇异值及对应奇异向量,记截断后的左奇异向量矩阵和奇异值矩阵分别为和,根据和构造邻接矩阵,使得
[0027][0028]其中是的第i行。
[0029]进一步地,步骤(6)包括:
[0030](6.1)计算所述邻接矩阵的度矩阵;
[0031](6.2)计算归一化的拉普拉斯矩阵,其中为单位矩阵;
[0032](6.3)计算拉普拉斯矩阵的特征向量,取最小的K个特征值对应的特征向量按列排列成矩阵,其中K为待聚类的类别数,对矩阵P的各行单位化得到作为图像样本的表示;
[0033](6.4)用K均值聚类方法对进行聚类,得到K个聚类结果。
[0034]根据本申请实施例的第二方面,提供一种基于秩约束自表示的图像聚类装置,包括:
[0035]数据获取及预处理模块,用于获取图像数据并对其进行预处理,将预处理后的图像作为输入的图像样本,其中是总样本数;
[0036]编码及解码模块,用于通过自编码神经网络模型的编码模块对所述图像样本进行特征提取,得到对应的图像特征,通过解码模块对所述图像特征进行重构,得到重构图像样本;
[0037]优化目标建立模块,用于基于所述图像样本和重构图像样本建立重构误差,基于所述图像特征建立自表示误差,针对自表示误差中的自表示矩阵建立刻画其块对角结构目标,其中在块对角结构中,通过对自表示矩阵的秩约束保证其连通性,综合所述重构误差、自表示误差和块对角结构目标得到优化目标;
[0038]优化目标求解模块,用于通过交替更新所述自编码神经网络模型的参数和所述自表示矩阵求解所述优化目标;
[0039]后处理模块,用于将求解得到的自表示矩阵经过后处理得到邻接矩阵;
[0040]谱聚类模块,用于利用谱聚类算法对所述邻接矩阵进行计算分割,实现所述图像样本的聚类,从而实现图片识别。
[0041]根据本申请实施例的第三方面,提供一种电子设备,包括:
[0本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于秩约束自表示的图像聚类方法,其特征在于,包括:(1)获取图像数据并对其进行预处理,将预处理后的图像作为输入的图像样本,其中是总样本数;(2)通过自编码神经网络模型的编码模块对所述图像样本进行特征提取,得到对应的图像特征,通过解码模块对所述图像特征进行重构,得到重构图像样本;(3)基于所述图像样本和重构图像样本建立重构误差,基于所述图像特征建立自表示误差,针对自表示误差中的自表示矩阵建立刻画其块对角结构的目标,其中在块对角结构中,通过对自表示矩阵的秩约束保证其连通性,综合所述重构误差、自表示误差和块对角结构目标得到优化目标;(4)通过交替更新所述自编码神经网络模型的参数和所述自表示矩阵求解所述优化目标;(5)将求解得到的自表示矩阵经过后处理得到邻接矩阵;(6)利用谱聚类算法对所述邻接矩阵进行计算分割,实现所述图像样本的聚类,从而实现图片识别。2.根据权利要求1所述的方法,其特征在于,所述编码模块为多层卷积编码器或多层感知机,所述解码模块为与所述编码模块对称的多层卷积编码器或多层感知机。3.根据权利要求1所述的方法,其特征在于,所述优化目标为:,,其中,,是第个图像样本,是以为网络参数的编码模块,是以为网络参数的解码模块,是第一度量函数,是由所述编码模块所提取的特征按列排成的矩阵,表示第二度量函数,是给定的超参数,是阶的自表示矩阵,是的对角元,是所有N阶对称半正定矩阵,为矩阵的秩。4.根据权利要求3所述的方法,其特征在于,若图像样本所在线性空间或流形的维数信息已知,则取参数为各类样本所在线性空间或流形的维数之和;若图像样本所在线性空间或流形的维数信息未知,则通过进行估计,其中为数据集中显著奇异值的个数,为图像样本的类别数量。5.根据权利要求3所述的方法,其特征在于,步骤(4)包括:(4.1)根据的限制,将阶自表示矩阵矩阵改写为大小分别为和的矩阵之积,实现秩约束的等价表示;(4.2)初始化神经网络参数和和自表示矩阵;(4.3)基于梯度下降法及其变体交替更新神经网络参数和自表示矩阵,直至迭代收敛。6.根据权利要求3所述的方法,其特征在于,步骤(5)包括:(5.1)给定超参数;(5.2)对自表示矩阵C的每一列进行稀疏化,对每个i,将列中最小的k个...

【专利技术属性】
技术研发人员:夏雨晴
申请(专利权)人:浙江财经大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1