System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 基于锚点和自适应图学习的半监督图像分类方法技术_技高网

基于锚点和自适应图学习的半监督图像分类方法技术

技术编号:44556122 阅读:2 留言:0更新日期:2025-03-11 14:17
本发明专利技术公开了一种基于锚点和自适应图学习的半监督图像分类方法,属于传统机器学习技术领域,采用不同规模且类型为数字图像或彩色图片的数据集,为半监督图像分类提供了多样且可靠的数据;构建的半监督分类模型可以利用锚点以及线性传播的方式将预测样本标签转换为先预测锚点标签,再线性组合出样本的标签,利用锚点数量远少于样本数量的特性,有效地加快了分类速度;采用自适应图学习的方法将自适应图作为迭代优化的对象,同时学习自适应图和样本伪标签矩阵,降低了分类精度受初始邻接图的影响,提高了分类的精度。

【技术实现步骤摘要】

本专利技术属于传统机器学习,具体为一种基于锚点和自适应图学习的半监督图像分类方法。


技术介绍

1、随着数据规模的扩大,数据分类任务面临着巨大的挑战。基于半监督学习(ssl)的分类模型利用少量标记数据样本和大量未标记数据样本来构建损失函数,相较于监督学习模型,这种方法节省了大量标记样本的时间,因此吸引了许多研究者的关注。作为近年来的热门话题,ssl可以分为传播学习和归纳学习。传播学习的核心思想是将标签从有限的样本传播到大量的未标记样本。而归纳学习主要是从标记样本和未标记样本中学习一个决策函数(分类器),并利用该分类器预测测试样本的标签。最近,主要的半监督学习方法包括:基于图的半监督学习(gssl)、协同训练模型和回归模型。其中,基于图的半监督学习模型更受欢迎,因为它能够充分利用图结构信息,并将数据视为顶点进行处理。因此,它已被广泛应用于许多实际应用中。基于先验一致性理论,附近的数据应具有相同的标签,而在相同结构中的数据也应有相同的标签。因此,构建数据之间的相似性图以建立模型,可以有效捕捉数据自身的隐藏结构信息,从而实现更好的分类效果。基于图的半监督学习模型的分类主要分为两个步骤:1)图的构建,2)软标签的获取。

2、近年来,许多基于图的半监督分类方法都集中在相似性图的构建和标签信息的使用上。聂等人提出了一种具有自适应权重特征和自适应图的半监督学习方法(anssl),该方法同时学习亲和矩阵并推断未知标签,该模型通过自动加权提取所有数据点之间有效而稳健的特征;何等人提出了一种新颖的半监督图像分割方法(bsog),该方法利用有限的标记数据和丰富的未标记高光谱影像(hs)样本实现同时的图像分割和局部结构学习。然而,由于涉及到所有数据的图构建以及迭代过程,该模型需要较长时间才能获得分类结果。上述方法通过构建统一模型,将图构建和标签获取结合起来,在许多数据集上取得了良好的性能。然而,在所有数据之间进行图构建不可避免地消耗了大量时间。


技术实现思路

1、本专利技术提供了一种基于锚点和自适应图学习的半监督图像分类方法,解决了在所有数据之间进行图构建消耗了大量时间的问题。

2、为实现上述目的,本专利技术提供如下技术方案:

3、基于锚点和自适应图学习的半监督图像分类方法,包括:

4、获取数字图像或彩色图片的数据集并进行预处理,获得处理后数据集;

5、根据处理后数据集构建锚图模型;

6、基于锚图模型构建半监督分类模型;

7、测试半监督分类模型的分类效果;

8、根据测试完成的半监督分类模型进行图像分类,展示分类结果。

9、优选地,获取数字图像或彩色图片的数据集并进行预处理的步骤具体为:

10、获取手写数字集以及图像数据集作为输入模型的数据集,通过脚本将两个图像数据集处理成矩阵n*d的形式,并进行降维操作,其中n表示数据集的规模,d表示样本的维数,使用聚类算法生成符合图像分布的锚点。

11、优选地,所述的降维算法为pca,对于手写数字集,规模为70000*784,使用pca算法将784维降低到82维,所述的聚类算法为k-means,锚点数为2000个,对于usps数据集,规模为9298*256,锚点数为1000个。

12、优选地,锚图模型的邻接矩阵通过自适应近邻方法获得如下:

13、

14、其中m表示锚点的个数,表示b的第i行,bij表示第i个样本和第j个锚点的相似性关系,且bij≥0,xi表示第i个样本,维数为d维,pj表示第j个锚点,维数为j维,γ为正则化参数;

15、所述的自适应近邻算法约定一个样本与k个锚点有相似关系,k选择范围在2到20之间。

16、优选地,基于锚图模型构建半监督分类模型的步骤具体为:

17、使用基本聚类模型、拟合项来构建半监督分类模型的损失函数如下:

18、

19、其中tr(.)表示迹,tr(ftlsf)为基本聚类模型,表示样本的伪标签矩阵,c为类数。表示关于s的拉普拉斯矩阵,d为关于s的度矩阵,其中对角元素di=∑jsij。为自适应项,为标签拟合项,其中fl表示假设知道前l个样本标签,yl表示知道前l个真实样本标签,λ,α表示惩罚因子;

20、所述的标签拟合项中真实标签yl通过随机在原始样本中选择l个包含所有类的已知标签构造,所述的f可以利用锚点和样本的相似关系转化求解,所述的自适应项中邻接矩阵w通过w=bλ-1bt获得,其中λ表示一个对角矩阵,对角元素分别对应于b的每一列的列和,采用迭代算法求解模型最优解,使用惩罚因子λ,α调整损失函数中不同项的权重。

21、优选地,锚点和样本的相似关系表示为f=bg,为锚点的伪标签矩阵,代入模型转换为g的求解,再通过f=bg得到最终的软标签矩阵,所述的迭代方法为固定s求解f,固定f求解s,迭代次数为30。

22、优选地,测试半监督分类模型的分类效果的步骤具体为;

23、使用准确率作为标签预测正确性的评估标准,计算公式为:其中prid表示预测正确的样本个数,real表示总样本个数;

24、变化模型中的其中一个参数和固定模型中的其它参数,测试该参数变化对分类精度的影响,并和其他算法进行对比实验验证该半监督分类模型的性能。

25、基于锚点和自适应图学习的半监督图像分类系统,包括:

26、预处理模块:用于获取数字图像或彩色图片的数据集并进行预处理,获得处理后数据集;

27、第一构建模块:用于根据处理后数据集构建锚图模型;

28、第二构建模块:用于基于锚图模型构建半监督分类模型;

29、测试模块:用于测试半监督分类模型的分类效果;

30、分类模块:用于根据测试完成的半监督分类模型进行图像分类,展示分类结果。

31、一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现基于锚点和自适应图学习的半监督图像分类方法的步骤。

32、一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现基于锚点和自适应图学习的半监督图像分类方法的步骤。

33、与现有技术相比,本专利技术具有以下有益效果:本专利技术提出了一种基于锚点和自适应图学习的半监督图像分类方法,通过获取数字图像或彩色图片的数据集并进行预处理,可以获得处理后数据集。基于处理后数据集构建的锚图模型,能够突出显示图像中的关键信息和特征,为后续的半监督分类提供有力支持,基于锚图模型构建半监督分类模型,能够充分利用有限的标注数据和丰富的未标注数据,通过估计未标注数据的标签并用于训练,提高分类器的泛化性能,在测试半监督分类模型的分类效果时,通过与实际标签进行对比,可以验证模型的准确性和可靠性。最终,根据测试完成的半监督分类模型进行图像分类,并展示分类结果,可以直观地本文档来自技高网...

【技术保护点】

1.基于锚点和自适应图学习的半监督图像分类方法,其特征在于,包括:

2.根据权利要求1所述的基于锚点和自适应图学习的半监督图像分类方法,其特征在于,获取数字图像或彩色图片的数据集并进行预处理的步骤具体为:

3.根据权利要求2所述的基于锚点和自适应图学习的半监督图像分类方法,其特征在于,所述的降维算法为PCA,对于手写数字集,规模为70000*784,使用PCA算法将784维降低到82维,所述的聚类算法为k-means,锚点数为2000个,对于USPS数据集,规模为9298*256,锚点数为1000个。

4.根据权利要求1所述的基于锚点和自适应图学习的半监督图像分类方法,其特征在于,锚图模型的邻接矩阵通过自适应近邻方法获得如下:

5.根据权利要求1所述的基于锚点和自适应图学习的半监督图像分类方法,其特征在于,基于锚图模型构建半监督分类模型的步骤具体为:

6.根据权利要求1所述的基于锚点和自适应图学习的半监督图像分类方法,所述的锚点和样本的相似关系表示为F=BG,为锚点的伪标签矩阵,代入模型转换为G的求解,再通过F=BG得到最终的软标签矩阵,所述的迭代方法为固定S求解F,固定F求解S,迭代次数为30。

7.根据权利要求1所述的基于锚点和自适应图学习的半监督图像分类方法,其特征在于,测试半监督分类模型的分类效果的步骤具体为;

8.基于锚点和自适应图学习的半监督图像分类系统,其特征在于,包括:

9.一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7任一项所述基于锚点和自适应图学习的半监督图像分类方法的步骤。

10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述基于锚点和自适应图学习的半监督图像分类方法的步骤。

...

【技术特征摘要】

1.基于锚点和自适应图学习的半监督图像分类方法,其特征在于,包括:

2.根据权利要求1所述的基于锚点和自适应图学习的半监督图像分类方法,其特征在于,获取数字图像或彩色图片的数据集并进行预处理的步骤具体为:

3.根据权利要求2所述的基于锚点和自适应图学习的半监督图像分类方法,其特征在于,所述的降维算法为pca,对于手写数字集,规模为70000*784,使用pca算法将784维降低到82维,所述的聚类算法为k-means,锚点数为2000个,对于usps数据集,规模为9298*256,锚点数为1000个。

4.根据权利要求1所述的基于锚点和自适应图学习的半监督图像分类方法,其特征在于,锚图模型的邻接矩阵通过自适应近邻方法获得如下:

5.根据权利要求1所述的基于锚点和自适应图学习的半监督图像分类方法,其特征在于,基于锚图模型构建半监督分类模型的步骤具体为:

6.根据权利要求1所述的基于锚点和自适应...

【专利技术属性】
技术研发人员:刘侍刚黄佳新彭亚丽
申请(专利权)人:陕西师范大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1