System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于半监督学习与知识蒸馏的多阶段损失优化OCTA图像分类方法技术_技高网

一种基于半监督学习与知识蒸馏的多阶段损失优化OCTA图像分类方法技术

技术编号:45012949 阅读:3 留言:0更新日期:2025-04-18 16:58
本发明专利技术公开了一种基于半监督学习与知识蒸馏的多阶段损失优化光学相干断层扫描血管造影(OCTA)图像诊断方法。方法包括以下步骤:(1)结合半监督学习构建教师‑学生模型框架;(2)数据集处理:随机移除训练集部分样本标签,作为无标签数据;(3)利用有标签数据训练教师模型,随后通过教师模型生成无标签数据的伪标签,仅保留满足置信度阈值的高质量伪标签;(4)用多阶段损失函数训练学生模型,包括有标签数据的监督损失、伪标签数据的监督损失及知识蒸馏损失。本发明专利技术通过半监督学习减少对标注数据的依赖,利用知识蒸馏提升轻量化学生模型性能,适用于临床资源有限的场景。

【技术实现步骤摘要】

本专利技术属于医学图像诊断领域,涉及一种光学相干断层扫描血管造影(opticalcoherence tomography angiography,octa)图像的疾病分类分类方法,具体为一种基于半监督学习与知识蒸馏的多阶段损失优化方法。


技术介绍

1、octa是一种无创的医学成像技术,广泛应用于视网膜和脉络膜疾病的检测和诊断。通过捕捉眼底微血管网络和组织结构的细节,octa为糖尿病视网膜病变、黄斑病变等疾病的早期筛查和诊断提供了重要依据。然而,octa图像的解读通常依赖于经验丰富的眼科医生,这一过程耗时且容易受到人为主观因素的影响。

2、现有的octa图像分类方法主要基于深度学习技术,通常需要大量标注数据进行监督学习。然而,高质量的医学标注数据获取成本高,尤其在资源有限的临床环境中,这成为了大规模应用深度学习技术的一大障碍。为了解决这一问题,半监督学习方法逐渐引起关注,它通过结合标注数据和未标注数据的学习,显著减少了对标注数据的依赖。半监督学习通过利用标注数据训练的模型对无标签数据生成伪标签,从而提升了无标签数据的利用率,但如何生成高质量伪标签仍是关键挑战。

3、在提高模型性能的同时,知识蒸馏方法也被广泛应用。知识蒸馏是一种模型压缩技术,通过将一个性能较高的复杂模型(教师模型)的知识传递给较小的轻量化模型(学生模型),从而在保证模型精度的前提下显著减少计算开销。这种方法为资源受限场景中的模型部署提供了有效的解决方案。然而,现有知识蒸馏方法通常依赖于标注数据进行训练,未能充分利用无标签数据。

4、octa图像中的病变信息往往具有复杂的局部特征和全局关联性,而传统深度学习模型在捕获全局依赖关系和细粒度特征时表现有限,尤其是在疾病类型复杂且差异较小时,分类性能往往不够理想。此外,为适应资源受限的临床环境,轻量化深度学习模型的研究逐渐成为热点,但轻量化模型的性能通常难以达到复杂深层模型的水平。如何结合半监督学习减少标注数据的依赖,并通过知识蒸馏提升轻量化模型性能,同时有效捕获图像中的局部与全局特征,已成为当前octa图像分类领域亟待解决的问题。


技术实现思路

1、本专利技术的目的是针对现有技术中octa图像分类依赖大量标注数据、轻量化模型性能不足以及全局特征捕获能力有限的问题,提出一种基于半监督学习与知识蒸馏的多阶段损失优化octa图像分类方法。该方法通过构建半监督学习框架,充分利用标注数据和无标签数据,生成高质量伪标签,减少对标注数据的依赖;同时结合知识蒸馏,将复杂模型的特征提取能力传递给轻量化模型,显著提升轻量化模型的分类性能。此外,本专利技术设计了多阶段损失函数,包括监督损失、伪标签监督损失和知识蒸馏损失,有效增强了学生模型对局部和全局特征的表征能力,从而实现了对octa图像的高效、精准分类诊断,满足临床资源有限场景中的应用需求。

2、实现本专利技术目的的技术方案是:

3、一种基于半监督学习与知识蒸馏的多阶段损失优化octa图像分类方法,包括如下步骤:

4、s1、数据集划分与处理

5、将octa-500数据集划分为训练集(105张有标签图片和350张无标签图片)、验证集(15张有标签图片)和测试集(20张有标签图片)。训练集用于模型训练,验证集用于选择最佳教师和学生模型,测试集用于最终模型性能评估。训练集中的无标签图片将用于生成伪标签。

6、s2、半监督学习—教师模型的训练与伪标签生成

7、利用训练集中的105张有标签数据对教师模型(resnet50)进行训练,使用交叉熵损失函数优化模型。在训练过程中,通过对验证集的f1分数进行评估,选择验证集上表现最佳的教师模型权重,并将其用于生成伪标签。使用训练好的教师模型对训练集中的350张无标签图片进行预测,生成伪标签。设置置信度阈值(0.7),仅保留高置信度伪标签用于后续训练,低于阈值的样本将被直接丢弃,从而提高伪标签的质量和训练的鲁棒性。

8、s3、学生模型的训练

9、将生成的高置信度伪标签与105张有标签数据结合,作为输入数据集用于训练学生模型(mobilenetv2)。在训练过程中,使用多阶段损失函数进行优化,包括:

10、监督损失:用于有标签数据的监督学习。

11、伪标签监督损失:用于高置信度伪标签数据的监督学习。

12、知识蒸馏损失:通过最小化学生模型和教师模型预测结果之间的差异,提升学生模型的性能。

13、采用多阶段损失函数对学生模型进行优化。

14、s4、测试与性能评估

15、将训练好的学生模型应用于测试集,计算模型在不同疾病类型(如糖尿病视网膜病变、黄斑病变等)上的分类准确率、f1分数、混淆矩阵等评估指标,并生成最终的诊断结果。

16、一种基于半监督学习与知识蒸馏的多阶段损失优化octa图像分类方法,所述系统包括如下技术模块:

17、数据预处理模块:负责octa-500数据集的划分和图像预处理。

18、教师模型训练模块:使用resnet50作为教师模型,在有标签数据上进行训练,生成高质量伪标签。

19、伪标签生成模块:对无标签数据进行预测,仅保留高置信度伪标签。

20、学生模型训练模块:使用mobilenetv2作为学生模型,通过多阶段损失函数进行优化训练。

21、模型评估模块:基于验证集的f1分数选择最佳模型,并在测试集上评估最终性能。

22、本申请的优点或有益效果:

23、本技术方案通过引入半监督学习框架,利用无标签数据生成高置信度伪标签,显著减少对标注数据的依赖,降低数据标注成本,适用于临床资源有限的应用场景,如视网膜疾病的辅助诊断和筛查。

24、本技术方案结合知识蒸馏,将教师模型的复杂特征提取能力传递给学生模型,在减少计算资源消耗的同时,增强学生模型对局部和全局特征的捕获能力,适用于资源有限的临床场景。

25、本技术方案通过设计多阶段损失函数,包括监督损失、伪标签监督损失和知识蒸馏损失,提升了轻量化学生模型的分类能力,在保证计算效率的同时,实现了对octa图像疾病分类的高精度诊断。

本文档来自技高网...

【技术保护点】

1.一种基于半监督学习与知识蒸馏的多阶段损失优化OCTA图像分类方法,其特征在于,包括以下步骤:

【技术特征摘要】

1.一种基于半监督学习与知识蒸馏的多阶段损失优化...

【专利技术属性】
技术研发人员:李栋奥库沃比·伊杜乌·保罗
申请(专利权)人:桂林电子科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1