System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术属于医学图像诊断领域,涉及一种光学相干断层扫描血管造影(opticalcoherence tomography angiography,octa)图像的疾病分类分类方法,具体为一种基于半监督学习与知识蒸馏的多阶段损失优化方法。
技术介绍
1、octa是一种无创的医学成像技术,广泛应用于视网膜和脉络膜疾病的检测和诊断。通过捕捉眼底微血管网络和组织结构的细节,octa为糖尿病视网膜病变、黄斑病变等疾病的早期筛查和诊断提供了重要依据。然而,octa图像的解读通常依赖于经验丰富的眼科医生,这一过程耗时且容易受到人为主观因素的影响。
2、现有的octa图像分类方法主要基于深度学习技术,通常需要大量标注数据进行监督学习。然而,高质量的医学标注数据获取成本高,尤其在资源有限的临床环境中,这成为了大规模应用深度学习技术的一大障碍。为了解决这一问题,半监督学习方法逐渐引起关注,它通过结合标注数据和未标注数据的学习,显著减少了对标注数据的依赖。半监督学习通过利用标注数据训练的模型对无标签数据生成伪标签,从而提升了无标签数据的利用率,但如何生成高质量伪标签仍是关键挑战。
3、在提高模型性能的同时,知识蒸馏方法也被广泛应用。知识蒸馏是一种模型压缩技术,通过将一个性能较高的复杂模型(教师模型)的知识传递给较小的轻量化模型(学生模型),从而在保证模型精度的前提下显著减少计算开销。这种方法为资源受限场景中的模型部署提供了有效的解决方案。然而,现有知识蒸馏方法通常依赖于标注数据进行训练,未能充分利用无标签数据。
4
技术实现思路
1、本专利技术的目的是针对现有技术中octa图像分类依赖大量标注数据、轻量化模型性能不足以及全局特征捕获能力有限的问题,提出一种基于半监督学习与知识蒸馏的多阶段损失优化octa图像分类方法。该方法通过构建半监督学习框架,充分利用标注数据和无标签数据,生成高质量伪标签,减少对标注数据的依赖;同时结合知识蒸馏,将复杂模型的特征提取能力传递给轻量化模型,显著提升轻量化模型的分类性能。此外,本专利技术设计了多阶段损失函数,包括监督损失、伪标签监督损失和知识蒸馏损失,有效增强了学生模型对局部和全局特征的表征能力,从而实现了对octa图像的高效、精准分类诊断,满足临床资源有限场景中的应用需求。
2、实现本专利技术目的的技术方案是:
3、一种基于半监督学习与知识蒸馏的多阶段损失优化octa图像分类方法,包括如下步骤:
4、s1、数据集划分与处理
5、将octa-500数据集划分为训练集(105张有标签图片和350张无标签图片)、验证集(15张有标签图片)和测试集(20张有标签图片)。训练集用于模型训练,验证集用于选择最佳教师和学生模型,测试集用于最终模型性能评估。训练集中的无标签图片将用于生成伪标签。
6、s2、半监督学习—教师模型的训练与伪标签生成
7、利用训练集中的105张有标签数据对教师模型(resnet50)进行训练,使用交叉熵损失函数优化模型。在训练过程中,通过对验证集的f1分数进行评估,选择验证集上表现最佳的教师模型权重,并将其用于生成伪标签。使用训练好的教师模型对训练集中的350张无标签图片进行预测,生成伪标签。设置置信度阈值(0.7),仅保留高置信度伪标签用于后续训练,低于阈值的样本将被直接丢弃,从而提高伪标签的质量和训练的鲁棒性。
8、s3、学生模型的训练
9、将生成的高置信度伪标签与105张有标签数据结合,作为输入数据集用于训练学生模型(mobilenetv2)。在训练过程中,使用多阶段损失函数进行优化,包括:
10、监督损失:用于有标签数据的监督学习。
11、伪标签监督损失:用于高置信度伪标签数据的监督学习。
12、知识蒸馏损失:通过最小化学生模型和教师模型预测结果之间的差异,提升学生模型的性能。
13、采用多阶段损失函数对学生模型进行优化。
14、s4、测试与性能评估
15、将训练好的学生模型应用于测试集,计算模型在不同疾病类型(如糖尿病视网膜病变、黄斑病变等)上的分类准确率、f1分数、混淆矩阵等评估指标,并生成最终的诊断结果。
16、一种基于半监督学习与知识蒸馏的多阶段损失优化octa图像分类方法,所述系统包括如下技术模块:
17、数据预处理模块:负责octa-500数据集的划分和图像预处理。
18、教师模型训练模块:使用resnet50作为教师模型,在有标签数据上进行训练,生成高质量伪标签。
19、伪标签生成模块:对无标签数据进行预测,仅保留高置信度伪标签。
20、学生模型训练模块:使用mobilenetv2作为学生模型,通过多阶段损失函数进行优化训练。
21、模型评估模块:基于验证集的f1分数选择最佳模型,并在测试集上评估最终性能。
22、本申请的优点或有益效果:
23、本技术方案通过引入半监督学习框架,利用无标签数据生成高置信度伪标签,显著减少对标注数据的依赖,降低数据标注成本,适用于临床资源有限的应用场景,如视网膜疾病的辅助诊断和筛查。
24、本技术方案结合知识蒸馏,将教师模型的复杂特征提取能力传递给学生模型,在减少计算资源消耗的同时,增强学生模型对局部和全局特征的捕获能力,适用于资源有限的临床场景。
25、本技术方案通过设计多阶段损失函数,包括监督损失、伪标签监督损失和知识蒸馏损失,提升了轻量化学生模型的分类能力,在保证计算效率的同时,实现了对octa图像疾病分类的高精度诊断。
本文档来自技高网...【技术保护点】
1.一种基于半监督学习与知识蒸馏的多阶段损失优化OCTA图像分类方法,其特征在于,包括以下步骤:
【技术特征摘要】
1.一种基于半监督学习与知识蒸馏的多阶段损失优化...
【专利技术属性】
技术研发人员:李栋,奥库沃比·伊杜乌·保罗,
申请(专利权)人:桂林电子科技大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。