当前位置: 首页 > 专利查询>清华大学专利>正文

基于半监督学习的脑部肿瘤识别模型的训练方法及装置制造方法及图纸

技术编号:26766482 阅读:38 留言:0更新日期:2020-12-18 23:43
本发明专利技术提出一种基于半监督学习的脑部肿瘤识别模型的训练方法及装置,所述脑部肿瘤识别模型包括检测网络和分类网络,所述方法包括:获取第一训练样本集和第二训练样本集;利用所述第一训练样本集,分别对所述检测网络和所述分类网络进行无监督学习,生成预训练检测网络和预训练分类网络;利用所述第二训练样本集,对所述预训练检测网络和所述预训练分类网络进行训练,生成经过训练后的检测网络和经过训练后的分类网络;输出经过训练后的脑部肿瘤识别模型,所述经过训练后的脑部肿瘤识别模型包括所述经过训练后的检测网络和所述经过训练后的分类网络。本发明专利技术通过半监督学习方式充分利用精标与粗标数据,从而得到更加鲁棒的深度卷积神经网络。

【技术实现步骤摘要】
基于半监督学习的脑部肿瘤识别模型的训练方法及装置
本专利技术涉及计算机视觉
,尤其涉及医学图像分类及深度学习技术,更具体地,涉及一种基于半监督学习的脑部肿瘤识别模型的训练方法及装置。
技术介绍
医学图像(如CT图像、MRI图像等)是医学领域一类重要数据,在辅助医生进行诊断、病理研究等方面有举足轻重的作用。利用人工智能技术对医学图像进行智能、自动分析,对提升医疗效率、节省医疗成本、减少患者痛苦等方面有重要意义,将为我国医疗信息化、智能化建设、提高我国医疗水平提供有力保障。其中,针对医学图像的分类是基于医学图像的智能分析中的一个最为基础的任务,它在疾病类型的识别、病灶严重程度的判断、病人恢复状况的量化等多种具体场景中有重要的需求。因此,发展准确的医学图像自动分类方法与系统在实际场景中有急迫的需求和重要的意义。脑部CT的相关任务是目前医学图像领域中较为流行的话题之一。但由于医学图像数据的获取与标注较为困难,且CT图像中肿瘤的位置、大小等特征不固定,使得肿瘤识别也较为困难,利用模型进行脑部肿瘤识别的准确率较低。
技术实现思路
针对上述问题,本专利技术提出一种基于半监督学习的脑部肿瘤识别模型的训练方法及装置,旨在解决在脑部CT序列的识别等任务中,医学图像的可利用精标数据稀少从而为模型训练带来的挑战,通过半监督学习方式充分利用精标与粗标数据,从而得到更加鲁棒的深度卷积神经网络,进而提升医学图像分类及脑部肿瘤识别的准确性。本专利技术第一方面实施例提出了一种基于半监督学习的脑部肿瘤识别模型的训练方法,所述脑部肿瘤识别模型包括检测网络和分类网络,所述方法包括:获取第一训练样本集和第二训练样本集,所述第一训练样本集中包括多个粗标数据和/或无标数据,所述第二训练样本集中包括多个精标数据,所述数据为脑部医学图像;利用所述第一训练样本集,分别对所述检测网络和所述分类网络进行无监督学习,生成预训练检测网络和预训练分类网络;利用所述第二训练样本集,对所述预训练检测网络和所述预训练分类网络进行训练,生成经过训练后的检测网络和经过训练后的分类网络;输出经过训练后的脑部肿瘤识别模型,所述经过训练后的脑部肿瘤识别模型包括所述经过训练后的检测网络和所述经过训练后的分类网络。本专利技术第二方面实施例提出了一种基于脑部肿瘤识别模型的脑部肿瘤识别方法,所述脑部肿瘤识别模型通过如前述第一方面实施例所述的基于半监督学习的脑部肿瘤识别模型的训练方法训练得到,所述脑部肿瘤识别模型包括检测网络和分类网络,所述方法包括:获取待识别的脑部医学图像;将所述脑部医学图像输入至所述脑部肿瘤识别模型的所述检测网络中,以获取所述脑部医学图像中的肿瘤潜在区域;将所述肿瘤潜在区域和所述脑部医学图像输入至所述脑部肿瘤识别模型的所述分类网络中,以获取所述脑部医学图像中包含肿瘤的预测概率;当所述预测概率大于预设阈值时,确定所述脑部医学图像中包含肿瘤。本专利技术第三方面实施例提出了一种基于半监督学习的脑部肿瘤识别模型的训练装置,所述脑部肿瘤识别模型包括检测网络和分类网络,所述装置包括:获取模块,用于获取第一训练样本集和第二训练样本集,所述第一训练样本集中包括多个粗标数据和/或无标数据,所述第二训练样本集中包括多个精标数据,所述数据为脑部医学图像;第一训练模块,用于利用所述第一训练样本集,分别对所述检测网络和所述分类网络进行无监督学习,生成预训练检测网络和预训练分类网络;第二训练模块,用于利用所述第二训练样本集,对所述预训练检测网络和所述预训练分类网络进行训练,生成经过训练后的检测网络和经过训练后的分类网络;输出模块,用于输出经过训练后的脑部肿瘤识别模型,所述经过训练后的脑部肿瘤识别模型包括所述经过训练后的检测网络和所述经过训练后的分类网络。本专利技术第四方面实施例提出了一种基于脑部肿瘤识别模型的脑部肿瘤识别装置,所述脑部肿瘤识别模型通过如前述第一方面实施例所述的基于半监督学习的脑部肿瘤识别模型的训练方法训练得到,所述脑部肿瘤识别模型包括检测网络和分类网络,所述装置包括:图像获取模块,用于获取待识别的脑部医学图像;第一输入模块,用于将所述脑部医学图像输入至所述脑部肿瘤识别模型的所述检测网络中,以获取所述脑部医学图像中的肿瘤潜在区域;第二输入模块,用于将所述肿瘤潜在区域和所述脑部医学图像输入至所述脑部肿瘤识别模型的所述分类网络中,以获取所述脑部医学图像中包含肿瘤的预测概率;确定模块,用于当所述预测概率大于预设阈值时,确定所述脑部医学图像中包含肿瘤。本专利技术第五方面实施例提出了一种计算机设备,包括处理器、存储器和存储在所述存储器上并可在所述处理器上运行的计算机程序,当所述计算机程序被所述处理器执行时,实现如第一方面实施例所述的基于半监督学习的脑部肿瘤识别模型的训练方法,或者,实现如第二方面实施例所述的基于脑部肿瘤识别模型的脑部肿瘤识别方法。本专利技术第六方面实施例提出了一种非临时性计算机可读存储介质,其上存储有计算机程序,当所述计算机程序被处理器执行时,实现如第一方面实施例所述的基于半监督学习的脑部肿瘤识别模型的训练方法,或者,实现如第二方面实施例所述的基于脑部肿瘤识别模型的脑部肿瘤识别方法。本专利技术提供的技术方案,至少可以带来如下有益效果:本专利技术将脑部肿瘤识别模型的训练分为两个阶段,先利用粗标数据和/或无标数据对整体模型进行无监督学习,使得模型输出的特征有一定的聚类效果,能够增强模型的泛化能力;之后,利用精标数据对检测网络和分类网络进行监督学习,能够提高模型的判别能力,实现医学图像领域中脑部CT序列的肿瘤自动识别,为临床中的预检测、医生鉴定病灶的二次校正打下基础。本专利技术通过无监督学习将医学图像中的大量无标与粗标数据利用起来,通过半监督学习训练得到脑部肿瘤识别模型,在训练过程中充分考虑了精标数据与粗标数据,从而实现了更加有效地特征抽取和更准确分类,从而训练出判别能力与泛化能力更强的模型,训练得到的模型具有精度高、适用范围广、鲁棒性强等优点,具有较强的实际应用前景。将训练好的脑部肿瘤识别模型用于脑部肿瘤识别,能够实现脑部肿瘤的自动识别,提高识别结果的准确性。本专利技术附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本申请的实践了解到。附图说明本申请上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:图1为本专利技术一实施例提出的基于半监督学习的脑部肿瘤识别模型的训练方法的流程示意图;图2为本专利技术另一实施例提出的基于半监督学习的脑部肿瘤识别模型的训练方法的流程示意图;图3为本专利技术又一实施例提出的基于半监督学习的脑部肿瘤识别模型的训练方法的流程示意图;图4为本专利技术一实施例提出的基于脑部肿瘤识别模型的脑部肿瘤识别方法的流程示意图;图5为本专利技术一实施例提出的基于半监督学习的脑部肿瘤识别模型的训练装置的结构示意图;图6为本本文档来自技高网...

【技术保护点】
1.一种基于半监督学习的脑部肿瘤识别模型的训练方法,其特征在于,所述脑部肿瘤识别模型包括检测网络和分类网络,所述方法包括:/n获取第一训练样本集和第二训练样本集,所述第一训练样本集中包括多个粗标数据和/或无标数据,所述第二训练样本集中包括多个精标数据,所述数据为脑部医学图像;/n利用所述第一训练样本集,分别对所述检测网络和所述分类网络进行无监督学习,生成预训练检测网络和预训练分类网络;/n利用所述第二训练样本集,对所述预训练检测网络和所述预训练分类网络进行训练,生成经过训练后的检测网络和经过训练后的分类网络;/n输出经过训练后的脑部肿瘤识别模型,所述经过训练后的脑部肿瘤识别模型包括所述经过训练后的检测网络和所述经过训练后的分类网络。/n

【技术特征摘要】
1.一种基于半监督学习的脑部肿瘤识别模型的训练方法,其特征在于,所述脑部肿瘤识别模型包括检测网络和分类网络,所述方法包括:
获取第一训练样本集和第二训练样本集,所述第一训练样本集中包括多个粗标数据和/或无标数据,所述第二训练样本集中包括多个精标数据,所述数据为脑部医学图像;
利用所述第一训练样本集,分别对所述检测网络和所述分类网络进行无监督学习,生成预训练检测网络和预训练分类网络;
利用所述第二训练样本集,对所述预训练检测网络和所述预训练分类网络进行训练,生成经过训练后的检测网络和经过训练后的分类网络;
输出经过训练后的脑部肿瘤识别模型,所述经过训练后的脑部肿瘤识别模型包括所述经过训练后的检测网络和所述经过训练后的分类网络。


2.根据权利要求1所述的方法,其特征在于,所述利用所述第一训练样本集,分别对所述检测网络和所述分类网络进行无监督学习,生成预训练检测网络和预训练分类网络,包括:
基于均匀分布对所述第一训练样本集进行随机采样,将所述第一训练样本集划分为多个样本子集,每个所述样本子集中包含预设个数的所述脑部医学图像;
从所述多个样本子集中选择一个所述样本子集分别输入至所述检测网络和所述分类网络中,以使所述检测网络和所述分类网络分别对所述脑部医学图像进行特征提取,并基于对比损失函数对提取的特征进行无监督学习,生成所述预训练检测网络和所述预训练分类网络。


3.根据权利要求1所述的方法,其特征在于,所述利用所述第二训练样本集,对所述预训练检测网络和所述预训练分类网络进行训练,生成经过训练后的检测网络和经过训练后的分类网络,包括:
利用所述第二训练样本集,对所述预训练检测网络进行训练,生成经过训练后的检测网络;
将所述多个精标数据输入至所述经过训练后的检测网络中,以获取所述经过训练后的检测网络对所述多个精标数据中肿瘤区域的预测结果;
根据所述预测结果,从所述多个精标数据中提取出多个局部肿瘤图像;
对所述多个局部肿瘤图像进行大小调整,生成多个目标局部肿瘤图像;
将每个所述目标局部肿瘤图像和对应的所述脑部医学图像分别输入至所述预训练分类网络进行特征提取,获取所述目标局部肿瘤图像的局部特征向量和所述脑部医学图像的全局特征向量;
将所述局部特征向量和所述全局特征向量进行拼接,生成融合特征向量;
将所述融合特征向量输入至所述预训练分类网络中进行训练,并基于交叉熵损失函数和反向传播算法更新所述预训练分类网络的参数,以使所述交叉熵损失函数最小化;
当更新参数后的所述预训练分类网络收敛时,确定所述预训练分类网络训练完成,生成所述经过训练后的分类网络。


4.一种基于脑部肿瘤识别模型的脑部肿瘤识别方法,其特征在于,所述脑部肿瘤识别模型通过如权利要求1-3任一所述的基于半监督学习的脑部肿瘤识别模型的训练方法训练得到,所述脑部肿瘤识别模型包括检测网络和分类网络,所述方法包括:
获取待识别的脑部医学图像;
将所述脑部医学图像输入至所述脑部肿瘤识别模型的所述检测网络中,以获取所述脑部医学图像中的肿瘤潜在区域;
将所述肿瘤潜在区域和所述脑部医学图像输入至所述脑部肿瘤识别模型的所述分类网络中,以获取所述脑部医学图像中包含肿瘤的预测概率;
当所述预测概率大于预设阈值时,确定所述脑部医学图像中包含肿瘤。


5.一种基于半监督学习的脑部肿瘤识别模型的训练装置,其特征在于,所述脑部肿瘤识别模型包括检测网络和分类网络,所述装置包括:
获取模块,用于获取第一训练样本集和第二训练样本集,所述第一训练样本集中包括多个粗标数据和/或无标数据,所述第二训练样本...

【专利技术属性】
技术研发人员:徐枫叶葳蕤郭雨晨杨东雍俊海戴琼海
申请(专利权)人:清华大学
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1