基于半监督学习的脑部肿瘤识别模型的训练方法及装置制造方法及图纸

技术编号：26766482 阅读：38 留言：0更新日期：2020-12-18 23:43

本发明专利技术提出一种基于半监督学习的脑部肿瘤识别模型的训练方法及装置，所述脑部肿瘤识别模型包括检测网络和分类网络，所述方法包括：获取第一训练样本集和第二训练样本集；利用所述第一训练样本集，分别对所述检测网络和所述分类网络进行无监督学习，生成预训练检测网络和预训练分类网络；利用所述第二训练样本集，对所述预训练检测网络和所述预训练分类网络进行训练，生成经过训练后的检测网络和经过训练后的分类网络；输出经过训练后的脑部肿瘤识别模型，所述经过训练后的脑部肿瘤识别模型包括所述经过训练后的检测网络和所述经过训练后的分类网络。本发明专利技术通过半监督学习方式充分利用精标与粗标数据，从而得到更加鲁棒的深度卷积神经网络。

全部详细技术资料下载

【技术实现步骤摘要】
基于半监督学习的脑部肿瘤识别模型的训练方法及装置
本专利技术涉及计算机视觉
，尤其涉及医学图像分类及深度学习技术，更具体地，涉及一种基于半监督学习的脑部肿瘤识别模型的训练方法及装置。
技术介绍
医学图像(如CT图像、MRI图像等)是医学领域一类重要数据，在辅助医生进行诊断、病理研究等方面有举足轻重的作用。利用人工智能技术对医学图像进行智能、自动分析，对提升医疗效率、节省医疗成本、减少患者痛苦等方面有重要意义，将为我国医疗信息化、智能化建设、提高我国医疗水平提供有力保障。其中，针对医学图像的分类是基于医学图像的智能分析中的一个最为基础的任务，它在疾病类型的识别、病灶严重程度的判断、病人恢复状况的量化等多种具体场景中有重要的需求。因此，发展准确的医学图像自动分类方法与系统在实际场景中有急迫的需求和重要的意义。脑部CT的相关任务是目前医学图像领域中较为流行的话题之一。但由于医学图像数据的获取与标注较为困难，且CT图像中肿瘤的位置、大小等特征不固定，使得肿瘤识别也较为困难，利用模型进行脑部肿瘤识别的准确率较低。
技术实现思路
针对上述问题，本专利技术提出一种基于半监督学习的脑部肿瘤识别模型的训练方法及装置，旨在解决在脑部CT序列的识别等任务中，医学图像的可利用精标数据稀少从而为模型训练带来的挑战，通过半监督学习方式充分利用精标与粗标数据，从而得到更加鲁棒的深度卷积神经网络，进而提升医学图像分类及脑部肿瘤识别的准确性。本专利技术第一方面实施例提出了一种基于半监督学习的脑部肿瘤识别模型的...

【技术保护点】
1.一种基于半监督学习的脑部肿瘤识别模型的训练方法，其特征在于，所述脑部肿瘤识别模型包括检测网络和分类网络，所述方法包括：/n获取第一训练样本集和第二训练样本集，所述第一训练样本集中包括多个粗标数据和/或无标数据，所述第二训练样本集中包括多个精标数据，所述数据为脑部医学图像；/n利用所述第一训练样本集，分别对所述检测网络和所述分类网络进行无监督学习，生成预训练检测网络和预训练分类网络；/n利用所述第二训练样本集，对所述预训练检测网络和所述预训练分类网络进行训练，生成经过训练后的检测网络和经过训练后的分类网络；/n输出经过训练后的脑部肿瘤识别模型，所述经过训练后的脑部肿瘤识别模型包括所述经过训练后的检测网络和所述经过训练后的分类网络。/n

【技术特征摘要】
1.一种基于半监督学习的脑部肿瘤识别模型的训练方法，其特征在于，所述脑部肿瘤识别模型包括检测网络和分类网络，所述方法包括：
获取第一训练样本集和第二训练样本集，所述第一训练样本集中包括多个粗标数据和/或无标数据，所述第二训练样本集中包括多个精标数据，所述数据为脑部医学图像；
利用所述第一训练样本集，分别对所述检测网络和所述分类网络进行无监督学习，生成预训练检测网络和预训练分类网络；
利用所述第二训练样本集，对所述预训练检测网络和所述预训练分类网络进行训练，生成经过训练后的检测网络和经过训练后的分类网络；
输出经过训练后的脑部肿瘤识别模型，所述经过训练后的脑部肿瘤识别模型包括所述经过训练后的检测网络和所述经过训练后的分类网络。

2.根据权利要求1所述的方法，其特征在于，所述利用所述第一训练样本集，分别对所述检测网络和所述分类网络进行无监督学习，生成预训练检测网络和预训练分类网络，包括：
基于均匀分布对所述第一训练样本集进行随机采样，将所述第一训练样本集划分为多个样本子集，每个所述样本子集中包含预设个数的所述脑部医学图像；
从所述多个样本子集中选择一个所述样本子集分别输入至所述检测网络和所述分类网络中，以使所述检测网络和所述分类网络分别对所述脑部医学图像进行特征提取，并基于对比损失函数对提取的特征进行无监督学习，生成所述预训练检测网络和所述预训练分类网络。

3.根据权利要求1所述的方法，其特征在于，所述利用所述第二训练样本集，对所述预训练检测网络和所述预训练分类网络进行训练，生成经过训练后的检测网络和经过训练后的分类网络，包括：
利用所述第二训练样本集，对所述预训练检测网络进行训练，生成经过训练后的检测网络；
将所述多个精标数据输入至所述经过训练后的检测网络中，以获取所述经过训练后的检测网络对所述多个精标数据中肿瘤区域的预测结果；
根据所述预测结果，从所述多个精标数据中提取出多个局部肿瘤图像；
对所述多个局部肿瘤图像进行大小调整，生成多个目标局部肿瘤图像；
将每个所述目标局部肿瘤图像和对应的所述脑部医学图像分别输入至所述预训练分类网络进行特征提取，获取所述目标局部肿瘤图像的局部特征向量和所述脑部医学图像的全局特征向量；
将所述局部特征向量和所述全局特征向量进行拼接，生成融合特征向量；
将所述融合特征向量输入至所述预训练分类网络中进行训练，并基于交叉熵损失函数和反向传播算法更新所述预训练分类网络的参数，以使所述交叉熵损失函数最小化；
当更新参数后的所述预训练分类网络收敛时，确定所述预训练分类网络训练完成，生成所述经过训练后的分类网络。

4.一种基于脑部肿瘤识别模型的脑部肿瘤识别方法，其特征在于，所述脑部肿瘤识别模型通过如权利要求1-3任一所述的基于半监督学习的脑部肿瘤识别模型的训练方法训练得到，所述脑部肿瘤识别模型包括检测网络和分类网络，所述方法包括：
获取待识别的脑部医学图像；
将所述脑部医学图像输入至所述脑部肿瘤识别模型的所述检测网络中，以获取所述脑部医学图像中的肿瘤潜在区域；
将所述肿瘤潜在区域和所述脑部医学图像输入至所述脑部肿瘤识别模型的所述分类网络中，以获取所述脑部医学图像中包含肿瘤的预测概率；
当所述预测概率大于预设阈值时，确定所述脑部医学图像中包含肿瘤。

5.一种基于半监督学习的脑部肿瘤识别模型的训练装置，其特征在于，所述脑部肿瘤识别模型包括检测网络和分类网络，所述装置包括：
获取模块，用于获取第一训练样本集和第二训练样本集，所述第一训练样本集中包括多个粗标数据和/或无标数据，所述第二训练样本...

【专利技术属性】
技术研发人员：徐枫，叶葳蕤，郭雨晨，杨东，雍俊海，戴琼海，
申请(专利权)人：清华大学，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人