一种基于迁移学习的医学图像识别方法技术

技术编号:35280937 阅读:9 留言:0更新日期:2022-10-22 12:23
本发明专利技术设计一种基于迁移学习的医学图像识别方法,主要用于解决医学疾病图像数据不足而导致分类模型出现精度较低、过拟合的问题。为了达到该目的,所采用的处理方法是采用已用大型数据集训练过的神经网络的部分结构以及自定义的全连接层作为整个神经网络模型来对已有的肺癌数据进行训练,并且在循环迭代训练达到一定饱和精度后采用微调方式来提高模型的精确度和训练效率。的精确度和训练效率。的精确度和训练效率。

【技术实现步骤摘要】
一种基于迁移学习的医学图像识别方法


[0001]本专利技术涉及计算机
,具体涉及迁移学习以及图像识别领域。

技术介绍

[0002]近年来随着深度学习领域迅速发展,使得深度学习在图像处理领域的技术也越来越成熟。其中在医学图像分类领域应用十分广泛,一个精度较高的分类模型可帮助医生识别一些难以用肉眼识别的疾病,极大的提高医生办公效率。
[0003]而要得到一个精度较高的分类模型,对模型的结构、参数等要求较高并且需要海量数据的训练。但医学图像数据又比较隐私,往往数据量比较少,无法达到模型所需要规模的数据。而迁移学习的出现就极大的改善了数据量不足的问题。迁移学习就是指利用任务、数据等之间的相似性,将在旧领域学习过的模型,应用于新领域的一种学习过程,具体来说就是把一个经过大型数据集训练过的模型应用到另一个场景中,从而将已经学习到的模型参数传递给新模型,从而加快并优化模型的学习效率。
[0004]本专利技术设计一种基于迁移学习的医学图像识别方法,将预训练好的InceptionResNetV2网络部分结构以及自定义全连接层作为神经网络模型对肺癌数据进行分类。预训练好的InceptionResNetV2网络部分结构(包括预训练好的权重参数但不包括最终的密集层)作为卷积基,自定义全连接层作为分类器。

技术实现思路

[0005]本专利技术设计一种基于迁移学习的医学图像识别方法,主要用于解决医学疾病图像数据不足而导致分类模型出现精度较低、过拟合的问题。为了达到该目的,所采用的处理方法是采用已用大型数据集训练过的神经网络的部分结构以及自定义的全连接层作为整个神经网络模型来对已有的肺癌数据进行训练,并且在循环迭代训练达到一定饱和精度后采用微调方式来提高模型的精确度和训练效率。
[0006]本专利技术的主要步骤是首先获取肺癌数据集,然后对数据集进行数据增强扩充样本量,并为这些数据设置相应的标签。之后将数据集分为训练集、验证集以及测试集,三者比例为6∶2∶2。之后将处理好的数据(包括训练集、验证集)输入到预训练网络中进行学习。在循环迭代训练达到一定饱和精度时,使用微调方式从卷积基中解冻顶部部分卷积层来和分类器一起进行训练,以此提高模型的精确度和训练效率。最后用测试集对训练好的神经网络模型进行预测评估。
[0007]区别于现有的处理方法,本专利技术的有益效果是:
[0008]1、与其他未经过预训练的网络相比,若要达到较高精度,本专利技术所采用的网络模型较未经预训练的所需要的数据量更少。
[0009]2、与识别精度较高的InceptionV3预训练网络模型以及ResNet152预训练网络模型相比,InceptionResNetV2预训练模型在相同条件(相同数据集、相同超参数等)下的识别精度远远高于InceptionV3、ResNet152。
[0010]3、在基于单个图像的ILSVRC 2012图像分类标准中表明,InceptionResNetV2的Top

1 Accuracy与Top

5 Accuracy分别为80.4、95.3,相对于InceptionV3的78.0、93.9以及ResNet152的76.8、93.2有显著的提升。
附图说明
[0011]下面结合附图对本专利技术的具体实施方式作进一步详细的描述。
[0012]图1是本专利技术使用InceptionResNetV2预训练网络对肺癌数据进行识别分类的流程图;
[0013]图2是本专利技术采用的迁移学网络架构。
具体实施方式
[0014]下面结合附图详细说明本专利技术具体实施方式。
[0015]请参阅图1所示:
[0016]一种基于迁移学习的医学图像识别方法,所采用的方法具体包括以下五个步骤:
[0017]步骤一:获取肺癌数据集,并对数据集进行数据增强,主要方式包括:翻转、旋转、模糊,进入步骤二;
[0018]步骤二:划分处理好的数据集。将数据集划分为训练集、验证集、测试集,三者的比例为6∶2∶2,进入步骤三;
[0019]步骤三:采用预训练网络InceptionResNetV2,选择使用预训练好的的权重参数等,但不选用网络自带的全连接层,之后添加自定义全连接层。将预训练网络的除密集层之外网络结构作为卷积基来提取图像特征,将自定义全连接层作为分类器进行最后的分类,进入步骤四;
[0020]步骤四:将划分好的数据集(包括训练集、验证集)输入网络并采取边训练边验证的方式进行学习,在模型达到一定饱和精度后,进行微调即解冻顶部部分卷积层和分类器一起进行训练,以此来提高模型精度,进入步骤五;
[0021]步骤五:使用测试集对训练完的神经网络模型进行预测,评测模型的泛化能力。
[0022]请参阅图2所示:
[0023]图2是本专利技术采用的迁移学习网络架构。训练好的卷积基负责提取图像特征,之后将这些图像特征传送给自定义的全连接层进行特征融合,最后再进行分类。当模型达到一定饱和精度时,进行微调即解冻顶部部分卷积层和分类器一起进行训练,以此来提高模型精度。
本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.本发明设计一种基于迁移学习的医学图像识别方法,其特征在于:主要用于解决医学疾病图像数据不足而导致分类模型出现精度较低、过拟合的问题,为了达到该目的,所采用的处理方法是采用已用大型数据集训练过的神经网络的部分结构以及自定义的全连接层作为整个神经网络模型来对已有的肺癌数据进行训练。2.根据权利要求1所述的一种基于迁移学学习的医学图像识别方法,其特征在于:在模型循环迭代训练达到一定饱和精度后采用微调方式来提高模型的精确度和训练效率。3.根据权利要求2所述的一种基于迁移学学习的医学图像识别方法,其特征在于:主要步骤是首先获取肺癌数据集,然后对数据集进行数据增强扩充样本量,并为这些数据设置相应的标签,之后将数据集分为训练集、验证集以及测试集,三者比例为6∶2∶2,之后将处理好的数据(包括训练集、验证集)输入到预训练网络中进行学习,在循环迭代训练达到一定饱和精度时,使用微调方式从卷积基中解冻顶部部分卷积层来和分类器一起进行训练,以此提高模型的精确度和训练效率,最后用测试集对训练好的神经网络模型进行预测评估。...

【专利技术属性】
技术研发人员:帅仁俊卢伟张雅婷
申请(专利权)人:南京工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1