一种双损失函数训练的残差网络和XGBoost的医学图像分类方法技术

技术编号:29760751 阅读:26 留言:0更新日期:2021-08-20 21:14
本发明专利技术公开了一种双损失函数训练的残差网络和XGBoost的医学图像分类方法,首先,收集医学图像数据集并将其划分为训练集和测试集;其次,对医学图像数据集进行预处理,将图像大小调整为224*224并且进行归一化处理;然后,搭建Resnet50网络作为模型的特征提取层,使用ELU激活函数替换Resnet50网络中残差块中的ReLU激活函数,并采用三元组损失以及中心损失共同训练Resnet50网络;之后,将Resnet50网络的最后一个全连接层移除,使用XGBoost作为模型的分类层;最后,使用训练集训练模型,将测试集输入训练好的模型得到分类结果。本发明专利技术使得同类样本特征更加靠近,不同类样本特征更加远离,有助于提高模型的分类精度;且分类效率高,在提高模型分类精度的同时,可以防止过拟合。

【技术实现步骤摘要】
一种双损失函数训练的残差网络和XGBoost的医学图像分类方法
本专利技术属于医学图像处理领域,涉及一种双损失函数训练的残差网络和XGBoost的医学图像分类方法。
技术介绍
医学影像技术的不断发展对疾病的诊治做出了巨大的贡献,使用影像学技术诊断疾病不仅效率高,而且对于传染性强的疾病而言,可以降低医患之间交叉感染的风险。医生通过分析患者的医学影像来诊断患者所患有的疾病种类。然而,能够准确分析医学影像的经验丰富的放射科医生在每个医院都属于稀缺人才,这使得人为检测的效率很低,所以,需要专利技术一种能够自动分析医学影像并进行准确判断的方法。目前自动诊断疾病的主流方法是使用AI技术,利用深度学习技术自动对医学图像进行分类。卷积神经网络是深度学习的代表算法之一,使用卷积神经网络对医学图像进行分类是当前的热门研究方向,选择一个合适的神经网络,使用医学图像作为数据训练神经网络,便可以使神经网络自动准确的分类医学影像从而达到准确诊断的目的。而使用神经网络对图像进行分类的关键在于神经网络提取到的图像的特征,本专利技术在选定的网络中使用三元组损失和中心损失共同训练网络,对网络中提取到的图像特征进行充分处理,最后使用XGBoost方法进行分类,进一步提高最终的分类精度。
技术实现思路
专利技术目的:本专利技术的目的是提供一种双损失函数训练的残差网络和XGBoost的图像分类方法,提高分类精度,提升模型的分类效果。技术方案:本专利技术提供一种双损失函数训练的残差网络和XGBoost的图像分类方法,具体包括以下步骤:(1)收集医学图像数据集,并将其划分为训练集和测试集;(2)对医学图像数据集进行预处理,将图像大小调整为224*224并且进行归一化处理;(3)搭建Resnet50网络作为模型特征提取层,使用ELU激活函数替换Resnet50网络中残差块中的ReLU激活函数,并采用三元组损失以及中心损失共同训练Resnet50网络;(4)将Resnet50网络网络的最后一个全连接层移除,使用XGBoost作为模型的分类层;(5)使用训练集训练模型,将测试集输入训练好的模型得到分类结果。进一步地,步骤(1)所述的训练集、验证集和测试集的比为8:2。进一步地,步骤(3)所述的采用三元组损失训练Resnet50网络过程如下:三元组损失由一个三元组<a,p,n>构成,一次输入三张成对图像,其中,a为训练集中选取的一个训练样本,p为与训练样本同一类别的样本,称为正样本,n为与训练样本不同类别的样本,称为负样本,三元组损失Ltri的计算公式为:Ltri=max(d(a,p)-d(a,n)+margin,0)其中,d(a,p)表示的是a和p之间的欧氏距离度量,d(a,n)表示的是a和n之间的欧氏距离度量,margin是a与p之间的距离和a与n之间的距离之间的间距,人为可控,偏小会难以区分相似的图像,偏大会导致网络不收敛,需要设置合理的margin值。进一步地,步骤(3)所述的中心损失训练Resnet50网络过程如下:其中,Lc表示中心损失,r表示样本的个数,u=1表示第一个样本,zu表示第u个样本提取到的特征,cyu表示第u个样本对应类别的所有样本的平均特征;Resnet50网络的总损失L的计算公式如下:L=Ltri+βLc其中,β是中心损失的平衡权重。进一步地,所述步骤(4)实现过程如下:设训练集为D={(gi,hi)},(D|=s,gi∈Rm,hi∈R),其中gi表示第i个样本,hi表示第i个样本的类别标签,s是训练集中样本个数,m是训练集中特征个数,Rm是由m个实数构成的实数集合,R表示实数集合,XGBoost是一个树集成模型,一共有K棵树,最小化目标函数Obj,Obj的定义如下:其中,是第i个样本的预测值,Ω(fk)表示第k棵树fk的复杂度,Ω是计算复杂度的公式符号。有益效果:与现有技术相比,本专利技术的有益效果:使用ELU激活函数替换Resnet50网络中残差块中的ReLU激活函数,可以使特征提取层学习更快并且对噪声有鲁棒性;使用三元组损失来训练特征提取层,可以增强欧式空间的类内紧凑性和类间可分性,也就是可以使得同类样本特征更加靠近,不同类样本特征更加远离,有助于提高模型的分类精度;添加中心损失配合三元组损失训练特征提取层,不仅可以进一步对提取到的特征进行处理,还可以弥补三元组损失的不足从而提高模型性能;使用XGBoost作为模型的分类层来进行最终的分类,效率高,在提高模型分类精度的同时,可以防止过拟合。附图说明图1是本专利技术的流程图;图2是修改后的残差模块图。具体实施方式下面结合附图对本专利技术作进一步详细说明。本专利技术提供一种双损失函数训练的残差网络和XGBoost的图像分类方法,如图1所示,具体包括以下步骤:步骤1:收集医学图像数据集,并将数据集划分为训练集和测试集。收集医学图像数据集,并根据神经网络需要大量数据进行训练的特性以及结合以往的实验经验将整个医学数据集的80%划分为训练集和20%的测试集。步骤2:为了统一标准对医学图像数据集进行预处理,将医学图像数据集中的图像大小调整为224*224并且进行归一化处理。步骤3:搭建Resnet50网络作为模型特征提取层,使用ELU激活函数替换Resnet50网络中残差块中的ReLU激活函数,使用ELU激活函数可以使特征提取层学习更快并且对噪声有鲁棒性,修改后的残差块如图2所示,输入残差块中的特征矩阵的深度为256维度,使用64个1*1的卷积核对其进行卷积,特征矩阵的深度降维到64维度,之后通过64个3*3的卷积核进行卷积,然后使用256个1*1的卷积核进行卷积,使得特征矩阵的深度升维到256维度,最后将输入的特征矩阵与经过3次卷积处理之后的特征矩阵相加,整个残差块中使用了3次ELU激活,分别是在第一次和第二次卷积以及最后相加操作之后。采用三元组损失以及中心损失共同训练Resnet50网络。使用三元组损失可以增强欧式空间的类内紧凑性和类间可分性,它由一个三元组<a,p,n>构成,所以,一次输入三张成对图像,(anchor)a指的是我们训练集中选取的一个CT训练样本,(positive)p是与训练样本同一类别的样本称为正样本,(negative)n是与训练样本不同类别的样本称为负样本,因此三元组损失Ltri的计算公式为:Ltri=max(d(a,p)-d(a,n)+margin,0)当d(a,p)-d(a,n)+margin大于0的时候Ltri的值是d(a,p)-d(a,n)+margin而当d(a,p)-d(a,n)+margin小于0的时候Ltri的值为0。其中,d(a,p)表示的是a和p之间的欧氏距离度量,d(a,n)表示的是a和n之间的欧氏距离度量,margin是a与p之间的距离和a与n之间的距离之间的间距,人为可控,偏本文档来自技高网...

【技术保护点】
1.一种双损失函数训练的残差网络和XGBoost的医学图像分类方法,其特征在于,包括以下步骤:/n(1)收集医学图像数据集,并其划分为训练集和测试集;/n(2)对医学图像数据集进行预处理,将图像大小调整为224*224并且进行归一化处理;/n(3)搭建Resnet50网络作为模型特征提取层,使用ELU激活函数替换Resnet50网络中残差块中的ReLU激活函数,并采用三元组损失以及中心损失共同训练Resnet50网络;/n(4)将Resnet50网络的最后一个全连接层移除,使用XGBoost作为模型的分类层;/n(5)使用训练集训练模型,将测试集输入训练好的模型得到分类结果。/n

【技术特征摘要】
1.一种双损失函数训练的残差网络和XGBoost的医学图像分类方法,其特征在于,包括以下步骤:
(1)收集医学图像数据集,并其划分为训练集和测试集;
(2)对医学图像数据集进行预处理,将图像大小调整为224*224并且进行归一化处理;
(3)搭建Resnet50网络作为模型特征提取层,使用ELU激活函数替换Resnet50网络中残差块中的ReLU激活函数,并采用三元组损失以及中心损失共同训练Resnet50网络;
(4)将Resnet50网络的最后一个全连接层移除,使用XGBoost作为模型的分类层;
(5)使用训练集训练模型,将测试集输入训练好的模型得到分类结果。


2.根据权利要求1所述的一种双损失函数训练的残差网络和XGBoost的医学图像分类方法,其特征在于,步骤(1)所述的训练集和测试集的比为8:2。


3.根据权利要求1所述的一种双损失函数训练的残差网络和XGBoost的医学图像分类方法,其特征在于,步骤(3)所述的采用三元组损失训练Resnet50网络过程如下:
三元组损失由一个三元组<a,p,n>构成,一次输入三张成对图像,其中,a为训练集中选取的一个训练样本,p为与训练样本同一类别的样本称为正样本,n为与训练样本不同类别的样本称为负样本,三元组损失Ltri的计算公式为为:
Ltri=max(d(a,p)-d(a,n)+margin,0)
其中,d(a,p)表示的是...

【专利技术属性】
技术研发人员:张小瑞周杰孙伟孙星明郑钰辉付章杰夏志华
申请(专利权)人:南京信息工程大学
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1