基于深度残差网络和Fisher向量技术的皮肤镜图像分类方法技术

技术编号：35444670 阅读：26 留言：0更新日期：2022-11-03 11:57

本发明专利技术公开了一种基于深度残差网络和Fisher向量技术的皮肤镜图像分类方法，首先使用数据集对预训练ResNet

全部详细技术资料下载

【技术实现步骤摘要】
基于深度残差网络和Fisher向量技术的皮肤镜图像分类方法

[0001]本专利技术属于图像处理
，具体涉及一种皮肤镜图像分类方法。

技术介绍

[0002]大多数传统的计算机辅助诊断皮肤病解决方案包括四个步骤，包括皮肤镜图像预处理、皮肤病变分割、特征提取和分类。大量手工制作皮肤病变的颜色、形状、大小和纹理等视觉特征首先在预处理的皮肤镜图像上提取，然后用于训练分类器。
[0003]传统方法以无监督的方式提取图像特征，而不需要大量的训练样本，这与其说是优点，不如说是缺点，因为几乎不可能找到一组最佳的手工特征或最准确的分类器。因此，传统方法在皮肤病变的诊断中通常表现相对较差。
[0004]自从AlexNet在2012年ImageNet挑战赛中赢得冠军以来，深度卷积神经网络 (DCNN)已普遍应用于许多视觉应用，并取得了显着的成功，包括图像分类、图像分割和目标检测。这种成功促使许多研究人员在医学图像分析中使用DCNN。然而， DCNN因其具有数百万个可学习参数而受到广泛批评，这使得当数据集不够大时，它容易过度拟合训练数据集。不幸的是，在皮肤镜图像分类中通常有一个小数据集，这与获取图像数据然后图像注释所需的工作有关。因此，DCNN在皮肤病变诊断任务上的表现不如在ImageNet挑战赛中的表现。为了解决这种"小样本"深度学习问题，建议将深度模型的表示能力与传统的特征聚合和分类技术相结合。
[0005]通过使用DCNN，在各种图像分类任务上取得了许多突破，通过提供统一的特征提取/>‑
分类框架，使用户摆脱了麻烦的手工特征提取。由于DCNN模型在图像分类任务中具有高性能，因此它也被用于皮肤病变分类：Esteva等人提出了一个模型，该模型在近129450张皮肤病图像上进行训练，并与21名具有专科医师资格的皮肤科医生在诊断最常见和最致命的皮肤癌方面的表现相匹配。Ge等人提出了一种具有显著性特征描述符的多模态DCNN模型，该模型由于其能够捕获皮肤镜图像和临床摄影图像上的判别特征，因此在分类任务中达到了优于单模态方法的性能。Zhang等人设计了一个端到端协同深度学习(SDL)模型。与其基本版本不同，其具有协同网络来预测输入图像对是否属于同一类，双DCN能够在训练过程中相互促进。Romero等人已经将迁移学习范式应用于VGGNet，VGGNet被用作皮肤镜图像分类的骨干网络。
[0006]皮肤病变分类也可以在分割后进行，因为该分类仅与病变区域相关，因此提出了另一组多任务DCNN模型。Yu等人提出的两阶段框架在第一阶段使用全卷积残留网络(FCRN)进行皮肤病变分割，基于该框架，在第二阶段使用非常深的残留网络对皮肤死亡进行分类。设计了新型CNN阻滞，将病变区域识别和病变分割整合到诊断管道中。同时，分割结果在分类过程中影响较大，具有像素级注释的可用皮肤镜图像较少，用于分类的两阶段"分割到分类"方法可能达到较低的准确性。
[0007]Fisher向量技术在2011年赢得了ImageNet挑战赛，为构建基于局部视觉描述符的高级语义图像特征提供了一种有效的方法，例如尺度不变特征变换(SIFT)和局部二进
制模式(LBP)。由于DCNN学习的特征图可以被视为局部特征，因此将DCNN 的强度与Fisher矢量技术相结合成为一种直接且具有竞争力的策略，以提高DCNN在图像分类任务中的性能。
[0008]FV(Fisher Vector)编码可以应用于DCNNS学习的特征映射，而不是本地视觉描述符(如SIFT和LBP)。Cimpoi等人将DCNN最后两层生成的特征图编码为FV 以进行纹理理解。Dixit等人提出了一种语义FV来编码DCNN的输出以进行场景分类。Tang等人提出了FisherNet，该网络在CNN中添加了Fisher层以构建端到端可训练系统，并且在PASCAL VOC数据集的分类准确性和计算效率方面具有明显的优势。 Simonyan等人pro145提出将FV堆叠在类似于神经网络的多层中，从而以明显更小的计算成本实现深度卷积网络的竞争结果。Nagel等人引入了Event Fisher向量，编码预先训练的DeepNets的特征，以描述图像集合或视频的顺序帧，以构建视觉图像流中事件识别的紧凑表示。Liu等人提出了两种新的Fisher向量编码策略来编码预先训练的 CNN的激活，包括基于稀疏编码的Fisher向量编码(SCFVC)和基于混合稀疏编码的 Fisher向量编码(HSCFVC)，它们在各种图像分类任务中实现了优于经典Fisher向量编码(FVC)的性能。

技术实现思路

[0009]为了克服现有技术的不足，本专利技术提供了一种基于深度残差网络和Fisher向量技术的皮肤镜图像分类方法，首先使用数据集对预训练ResNet
‑
50模型进行训练，得到 ftResNet，再采用ftResNet进行特征提取，提取的特征视为视觉描述符；将获得的特视觉描述符编码为FV；最后用得到的FV训练SVM对测试图像进行分类；本专利技术方法能够大幅提供对皮肤病变分类的准确性。
[0010]本专利技术解决其技术问题所采用的技术方案包括如下步骤：
[0011]步骤1：使用数据集对预训练ResNet
‑
50模型进行训练；
[0012]使用在ImageNet数据库上预训练的ResNet
‑
50模型作进行特征提取；ResNet
‑
50 模型包括一个通用卷积层、一个最大池化层，多个残留块和一个全连接层，为了将预先训练的ResNet
‑
50应用于皮肤病变分类，最后一个全连接层只保留前七个神经元，并删除该层中的其他神经元和相关权重；
[0013]采用皮肤镜图像数据库作为数据集；将数据集中的图像进行随机裁剪，用于数据增强；并将裁剪后的图片大小调整为224
×
224；使用批大小为32的随机梯度下降SGD 算法作为优化器，以最小化交叉熵损失对ResNet
‑
50模型进行训练，训练完成后得到 ftResNet；
[0014]步骤2：采用ftResNet进行特征提取，并进行缩放，不同的取值代表不同的缩放大小；
[0015]用因子2
s
，s＝
‑
2，
‑
1.5，
···
，1，获得7个增强；
[0016]将增强后的图像输入ftResNet，将ftResNet中res5c_branch2a层的输出作为特征图，该特征图被视为视觉描述符，其维度为D＝512；
[0017]步骤3：将获得的特征图编码为FV；
[0018]设X＝{x
k
∈R
D
；k＝1,...,K}为从K幅图像中获得描述符；
[0019]假设生成过程由X具有参数u
θ
的GMM建模θ＝{ω
l<本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于深度残差网络和Fisher向量技术的皮肤镜图像分类方法，其特征在于，包括如下步骤：步骤1：使用数据集对预训练ResNet
‑
50模型进行训练；使用在ImageNet数据库上预训练的ResNet
‑
50模型作进行特征提取；ResNet
‑
50模型包括一个通用卷积层、一个最大池化层，多个残留块和一个全连接层，为了将预先训练的ResNet
‑
50应用于皮肤病变分类，最后一个全连接层只保留前七个神经元，并删除该层中的其他神经元和相关权重；采用皮肤镜图像数据库作为数据集；将数据集中的图像进行随机裁剪，用于数据增强；并将裁剪后的图片大小调整为224
×
224；使用批大小为32的随机梯度下降SGD算法作为优化器，以最小化交叉熵损失对ResNet
‑
50模型进行训练，训练完成后得到ftResNet；步骤2：采用ftResNet进行特征提取，并进行缩放，不同的取值代表不同的缩放大小；用因子2
s
，s＝
‑
2，
‑
1.5，
…
，1，获得7个增强；将增强后的图像输入ftResNet，将ftResNet中res5c_branch2a层的输出作为特征图，该特征图被视为视觉描述符，其维度为D＝512；步骤3：将获得的特征图编码为FV；设X＝{x
k
...

【专利技术属性】
技术研发人员：夏勇，胡航语，陈梓杨，
申请(专利权)人：西北工业大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人