基于残差和金字塔切分注意力的眼底硬渗出物分割方法技术

技术编号：41156645 阅读：20 留言：0更新日期：2024-04-30 18:20

本发明专利技术公开一种基于残差和金字塔切分注意力的眼底硬渗出物分割方法，该方法采用预训练的ResNet50作为UNet网络的主干特征提取部分，增强眼底图像特征的提取能力；在UNet网络的瓶颈层添加PSA模块，可以获取多尺度感受野，有效地提取更细粒度的多尺度空间信息；在UNet网络的跳跃连接之间加入改进的残差注意力机制模块,可以降低浅层冗余信息的干扰，同时避免了网络可能出现的退化现象；此外，为了解决正负样本不均衡问题，设计了一种加权交叉熵损失和Dice Loss的联合损失函数。本发明专利技术方法对于改善眼底图像分析的准确性和鲁棒性具有重要意义，为眼底疾病的早期诊断和治疗提供更可靠、高效的辅助工具，有望对糖尿病性视网膜病变的诊断和预防产生重要影响。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及计算机图像分割领域，尤其涉及一种基于残差和金字塔切分注意力的眼底硬渗出物分割方法。

技术介绍

1、糖尿病视网膜病变(diabetic retinopathy,dr)作为糖尿病最主要的微血管并发症，严重影响患者的视力甚至可能导致失明。硬渗出物作为糖尿病视网膜早期的重要标志物之一，对于判断糖尿病视网膜病变的分期具有十分重要的意义。硬渗出物分割是dr诊断和治疗中的关键环节，通过分割出视网膜图像中的病变区域，可以准确定位和量化病变范围，帮助医生进行病情评估和治疗决策。目前，眼底硬渗出物的临床检测主要依赖专业眼科医生手动诊断，不仅耗时费力，而且易受医生主观因素的影响。因此，迫切需要一种自动化的硬渗出物病变分割方法。

2、针对硬渗出物病变的分割方法，主要分为两类：传统分割方法和深度学习方法。传统分割方法依赖于图像处理技术和基于特征工程，通过手动提取图像特征，如颜色、纹理、边缘等，并结合阈值分割、边缘检测、区域生长等技术，进行硬渗出物的识别和分割。然而，传统方法在处理复杂背景和病变重叠的情况下表现不佳。在多样化的眼底图像中，难以捕获到所有特征，导致分割精度和鲁棒性不足。此外，对于特定阈值和参数的选择高度依赖于人工经验，使得这些方法在实际应用中面临一定的局限性。

3、深度学习方法近年来在眼底图像分割中迅速崛起，以其强大的特征学习和自适应性在硬性渗出物分割任务中获得了广泛应用。深度学习方法通过cnn等模型对眼底图像进行端到端的学习，避免手动特征提取的繁琐过程，深度学习网络结构能够自动学习特征，并在大量标记数据

4、此外，眼底图像本身的复杂性和多样性给分割任务带来了挑战，眼底图像具有不同光照条件、尺度、病变类型和形态变化，这使得传统的图像处理技术和深度学习模型在处理硬渗出物时面临困难。而且硬渗出物还会受到其他病变的影响，这也增加了分割的难度。

技术实现思路

1、本专利技术所要解决的技术问题是：由于硬渗出物病变的形态复杂多样，病变目标较小、边界模糊、多尺度特征提取困难等问题，导致现有的硬渗出物分割方法难以实现病变区域的精确分割，因此，本专利技术基于深度学习和图像处理技术，结合金字塔切分注意力模块、改进残差结构，构建了一种新的分割网络模型，从而实现眼底硬渗出物的精确分割。采用该分割网络模型，眼底硬渗出物的分割性能得到提升。

2、为解决上述技术问题，本专利技术采取的技术方案如下：设计基于残差和金字塔切分注意力的眼底硬渗出物分割方法，其特征在于，该方法包括下述步骤：

3、步骤1：获取眼底硬渗出物分割数据集

4、获取眼底彩色图像，首先对其进行尺寸归一化处理，然后通过labelme标注工具对眼底彩色图像中的硬渗出物病变区域进行人工标注，生成标签图像，其中硬渗出物病变区域被标记为“硬渗出物”类别，其他区域标记为“非硬渗出物”类别，即为“背景”区域，得到硬渗出物分割数据集；硬渗出物分割数据集中的一个数据样本为一张眼底彩色图像和一张对应的标签图像，将获得的硬渗出物分割数据集按照9：1的数量比例随机划分为训练集和测试集；

5、步骤2：对训练集和测试集的眼底彩色图像和对应的标签图像进行预处理

6、对训练集和测试集进行预处理，具体为：采用中值滤波法去除每个数据集中的眼底彩色图像中的噪声，同时对眼底彩色图像进行裁剪，裁剪掉眼底彩色图像中黑色冗余边框，只保留眼底彩色图像中感兴趣区域；

7、步骤3：对经过步骤2预处理后的训练集和测试集进行patch处理

8、对训练集和测试集分别进行patch处理，具体为：采用随机裁剪法对训练集中的眼底彩色图像和标签图像进行随机裁剪，裁剪后的眼底彩色图像和标签图像大小为256×256；采用滑动窗口法对测试集中的眼底彩色图像和标签图像进行切片处理，步长为128，切片后的眼底彩色图像和标签图像大小为256×256；对于随机裁剪或切片处理得到的不含有病变区域的子图进行剔除，以确保每张子图都含有病变区域；

9、步骤4：对经过步骤3patch处理后的训练集和测试集进行数据增强

10、对经过patch处理后的训练集中的眼底彩色图像和对应的标签图像进行数据增强，得到训练数据集；对经过patch处理后的测试集中的眼底彩色图像和对应的标签图像进行数据增强，得到测试数据集；

11、步骤5：构建眼底硬渗出物分割网络模型

12、所述眼底硬渗出物分割网络模型包括主干特征提取部分、多尺度特征增强模块psa、rse模块部分以及解码器部分；

13、所述主干特征提取部分包括五个特征提取模块，分别为res-block1、res-block2、res-block3、res-block4和res-block5，每一个特征提取模块后面连接一个最大池化层操作；

14、所述res-block1由一个7×7卷积层、bn层、relu激活函数和最大池化操作依次串联构成，用于对输入图像的预处理，对于输入图像k，经过res-block1处理后，输出特征图f0；res-block2、res-block3、res-block4和res-block5结构相似，分别依次由3、4、6、3个bottleneck残差块串联组成；每个bottleneck残差块包括1×1卷积、3×3卷积、1×1卷积、relu激活函数和恒等映射identity，对于输入特征图x，首先依次经过1×1卷积、3×3卷积、1×1卷积处理，将卷积处理的最终结果和x的恒等映射identity进行相加操作，然后经过relu激活函数，得到该bottleneck残差块的输出；多个bottleneck残差块串联时，则前一个bottleneck残差块的输出作为后一个bottleneck残差块的输入；

15、特征图f0经过一个最大池化层操作，再经过res-block2的3个bottleneck残差块处理后，得到特征图f1；特征图f1经过一个最大池化层操作，再经过res-block3的4个bottleneck残差块处理后，得到特征图f2；特征图f2经过一个最大池化层操作，再经过res-block4的6个bottleneck残差块处理后，得到特征图f3；特征图f3经过一个最大池化层操作，再经过res-block5的3个bottleneck残差块处理后，得到特征图f4；

16、输入图像k的大小为256×256，经过5次下采样后，输出的特征图f4大小为16×16；

17、所述多尺度特征增强模块为金字塔切分注意力psa模块，所述psa模块串联在res-block5之后，对特征图f4经过一个最大池化层操作得到的特征图y进行特征增强；psa模块是由spc模块和se weight模块组成，首先，利用多尺度特征提取算子spc将输入的病灶特征图拆分成s块，获得通道方面的多尺度特征图，接着，利用本文档来自技高网...

【技术保护点】

1.基于残差和金字塔切分注意力的眼底硬渗出物分割方法，其特征在于，该方法包括下述步骤：

2.根据权利要求1所述的基于残差和金字塔切分注意力的眼底硬渗出物分割方法，其特征在于，步骤4中，数据增强的方式为水平翻转、垂直翻转、随机裁剪、随机旋转、自适应直方图均衡化CLAHE、Gamma变换中的至少一种。

3.根据权利要求1所述的基于残差和金字塔切分注意力的眼底硬渗出物分割方法，其特征在于，所述眼底硬渗出物分割网络模型基于深度学习框架Pytorch实现，Python版本为3.8，GPU型号为NVIDIA RTX 3090、24G显存、Cuda11.3，操作系统为Ubuntu20.04。

4.根据权利要求1所述的基于残差和金字塔切分注意力的眼底硬渗出物分割方法，其特征在于，步骤6中，预测概率的计算方法为：眼底硬渗出物分割网络模型对输入的眼底彩色图像进行前向传播后产生预测标签图像，预测标签图像的每个像素点都包含了模型对各个类别的原始分数，然后经过Sigmoid函数，将其映射为属于每个类别的概率。

5.根据权利要求1所述的基于残差和金字塔切分注意

...

【技术特征摘要】

1.基于残差和金字塔切分注意力的眼底硬渗出物分割方法，其特征在于，该方法包括下述步骤：

2.根据权利要求1所述的基于残差和金字塔切分注意力的眼底硬渗出物分割方法，其特征在于，步骤4中，数据增强的方式为水平翻转、垂直翻转、随机裁剪、随机旋转、自适应直方图均衡化clahe、gamma变换中的至少一种。

3.根据权利要求1所述的基于残差和金字塔切分注意力的眼底硬渗出物分割方法，其特征在于，所述眼底硬渗出物分割网络模型基于深度学习框架pytorch实现，python版本为3.8，gpu型号为nvidia rtx 3090、24g显存、cuda11.3，操作系统为ubuntu20.04。

4.根据权利要求1所述的基于残差和金字塔切分注意力的眼底硬渗出物分割方...

【专利技术属性】
技术研发人员：池越，王志鲁，王劭奇，
申请(专利权)人：河北工业大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人