System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及医学图像的细胞核分割和分类,具体涉及到一种基于域适应的弱监督细胞核分类方法。
技术介绍
1、数字病理图像被认为是临床诊断和治疗的重要依据,通过扫描组织切片创建的高分辨图像可以提供清晰的组织结构信息,便于病理学家清楚的观察组织和细胞的内部结构,可以提高疾病诊断的效率和准确性。细胞核的形态和结构变化是诸多疾病发生的重要指示,而细胞核的精准分类有助于帮助病理医生判断肿瘤区域和肿瘤类型,因此病理图像中的细胞核的精准分割和分类对于推动精准治疗具有重大意义。
2、由于不同类型的细胞核可能会具有相似的形态和结构特征,而且同一种类的细胞核在不同阶段同样存在较大差异,因此对于细胞核的分类依然是一个巨大挑战。传统的细胞核分类方法主要是通过提取细胞核内部的形态,纹理和拓扑等特征,然后利用机器学习算法(支持向量机,随机森林等)完成细胞核的分类预测,然而这些方法对于手工特征的设计过度依赖,如果特征的代表性不强或者手工特征的数量不足以支撑分类器判断,则会降低细胞核分类的准确性,没有临床治疗的价值。随着深度学习技术的发展成熟,卷积神经网络在自然图像有良好分类性能的模型也逐渐应用到细胞核分类中,hover-net利用了核像素到质心的水平和垂直距离有效地解决的细胞核的边界重叠问题,并设计三个分支先从背景中分离出核像素,再分离边界重叠的细胞核,最后聚和细胞的核像素预测类型,这是第一个可以对组织病理图像同时进行细胞核分割和分类的深度神经网络,但是这种方法需要依靠大量带有细胞核分割和分类标注的数据来进行训练,在实际操作中耗费大量时间和经济成本
技术实现思路
1、针对现有技术中存在的问题,本专利技术的主要目的是提出一种基于域适应的弱监督细胞核分类任务的方法,最终目的是为了减小源域和目标域之间的数据差异,达到可以同时对源域和目标域数据中多种细胞核同时分类的效果。首先选取两个广泛应用的具有标签的病理图像细胞核数据集分别作为域适应方法中的源域和目标域数据,根据两个数据集的标签值将单个细胞裁剪出来。然后利用卷积神经网络对单个细胞图像进行特征提取,并采用全连接网络作为分类器对训练数据进行细胞核分类。同时采用弱监督学习方法对整个训练过程监督,以达到减少源域和目标域之间数据差异的效果。本专利技术与现有的技术相比具有明显的进步和优势,可以有效的解决现有细胞核分类技术中标注数据少,数据集之间差异大等诸多问题,可以同时达到更加准确完善的细胞核分类效果。
2、为了实现上述目的,本专利技术提供了一种基于域适应的弱监督细胞核分类方法,包括以下步骤:
3、步骤1)对两个细胞核数据集进行裁剪预处理,并且构造对应的新数据集;
4、步骤2)基于源域数据集使用卷积神经网络提取特征,并且进行高维映射;
5、步骤3)基于源域数据的预训练网络对目标域数据进行特征提取和高维映射;
6、步骤4)在高维映射空间中通过高斯混合模型实现目标域数据向源域数据对齐和标签传递;
7、步骤5)迭代步骤4)过程,直到所有目标域数据完成数据对齐和标签传递;
8、步骤6)使用分类器模型对完成数据整合和标签传递的目标域数据进行细胞核分类预测;
9、进一步,所述步骤1)中的细胞核数据集的裁剪和预处理,包括:
10、对输入的rgb细胞核图像数据通过label确定mask值;
11、通过单个细胞核的mask确定细胞核的边界轮廓,并以此计算细胞核的最小外接矩形和轮廓的几何矩;
12、利用矩计算单个细胞核的质心坐标;
13、通过细胞核的质心坐标和最小外接矩形裁剪源域和目标域的细胞核图像数据。
14、进一步,所述步骤2)中基于源域数据的特征提取和高维映射,包括:
15、基于源域数据的数据增强(平移,旋转,缩放)的图像预处理;
16、使用残差神经网络resnet对源域中有标签值的细胞核图像数据进行特征提取;
17、将生成的特征图进行全局平均池化,每个特征图的空间维度缩减为单个值,形成高维特征向量;
18、使用分类器基于细胞特征进行源域数据的初始类别预测,判断细胞特征的区分能力,基于分类损失评估细胞分类模型的可靠性。
19、进一步,所述步骤3)中对目标域数据进行特征提取和高维映射,包括:
20、基于目标域数据的数据增强(平移,旋转,缩放)的图像预处理;
21、基于预训练网络resnet对目标域数据中没有标签值的细胞核图像数据进行特征提取;
22、计算特征提取得到特征图的高维映射的特征向量。
23、进一步,所述步骤4)中数据对齐和标签传递,包括:
24、在高维空间中将源域中带有标签的已知细胞类别空间远离,没有标签的目标域数据空间聚拢;
25、对源域数据和目标域数据建立高斯混合模型,帮助寻找目标域中的异常样本,提高系统的鲁棒性;
26、对比源域中已知细胞类别的细胞特征和目标域计算得到的特征;
27、对齐源域和目标域的细胞分类特征;
28、将已对齐的源域标签传递给目标域。
29、进一步,所述步骤5)具体步骤,包括:
30、统计还未具有细胞标签的目标域数据;
31、迭代上述数据对和源域向目标域标签传递步骤;
32、逐渐缩小源域和目标域之间的数据差异,直到所有未知类型都带有细胞标签。
33、进一步,所述步骤6)具体步骤,包括:
34、使用在源域数据上进行细胞分类的全连接层作为分类器;
35、基于预训练的分类器对目标域数据进行最终的细胞核分类。
36、本专利技术的设计思路为:首先选取两个广泛应用的具有标签的病理图像细胞核数据集数据集分别作为域适应方法中的源域和目标域数据,并且根据标签值将单个细胞核裁剪,构造一个以单个细胞核图像和对应细胞类型的标签值的新数据集,然后对源域和目标域的细胞核图像进行特征提取,特征提取过程可以使用卷积神经网络作为编码器,对提取的特征建立高斯混合数学模型,实现数据交互和标签传递,在此过程通过多次迭代的方法实现源域标签向目标域数据传递,以达到减小源域和目标域数据差异的效果。最后使用分类器对目标域的全部数据进行细胞核分类,解决当前细胞核标注稀少、数据差异大等细胞核分类任务中的主要困难。
37、与现有的技术相比,本专利技术的有益效果如下:本专利技术基于域适应的弱监督细胞核分类的方法,通过域适应可以减小源域和目标域之间的数据差异,改善数据集成的问题,基于弱监督学习可以降低对细胞注释的标签依赖,改善细胞核分类的准确度,更加符合临床需求。相对与其他的细胞核分类方法在硬件需求,数据标签依赖,泛化能力以及整体分类任务效果都有所优化。
本文档来自技高网...【技术保护点】
1.一种基于域适应的弱监督细胞核分类方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种基于域适应的弱监督细胞核分类方法,其特征在于,所述步骤1)中的细胞核数据集的裁剪和预处理过程如下:
3.根据权利要求1所述的一种基于域适应的弱监督细胞核分类方法,其特征在于,所述步骤2)的具体过程如下:
4.根据权利要求1所述的一种基于域适应的弱监督细胞核分类方法,其特征在于,所述步骤3)的具体过程如下:
5.根据权利要求1所述的一种基于域适应的弱监督细胞核分类方法,其特征在于,所述步骤4)的具体过程如下:
6.根据权利要求1所述的一种基于域适应的弱监督细胞核分类方法,其特征在于,所述步骤5)具体步骤,包括:
7.根据权利要求1所述的一种基于域适应的弱监督细胞核分类方法,其特征在于,所述步骤6)具体步骤,包括:
【技术特征摘要】
1.一种基于域适应的弱监督细胞核分类方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种基于域适应的弱监督细胞核分类方法,其特征在于,所述步骤1)中的细胞核数据集的裁剪和预处理过程如下:
3.根据权利要求1所述的一种基于域适应的弱监督细胞核分类方法,其特征在于,所述步骤2)的具体过程如下:
4.根据权利要求1所述的一种基于域适应的弱监督细胞核分类...
【专利技术属性】
技术研发人员:何敏,王迎春,李国君,
申请(专利权)人:中国科学院杭州医学研究所,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。