本发明专利技术公开了一种基于多示例学习的病理图像细胞识别方法,包括以下步骤:S1:采集细胞组织图像,并进行预处理;S2:建立预测模型;S3:将待测细胞图像数据输入至预测模型,进行病理图像细胞识别。本发明专利技术利用整个组织图片的标签对单个细胞图片进行训练,从而网络拥有对单个细胞进行识别的能力,弥补了传统的以整图训练的神经网络无法对单个细胞进行预测的缺陷。本发明专利技术运用多示例学习的学习方法弥补了传统预测模型中无法对没有标签的细胞进行预测的缺陷。该模型可以在医学智能应用中,为构建自动辅助诊断和治疗系统提供重要技术手段。辅助诊断和治疗系统提供重要技术手段。辅助诊断和治疗系统提供重要技术手段。
【技术实现步骤摘要】
一种基于多示例学习的病理图像细胞识别方法
[0001]本专利技术属于机器学习和深度学习
,具体涉及一种基于多示例学习的病理图像细胞识别方法。
技术介绍
[0002]病理图像是从被检测者身体中取出的患病组织,加以H&E染色后得到的切片图像。由于这种染料只会和细胞发生反应,因此被H&E染色的组织结构中,只有细胞才会被染上颜色。这样病理医生就可以直接对细胞进行观察和计数。它对于病人患病情况的诊断具有重要作用。传统的检测方法是医生直接使用显微镜观察,或肉眼观察放大的图片,以对细胞进行识别,发现阳性细胞,计算阳性率。人工的识别优点是正确率较高,一般不会出现错误。但是缺点也很明显,不同的人可能会在某些细胞上判断不一,有主观性;耗费受训练的专业人员的时间,并且效率低下;观测结果往往是通过估算得到的。由于这些原因,大量的病理图像都要么是无标签的,或者整张病理图像仅仅有“有癌”和“无癌”的标签,而图片中的具体区域和具体细胞是没有标签的。
[0003]计算机处理这样图片的方法很多。传统的图片处理方法会使用一些算子得到特征,再将特征进行统计运算。或者人工分割图像,对有特征的区域进行计算获得特征向量,最后使用分类器进行运算。而由于带有细胞标签的数据过少,难以训练针对细胞本身的分类器。
技术实现思路
[0004]本专利技术的目的是为了解决一般分类算法的问题,提出了一种基于多示例学习的病理图像细胞识别方法。
[0005]本专利技术的技术方案是:一种基于多示例学习的病理图像细胞识别方法包括以下步骤:
[0006]S1:采集细胞组织图像,并进行预处理;
[0007]S2:基于预处理后的图像建立预测模型;
[0008]S3:将待测细胞图像数据输入至预测模型,进行病理图像细胞识别。
[0009]本专利技术的有益效果是:本专利技术利用单个细胞图片和整个组织图片的标签进行训练,从而网络拥有对单个细胞进行识别的能力,弥补了传统的以整图训练的神经网络无法对单个细胞进行预测的缺陷。本专利技术运用多示例学习的学习方法弥补了传统预测模型中无法对没有标签的细胞进行预测的缺陷。该模型可以在医学智能应用中,为构建自动辅助诊断和治疗系统提供重要技术手段。
[0010]进一步地,步骤S1包括以下子步骤:
[0011]S11:采集细胞组织图像,并将细胞组织图像中的细胞标注以CSV文件的形式存储;
[0012]S12:将CSV文件的列作为细胞组织中心点的横坐标和纵坐标,并将其分为训练集和测试集;
[0013]S13:随机选择其中一张细胞组织图像,利用staintools包训练均值器;
[0014]S14:利用训练后的均值器对训练集和测试集进行归一化,并基于细胞组织中心点的横坐标和纵坐标,利用sci
‑
image读取归一化后的细胞图像,完成预处理。
[0015]上述进一步方案的有益效果是:在本专利技术中,对所有训练集和测试集图片文件,都先用均值器Normalizer进行归一化处理再进行运算。得到的图像既包含了细胞特征,也包含了细胞周围的特征。
[0016]进一步地,步骤S2包括以下子步骤:
[0017]S21:将ResNet网络作为特征提取器,输出单个细胞特征,并进行迁移学习;
[0018]S22:将归一化后的整个细胞组织图像中每个进行迁移学习后的细胞特征作为图片阳性率特征,输入多示例学习层进行聚合;
[0019]S23:将聚合后的输出作为整个细胞组织图像的预测概率,并利用优化函数进行训练,完成预测模型的建立。
[0020]上述进一步方案的有益效果是:在本专利技术中,为了高效快速地提取细胞特征,使用高性能的ResNet网络。而由于细胞图像较小,因此一般采用ResNet家族中ResNet50或者ResNet18这样比较小的网络。
[0021]进一步地,步骤S21中,若细胞组织图像数量少于200张,则采用ResNet18网络;若细胞组织图像数量多于200张,则采用ResNet50网络;进行迁移学习时,在ResNet网络的输出层添加一个输入形状为1000
×
1,输出为相应分类数目的线性层。
[0022]进一步地,步骤S22中,多示例学习层进行聚合的计算公式为:
[0023][0024]其中,g({p
j
})表示整个细胞组织图像的阳性概率,|j|表示每个组织细胞图像中所含有细胞个数,p
j
表示每个单个细胞的阳性预测概率,r表示超参数。
[0025]进一步地,步骤S23中,优化函数为交叉熵损失函数,优化器设置为Adam优化器,学习率为0.001。
附图说明
[0026]图1为病理图像细胞识别方法的流程图。
具体实施方式
[0027]下面结合附图对本专利技术的实施例作进一步的说明。
[0028]在描述本专利技术的具体实施例之前,为使本专利技术的方案更加清楚完整,首先对本专利技术中出现的缩略语和关键术语定义进行说明:
[0029]sci
‑
image:图像处理软件包。
[0030]如图1所示,本专利技术提供了一种基于多示例学习的病理图像细胞识别方法,包括以下步骤:
[0031]S1:采集细胞组织图像,并进行预处理;
[0032]S2:基于预处理后的图像建立预测模型;
[0033]S3:将待测细胞图像数据输入至预测模型,进行病理图像细胞识别。
[0034]在本专利技术实施例中,如图1所示,步骤S1包括以下子步骤:
[0035]S11:采集细胞组织图像,并将细胞组织图像中的细胞标注以CSV文件的形式存储;
[0036]S12:将CSV文件的列作为细胞组织中心点的横坐标和纵坐标,并将其分为训练集和测试集;
[0037]S13:随机选择其中一张细胞组织图像,利用staintools包训练均值器;
[0038]S14:利用训练后的均值器对训练集和测试集进行归一化,并基于细胞组织中心点的横坐标和纵坐标,利用sci
‑
image读取归一化后的细胞图像,完成预处理。
[0039]在本专利技术中,对所有训练集和测试集图片文件,都先用均值器Normalizer进行归一化处理再进行运算。得到的图像既包含了细胞特征,也包含了细胞周围的特征。测试集和训练集一般是以7:3或者8:2的比例从数据样本中随机选取。
[0040]在本专利技术实施例中,如图1所示,步骤S2包括以下子步骤:
[0041]S21:将ResNet网络作为特征提取器,输出单个细胞特征,并进行迁移学习;
[0042]S22:将归一化后的整个细胞组织图像中每个进行迁移学习后的细胞特征作为图片阳性率特征,输入多示例学习层进行聚合;
[0043]S23:将聚合后的输出作为整个细胞组织图像的预测概率,并利用优化函数进行训练,完成预测模型的建立。
[0044]在本专利技术中,为本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种基于多示例学习的病理图像细胞识别方法,其特征在于,包括以下步骤:S1:采集细胞组织图像,并进行预处理;S2:基于预处理后的图像建立预测模型;S3:将待测细胞图像数据输入至预测模型,进行病理图像细胞识别。2.根据权利要求1所述的基于多示例学习的病理图像细胞识别方法,其特征在于,所述步骤S1包括以下子步骤:S11:采集细胞组织图像,并将细胞组织图像中的细胞标注以CSV文件的形式存储;S12:将CSV文件的列作为细胞组织中心点的横坐标和纵坐标,并将其分为训练集和测试集;S13:随机选择其中一张细胞组织图像,利用staintools包训练均值器;S14:利用训练后的均值器对训练集和测试集进行归一化,并基于细胞组织中心点的横坐标和纵坐标,利用sci
‑
image读取归一化后的细胞图像,完成预处理。3.根据权利要求1所述的基于多示例学习的病理图像细胞识别方法,其特征在于,所述步骤S2包括以下子步骤:S21:将ResNet网络作为特征提取器,输出单个细胞特征,并进行迁移学习;S22:将归一化后的整个细胞组织图像中每个进行迁移学习后的细胞特征作为图片阳...
【专利技术属性】
技术研发人员:付波,付灵傲,叶丰,步宏,
申请(专利权)人:电子科技大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。