一种细胞自动检测方法技术

技术编号:36339093 阅读:21 留言:0更新日期:2023-01-14 17:51
本发明专利技术涉及医学图像处理技术领域,具体涉及一种细胞自动检测方法,在YOLOV7的基础上使用了主动学习协同半监督学习的算法框架与采样策略,通过主动学习策略选择样本识别效果差的样本给人工专家进行标注,再根据半监督学习策略选择样本识别效果好的样本和生成的伪标签作为真实值扩充已标注样本;在选择策略中,针对具体分类场景,融合了伪标签的信息熵和相似度信息来计算伪标签的不确定性,相比其他机器学习方法,本发明专利技术的基于深度学习的YOLOV7目标检测框架能够更精确地检测与识别多种尺度大小以及各种形态视角的细胞,有效避免了传统细胞形态学算法在视角和细胞尺寸问题所造成的漏检和识别率低的状况。的漏检和识别率低的状况。的漏检和识别率低的状况。

【技术实现步骤摘要】
一种细胞自动检测方法


[0001]本专利技术涉及医学图像处理
,具体涉及一种细胞自动检测方法。

技术介绍

[0002]当前细胞的检测主要依赖于专家的人工镜检,所以标准不一,检测过程费时费力,价格又贵;而细胞自动检测技术又分为人工特征法和深度学习法两类,其中人工特征法是通过数据库比对,来检测识别细胞,这就需要人工建立庞大的特征数据库,代价高昂;深度学习法虽然避免了人工特征法需要人为提取特征的缺点,但是依赖于大规模标注数据集训练模型,由于标记代价高,实际中也无法获取这么多标记数据。而且在检测时,容易出现漏检,识别标记不全,准确率不高、检测时间长等情况。

技术实现思路

[0003]本专利技术的目的在于提供一种细胞自动检测方法,提出了一种细胞自动检测方法,改善现有基于深度学习的细胞自动检测技术中因过分依赖于大规模标注数据集出现漏检、识别标记不全、准确率低和检测时间长的技术问题。
[0004]为实现上述目的,本专利技术提供了一种细胞自动检测方法,包括下列步骤:
[0005]步骤1:采集大量细胞显微图像作为样本集,每张图片为一个样本;
[0006]步骤2:在所述样本集中选择少量样本并进行人工标注及定义,其中获得有标签的样本集为L集,剩余所有无标签的样本集为U集,初始为空的伪标签集为P集,初始为空的未标签样本侯选集为UP集,通过主动学习策略采集到的样本集为E集,通过半监督采样集F集;
[0007]步骤3:将P、L、F数据集作为训练样本,通过YOLO V7目标检测模型训练半监督检测模型;
[0008]步骤4:判断F集是否为空,若是跳转至步骤11执行;若否,则继续向下执行;
[0009]步骤5:首先更新未标签样本侯选集UP=UP∪F,然后清空F集中的所有样本,将半监督学习策略筛选的样本加入到UP集;
[0010]步骤6:通过YOLO模型和主动学习策略S1,从U集中选取s1个样本作为E集,进行人工标注,并更新U集,其中L=L∪s1,U=U/s1;
[0011]步骤7:搭建Faster R

CNN模型,通过上一步骤扩充后的L集训练Faster R

CNN分类器,获得检测模型;
[0012]步骤8:通过步骤7中已训练的FasterR

CNN模型对未标签样本侯选集UP进行检测,获得预测结果label1;
[0013]步骤9:使用步骤3获得的YOLO模型,对UP集中的所有样本进行检测,获得预测结果label2;
[0014]步骤10:选取步骤8和步骤9这两个步骤中所获预测结果相同的样本,定义为p1集,并补充到伪标签集P集中去;
[0015]步骤11:根据步骤3获得的YOLO模型,结合半监督学习采样策略S2,从U集中查找s2
个样本,供下一次训练YOLO模型使用;
[0016]步骤12:将U集更新为U=U/F;
[0017]步骤13:判断U集是否为空集,若是,程序结束;若不是,则回到步骤3继续运行。
[0018]其中,在步骤2中的L集包含白细胞WBC、单个真菌孢子SMB、发芽真菌孢子MMB、真菌孢子团TMB、上皮细胞SPC、红细胞RBC、线索细胞XSC、滴虫D、真菌菌丝MS和杆菌XJ共10个类别。
[0019]其中,首次训练时只有L集有样本数据,YOLO模型为主要检测模型,最终迭代结果为最终的细胞检测模型。
[0020]其中,所述细胞自动检测方法通过YOLO模型获得样本池U中所有未标记样本的预测值,包括所有细胞各类别的概率以及边界框。
[0021]其中,所述细胞自动检测方法采用信息熵的度量方法来表示伪标签结果的不确定性,从而选择信息量大的样本。
[0022]其中,所述细胞自动检测方法引入相似度信息,针对具体分类场景融合了伪标签的信息熵和相似度信息来计算伪标签的不确定性。
[0023]本专利技术提供了一种细胞自动检测方法,在YOLO V7的基础上使用了主动学习协同半监督学习的算法框架与采样策略,通过主动学习策略选择样本识别效果差的样本给人工专家进行标注,再根据半监督学习策略选择样本识别效果好的样本和生成的伪标签作为真实值扩充已标注样本;在选择策略中,针对具体分类场景,融合了伪标签的信息熵和相似度信息来计算伪标签的不确定性,这种方法选择的样本质量更高,减少了冗余样本,使人工标记时间更少,模型准确率更高,检测性能更好,相比其他机器学习方法,本专利技术的基于深度学习的YOLO V7目标检测框架能够更精确地检测与识别多种尺度大小以及各种形态视角的细胞,有效避免了传统细胞形态学算法在视角和细胞尺寸问题所造成的漏检和识别率低的状况。
附图说明
[0024]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0025]图1是本专利技术的一种细胞自动检测方法的流程示意图。
[0026]图2是本专利技术具体实施例中的上皮细胞与霉菌的尺度大小对比示意图。
[0027]图3是本专利技术具体实施例中的白细胞与红细胞对比示意图。
[0028]图4是本专利技术与现有的机器学习检测方法的效果对比图。
具体实施方式
[0029]下面详细描述本专利技术的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本专利技术,而不能理解为对本专利技术的限制。
[0030]请参阅图1,本专利技术提供了一种细胞自动检测方法,包括下列步骤:
[0031]步骤1:采集大量细胞显微图像作为样本集,每张图片为一个样本;
[0032]步骤2:在上述步骤1的样本中选择部分进行人工标注,获得有标签的样本集定义为L集,剩余所有无标签的样本集定义为U集,定义初始为空的伪标签集为P集,初始为空的未标签样本侯选集为UP集,通过主动学习策略采集到的样本集为E集,通过半监督采样集F集;
[0033]步骤3:将P、L、F数据集作为训练样本,通过YOLO V7目标检测模型训练半监督检测模型,其中首次训练时只有L集有样本数据,YOLO模型为主要检测模型,最终迭代结果为我们的最终模型;
[0034]步骤4:判断F集是否为空,若F为空,此时表示半监督学习没有提取到样本,此时UP数据与上一次循环的数据一样,所以直接跳转至步骤11执行;若否,则继续向下执行;
[0035]步骤5:首先更新未标签样本侯选集UP=UP∪F,然后清空F集中的所有样本,将半监督学习策略筛选的样本加入到UP集,以供后续对这些样本和预测结果进行复筛;
[0036]步骤6:通过YOLO模型和主动学习策略S1,从U集中选取s1个样本作为E集,进行人工标注,并更新样本池U,本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种细胞自动检测方法,其特征在于,包括下列步骤:步骤1:采集大量细胞显微图像作为样本集,每张图片为一个样本;步骤2:在所述样本集中选择少量样本并进行人工标注及定义,其中获得有标签的样本集为L集,剩余所有无标签的样本集为U集,初始为空的伪标签集为P集,初始为空的未标签样本侯选集为UP集,通过主动学习策略采集到的样本集为E集,通过半监督采样集F集;步骤3:将P、L、F数据集作为训练样本,通过YOLO V7目标检测模型训练半监督检测模型;步骤4:判断F集是否为空,若是跳转至步骤11执行;若否,则继续向下执行;步骤5:首先更新未标签样本侯选集UP=UP∪F,然后清空F集中的所有样本,将半监督学习策略筛选的样本加入到UP集;步骤6:通过YOLO模型和主动学习策略S1,从U集中选取s1个样本作为E集,进行人工标注,并更新U集,其中L=L∪s1,U=U/s1;步骤7:搭建Faster R

CNN模型,通过上一步骤扩充后的L集训练Faster R

CNN分类器,获得检测模型;步骤8:通过步骤7中已训练的FasterR

CNN模型对未标签样本侯选集UP进行检测,获得预测结果label1;步骤9:使用步骤3获得的YOLO模型,对UP集中的所有样本进行检测,获得预测结果label2;步骤10:选取...

【专利技术属性】
技术研发人员:张成浩王月周忠娇谢海琼
申请(专利权)人:重庆生物智能制造研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1