基于深度学习的宫颈癌细胞智能检测方法技术

技术编号:27366101 阅读:28 留言:0更新日期:2021-02-19 13:49
基于深度学习的宫颈癌细胞智能检测方法。本发明专利技术涉及深度学习方法对细胞核的分类。本发明专利技术的目的是为了解决现有传统诊断方式检测癌细胞准确率低、耗时长等问题。为解决此问题,本发明专利技术提出了一种基于深度学习的智能宫颈癌细胞筛查方法。方法的具体过程为:一、数据准备;二、细胞核分割;三、细胞核分类;四、筛选癌细胞。在细胞核分类部分,数据上利用主动学习的方法进行数据的扩充和类别的细分;模型上以ResNeSt为基础模型,引入医生诊断经验,提取诊断指标共同作用训练出更加准确的模型。实验表明,本文细胞核分类方法准确率比原模型准确率更高,另外,本发明专利技术还提供了一种更有效的扩充数据和类别细分的数据准备方法。本发明专利技术应用于医学图像分类领域。医学图像分类领域。

【技术实现步骤摘要】
基于深度学习的宫颈癌细胞智能检测方法


[0001]本专利技术涉及深度学习方法对细胞核的分类

技术介绍

[0002]宫颈癌是女性的第二大杀手,其发病率和死亡率仅次于乳腺癌。癌症只有在早发现的情况下才有被治愈的希望,在晚期发生转移后是无法治愈的。因此早发现早诊断早治疗是应对癌症爆发的唯一途径。目前的宫颈癌诊断主要依赖于医生的人工阅片,工作量大、误诊率高,也无法推行大面积筛查。随着人工智能技术的发展,近年来出现的宫颈癌细胞智能检测方法,通过自动拍摄病理图像,自动分析和识别癌细胞,能有效减少医生诊断的工作量,并提高诊断准确率。但是病理自动诊断系统目前还没有做到真正的实际应用,并且很多方法仅依靠深度学习来实现。没有更多的考虑医生真实诊断时的诊断经验。这些问题给宫颈癌细胞智能检测方法的应用带来了很大的挑战。
[0003]本文主要研究可以应用到实际的宫颈癌细胞智能检测方法,有效的辅助医生的诊断工作。只有这样,才能够减少医生的阅片时间,从而防止因为医生眼疲劳造成的误诊,并且可以帮助医生更加精准的全盘掌握病人的细胞数据信息。近年来深度学习、计算机视觉、模式识别等技术取得突破性进展,人工智能技术在医疗影像和病理图像领域的探索逐步深入。随着人工智能技术的不断发展和成熟,国家近年来亦不断颁布鼓励人工智能+医疗的政策制度。目前,人工智能检测宫颈癌细胞有两种途径,一种是先分割细胞核再分类得到癌细胞,另一种是直接分类识别出癌细胞,其余正常细胞不考虑。这两种方法其重要的关键技术为细胞分割、细胞检测与识别。
[0004]目前,应用在医学图像上经典的分割方法是U-Net。并且这几年也有不少学者对U-Net分割模型进行进一步改进。其改进主要在损失函数、添加注意力机制、跳跃链接这三个方向改进。还有一些分割方法如FCN、ACNet等。图像分类的方法也有很多,最常见的如ResNet、VGG、AlexNet等方法。其中,ResNet模型现已经成为很多目标检测网络的骨干网络。2019年李沐团队在ResNet基础网络进一步进行改进,加入split-Attention注意力机制,提出ResNeSt网络,在分割和分类领域都有更强的效果。
[0005]另一种直接检测宫颈癌细胞的方法有YOLO系列方法和Mask R-CNN等。YOLO系列图像识别主要是利用整张图作为网络的输入,直接在输出层回归 bounding box的位置及其所属的类别的方法,是最快速的检测方法。Mask R-CNN 是一个两阶段的框架,第一个阶段扫描图像并生成提议(proposals,即有可能包含一个目标的区域),第二阶段分类提议并生成边界框和掩码,是一种既可以实例分割又可以物体检测的方法。
[0006]第一种先分割再分类的方法可以全面分析病人的每一个细胞,但是效率低,检测时间长;直接识别癌细胞方法虽然效率快、但是不能全盘把握病人的所有细胞信息,会发生漏检等情况。所以根据医生具体需求,本文采取先分割再分类的检测方法,并且引入医生的诊断经验,将深度学习提取的特征和人工提取特征连接起来共同作用于分类模型,从而更好的分类宫颈细胞,因此本专利技术中的方法的提出具有重要意义。

技术实现思路

[0007]本专利技术的目的是为了解决医生诊断准确率低、主观性强、以及诊断耗时长的问题,从而做到智能化快速准确的检测出癌细胞。本专利技术共分为四个阶段:数据准备、细胞核分割、细胞核分类、癌细胞筛查。首先利用改进的U-Net分割方法检测细胞核,然后对检测出的细胞核进行分类,最后根据医生经验并结合各个类别的特点,对细胞类别进行癌细胞的筛选,总流程如图1所示。
[0008]上述专利技术主要通过以下技术方案实现:
[0009]步骤一、采集显微镜下病人的玻片图像,将所有图像转成模型需要的尺寸;
[0010]步骤二、对病人所有图像进行分割。在本步骤中,本专利技术提供了改进的U-Net 分割方法:
[0011]首先,对U-Net分割模型加入注意力机制,然后将对称卷积改为非对称卷积,提高网络分割的效率和精度。对U-Net分割模型改进的网络设计如图2所示;
[0012]步骤三、利用主动学习的方法进行分类数据扩充和类别细分。具体方法如下:
[0013]本步骤利用主动学习方法对分类数据进行扩充和类别细分。首先准备形态各异的病人细胞图像,利用步骤二分割模型方法对细胞图像进行分割。然后对分割后的细胞核以细胞核轮廓的最小外接矩形向外扩展10px的矩形切割保存,得到一批初始数据D1。先人工大致粗分为四类。然后利用初始数据D1训练一个mlp 分类模型,用它对大量新细胞图像进行切割并初步粗分类。粗分类以后根据具体每类的分类情况一方面对该类数据进行清洗,另一方面对类别进行错误分析并做一些改进,如将类别细分或合并。最后人工调整错误分类结果或重新分为新类,扩充到训练数据集D1。如此循环细分直到数据集各类达到2000。
[0014]数据集各类达到2000以后,重新利用新调整后的训练数据集D1训练ResNeSt 分类模型,观察分类效果,若达到预期效果,则停止。没有达到,则对训练数据集进行扩充和平衡数据,并调整类别。具体方法为继续利用ResNeSt分类模型分类新图像,对分得的细胞核图像进行清洗并纠错,观察是否类别划分不合理或数据不平衡,然后进行人工调整。再次训练ResNeSt分类模型,直到达到预期效果。
[0015]最终确定分类效果最好的类别和各类别数量。其扩充分类数据和类别细分流程如图3所示。
[0016]步骤四、利用引入医生诊断经验的ResNeSt分类模型进行细胞核分类。将步骤二分割的细胞核,按其外接矩形向外扩展10px将细胞核切割出来,即保持细胞核的完整性,又带有一些细胞浆的信息。然后对细胞核进行分类。引入医生诊断经验的ResNeSt分类模型进行细胞核分类,具体方法如下:
[0017]首先利用在ImageNet数据集上迁移的ResNeSt分类模型自动提取图像特征 CFeature,然后根据《子宫颈细胞学Bethesda报告系统》一书,从中提取出可以进行量化的诊断标准作为特征MFeature,提取诊断标准如下:
[0018](1)核深染,伴大小和形状的变化。
[0019](2)核染色质均匀分布,常呈粗颗粒状,有时染色质呈煤球样或浓缩不透明。
[0020](3)细胞核增大,增大为中层细胞核的2.5-3倍。
[0021]根据以上标准提炼成细胞特征MFeature如下:
[0022](1)细胞核面积
[0023]Area
n
=细胞核的像素点数
[0024]其中,Area
n
为细胞核面积。
[0025](2)细胞核面积系数
[0026][0027]其中,A
mean
为本层细胞核面积均值,A
n
为细胞核面积。
[0028](3)细胞核异形性
[0029]核圆度
[0030][0031]椭圆度
[0032][0033]抻长度
[本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于深度学习的宫颈癌细胞智能检测方法,其特征在于,数据准备和细胞核分类,具体检测方法包含的步骤如下:S1、利用U-Net分割模型分割细胞核;S2、利用主动学习的方法进行分类数据的扩充和类别细分;S3、利用引入医生诊断经验的ResNeSt分类模型进行细胞核分类;S4、统计各项指标,制定分类策略筛选癌细胞。2.如权利要求1所述的基于深度学习的宫颈癌细胞智能检测方法,其特征在于,步骤S2中所述的主动学习的方法进行数据扩充和类别细分,方法如下:首先,准备形态各异的病人细胞图像,利用U-Net分割模型对细胞图像进行分割;对分割后的细胞核以细胞核轮廓的最小外接矩形向外扩展10px的矩形切割保存,得到一批初始数据D1;先人工大致粗分为四类;然后,利用初始数据D1训练一个mlp分类模型,用它对大量新细胞图像进行切割并初步粗分类;粗分类以后根据具体每类的分类情况一方面对该类数据进行清洗,另一方面对类别进行错误分析并做一些改进,如将类别细分或合并;最后人工调整错误分类结果或重新分为新类,扩充到训练数据集D1;如此循环训练调整直到数据集各类达到2000;数据集各类达到2000以后,重新利用新调整后的训练数据集D1训练ResNeSt分类模型,观察分类效果,若达到预期效果,则停止;若没有达到,则对训练数据集进行扩充和平衡数据,并调整类别,具体方法为利用ResNeSt分类模型分类新图像,对分得的细胞核图像进行清洗并纠错,观察是否类别划分不合理或数据不平衡,然后进行人工调整;再次训练ResNeSt分类模型,直到达到预期效果;最终确定分类效果最好的类别和各类别数量。3.如权利要求1所述的基于深度学习的宫颈癌细胞智能检测方法,其特征在于,步骤S3中所述的引入医生诊断经验的ResNeSt分类模型的细胞核分类方法如下:首先,利用在ImageNet预训练的ResNeSt分类模型自动提取特征CFeature;然后,根据医生的诊断经验,设计人工特征指标MFeature;MFeature各特征和公式设计如下:(1)细胞面积Area
n
=细胞核的像素点数,其中,Area
n
为细胞核面积;(2)细胞核面积系数其中,A
mean
为本层细胞核面积均值,Area
n
为细胞核面积;(3)细胞异形性核圆度:椭圆度:抻...

【专利技术属性】
技术研发人员:何勇军邵慧丽陈德运
申请(专利权)人:哈尔滨理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1