一种基于粒度优化特征的宫颈细胞图像半监督分类方法技术

技术编号：31798634 阅读：16 留言：0更新日期：2022-01-08 10:58

本发明专利技术提供一种基于粒度优化特征的宫颈细胞图像半监督分类方法，包括如下步骤：(1)利用有限的标记训练样本和类别隶属模糊方法，得到训练和测试样本的粒度特征；(2)使用近邻粗糙集方法去除冗余特征，对粒度特征进行优化，以降低样本粒度特征规模；(3)利用标记样本训练BP神经网络得到基分类器；(4)从未标记样本数据中不断选取候选样本进行标记，将新标记的候选样本扩充到原始训练样本中对BP网络进行再次训练，重复扩充和再训练过程，直到标记样本数目达到相应标准。本发明专利技术能够准确高效地对宫颈细胞图像进行分类，兼具更优的分类准确率和kappa系数。和kappa系数。和kappa系数。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于粒度优化特征的宫颈细胞图像半监督分类方法

[0001]本专利技术属于医疗图像处理
，具体涉及一种基于粒度优化特征的宫颈细胞图像半监督分类方法。

技术介绍

[0002]目前，随着医疗机构中病患电子档案和病历、医院信息系统等的逐步完善，医院收集到的患者数字图像数据越来越多，宫颈细胞图像也是如此。因此，如何利用宝贵且海量的图像资源辅助医疗工作是医疗工作者及科学工作者面临的新课题。医院采样人员从一位女性身上采集的组织样本包含几十到上百个细胞，那么一百位女性就有上千细胞待查。我国有十几亿人口，符合宫颈癌发病条件的女性也有上亿人次，如果每人每年做一次巴氏测试，粗略估计，至少有几十亿个细胞待逐一观察、判断其是否癌变。医疗人员要从成千上万的宫颈细胞微观图像中，用肉眼找出具有微小癌变的几个或几十个癌细胞，工作量巨大。并且医疗人员长时间、枯燥的阅图，也难免遗漏、误判部分癌细胞。如果基于人工智能技术的智能分析系统能正确、高效的进行细胞定量分析，那么使用智能分析系统辅助医疗工作就能减少癌细胞误判率、提高识别效率。
[0003]准确的宫颈细胞多分类模型在很大程度上，严重依赖于大量已标记的训练样本，但是大量标记的训练样本恰恰是医学图像数据分类领域的瓶颈。而且，对于医学图像数据而言，许多图像分析的应用常常面临严重的不均衡问题(维度灾难)，就是有限数目的训练样本却伴随着更高维度，导致决策过程更加困难。在上述不可避免条件下，使用半监督学习粒度神经网络提升分类模型的性能是一种新的研究方向。
[0004]总之，对于宫颈细胞图...

【技术保护点】

【技术特征摘要】
1.一种基于粒度优化特征的宫颈细胞图像半监督分类方法，其特征在于，包括如下步骤：(1)利用有限的标记训练样本和类别隶属模糊方法，得到测试样本的粒度特征；(2)使用近邻粗糙集方法去除冗余特征，对粒度特征进行优化，以降低样本粒度特征规模；(3)利用标记样本训练BP神经网络得到基分类器；(4)从未标记样本数据中不断选取候选样本进行标记，将新标记的候选样本扩充到原始训练样本中对BP网络进行再次训练，重复扩充和再训练过程，直到标记样本数目达到相应标准。2.根据权利要求1所述的一种基于粒度优化特征的宫颈细胞图像半监督分类方法，其特征在于，所述步骤(1)中，类别隶属模糊方法的目标是将每个特征刻画成模糊隶属度，利用类别隶属度信息对原始特征进行重构，具体步骤为：(1
‑
1)设每个样本有n维特征F
i
＝(F
i1
,F
i2
,
…
,F
in
)，将样本的每一维特征表示成为模糊粒度，得到n
×
C大小的矩阵：F
i
’
＝[μ1(F
i1
),μ2(F
i1
),
…
,μ
c
(F
i1
),
…
,μ
C
(F
i1
),μ1(F
i2
),μ2(F
i2
),
…
,μ
c
(F
i2
),
…
,μ
C
(F
i2
),
…
,μ1(F
in
),μ2(F
in
),
…
,μ
c
(F
in
),
…
,μ
C
(F
in
)]；其中，C(c＝1,2,
…
,C)为样本类别数目，μ1(F
in
),μ2(F
in
),
…
,μ
c
(F
in
),
…
,μ
C
(F
in
)表示样本的每个维度特征属于不同类别的隶属度；(1
‑
2)将每维特征类别的隶属度映射到模糊粒度空间，空间元素为：μ(F
in
；a,r,b)＝0
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
F
in
≤a，＝2
N
‑1[(F
in
‑
a)
÷
(r
‑
a)]
N
ꢀꢀꢀꢀ
a<F
in
≤p，＝1
‑2N
‑1[(r
‑
F
in
)
÷
(r
‑
a)]
N
ꢀꢀ
p<F
in
≤r，＝1
‑2N
‑1[(F
in
‑
r)
÷
(b
‑
r)]
N
ꢀꢀ
r<F
in
≤q，＝2
N
‑1[(b
‑
F
in
)
÷
(b
‑
r)]
N
ꢀꢀꢀꢀ
q<F
in
≤b，＝0
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
F
in
≥b；其中，N是成员函数的模糊度，取值为2，模糊成员函数的中心为r＝(p+q)
÷
2，p和q是交点；当训练样本更接近类别C时，r的值更接近于1；当样本更接近交点时，值更接近于0.5；训练样本中心点r＝mean(F
n
)，为第n维特征的平均值；上述交点的估算公式是：p＝mean(F
n
...

【专利技术属性】
技术研发人员：赵理莉，鞠恒荣，丁卫平，胡彬，
申请(专利权)人：南通大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人