【技术实现步骤摘要】
【国外来华专利技术】用于组织图像分类的多实例学习器
[0001]本专利技术涉及数字病理学领域,更特别地涉及图像分析领域。
技术介绍
[0002]已知有几种图像分类方法可用于将数字病理图像分类为不同的类别,诸如“健康组织”或“癌组织”等。例如,Sertan Kaymaka等人在“Breast cancer image classification using artificial neural networks”,《Procedia Computer Science》,第120卷,2017年,第126
‑
131页中,描述了一种使用反向传播神经网络(BPPN)对乳腺癌诊断图像进行自动分类的方法。
[0003]然而,申请人已观察到,就乳房X光检查图像中癌症相关的节结的早期检测而言提供良好结果的各种机器学习技术未能对其他类型的组织切片的图像,特别是全视野载玻片图像进行分类。
[0004]与使用现有机器学习方法进行图像分类相关联的另一个问题是,经训练的机器学习程序通常就像是黑箱。在决定给某个患者施用潜在有效但副作用强烈的药物是否可行时,不得不完全或部分依赖这个“黑箱”,而不能以语言表述潜在的“决策逻辑”,这对于医生和患者来说都是不尽如人意的。
[0005]MAXIMILIAN ILSE等人的:“Attention
‑
based Deep Multiple Instance Learning”,ARXIV.ORG,CORNELL UNIVERSITY LIBRARY,201OLIN LIB ...
【技术保护点】
【技术特征摘要】
【国外来华专利技术】1.一种用于对组织图像(212、712
‑
718、822
‑
282)进行分类的方法(100),所述方法包括:
‑
通过图像分析系统(200)接收(102)多个数字图像(212、712
‑
718、822
‑
282),所述数字图像中的每个数字图像描绘患者的组织样品;
‑
通过所述图像分析系统将每个所接收的图像拆分(104)成一组图像块(216、902
‑
906、940、942);
‑
针对所述块中的每个块,通过所述图像分析系统,计算(106)特征向量(220),所述特征向量(220)包含从所述块中选择性地提取的图像特征;
‑
提供(108)多实例学习(MIL)程序(226),所述多实例学习程序(226)被配置为使用模型来基于从任何输入图像的所有块中提取的特征向量将所述输入图像分类为至少两个不同类别中的一个类别的成员;
‑
针对所述块中的每个块,计算(110)确定性值(221),所述确定性值指示所述模型关于所述块的特征向量对从中导出所述块的图像的分类的贡献的确定性;
‑
针对所述图像中的每个图像:
·
通过所述MIL程序(226)使用基于确定性值的池化函数(996)以作为所述图像的所述块的确定性值(221)的函数来将从所述图像中提取的特征向量聚合(111)成全局特征向量(995),并且从所述全局特征向量计算(112)聚合的预测值(997);或
·
通过所述MIL程序从所述图像的所述特征向量(220)中的每个特征向量计算(113)预测值(998),并且通过所述MIL程序(226)使用(114)基于确定性值的池化函数(996)以作为所述图像的所述块的确性值的函数来将所述图像的所述预测值聚合成聚合的预测值(997);以及
‑
通过所述MIL程序将所述图像中的每个图像基于所述聚合的预测值分类(116)为所述至少两个不同类别中的一个类别的成员。2.根据权利要求1所述的方法,其进一步包括:
‑
经由GUI将分类结果输出至用户;和/或
‑
将所述分类结果输出到另一应用程序。3.根据前述权利要求中任一项所述的方法,
‑
其中所述MIL程序为二进制MIL程序,
‑
其中至少两个类别包括称为“正类别”的第一类别和称为“负类别”的第二类别,
‑
其中如果MIL模型针对所述图像中的任何一个图像的所述块中的至少一个块预测这个块的特征向量包括针对所述“正类别”的证据,则这个图像分类为所述“正类别”,
‑
其中如果所述MIL模型针对所述图像中的任何一个图像的所有的所述块预测其各自的特征向量均不包括针对所述“正类别”的证据,则这个图像分类为所述“负类别”。4.根据前述权利要求中任一项所述的方法,所述基于确定性值的池化函数在测试时使用,所述MIL程序的提供(108)包括:
‑
在从一组训练图像生成的一组训练块中提取特征向量;
‑
对所述MIL程序进行关于所述特征向量的训练,从而在训练时使用与在测试时使用的基于确定性值的池化函数相同的基于确定性值的池化函数,或者在训练时使用与在测试时使用的基于确定性值的池化函数不同的另一基于确定性值的池化函数,
其中优选地,在训练时使用的所述基于确定性值的池化函数为基于确定性值的最大池化函数或基于确定性值的均值池化函数,并且其中在测试时使用的所述基于确定性值的池化函数为基于确定性值的最大池化函数。5.根据前述权利要求中任一项所述的方法,其中所述基于确定性值的池化函数为基于确定性值的最大池化函数,其中对于所述图像中的每个图像,所述基于确定性值的池化函数的使用包括子方法a)、b、c)或d),所述子方法分别包括:
‑
a1)以针对所述块中的每个块计算出的确定性值(c,221)对这个块的预测值(h,998)进行加权,从而获得加权的预测值(wh,228);
‑
a2)识别针对所述图像的所有的所述块计算出的所有加权的预测值的最大值(wh
最大
);以及
‑
a3)使用最大加权的预测值(wh
最大
)作为所述聚合的预测值(997);或
‑
b)使用具有最大确定性值(c
最大
)的块的预测值(h,998)作为所述聚合的预测值(997);或
‑
c1)以针对所述块中的每个块计算出的所述确定性值(c,221)对这个块的特征向量(fv,220)进行加权,从而获得加权的特征向量(wfv);
‑
c2)识别针对所述图像的所有的所述块计算出的所有加权的特征向量的最大值(wfv
最大
);或
‑
d)使用具有所述最大确定性值(c
最大
)的块的特征向量(fv)作为所述全局特征向量(995)。6.根据前述权利要求中任一项所述的方法,其中所述基于确定性值的池化函数为基于确定性值的均值池化函数,其中对于所述图像中的每个图像,所述基于确定性值的池化函数的使用包括:
‑
以针对所述块中的每个块计算出的所述确定性值(c)对这个块的所述特征向量(fv)进行加权,从而获得加权的特征向量(wfv);以及计算所述全局特征向量作为所述图像的所有的所述加权的特征向量(wfv)的均值;或
‑
以针对所述块中的每个块计算出的所述确定性值(c)对这个块的所述预测值(h)进行加权,从而获得加权的预测值(wh);计算所述图像的所述加权的预测值的均值;以及使用计算的均值作为所述聚合的预测值。7.根据前述权利要求中任一项所述的方法,其中所述MIL程序是神经网络,并且其中在所述神经网络的模型的训练和/或测试时使用丢弃技术计算所述确定性值。8.根据权利要求7所述的方法,其中所述确定性值被计算为蒙特
‑
卡洛丢弃(MC Dropout)。9.根据前述权利要求中任一项所述的方法,其中所述丢弃技术和/或所述基于确定性值的池化函数在所述模型的测试时使用,而不是在所述模型的训练时使用。10.根据权利要求8或9所述的方法,其中所述神经网络包括一个或多个失活丢弃层,其中失活丢弃层是在训练时激活并在测试时失活的丢弃层,所述方法包括在测试时重新激活一个或多个丢弃层;或其中在训练时的所述神经网络没有任何丢弃层,所述方法包括在测试时向所述神经网络添加一个或多个丢弃层;
其中在测试时针对所述块中的任一块计算确定性值进一步包括:
‑
针对所述块中的每个块,基于从所述块中提取的特征向量多次计算预测值(h
d
),其中每次计算所述预测值(h
d
)时,一个或多个重新激活或添加的丢弃层丢弃所述网络的节点的不同子集;
‑
...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。