用于肿瘤评估的深度学习模型制造技术

技术编号:34877719 阅读:27 留言:0更新日期:2022-09-10 13:33
一种由包括处理电路系统的装置确定个体基于图像中的肿瘤的临床值的方法可以包括由该处理电路系统执行指令,这些指令使该装置进行以下操作:基于该图像确定肿瘤中淋巴细胞的淋巴细胞分布;将分类器应用于该淋巴细胞分布以对该肿瘤进行分类,该分类器已经被训练为将肿瘤分类为选自分别与淋巴细胞分布相关联的至少两个类别的类别;并且基于患有该分类器将该肿瘤分类为的类别的肿瘤的个体的预后来确定该个体的临床值。定该个体的临床值。定该个体的临床值。

【技术实现步骤摘要】
【国外来华专利技术】用于肿瘤评估的深度学习模型
相关申请的交叉引用
[0001]本申请要求于2020年1月11日提交的美国临时申请号62/959,931的权益,该美国临时申请的全部披露内容通过引用并入。


[0002]本披露内容涉及使用机器学习模型进行图像分析的领域,并且更特别地涉及使用深度学习模型确定与肿瘤相关的临床变量。

技术介绍

[0003]这里提供的
技术介绍
描述是为了总体上呈现本披露内容的上下文。当前提及的专利技术人在本
技术介绍
部分描述的范围内的工作以及在提交时可能不符合现有技术的描述的各方面既不明确地也不暗示地承认是相对于本披露内容的现有技术。
[0004]在医学领域,许多场景涉及对癌症肿瘤的分析,以基于如位置、大小、形状和组成成分等特性评估肿瘤类别。评估可以实现预测,如肿瘤行为和可能的侵袭性,如生长和/或转移的概率和速率。肿瘤的这些特性继而可以确定个体的临床值(如预后),如可能的存活率,并且可以指导医疗决策,如化疗、手术和姑息治疗的选择、类型和/或时机。然而,预后(包括存活能力)的确定因可能影响该确定的相关因素的数量和种类以及因素相关性而变得困难。
[0005]多种诊断和预后技术可以用于进行肿瘤类别评估。例如,数据集合可以包括关于患有肿瘤的个体的特征(如每个个体的年龄、生理、病史和/或如吸烟等行为习惯),可以与个体的预后数据(如典型的存活率)相关。可以应用Cox比例风险模型基于收集的数据集和临床数据来确定临床特征集中的特征的相关性,这可以支持关于个体基于肿瘤的临床值(如预后)的各个风险因素的相关性的一些结论。此后,临床医生可以使用该信息来指导对患有类似肿瘤的个体的诊断、预后和/或有效护理选择的确定或预测。而且,可以收集关于这些个体的类似风险因素并通过Cox比例风险模型进行处理,以预测个体基于类似肿瘤的临床值(如预后),Cox比例风险模型是基于这些类似肿瘤开发的。
[0006]用于评估个体基于肿瘤的临床值(如预后)的其他技术可以利用一种或多种机器学习模型。例如,可以生成具有已知特性的肿瘤样本的训练数据集,如关于肿瘤、切除了肿瘤的个体、和/或个体的临床值(如预后)的数据。机器学习分类器可以使用带有标签的训练数据集进行训练,这些标签指示每个输入所表示的类别,如每个肿瘤是表示预后不良的高风险肿瘤还是预后良好的低风险肿瘤。训练过程可以产生经训练的机器学习分类器,该经训练的机器学习分类器以与训练数据集的示例一致的方式对新输入进行分类。
[0007]可以选择各种不同的机器学习模型作为肿瘤的分类器,如贝叶斯(Bayesian)分类器、人工神经网络和支持向量机(SVM)。作为第一个这样的示例,卷积神经网络(CNN)可以处理n维输入以检测其中可能出现的肿瘤图像的特征。可以向包括神经元卷积层序列的卷积神经网络提供如肿瘤图像的像素阵列等特征向量。每个卷积层可以产生指示在细节水平上
检测到的一些肿瘤图像特征的特征图,该特征图可以由序列中的下一个卷积层处理。由卷积神经网络的最终卷积层产生的特征图可以由肿瘤的分类器处理,该分类器可以被训练为指示特征图是否类似于训练数据集的图像中的对象的特征图。例如,CNN可以被训练为识别与高风险预后和低风险预后相关的肿瘤视觉特征。
[0008]作为第二个这样的示例,可以生成高斯混合模型(GMM)以将关于肿瘤的数据分类为具有代表性特性的不同肿瘤簇。对于训练数据集中的表示肿瘤的每个样本,可以识别特征集,如位置、大小、形状和组成成分。训练数据集的样本可以定位在多维特征空间内,其中,每个特征都沿维度轴表示。可以应用机器学习技术来识别特征空间内具有类似预后的肿瘤簇,如表示高风险肿瘤的第一簇和表示低风险肿瘤的第二簇,其中,每个簇被表示为特征空间内相应特征的高斯概率分布的集合。即使簇的一些部分重叠(例如,即使具有特定特征集的肿瘤可以被包括在高风险簇或低风险簇中),簇的高斯概率分布也可以实现关于肿瘤属于各个簇的可能性的概率预测。以这种方式,高斯混合模型可以基于对训练数据集中的类似肿瘤样本的聚簇实现个体预后预测。

技术实现思路

[0009]一些示例实施例可以包括一种操作包括处理电路系统的装置的方法,其中该方法包括由该处理电路系统执行指令,这些指令使该装置:接收描绘肿瘤的至少一部分的图像;基于该图像确定该肿瘤中淋巴细胞的淋巴细胞分布;将分类器应用于该淋巴细胞分布以对该肿瘤进行分类,该分类器已经被训练为将肿瘤分类为选自分别与淋巴细胞分布相关联的至少两个类别的类别;并且基于与患有该分类器将该肿瘤分类为的类别的肿瘤的个体相对应的预后数据集来确定个体的临床值。
[0010]在一些示例实施例中,肿瘤是胰腺癌肿瘤或乳腺癌肿瘤。
[0011]在一些示例实施例中,该装置可以进一步包括卷积神经网络,该卷积神经网络被训练为确定图像区域中淋巴细胞的淋巴细胞分布,并且这些指令可以使该装置调用该卷积神经网络来确定该肿瘤的图像的相应区域中淋巴细胞的淋巴细胞分布。在一些示例实施例中,该卷积神经网络可以进一步被训练为将该图像的区域分类为选自区域类型集的一个或多个区域类型,该区域类型集包括肿瘤区域、淋巴细胞区域或者间质区域。在一些示例实施例中,确定该肿瘤中淋巴细胞的淋巴细胞分布可以包括,对于该图像的相应淋巴细胞区域:确定该淋巴细胞区域到肿瘤区域或间质区域中的一者或两者的距离;基于该距离将该淋巴细胞区域表征为肿瘤浸润淋巴细胞区域、肿瘤邻近淋巴细胞区域、间质浸润淋巴细胞区域或间质邻近淋巴细胞区域之一,并且该分类器可以基于该淋巴细胞区域的表征进一步对该肿瘤进行分类。在一些示例方法中,确定该肿瘤中淋巴细胞的淋巴细胞分布可以包括,对于该图像的相应间质区域:确定该间质区域到肿瘤区域的距离;以及基于该距离将该间质区域表征为肿瘤浸润间质区域或肿瘤邻近间质区域之一,并且该分类器可以进一步基于该间质区域的表征对该肿瘤进行分类。
[0012]在一些示例实施例中,该至少两个类别可以包括与第一存活概率相关联的高风险肿瘤类别,以及与第二存活概率相关联的低风险肿瘤类别,该第二存活概率比该第一存活概率长。
[0013]在一些示例实施例中,该分类器可以进一步包括高斯混合模型,该高斯混合模型
被配置为针对相应类别确定该类别的肿瘤的特征在特征空间内的概率分布。在一些示例实施例中,该高斯混合模型的特征空间的特征可以选自特征集,该特征集包括:该图像的肿瘤区域的测量结果、该图像的间质区域的测量结果、该图像的淋巴细胞区域的测量结果、该图像的肿瘤浸润淋巴细胞区域的测量结果、该图像的肿瘤邻近淋巴细胞区域的测量结果、该图像的间质浸润淋巴细胞区域的测量结果、该图像的间质邻近淋巴细胞区域的测量结果、该图像的肿瘤浸润间质区域的测量结果以及该图像的肿瘤邻近间质区域的测量结果。在一些示例实施例中,特征子集可以基于这些相应类别与该子集的相应特征的相关性从该特征集中选择。在一些示例实施例中,这些相应类别与这些相应特征的相关性可以基于该特征空间的轮廓得分或一致性指数中的一者或两者。在一些示例实施例中,该特征子集可以基本上由该图像的淋巴细胞区域的测量结果、该图像本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种操作包括处理电路系统的装置的方法,该方法包括:由该处理电路系统执行指令,这些指令使该装置进行以下操作:接收描绘肿瘤的至少一部分的图像,基于该图像确定该肿瘤中淋巴细胞的淋巴细胞分布,将分类器应用于该淋巴细胞分布以对该肿瘤进行分类,该分类器已经被训练为将肿瘤分类为选自分别与淋巴细胞分布相关联的至少两个类别的类别,并且基于与患有该分类器将该肿瘤分类为的类别的肿瘤的个体相对应的预后数据集来确定个体的临床值。2.如权利要求1所述的方法,其中,该肿瘤是以下各项之一:胰腺癌肿瘤,以及乳腺癌肿瘤。3.如权利要求1所述的方法,其中:该装置进一步包括卷积神经网络,该卷积神经网络被训练为确定图像区域中淋巴细胞的淋巴细胞分布,并且这些指令使该装置调用该卷积神经网络来确定该肿瘤的图像的相应区域中淋巴细胞的淋巴细胞分布。4.如权利要求3所述的方法,其中,该卷积神经网络进一步被训练为将该图像的区域分类为选自区域类型集的一个或多个区域类型,该区域类型集包括:肿瘤区域,淋巴细胞区域,或者间质区域。5.如权利要求4所述的方法,其中:确定该肿瘤中淋巴细胞的淋巴细胞分布包括,对于该图像的相应淋巴细胞区域:确定该淋巴细胞区域到肿瘤区域或间质区域中的一者或两者的距离,以及基于该距离,将该淋巴细胞区域表征为以下各项之一:肿瘤浸润淋巴细胞区域,肿瘤邻近淋巴细胞区域,间质浸润淋巴细胞区域,以及间质邻近淋巴细胞区域;并且该分类器进一步基于该淋巴细胞区域的表征对该肿瘤进行分类。6.如权利要求4所述的方法,其中:确定该肿瘤中淋巴细胞的淋巴细胞分布包括,对于该图像的相应间质区域:确定该间质区域到肿瘤区域的距离,以及基于该距离,将该间质区域表征为以下各项之一:肿瘤浸润间质区域,以及肿瘤邻近间质区域;并且该分类器进一步基于该间质区域的表征对该肿瘤进行分类。7.如权利要求1所述的方法,其中,该至少两个类别包括:与第一存活概率相关联的高风险肿瘤类别,以及
与第二存活概率相关联的低风险肿瘤类别,该第二存活概率比该第一存活概率长。8.如权利要求1所述的方法,其中,该分类器进一步包括高斯混合模型,该高斯混合模型被配置为针对相应类别确定该类别的肿瘤的特征在特征空间内的概率分布。9.如权利要求8所述的方法,其中,该高斯混合模型的特征空间的特征选自特征集,该特征集包括:该图像的肿瘤区域的测量结果,该图像的间质区域的测量结果,该图像的淋巴细胞区域的测量结果,该图像的肿瘤浸润淋巴细胞区域的测量结果,该图像的肿瘤邻近淋巴细胞区域的测量结果,该图像的间质浸润淋巴细胞区域的测量结果,该图像的间质邻近淋巴细胞区域的测量结果,该图像的肿瘤浸润间质区域的测量结果,以及该图像的肿瘤邻近间质区域的测量结果。10.如权利要求9所述的方法,其中,特征子集是基于这些相应类别与该子集的相应特征的相关性从该特征集中选择的。11.如权利要求10所述的方法,其中,这些相应类别与这些相应特征的相关性基于以下中的一者或两者:该特征空间的轮廓得分,或者一致性指数。12.如权利要求10所述的方法,其中,该特征子集基本上由以下各项组成:该图像的淋巴细胞区域的测量结果,该图像的肿瘤浸润淋巴细胞区域的测量结果,该图像的肿瘤邻近淋巴细胞区域的测量结果,以及该图像的肿瘤浸润间质区域的测量结果。13.如权利要求1所述的方法,其中,这些指令进一步使该装置进行以下操作:将Cox比例风险模型应用于该肿瘤的临床特征以确定该肿瘤的类别,并且基于患有该分类器将该肿瘤分类为的类别和由该Cox比例风险模型确定的类别的肿瘤的个体的预后来确定该个体的临床值。14.如权利要求13所述的方法,其中,该Cox比例风险模型的肿瘤的临床特征选自临床特征集,该临床特征集包括:该肿瘤的初步诊断,该肿瘤的位置,该肿瘤的治疗,该肿瘤的测量结果,该肿瘤的转移状况,该个体的初步诊断,该个体的先前癌症病史,该个体的人种,
该个体的种族,该个体的性别,该个体的吸烟习惯频率,该个体的吸烟习惯持续时间,以及该个体的饮酒史。15.如权利要求14所述的方法,其中,特征的临床特征子集是基于这些相应类别与该临床特征子集中的相应临床特征的相关性、针对该Cox比例风险模型从该临床特征集中选择的。16.如权利要求15所述的方法,其中,该临床特征子集由以下各项组成:该肿瘤的测量结果,以及该肿瘤的转移状况。17.如权利要求1所述的方法,其中:该至少两个类别是低风险肿瘤类别和高风险肿瘤类别,确定该淋巴细胞分布进一步包括将卷积神经网络应用于该图像,该卷积神经网络被配置为测量该图像的不同区域类型的淋巴细胞的淋巴细胞分布,该分类器是双向高斯混合模型,该双向高斯混合模型被配置为针对相应类别确定该类别的肿瘤的特征在特征空间内的概率分布,该方法进一步包括将Cox比例风险模型应用于该肿瘤的临床特征以确定该肿瘤的类别,并且确定该个体的临床值进一步基于通过该Cox比例风险模型确定的类别。1...

【专利技术属性】
技术研发人员:M
申请(专利权)人:南坦生物组学有限责任公司南泰奥斯公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1