癌症预后制造技术

技术编号:37180751 阅读:12 留言:0更新日期:2023-04-20 22:47
本公开特别涉及用于对统计函数进行参数化的计算机实现的方法。所述统计函数被配置用于对癌症患者执行预后。所述参数化方法包括提供与各自都患有癌症疾病的多个患者相关的数据集。针对每个患者,所述数据集包括统计函数的输入数据。所述输入数据包括来自患者的肿瘤切片的至少一幅组织学图像的视觉数据。所述输入也包括来自对患者的肿瘤组织进行测序的基因组数据。所述输入数据还包括患者的临床数据。所述数据集也包括患者在癌症疾病演变方面的临床端点。所述参数化方法还包括基于所述数据集对所述统计函数进行参数化。这形成了对患有癌症疾病的患者执行预后的经改进的解决方案。案。案。

【技术实现步骤摘要】
risk of recurrence after endocrine therapy of ER+breast cancer.JNCI:Journal of the National Cancer Institute,110(2),166

175。
[0012]·
Jackson,H.W.,Fischer,J.R.,Zanotelli,V.R.,Ali,H.R.,Mechera,R.,Soysal,S.D.,Moch,H.,Muenst,S.,Varga,Z.,Weber,W.P.and Bodenmiller,B.,2020.The single

cell pathology landscape of breast cancer.Nature,578(7796),pp.615

620。
[0013]·
Yuan,Y.,2016.Spatial heterogeneity in the tumor microenvironment.Cold Spring Harbor perspectives in medicine,6(8),p.a026583。
[0014]·
Yuan&al.2012.Quantitative image analysis of cellular heterogeneity in breast tumors complements genomic profiling.Science translational medicine,4(157),pp.157ra143

157ra143。
[0015]·
Becht,E&al.,2016.Estimating the population abundance of tissue

infiltrating immune and stromal cell populations using gene expression.Genome biology,17(1),pp.1

20。
[0016]·
Zhu,X.,Yao,J.and Huang,J.,2016,December.Deep convolutional neural network for survival analysis with pathological images.In 2016IEEE International Conference on Bioinformatics and Biomedicine(BIBM)(pp.544

547).IEEE。
[0017]现有的解决方案,特别是ImmunoScore,存在一些缺点。其仅基于局部分区分析,并且因此并未充分使用患者的医学图像中存在的完整数据。其也需要预确定的值,常常是阈值,对其的估计包括一些启发式方法。另外,除了医学图像之外,其不利用可获得的关于患者的其他数据。
[0018]因此,需要提供一种以更高的准确度对患有癌症疾病的患者执行预后的计算机实现的解决方案。

技术实现思路

[0019]因此,提供了一种用于对统计函数进行参数化的计算机实现的方法,后文被称作“参数化方法”。所述统计函数被配置用于对癌症患者执行预后。所述参数化方法包括提供与各自都患有癌症疾病的多个患者相关的数据集。针对每个患者,所述数据集包括统计函数的输入数据。所述输入数据包括来自患者的肿瘤切片(slide)的至少一幅组织学图像的视觉数据。所述输入数据也包括来自对患者的肿瘤组织进行测序的基因组数据。所述输入数据还包括患者的临床数据。所述数据集也包括患者在癌症疾病的演变方面的临床端点。所述参数化方法还包括基于所述数据集对所述统计函数进行参数化。
[0020]所述参数化方法可以包括以下中的一项或多项:
[0021]‑
所述视觉数据是从表示一种或多种分布的一幅或多幅图获得的,包括:组织纹理的分布、淋巴细胞存在的分布、和/或细胞密度的分布;
[0022]‑
经由相应的卷积神经网络从至少一幅组织学图像中提取至少一幅图;
[0023]‑
所述一幅或多幅图包括各自表示相应分布的若干图;
[0024]‑
所述一幅或多幅图包括经由第一CNN从所述至少一幅组织学图像中提取的纹理图,所述纹理图具有各自表示纹理的预定集合中的纹理的像素,每个像素由利用所述第一
CNN对所述至少一幅组织学图像的相应图块(tile)进行分类而产生;
[0025]‑
所述一幅或多幅图包括经由第二CNN从所述至少一幅组织学图像中提取的淋巴细胞图,所述淋巴细胞图具有各自指示淋巴细胞存在的像素,每个像素由利用所述第二CNN对所述至少一幅组织学图像的相应图块进行分类而产生;
[0026]‑
所述一幅或多幅图包括经由第三CNN从所述至少一幅组织学图像中提取的细胞密度图,所述细胞密度图具有各自表示细胞的局部数量的像素,每个像素由利用所述第三CNN对所述至少一幅组织学图像的相应图块中的细胞数量进行计数而产生;
[0027]‑
基因组数据表示细胞类型分布和/或基因表达数据;
[0028]‑
所述临床数据表示患者年龄、患者性别、肿瘤阶段、淋巴结阶段和/或转移阶段中的至少一种;
[0029]‑
所述统计函数包括神经网络、随机模型和/或诸如Cox模型的回归模型;和/或
[0030]‑
所述统计函数被配置为输出对患者的结果的预测和/或对肿瘤演变的预测。
[0031]也提供了一种使用利用参数化方法而参数化的统计函数以用于对癌症患者执行预后的计算机实现的方法,后文被称作“使用方法”。所述使用方法包括提供输入数据。所述输入数据包括:来自患者的肿瘤切片的至少一幅组织学图像的视觉数据,来自对患者的肿瘤组织进行测序的基因组数据,以及患者的临床数据。所述使用方法也包括将所述统计函数应用于所述输入数据以对患者执行预后。
[0032]也提供了一种用于形成参数化方法的数据集的计算机实现的方法,后文被称为“数据集形成方法”。换言之,通过数据集形成方法获得的数据集被配置为在参数化方法中如此提供,以便基于所述数据集对所述函数进行参数化。在所述数据集中,所述输入数据与患者间的临床端点相关,这意味着针对每个患者,所述数据集被结构化为使得针对患者的输入数据能够与患者的临床端点相关联。这可以经由关系数据库中的关系或者属于同一表的输入数据和临床端点两者、经由来自/去往输入数据/临床端点两者的数据指针、或者也经由被附加到输入数据和临床端点两者的患者ID来实现。
[0033]还提供了与上述方法相关的数据结构,换言之,例如经由一个或多个数据文件有形地记录在数据存储介质上的数据。所述数据结构包括以下中的任意一种或者任意组合:
[0034]·
根据参数化方法而参数化的统本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用于对统计函数进行参数化的计算机实现的方法,所述统计函数被配置用于对癌症患者执行预后,所述方法包括:

提供与各自都患有癌症疾病的多个患者相关的数据集,所述数据集针对每个患者包括:o所述统计函数的输入数据,所述输入数据包括:
·
来自所述患者的肿瘤切片的至少一幅组织学图像的视觉数据,
·
来自对所述患者的肿瘤组织进行测序的基因组数据,以及
·
所述患者的临床数据,以及o所述患者在所述癌症疾病的演变方面的临床端点;以及

基于所述数据集对所述统计函数进行参数化。2.根据权利要求1所述的方法,其中,所述视觉数据是从表示一种或多种分布的一幅或多幅图中获得的,所述一种或多种分布包括:
·
组织纹理的分布,
·
淋巴细胞存在的分布,和/或
·
细胞密度的分布。3.根据权利要求2所述的方法,其中,至少一幅图是经由相应的卷积神经网络(CNN)从所述至少一幅组织学图像中提取的。4.根据权利要求2或3所述的方法,其中,所述一幅或多幅图包括各自表示相应分布的若干幅图。5.根据权利要求3或4所述的方法,其中:
·
所述一幅或多幅图包括经由第一CNN从所述至少一幅组织学图像中提取的纹理图,所述纹理图具有各自表示纹理的预定集合中的纹理的像素,每个像素由利用所述第一CNN对所述至少一幅组织学图像的相应图块进行分类而产生,
·
所述一幅或多幅图包括经由第二CNN从所述至少一幅组织学图像中提取的淋巴细胞图,所述淋巴细胞图具有各自指示淋巴细胞存在的像素,每个像素由利用所述第二CNN对所述至少一幅组织学图像的相应图块进行分类而产生,和/或
·

【专利技术属性】
技术研发人员:S
申请(专利权)人:达索系统公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1