分析物的空间分析制造技术

技术编号:35244320 阅读:37 留言:0更新日期:2022-10-19 09:50
用于分析物的空间分析的系统和方法包括将样品放置在具有基准标记和捕获点的基底上。然后,获取所述样品的图像并从所述捕获点获得序列读数。一组捕获探针群中的每个捕获探针群(i)位于不同的捕获点处,(ii)直接或间接地与来自所述样品的分析物缔合,并且(iii)具有唯一空间条形码。测序读数用于检测所述分析物。测序读数包括对应的捕获探针群的空间条形码。空间条形码将读数定位到相应的捕获点,从而将它们划分成子集,每个子集用于相应捕获点。基准标记有助于复合表示,所述复合表示包含(i)与所述捕获点对齐的所述图像和(ii)映射到所述相应的捕获点的在所述图像内的相应位置处的序列读数的每个子集的表示。的序列读数的每个子集的表示。的序列读数的每个子集的表示。

【技术实现步骤摘要】
【国外来华专利技术】分析物的空间分析
[0001]相关申请的交叉引用
[0002]本申请要求于2020年6月20日提交的题为《用于分析物的空间分析的流水线(Pipeline for Spatial Analysis of Analytes)》的美国临时专利申请第63/041,825号、于2020年2月21日提交的题为《用于分析物的分析的流水线(Pipeline for Analysis of Analytes)》的美国临时专利申请第62/980,073号,以及于2019年11月21日提交的题为《用于分析物的分析的流水线(Pipeline for Analysis of Analytes)》的美国临时专利申请第62/938,336号的优先权,其各自通过引用整体并入本文。


[0003]本说明书描述了涉及在大型复杂的数据集中处理观察到的分析物数据(例如空间排列的下一代测序数据)并且使用该数据来可视化图案的技术。

技术介绍

[0004]复杂组织中分析物的空间分辨率提供了对生物功能和形态学的基础过程的新见解,如细胞命运和发育、疾病进展和检测,以及细胞和组织水平的调节网络。参见,Satija等人,2015,《单细胞基因表达数据的空间重建(Spatial reconstruction of single

cell gene expression data)》,《自然生物技术(Nature Biotechnology.)》33,495

502,doi:10.1038.nbt.3192和Achim等人,2015,《单细胞RNA序列数据到起源组织的高通量空间映射(High

throughput spatial mapping of single

cell RNA

seq data to tissue of origin)》,《自然生物技术》33:503

509,doi:10.1038/nbt.3209,其各自通过引用整体并入本文。对分析物之间的空间模式或其它形式的关系的理解可以提供关于差异细胞行为的信息。这反过来有助于阐明复杂的病症,如复杂的疾病。例如,分析物(例如,基因)的丰度与特定组织类(例如,疾病组织、健康组织、疾病组织和健康组织的边界等)的组织亚群相关联的确定提供了分析物与如复杂疾病等病症相关联的推理证据。同样,分析物的丰度与复杂2维或3维组织(例如,哺乳动物脑、肝、肾、心脏、肿瘤或模型生物体的发育胚胎)中的异质细胞群体的特定亚群相关联的确定提供了分析物在特定亚群中的关联的推理证据。
[0005]因此,分析物的空间分析可以通过标识复杂组织中的风险区域并通过(例如,基因表达、蛋白质表达、DNA甲基化和/或单核苷酸多态性等的)空间重建表征这些区域中存在的分析物图谱来为疾病的早期检测提供信息。分析物到其在区域或子区域内的特定位置的高分辨率空间映射揭示了分析物的空间表达模式,提供了相关数据,并进一步暗示了与疾病或其它感兴趣的形态或表型有关的分析物网络相互作用,从而导致对细胞在其形态背景下的整体理解。参见,10X,2019,《空间解析的转录组学(Spatially

Resolved Transcriptomics)》,10X,2019,《内部Visium空间技术(Inside Visium Spatial Technology)》和10X,2019,《Visium空间基因表达解决方案(Visium Spatial Gene Expression Solution)》,其各自通过引用整体并入本文。
[0006]分析物的空间分析可以通过捕获分析物和/或分析物捕获剂或分析物结合域并使
用指示对应于已知位置的感兴趣的组织或区域的参考图像将其映射到已知位置(例如,使用附着于基底的条形码捕获探针)来进行。例如,在空间分析的一些实施方式中,制备样品(例如,将新鲜冷冻的组织切片、置于载片上、固定和/或染色以进行成像)。样品的成像提供了用于空间分析的参考图像。然后使用例如经由条形码捕获探针的分析物或分析物配体捕获、文库构建和/或测序进行分析物检测。所得条形码分析物数据和参考图像可以在数据可视化期间组合以进行空间分析。参见,10X,2019,《内部Visium空间技术》。
[0007]这种分析的一个困难是确保样品或样品的图像(例如,组织切片或组织切片的图像)与条形码捕获探针正确对齐(例如,使用基准对齐)。在用于组织样品制备和切片的传统湿实验室方法中,频繁出现样品质量的缺陷进一步复杂化了本领域的技术限制。这些问题是由于组织样品本身的性质(尤其包括间隙区域、液泡和/或在成像后通常难以解释的一般粒度)或由于不适当的处理或样品降解而引起的,不适当的处理或样品降解导致样品中的间隙或孔(例如,撕裂样品或仅获得部分样品,如从活组织检查中获得)。另外,用于成像的湿实验室方法会导致其它缺陷,包括但不限于气泡、碎片、沉积在基底或组织上的结晶染色颗粒、不一致或较差的对比度染色,和/或产生图像模糊、曝光过度或曝光不足,和/或分辨率差的显微镜限制。参见,Uchida,2013,《生物图像的图像处理和识别(Image processing and recognition for biological images)》,《发展、生长和分化(Develop.Growth Differ.)》55,523

549,doi:10.1111/dgd.12054,其通过引用整体并入本文。这种缺陷使得对齐更加困难。
[0008]因此,本领域需要提供改进的空间分析物(例如,核酸和蛋白质)分析的系统和方法。此类系统和方法将允许图像中组织样品的可再现的标识和对齐,而不需要大量的培训和劳动力成本,并且将通过消除由于主观对齐引起的人为误差来进一步提高标识的准确性。此类系统和方法将进一步为从业者提供成本有效的、用户友好的工具以可靠地执行空间分析物分析。

技术实现思路

[0009]在本公开中提供了用于解决上述问题的技术解决方案(例如,计算系统、方法和非暂时性计算机可读存储介质)。
[0010]以下呈现本公开的
技术实现思路
以便提供对本公开的一些方面的基本理解。该
技术实现思路
不是本公开的广泛综述。其不旨在标识本公开的关键/重要元素或描绘本公开的范围。其唯一目的是以简化形式呈现本专利技术的一些概念,作为稍后呈现的更详细描述的序言。
[0011]本公开的一个方面提供了一种分析物的空间分析方法,其包含:A)将样品(例如,切片的组织样品)放置在基底上,其中基底包括多个基准标记和一组捕获点。在一些实施例中,该组捕获点包含至少1000、2000、5000、10,000、15,000、20,000、25,000、30,000、35,000、40,000、45,000、50,000、55,000、60,000、65,000、70,000、75,000、80,000、85,000、90,000、95,000或100,000个捕获点。基准标记不直接或间接地与本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种分析物的空间分析方法,其包含:A)将样品放置在基底上,其中所述基底包含多个基准标记和一组捕获点,其中所述一组捕获点包含至少1000个捕获点;B)获得所述基底上的所述样品的一个或多个图像,其中所述一个或多个图像中的每个相应图像包含呈像素值阵列形式的对应多个像素,其中所述像素值阵列包含至少100,000个像素值;C)在A)放置后,以电子形式从所述一组捕获点获得多个序列读数,其中:一组捕获探针群中的每个相应捕获探针群(i)位于所述一组捕获点中的不同捕获点处,并且(ii)直接或间接地与来自所述样品的一种或多种分析物缔合,所述一组捕获探针群中的每个相应捕获探针群由多个空间条形码中的至少一个唯一空间条形码来表征,所述多个序列读数包含对应于所述一种或多种分析物的全部或部分的序列读数,以及所述多个序列读数包含至少10,000个序列读数,以及所述多个序列读数中的每个相应序列读数包括所述一组捕获探针群中所述对应的捕获探针群的空间条形码或其互补物;D)使用所述多个空间条形码的全部或子集来将所述多个序列读数中的相应序列读数定位到所述一组捕获点中的对应捕获点,从而将所述多个序列读数划分成多个序列读数子集,每个相应序列读数子集对应于所述多个捕获点中的不同捕获点;以及E)使用所述多个基准标记以提供复合表示,所述复合表示包含(i)与所述基底上的所述一组捕获点对齐的所述一个或多个图像和(ii)映射到对应于所述样品中的所述一种或多种分析物的相应位置的相应捕获点的在所述一个或多个图像内的每个相应位置处的每个序列读数子集的全部或一部分的表示。2.根据权利要求1所述的方法,其中所述复合表示提供了映射到所述多个捕获点中的每个捕获点处的多种分析物中的每种分析物的核酸片段的相对丰度。3.根据权利要求1所述的方法,其中在E)中,通过包含以下步骤的过程将所述一个或多个图像中的第一图像与所述基底上的所述一组捕获点进行对齐:分析所述像素值阵列以标识所述第一图像的多个导出基准点;使用与所述基底唯一相关联的基底标识符来选择多个模板中的第一模板,其中所述多个模板中的每个模板包含对应的多个参考基准点的参考位置和对应的坐标系;使用对齐算法将所述第一图像的所述多个导出基准点与所述第一模板的所述对应的多个参考基准点进行对齐,以获得所述第一图像的所述多个导出基准点与所述第一模板的所述对应的多个参考基准点之间的变换;以及使用所述变换和所述第一模板的所述坐标系来定位所述一组捕获点中的每个捕获点在所述第一图像中的对应位置。4.根据权利要求3所述的方法,其中使用所述变换和所述第一模板的所述坐标系来定位所述一组捕获点中的每个捕获点包含:通过包含以下步骤的过程将所述多个像素中的每个相应像素分配给第一类或第二类,其中所述第一类表示所述样品在所述基底上的覆盖,并且所述第二类表示背景:(i)使用所述多个基准标记来限定所述第一图像内的边界框,
(ii)从所述多个像素去除落在所述边界框之外的相应像素,(iii)在所述去除(ii)之后,在所述多个像素上运行多个启发式分类器,其中,对于多个像素,所述启发式分类器对所述相应像素进行所述第一类和所述第二类之间的投票,从而为所述多个像素中的每个相应像素形成对应的合计得分,以及(iv)对所述多个像素中的每个相应像素的所述合计得分和强度应用分割算法,以独立地为所述多个像素中的每个相应像素分配作为样品或背景的概率。5.根据权利要求4所述的方法,其中每个对应的合计得分是包含明显的第一类、可能的第一类、可能的第二类和明显的第二类的一组类中的一个类。6.根据权利要求1所述的方法,其中所述方法进一步包含,对于多个基因座中的每个相应基因座,执行包含以下步骤的过程:i)对所述多个序列读数中映射到所述相应基因座的每个相应序列读数进行对齐,从而从所述相应基因座的对应单元型组中确定所述相应序列读数的单元型同一性,以及ii)通过所述相应序列读数的所述空间条形码和所述单元型同一性对所述多个序列读数中映射到所述相应基因座的每个相应序列读数进行分类,从而确定所述样品中每个对应单元型组中的每个单元型的空间分布,其中对于所述基底上所述一组捕获点中的每个捕获点,所述空间分布包括所述相应基因座的所述单元型组中每个单元型的丰度。7.根据权利要求6所述的方法,所述方法进一步包含使用所述空间分布来表征受试者的生物学状况。8.根据权利要求4所述的方法,所述方法进一步包含:将掩模覆盖在所述第一图像上,其中所述掩模使得所述第一图像的所述多个像素中已被分配成为样品的更大概率的每个相应像素被分配第一属性,并且使得所述多个像素中已被分配成为背景的更大概率的每个相应像素被分配第二属性。9.根据权利要求8所述的方法,其中所述第一属性是第一颜色,且所述第二属性是第二颜色。10.根据权利要求9所述的方法,其中所述第一颜色是红色和蓝色中的一种,且所述第二颜色是红色和蓝色中的另一种。11.根据权利要求8所述的方法,其中所述第一属性是亮度或不透明度的第一水平,且所述第二属性是亮度或不透明度的第二水平。12.根据权利要求8所述的方法,所述方法进一步包含:基于所述复合表示中的所述捕获点的相应表示附近的像素的独立分配,所述复合表示中的所述多个捕获点中的捕获点的每个相应表示被分配所述第一属性或所述第二属性。13.根据权利要求1所述的方法,其中所述一组捕获点中的捕获点包含捕获域。14.根据权利要求1所述的方法,其中所述一组捕获点中的捕获点包含切割域。15.根据权利要求1所述的方法,其中所述一组捕获点中的每个捕获点直接附着或间接附着于所述基底。16.根据权利要求1所述的方法,其中所述一种或多种分析物包含五种或更多种分析物、十种或更多种分析物、五十种或更多种分析物、一百种或更多种分析物、五百种或更多种分析物、1000种或更多种分析物、2000种或更多种分析物,或2000种至100,000种分析物。
17.根据权利要求1所述的方法,其中唯一空间条形码对从集合{1,

,1024}、{1,

,4096}、{1,

,16384}、{1,

,65536}、{1,

,262144}、{1,

,1048576}、{1,

,4194304}、{1,

,16777216}、{1,

,67108864}或{1,

,1x 10
12
}中选择的唯一预定值进行编码。18.根据权利要求1至17中任一项所述的方法,其中所述一组捕获探针群中的相应捕获探针群包括1000个或更多个捕获探针、2000个或更多个捕获探针、10,000个或更多个捕获探针、100,000个或更多个捕获探针、1x 106个或更多个捕获探针、2x106个或更多个捕获探针,或5x 106个或更多个捕获探针。19.根据权利要求18所述的方法,其中所述相应捕获探针群中的每个捕获探针包括聚

T序列和表征不同捕获点的所述唯一空间条形码。20.根据权利要求18所述的方法,其中所述相应捕获探针群中的每个捕获探针包括与所述多个空间条形码相同的空间条形码。21.根据权利要求18所述的方法,其中所述相应捕获探针群中的每个捕获探针包括与所述多个空间条形码不同的空间条形码。22.根据权利要求1所述的方法,其中所述样品是深度为100微米或更小的切片组织样品。23.根据权利要求22所述的方法,其中所述一个或多个图像包含多个图像,并且所述多个图像中的第一图像是使用所述样品的第一切片获得的,并且所述多个图像中的第二图像是使用所述样品的第二切片获得的。24.根据权利要求1所述的方法,其中所述一种或多种分析物是多种分析物,所述一组捕获探针群中的相应捕获探针群包括多个捕获探针,所述多个捕获探针中的每个捕获探针包括由多种捕获域类型中的一种捕获域类型表征的捕获域,以及所述多种捕获域类型中的每种相应捕获域类型被配置成结合所述多种分析物中的不同分析物。25.根据权利要求24所述的方法,其中所述多种捕获域类型包含2至15,000种捕获域类型,并且对于所述多种捕获域类型中的每种捕获域类型,所述相应捕获探针群包括至少5个、至少10个、至少100个或至少1000个捕获探针。26.根据权利要求1所述的方法,其中所述一种或多种分析物是多种分析物,所述一组捕获点中的相应捕获点包括多个捕获探针,所述多个捕获探针中的每个捕获探针包括由被配置成以无偏方式结合所述多种分析物中的每种分析物的单一捕获域类型表征的捕获域。28.根据权利要求1所述的方法,其中所述一组捕获点中的至少30%、至少40%、至少50%、至少60%、至少70%、至少80%或至少90%的所述捕获点中的每个捕获点包含在所述基底上对应的100微米
×
100微米的正方形内。29.根据权利要求1所述的方法,其中所述基底上的所述一组捕获点中的每个相应捕获点的中心到相邻捕获点之间的距离在50微米至300微米之间。30.根据权利要求1所述的方法,其中所述一组捕获点中的至少30%、至少40%、至少50%、至少60%、至少70%、至少80%或至少90%的所述捕获点具有80微米或更小的直径。
31.根据权利要求1所述的方法,其中所述一组捕获点中的至少30%、至少40%、至少50%、至少60%、至少70%、至少80%或至少90%的所述捕获点具有25微米至65微米之间的直径。32.根据权利要求1所述的方法,其中所述基底上的所述一组捕获点中的每个相应捕获点的中心到相邻捕获点之间的距离在40微米至100微米之间。33.根据权利要求4所述的方法,其中所述多个启发式分类器包含第一启发式分类器,所述第一启发式分类器标识将所述多个像素划分为所述第一类和所述第二类的单个强度阈值,从而使得所述第一启发式分类器对所述多个像素中的每个相应像素进行所述第一类或所述第二类的投票,并且其中所述单个强度阈值表示所...

【专利技术属性】
技术研发人员:尹沂峰Z
申请(专利权)人:一零X基因组学有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1