【技术实现步骤摘要】
【国外来华专利技术】分析物的空间分析
[0001]相关申请的交叉引用
[0002]本申请要求于2020年6月20日提交的题为《用于分析物的空间分析的流水线(Pipeline for Spatial Analysis of Analytes)》的美国临时专利申请第63/041,825号、于2020年2月21日提交的题为《用于分析物的分析的流水线(Pipeline for Analysis of Analytes)》的美国临时专利申请第62/980,073号,以及于2019年11月21日提交的题为《用于分析物的分析的流水线(Pipeline for Analysis of Analytes)》的美国临时专利申请第62/938,336号的优先权,其各自通过引用整体并入本文。
[0003]本说明书描述了涉及在大型复杂的数据集中处理观察到的分析物数据(例如空间排列的下一代测序数据)并且使用该数据来可视化图案的技术。
技术介绍
[0004]复杂组织中分析物的空间分辨率提供了对生物功能和形态学的基础过程的新见解,如细胞命运和发育、疾病进展和检测,以及细胞和组织水平的调节网络。参见,Satija等人,2015,《单细胞基因表达数据的空间重建(Spatial reconstruction of single
‑
cell gene expression data)》,《自然生物技术(Nature Biotechnology.)》33,495
‑
502,doi:10.1038.nbt.3192和Achim等 ...
【技术保护点】
【技术特征摘要】
【国外来华专利技术】1.一种分析物的空间分析方法,其包含:A)将样品放置在基底上,其中所述基底包含多个基准标记和一组捕获点,其中所述一组捕获点包含至少1000个捕获点;B)获得所述基底上的所述样品的一个或多个图像,其中所述一个或多个图像中的每个相应图像包含呈像素值阵列形式的对应多个像素,其中所述像素值阵列包含至少100,000个像素值;C)在A)放置后,以电子形式从所述一组捕获点获得多个序列读数,其中:一组捕获探针群中的每个相应捕获探针群(i)位于所述一组捕获点中的不同捕获点处,并且(ii)直接或间接地与来自所述样品的一种或多种分析物缔合,所述一组捕获探针群中的每个相应捕获探针群由多个空间条形码中的至少一个唯一空间条形码来表征,所述多个序列读数包含对应于所述一种或多种分析物的全部或部分的序列读数,以及所述多个序列读数包含至少10,000个序列读数,以及所述多个序列读数中的每个相应序列读数包括所述一组捕获探针群中所述对应的捕获探针群的空间条形码或其互补物;D)使用所述多个空间条形码的全部或子集来将所述多个序列读数中的相应序列读数定位到所述一组捕获点中的对应捕获点,从而将所述多个序列读数划分成多个序列读数子集,每个相应序列读数子集对应于所述多个捕获点中的不同捕获点;以及E)使用所述多个基准标记以提供复合表示,所述复合表示包含(i)与所述基底上的所述一组捕获点对齐的所述一个或多个图像和(ii)映射到对应于所述样品中的所述一种或多种分析物的相应位置的相应捕获点的在所述一个或多个图像内的每个相应位置处的每个序列读数子集的全部或一部分的表示。2.根据权利要求1所述的方法,其中所述复合表示提供了映射到所述多个捕获点中的每个捕获点处的多种分析物中的每种分析物的核酸片段的相对丰度。3.根据权利要求1所述的方法,其中在E)中,通过包含以下步骤的过程将所述一个或多个图像中的第一图像与所述基底上的所述一组捕获点进行对齐:分析所述像素值阵列以标识所述第一图像的多个导出基准点;使用与所述基底唯一相关联的基底标识符来选择多个模板中的第一模板,其中所述多个模板中的每个模板包含对应的多个参考基准点的参考位置和对应的坐标系;使用对齐算法将所述第一图像的所述多个导出基准点与所述第一模板的所述对应的多个参考基准点进行对齐,以获得所述第一图像的所述多个导出基准点与所述第一模板的所述对应的多个参考基准点之间的变换;以及使用所述变换和所述第一模板的所述坐标系来定位所述一组捕获点中的每个捕获点在所述第一图像中的对应位置。4.根据权利要求3所述的方法,其中使用所述变换和所述第一模板的所述坐标系来定位所述一组捕获点中的每个捕获点包含:通过包含以下步骤的过程将所述多个像素中的每个相应像素分配给第一类或第二类,其中所述第一类表示所述样品在所述基底上的覆盖,并且所述第二类表示背景:(i)使用所述多个基准标记来限定所述第一图像内的边界框,
(ii)从所述多个像素去除落在所述边界框之外的相应像素,(iii)在所述去除(ii)之后,在所述多个像素上运行多个启发式分类器,其中,对于多个像素,所述启发式分类器对所述相应像素进行所述第一类和所述第二类之间的投票,从而为所述多个像素中的每个相应像素形成对应的合计得分,以及(iv)对所述多个像素中的每个相应像素的所述合计得分和强度应用分割算法,以独立地为所述多个像素中的每个相应像素分配作为样品或背景的概率。5.根据权利要求4所述的方法,其中每个对应的合计得分是包含明显的第一类、可能的第一类、可能的第二类和明显的第二类的一组类中的一个类。6.根据权利要求1所述的方法,其中所述方法进一步包含,对于多个基因座中的每个相应基因座,执行包含以下步骤的过程:i)对所述多个序列读数中映射到所述相应基因座的每个相应序列读数进行对齐,从而从所述相应基因座的对应单元型组中确定所述相应序列读数的单元型同一性,以及ii)通过所述相应序列读数的所述空间条形码和所述单元型同一性对所述多个序列读数中映射到所述相应基因座的每个相应序列读数进行分类,从而确定所述样品中每个对应单元型组中的每个单元型的空间分布,其中对于所述基底上所述一组捕获点中的每个捕获点,所述空间分布包括所述相应基因座的所述单元型组中每个单元型的丰度。7.根据权利要求6所述的方法,所述方法进一步包含使用所述空间分布来表征受试者的生物学状况。8.根据权利要求4所述的方法,所述方法进一步包含:将掩模覆盖在所述第一图像上,其中所述掩模使得所述第一图像的所述多个像素中已被分配成为样品的更大概率的每个相应像素被分配第一属性,并且使得所述多个像素中已被分配成为背景的更大概率的每个相应像素被分配第二属性。9.根据权利要求8所述的方法,其中所述第一属性是第一颜色,且所述第二属性是第二颜色。10.根据权利要求9所述的方法,其中所述第一颜色是红色和蓝色中的一种,且所述第二颜色是红色和蓝色中的另一种。11.根据权利要求8所述的方法,其中所述第一属性是亮度或不透明度的第一水平,且所述第二属性是亮度或不透明度的第二水平。12.根据权利要求8所述的方法,所述方法进一步包含:基于所述复合表示中的所述捕获点的相应表示附近的像素的独立分配,所述复合表示中的所述多个捕获点中的捕获点的每个相应表示被分配所述第一属性或所述第二属性。13.根据权利要求1所述的方法,其中所述一组捕获点中的捕获点包含捕获域。14.根据权利要求1所述的方法,其中所述一组捕获点中的捕获点包含切割域。15.根据权利要求1所述的方法,其中所述一组捕获点中的每个捕获点直接附着或间接附着于所述基底。16.根据权利要求1所述的方法,其中所述一种或多种分析物包含五种或更多种分析物、十种或更多种分析物、五十种或更多种分析物、一百种或更多种分析物、五百种或更多种分析物、1000种或更多种分析物、2000种或更多种分析物,或2000种至100,000种分析物。
17.根据权利要求1所述的方法,其中唯一空间条形码对从集合{1,
…
,1024}、{1,
…
,4096}、{1,
…
,16384}、{1,
…
,65536}、{1,
…
,262144}、{1,
…
,1048576}、{1,
…
,4194304}、{1,
…
,16777216}、{1,
…
,67108864}或{1,
…
,1x 10
12
}中选择的唯一预定值进行编码。18.根据权利要求1至17中任一项所述的方法,其中所述一组捕获探针群中的相应捕获探针群包括1000个或更多个捕获探针、2000个或更多个捕获探针、10,000个或更多个捕获探针、100,000个或更多个捕获探针、1x 106个或更多个捕获探针、2x106个或更多个捕获探针,或5x 106个或更多个捕获探针。19.根据权利要求18所述的方法,其中所述相应捕获探针群中的每个捕获探针包括聚
‑
T序列和表征不同捕获点的所述唯一空间条形码。20.根据权利要求18所述的方法,其中所述相应捕获探针群中的每个捕获探针包括与所述多个空间条形码相同的空间条形码。21.根据权利要求18所述的方法,其中所述相应捕获探针群中的每个捕获探针包括与所述多个空间条形码不同的空间条形码。22.根据权利要求1所述的方法,其中所述样品是深度为100微米或更小的切片组织样品。23.根据权利要求22所述的方法,其中所述一个或多个图像包含多个图像,并且所述多个图像中的第一图像是使用所述样品的第一切片获得的,并且所述多个图像中的第二图像是使用所述样品的第二切片获得的。24.根据权利要求1所述的方法,其中所述一种或多种分析物是多种分析物,所述一组捕获探针群中的相应捕获探针群包括多个捕获探针,所述多个捕获探针中的每个捕获探针包括由多种捕获域类型中的一种捕获域类型表征的捕获域,以及所述多种捕获域类型中的每种相应捕获域类型被配置成结合所述多种分析物中的不同分析物。25.根据权利要求24所述的方法,其中所述多种捕获域类型包含2至15,000种捕获域类型,并且对于所述多种捕获域类型中的每种捕获域类型,所述相应捕获探针群包括至少5个、至少10个、至少100个或至少1000个捕获探针。26.根据权利要求1所述的方法,其中所述一种或多种分析物是多种分析物,所述一组捕获点中的相应捕获点包括多个捕获探针,所述多个捕获探针中的每个捕获探针包括由被配置成以无偏方式结合所述多种分析物中的每种分析物的单一捕获域类型表征的捕获域。28.根据权利要求1所述的方法,其中所述一组捕获点中的至少30%、至少40%、至少50%、至少60%、至少70%、至少80%或至少90%的所述捕获点中的每个捕获点包含在所述基底上对应的100微米
×
100微米的正方形内。29.根据权利要求1所述的方法,其中所述基底上的所述一组捕获点中的每个相应捕获点的中心到相邻捕获点之间的距离在50微米至300微米之间。30.根据权利要求1所述的方法,其中所述一组捕获点中的至少30%、至少40%、至少50%、至少60%、至少70%、至少80%或至少90%的所述捕获点具有80微米或更小的直径。
31.根据权利要求1所述的方法,其中所述一组捕获点中的至少30%、至少40%、至少50%、至少60%、至少70%、至少80%或至少90%的所述捕获点具有25微米至65微米之间的直径。32.根据权利要求1所述的方法,其中所述基底上的所述一组捕获点中的每个相应捕获点的中心到相邻捕获点之间的距离在40微米至100微米之间。33.根据权利要求4所述的方法,其中所述多个启发式分类器包含第一启发式分类器,所述第一启发式分类器标识将所述多个像素划分为所述第一类和所述第二类的单个强度阈值,从而使得所述第一启发式分类器对所述多个像素中的每个相应像素进行所述第一类或所述第二类的投票,并且其中所述单个强度阈值表示所...
【专利技术属性】
技术研发人员:尹沂峰,Z,
申请(专利权)人:一零X基因组学有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。