本发明专利技术提供了基因组分析的系统和方法,提供了一种框架来确定肿瘤的克隆性、所有主要克隆的数目和比例以及用于区分它们的变异体。该探讨的系统和方法也允许将突变定相到亲本等位基因,从而确定它们在肿瘤细胞群体出现的时间,以及对于存在肿瘤活检中的污染正常组织的量提供准确的估计。
【技术实现步骤摘要】
【国外来华专利技术】【专利说明】 本申请请求保护我们共同审理中的序列号为61/711467的美国临时申请的优先 权,该申请于2012年10月9日提交,在此通过引用并入全文。
本专利技术的领域是基因组数据的计算分析,特别是其设及混合细胞群的克隆性状态 的鉴定。
技术介绍
随着全基因组数据的日益普及和全基因组测序的不断提速,如今可W得到大批量 的数据,该便要求有意义的分析W将信息提供给临床医生或科学家来实现更有效的治疗或 药物开发。 例如,现在可W从像"癌症基因组图谱"(TCGA)项目获得多种肿瘤和匹配的正常 全基因组序列,而难W提取相关的信息。为了获得统计学相关数据,基因组测序的高覆盖度 (例如,大于30倍)的需要,使问题变得更加复杂。该样的基因组信息即使W压缩的形式, 通常可W达到数百GB,并在许多情况下,对多个该样的大数据集进行比较的有意义的分析 是非常缓慢,并难W管理的,但是,对于发现相对于第二样本在任何给定样品中发生的许多 基因组变化,是绝对必要的。最近,正如W02013/074058中描述的,已经开发了系统和方法, 通过避免大量输出文件的格式来实现信息的快速产生。该专利公布和本文中设及的所有其 它公布均通过引用并入全文,其程度相当于每个单独的公告或专利申请被特定地和单独地 指出通过引用并入全文。如果并入的参考文献中的定义或术语的使用与本文提供的该术语 的定义不一致或相反,本文提供的该术语的定义适用,引用文献中的术语的定义不适用。 尽管'048应用的系统比其它已知系统有了显著改进,但仍存在着各种各样的困 难。例如,大多数的乳腺癌是临床异质性和基因组异质性的,是由几个不同病理和分子亚型 组成的,所述不同病理和分子亚型往往使得基因组分析变得复杂。此外,为了洞察组织的肿 瘤细胞中可能的肿瘤细胞演变和导致的克隆性,目前已知的方法不允许对该种基因组多样 性去卷积。 因此,尽管基因组分析的许多方法是已知的现有技术,但所有的或几乎所有的方 法都苦于一些缺点。最显著地,迄今已知的方法无法允许在分子水平上的肿瘤进展的鉴定, 从而不能洞察克隆性和潜在的治疗功效。从另一个角度看,迄今已知的方法无法允许鉴定 含有多个非同质细胞的样本中的克隆性和细胞群的克隆的关系。因此,仍然有需要提供一 种改进的用于基因组分析的系统和方法,特别是提供关于克隆性、克隆比例、分子肿瘤进展 的信息的,和/或基于该样的信息提供治疗方案的系统和方法。
技术实现思路
本专利技术设及用于遗传分析的各种系统、装置和方法,特别是设及用于鉴定样品中 不同细胞克隆的存在和分布的基因组分析的各种系统、装置和方法,其中,所述样品包含一 个或多个细胞的克隆群,所述鉴定样品中不同细胞克隆的存在和分布的基因组分析基于从 样品中获得的基因组数据。在特别优选的方面中,所述分析基于来自肿瘤或其它异常细胞 群的基因组DNA,并且不仅能够确定肿瘤或细胞群中的多个克隆,还能识别可能的克隆演变 和/或克隆关系。 在本专利技术主题的一个方面,根据从肿瘤中获得的测序数据来体外确定肿瘤克隆性 的方法,包括从测序数据确定测序数据中等位基因的拷贝数和等位基因比例的步骤,W及 基于确定的拷贝数和确定的等位基因比例计算等位基因的等位基因状态的另一步骤。等位 基因状态随后被用来确定肿瘤的克隆性。不限于本专利技术的主题,一般优选地,等位基因状态 绘制或显示在等位基因状态图中(其可W是单或双等位基因状态图)。 在本专利技术的主题的至少一些实施方式中,拷贝数和等位基因比例的确定是通过序 列分析程序(例如,BAMBAM)实施的,所述序列分析程序通过序列串的增量同步产生局部比 对。在其他状态中,预期等位基因状态包括正常的拷贝数、单拷贝扩增、单拷贝/半合子缺 失、拷贝中性杂合子缺失和两个等位基因扩增。 在本专利技术主题的进一步预期实施方式中,等位基因状态的计算包括正常污染的纠 正,对于肿瘤和正常细胞使用主要与次要等位基因状态,和/或包括对于等位基因的混合 比例Mb的确定(对于单克隆肿瘤是0或1,或者当肿瘤是多克隆时,大于0且小于1)。仍 然可W进一步预期的是,等位基因状态的计算也可W包括测序覆盖水平的纠正,特别是在 对肿瘤的覆盖水平比同一患者的相应的非肿瘤(例如,健康)样品的覆盖水平更高的情况 下。 在需要时,预期的方法将进一步包括确定等位基因状态的地标(landmark)的步 骤,其优选用于确定肿瘤中的一些不同的(相关或不相关的)克隆和/或肿瘤中的一部分 克隆。此外,或可替代地,仍然可W进一步预期的是,突变可W与主要等位基因或次要等位 基因有关,并且该突变等位基因比例可用于确定相对于等位基因状态的变化的突变发生的 时间。 在本专利技术主题的另一个方面,肿瘤中的等位基因状态的体外可视的方法,包括:确 定测序数据中等位基因的拷贝数和等位基因比例的步骤,W及基于确定的拷贝数和确定的 等位基因比例计算等位基因的等位基因状态的步骤。在更进一步的步骤中,等位基因的等 位基因状态绘制在等位基因状态图中,所述等位基因状态图为拷贝数-等位基因比例图 (通常是主要等位基因比例)。 最典型地,等位基因状态图呈现使得等位基因状态图中的每个顶点对应于一个肿 瘤等位基因状态,在多克隆肿瘤图中,具有等位基因的增加或缺失的克隆沿顶点间绘制的 边缘绘制,和/或在多克隆肿瘤图中,具有除了等位基因的增加或缺失外的其他变化的克 隆在顶点间绘制的边缘之间绘制。仍然可W进一步预期的是,对于正常污染,等位基因状态 图可调。当然,应该理解的是,等位基因状态图可W是双等位基因状态图。 因此,从不同的角度来看,专利技术人也考虑了BAM服务器中接收多个基因组序列的 读取的分析基因测序数据的方法,其中,所述多个基因组序列的读取是从同一患者肿瘤样 品的基因组和正常样品的基因组中获得的。所述BAM服务器随后处理多个基因组序列的读 取,W产生多个差分序列对象,所述差分序列对象包括肿瘤基因组中的等位基因的拷贝数 和等位基因比例。分析工具(其禪合到BAM服务器)随后处理等位基因的拷贝数和等位基 因比例,从而确定等位基因的等位基因状态。 在此类方法的典型实施方式中,差分序列数据库被禪合到所述BAM服务器和分析 工具,使得所述BAM服务器将差分序列对象提供到差分序列数据库,并且使得所述差分序 列数据库将所述差分序列对象提供到所述分析工具。此外,可W预期,分析工具生成图像输 出,所述图像输出绘制了等位基因状态图中等位基因的等位基因状态。 在本专利技术主题的另一个预期的方面中,体外表征来自肿瘤的基因组信息的方法, 包括确定肿瘤基因组中等位基因的等位基因状态的步骤,W及通过确定的等位基因状态识 别肿瘤为单克隆肿瘤或为包括至少两个不同肿瘤克隆的步骤。 在该样的方法中,还考虑到使用所确定的等位基因状态,W识别肿瘤克隆的关系 (例如,为不同且不相关的或相关的)。在克隆为相关的情况下,可W考虑到,所确定的等位 基因状态可被用于确定不同肿瘤克隆的克隆来历。[001引因此,专利技术人也考虑体外表征肿瘤块中的肿瘤克隆的方法,在其中一个步骤中 (如从BAM服务器)获取来自肿瘤块的基因组序列信息。在另一步骤中,所述基因组信息被 用来确定肿瘤基因组序列信息中的等位基因的等位基因状态。在进一步的步骤中,确定等 位基因状态图中等位基因的等位本文档来自技高网...
【技术保护点】
一种通过从肿瘤获得的测序数据体外测定肿瘤的克隆性的方法,包括:从所述测序数据确定测序数据内的等位基因的拷贝数和等位基因比例;基于所述确定的拷贝数和确定的等位基因比例计算所述等位基因的等位基因状态;以及使用所述等位基因状态确定肿瘤的克隆性。
【技术特征摘要】
【国外来华专利技术】
【专利技术属性】
技术研发人员:J·Z·桑伯恩,
申请(专利权)人:凡弗三基因组有限公司,
类型:发明
国别省市:美国;US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。