用于目标区域捕获高通量测序的特异性肿瘤探针区域设计方法和装置以及探针制造方法及图纸

技术编号:15199993 阅读:131 留言:0更新日期:2017-04-22 00:56
本发明专利技术公开了一种用于目标区域捕获高通量测序的特异性肿瘤探针区域设计方法和装置以及探针,该方法包括:计算第一肿瘤突变数据库中与待设计的肿瘤相关的基因和突变,找出突变频率最高的CDS区域,作为第一区域;使用第二肿瘤突变数据库中的肿瘤患者数据验证所述第一区域,并使样本频率最大化,得到包含最多患者的区域,作为第二区域;计算样本频率以及RI值,对样本区域进一步优化,得到第三区域,其中RI值表示平均1kb内含有的突变数。利用本发明专利技术的方法,只对目标区域进行研究,测序范围大幅度减少,测序时间和费用相应降低,可以显著减少检测周期,降低成本,更适合临床应用。

Method and apparatus for designing a specific tumor probe region for high-throughput sequencing of target regions

The invention discloses a method for capturing the target area for high-throughput sequencing of tumor specific probe design method and device and probe, the method includes: calculating the first tumor mutation database related to the design of tumor genes and mutations found mutations in the CDS region with the highest frequency, as the first region; second tumor tumor with the data in the database to verify the first region, and the maximum sample frequency, most patients included area, as the second areas; calculation of sample frequency and RI value, further optimization of the sample area, third area, the average value of RI indicates the 1KB contained in the mutation. By using the method of the invention, only the target area is studied, the sequencing range is greatly reduced, the sequencing time and the cost are reduced correspondingly, the detection period is reduced, the cost is reduced, and the utility model is more suitable for clinical application.

【技术实现步骤摘要】

本专利技术涉及肿瘤探针设计
,尤其涉及一种用于目标区域捕获高通量测序的特异性肿瘤探针区域设计方法和装置以及探针
技术介绍
据世界卫生组织(WHO)2014年2月4日发布的新版《世界癌症报告》统计,每年新增癌症患者数量约为1400万,预计在2025年增长至1900万,2030年增长至2200万,2035年增长至2400万。其中,2012年中国癌症发病人数为306.5万,约占全球发病人数的五分之一。癌症死亡人数为220.5万,约占全球癌症死亡人数的四分之一。今后20年,我国癌症的发病数和死亡数还将持续上升。根据国际癌症研究署预测,如不采取有效措施,我国癌症发病数和死亡数到2020年将上升至400万人和300万人;2030年将上升至500万人和350万人。我国癌症发病率接近世界水平,但死亡率高于世界水平,其中肝癌的死亡率排在所有癌症种类的第二位。肿瘤防治专家认为,癌症死亡率居高不下,主要原因在于我国癌症发现较多处于中晚期。若能提早发现癌症,加以干预,针对不同病人的实际情况,采取方便快捷、确实有效的治疗以及监测手段,对缓解病人的痛苦、降低死亡率无疑具有重要的意义。在我国,肝癌是最常见的恶性肿瘤之一,每年死于肝癌的人数高达350,000,并且呈逐年递增的趋势[1]。目前对于肝癌的治疗除了手术之外,具有针对性的靶向药物较少,大部分(尤其是具有转移病灶)的患者需要通过化疗进行治疗。有研究表明,通过确定患者的特定病因进而采取靶向疗法更加安全、有效[2,3,4]。目前,大多数的检测仍然是以一种低通量的方式,来研究某个基因的相关遗传变异。尽管当前已有众多肝细胞癌相关的研究,但由于目前技术、成本的限制,依然没有普遍意义上针对肝癌患者的基因检测。近年来发展的高通量测序技术,为肝癌的研究提供了一条新途径,可以通过取得癌症病人的肿瘤组织DNA,对患者的基因变异进行批量研究,寻找可用于治疗的药物靶点,同时为新药研究及开发等奠定遗传学基础。然而,全基因组/全外显子组测序成本较高,并且研究某一特定肿瘤时(如肝癌),针对性较差。目标区域捕获高通量测序技术,可以通过设计特异性的探针,对感兴趣的基因进行目标区域捕获,随后进行测序,显著提高研究的特异性,节约成本。因此,设计针对肝癌特异性的探针区域以及探针序列显得尤为重要。目前,大多数的肿瘤基因检测仍以一种低通量的方式,研究某个基因的相关遗传变异以及体细胞突变。StoehrR等利用Sanger测序的方法对167例前列腺癌患者TERT基因的启动子区进行了研究[5]。WooHG等通过直接测序的方法对409名肝细胞癌患者的TP53基因进行了研究,发现TP53基因的R249S和V157F突变与肝细胞癌患者的预后相关[6]。意大利的科学家通过对65例肝细胞癌患者的DNA进行直接测序,对KRAS、BRAF以及PIK3CA三个基因进行了研究[7]。以上研究使用的这些方法需要根据已报道的相关文献,针对已知基因进行检测,检出率低,并且一次只能对部分基因进行检测,通量低,不适合用于致病基因复杂的癌症基因检测。随着高通量测序的发展,近些年越来越多的研究通过全基因组/全外显子测序的方法对肝癌患者的基因组DNA进行研究。郑汉城等[8]的研究分别对88例肝细胞癌患者的肿瘤组织和癌旁组织进行了全基因组测序。发现了一系列与HBV介导的肝细胞癌发生、发展相关的基因突变及相关信号通路变化。该研究发现了肝细胞癌发生过程中不同于其他癌症的两条关键性信号通路。研究人员表示,这可能是一些靶向治疗方法在其他癌症中能够发挥作用,而在肝细胞癌中无法奏效的原因所在[8],为肝癌的早期诊断、治疗及靶向药物研发等提供了非常宝贵的资源,有助于提高肝癌的诊断和预防[9]。然而,通过全基因组/全外显子组测序对患者的基因组变异进行研究,成本较高,且不适于临床应用。目标区域捕获高通量测序技术,是一种结合特异性目标区域捕获芯片以及高通量测序的基因检测技术,通过将生物样本中基因靶序列与固定有基因探针的基因芯片进行特异性杂交,随后通过高通量测序,给出待检基因的基因信息的方法。LuscanA等研究设计了一个包含409个基因的芯片,用于黑色素瘤突变谱的研究,通过序列捕获测序发现了FBXW7基因在肿瘤发生发展中的作用[10]。目前已有基于高通量测序的肿瘤个性化治疗基因检测服务项目,旨在为肿瘤患者提供全方位的用药指导,实现肿瘤的个性化治疗。然而,大部分的检测由于所涉及的基因较多,针对性较差,成本较高。因此,开展高通量检测应用于癌症的检测,离不开好的有针对性的基因芯片。一些研究通过全基因组/全外显子组测序的方法对肝癌患者的基因组DNA进行研究,由于成本较高,不适合临床应用,很多研究者进而转向目标区域捕获高通量测序技术,设计相关基因芯片对感兴趣的基因进行研究。现有的目标区域捕获探针只是对明确报道的致病基因进行探针设计,缺乏针对性。这种检测存在一定的缺陷,基因芯片的设计缺乏针对性,成本相对较高,不能有针对性的对肝癌患者进行大规模研究。
技术实现思路
本专利技术提供一种用于目标区域捕获高通量测序的特异性肿瘤探针区域设计方法和装置以及探针。根据本专利技术的第一方面,本专利技术提供一种用于目标区域捕获高通量测序的特异性肿瘤探针区域设计方法,包括:计算第一肿瘤突变数据库中与待设计的肿瘤相关的基因和突变,找出突变频率最高的CDS区域,作为第一区域;使用第二肿瘤突变数据库中的肿瘤患者数据验证上述第一区域,并使样本频率最大化,得到包含最多患者的区域,作为第二区域;计算样本频率以及RI值,对样本区域进一步优化,得到第三区域,其中RI值表示平均1kb内含有的突变数。进一步地,上述方法还包括如下至少之一:选取肿瘤治疗相关的化疗药物位点,将得到的包含SNP的区域,作为第四区域;选取已经明确的肿瘤治疗药物靶标,同时加入一些潜在的药物治疗靶点,作为第五区域。进一步地,上述产生第一区域的步骤具体包括:计算肿瘤患者特定基因的突变频率,确定第一临界值,筛选出种子基因,得到种子基因的个数;计算CDS区域的突变频率,确定第二临界值,选择最初的探针区域;通过上述种子基因与上述CDS区域取交集获得上述第一区域。进一步地,上述产生第二区域的步骤具体包括:去除上述第二肿瘤突变数据库中待设计的肿瘤项目的患者中突变发生在上述第一区域的患者;计算剩余患者所有CDS区域的样本频率,确定第三临界值;计算剩余CDS区域,如果有新的样本在此区域发生突变,则区域被保留;对以上步骤进行迭代,直到无区域符合条件为止,得到第二区域。进一步地,上述产生第三区域的步骤具体包括:以样本临界值为M以及RI值临界值为N进行计算,得到候选CDS区域,其中样本临界值M表示至少M个样本在此区域内发生突变;计算上述候选CDS区域的突变频率,进一步筛选,选取临界值为P,得到上述第三区域,其中临界值P表示只保留至少包含P个突变的CDS区域。进一步地,上述肿瘤为肝癌。进一步地,上述第一肿瘤突变数据库为癌症中体细胞突变目录数据库(CatalogueofSomaticMutationsinCancer,COSMIC),上述第二肿瘤突变数据库为国际癌症基因组联盟数据库(InternationalCancerGenomeConsortium,ICGC)。根据本发本文档来自技高网
...
用于目标区域捕获高通量测序的特异性肿瘤探针区域设计方法和装置以及探针

【技术保护点】
一种用于目标区域捕获高通量测序的特异性肿瘤探针区域设计方法,其特征在于,所述方法包括:计算第一肿瘤突变数据库中与待设计的肿瘤相关的基因和突变,找出突变频率最高的CDS区域,作为第一区域;使用第二肿瘤突变数据库中的肿瘤患者数据验证所述第一区域,并使样本频率最大化,得到包含最多患者的区域,作为第二区域;计算样本频率以及RI值,对样本区域进一步优化,得到第三区域,其中RI值表示平均1kb内含有的突变数。

【技术特征摘要】
1.一种用于目标区域捕获高通量测序的特异性肿瘤探针区域设计方法,其特征在于,所述方法包括:计算第一肿瘤突变数据库中与待设计的肿瘤相关的基因和突变,找出突变频率最高的CDS区域,作为第一区域;使用第二肿瘤突变数据库中的肿瘤患者数据验证所述第一区域,并使样本频率最大化,得到包含最多患者的区域,作为第二区域;计算样本频率以及RI值,对样本区域进一步优化,得到第三区域,其中RI值表示平均1kb内含有的突变数。2.根据权利要求1所述的特异性肿瘤探针区域设计方法,其特征在于,所述方法还包括如下至少之一:选取肿瘤治疗相关的化疗药物位点,将得到的包含SNP的区域,作为第四区域;选取已经明确的肿瘤治疗药物靶标,同时加入一些潜在的药物治疗靶点,作为第五区域。3.根据权利要求1所述的特异性肿瘤探针区域设计方法,其特征在于,所述产生第一区域的步骤具体包括:计算肿瘤患者特定基因的突变频率,确定第一临界值,筛选出种子基因,得到种子基因的个数;计算CDS区域的突变频率,确定第二临界值,选择最初的探针区域;通过所述种子基因与所述CDS区域取交集获得所述第一区域。4.根据权利要求1所述的特异性肿瘤探针区域设计方法,其特征在于,所述产生第二区域的步骤具体包括:去除所述第二肿瘤突变数据库中待设计的肿瘤项目的患者中突变发生在所述第一区域的患者;计算剩余患者所有CDS区域的样本频率,确定第三临界值;计算剩余CDS区域,如果有新的样本在此区域发生突变,则区域被保留;对以上步骤进行迭代,直到无区域符合条件为止,得到第二区域。5.根据权利要求1所述的特异性肿瘤探针区域设计方法,其特征在于,所述产生第三区域的步骤具体包括:以样本临界值为M以及RI值临界值为N进行计算,得到候选CDS区域,其中样本临界值M表示至少M个样本在此区域内发生突变;计算所述候选CDS区域的突变频率,进一步筛选,选取临界值为P,得到所述第三区域,其中临界值...

【专利技术属性】
技术研发人员:孙岩程征宇方晓东魏晓明石泉于竞林木飞
申请(专利权)人:深圳华大基因科技服务有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1