The invention discloses a method for capturing the target area for high-throughput sequencing of tumor specific probe design method and device and probe, the method includes: calculating the first tumor mutation database related to the design of tumor genes and mutations found mutations in the CDS region with the highest frequency, as the first region; second tumor tumor with the data in the database to verify the first region, and the maximum sample frequency, most patients included area, as the second areas; calculation of sample frequency and RI value, further optimization of the sample area, third area, the average value of RI indicates the 1KB contained in the mutation. By using the method of the invention, only the target area is studied, the sequencing range is greatly reduced, the sequencing time and the cost are reduced correspondingly, the detection period is reduced, the cost is reduced, and the utility model is more suitable for clinical application.
【技术实现步骤摘要】
本专利技术涉及肿瘤探针设计
,尤其涉及一种用于目标区域捕获高通量测序的特异性肿瘤探针区域设计方法和装置以及探针。
技术介绍
据世界卫生组织(WHO)2014年2月4日发布的新版《世界癌症报告》统计,每年新增癌症患者数量约为1400万,预计在2025年增长至1900万,2030年增长至2200万,2035年增长至2400万。其中,2012年中国癌症发病人数为306.5万,约占全球发病人数的五分之一。癌症死亡人数为220.5万,约占全球癌症死亡人数的四分之一。今后20年,我国癌症的发病数和死亡数还将持续上升。根据国际癌症研究署预测,如不采取有效措施,我国癌症发病数和死亡数到2020年将上升至400万人和300万人;2030年将上升至500万人和350万人。我国癌症发病率接近世界水平,但死亡率高于世界水平,其中肝癌的死亡率排在所有癌症种类的第二位。肿瘤防治专家认为,癌症死亡率居高不下,主要原因在于我国癌症发现较多处于中晚期。若能提早发现癌症,加以干预,针对不同病人的实际情况,采取方便快捷、确实有效的治疗以及监测手段,对缓解病人的痛苦、降低死亡率无疑具有重要的意义。在我国,肝癌是最常见的恶性肿瘤之一,每年死于肝癌的人数高达350,000,并且呈逐年递增的趋势[1]。目前对于肝癌的治疗除了手术之外,具有针对性的靶向药物较少,大部分(尤其是具有转移病灶)的患者需要通过化疗进行治疗。有研究表明,通过确定患者的特定病因进而采取靶向疗法更加安全、有效[2,3,4]。目前,大多数的检测仍然是以一种低通量的方式,来研究某个基因的相关遗传变异。尽管当前已有众多肝细胞癌相关 ...
【技术保护点】
一种用于目标区域捕获高通量测序的特异性肿瘤探针区域设计方法,其特征在于,所述方法包括:计算第一肿瘤突变数据库中与待设计的肿瘤相关的基因和突变,找出突变频率最高的CDS区域,作为第一区域;使用第二肿瘤突变数据库中的肿瘤患者数据验证所述第一区域,并使样本频率最大化,得到包含最多患者的区域,作为第二区域;计算样本频率以及RI值,对样本区域进一步优化,得到第三区域,其中RI值表示平均1kb内含有的突变数。
【技术特征摘要】
1.一种用于目标区域捕获高通量测序的特异性肿瘤探针区域设计方法,其特征在于,所述方法包括:计算第一肿瘤突变数据库中与待设计的肿瘤相关的基因和突变,找出突变频率最高的CDS区域,作为第一区域;使用第二肿瘤突变数据库中的肿瘤患者数据验证所述第一区域,并使样本频率最大化,得到包含最多患者的区域,作为第二区域;计算样本频率以及RI值,对样本区域进一步优化,得到第三区域,其中RI值表示平均1kb内含有的突变数。2.根据权利要求1所述的特异性肿瘤探针区域设计方法,其特征在于,所述方法还包括如下至少之一:选取肿瘤治疗相关的化疗药物位点,将得到的包含SNP的区域,作为第四区域;选取已经明确的肿瘤治疗药物靶标,同时加入一些潜在的药物治疗靶点,作为第五区域。3.根据权利要求1所述的特异性肿瘤探针区域设计方法,其特征在于,所述产生第一区域的步骤具体包括:计算肿瘤患者特定基因的突变频率,确定第一临界值,筛选出种子基因,得到种子基因的个数;计算CDS区域的突变频率,确定第二临界值,选择最初的探针区域;通过所述种子基因与所述CDS区域取交集获得所述第一区域。4.根据权利要求1所述的特异性肿瘤探针区域设计方法,其特征在于,所述产生第二区域的步骤具体包括:去除所述第二肿瘤突变数据库中待设计的肿瘤项目的患者中突变发生在所述第一区域的患者;计算剩余患者所有CDS区域的样本频率,确定第三临界值;计算剩余CDS区域,如果有新的样本在此区域发生突变,则区域被保留;对以上步骤进行迭代,直到无区域符合条件为止,得到第二区域。5.根据权利要求1所述的特异性肿瘤探针区域设计方法,其特征在于,所述产生第三区域的步骤具体包括:以样本临界值为M以及RI值临界值为N进行计算,得到候选CDS区域,其中样本临界值M表示至少M个样本在此区域内发生突变;计算所述候选CDS区域的突变频率,进一步筛选,选取临界值为P,得到所述第三区域,其中临界值...
【专利技术属性】
技术研发人员:孙岩,程征宇,方晓东,魏晓明,石泉,于竞,林木飞,
申请(专利权)人:深圳华大基因科技服务有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。