一种基于单样本的肿瘤突变负荷检测方法和装置制造方法及图纸

技术编号:24609897 阅读:50 留言:0更新日期:2020-06-23 23:23
本发明专利技术涉及生物医学领域的一种基于单样本的肿瘤突变负荷检测方法和装置。本发明专利技术提供的探针组合物,包括捕获表1所示基因的外显子区域,表2所示基因的内含子、启动子、融合断点区域的探针以及表3所示基因的编码区区域的探针。人肿瘤多基因检测试剂盒包括所述探针组合物。基于单样本的TMB检测方法包括:获取待测肿瘤样本的目标区域测序数据,与参考基因组比对,基于所得比对结果,进行变异位点检测,过滤所得原始变异结果与正常样本正常基线数据库重合的位点,过滤所得第一体细胞突变数据集的高频率生殖突变位点,筛选出所得第二体细胞突变数据集中克隆类型体细胞突变位点;计算TMB。该方法无需配对样本,能准确检测肿瘤样本TMB。

A method and device for detecting tumor mutation load based on single sample

【技术实现步骤摘要】
一种基于单样本的肿瘤突变负荷检测方法和装置
本专利技术涉及生物医学领域,具体涉及一种基于单样本的肿瘤突变负荷检测方法和装置。
技术介绍
近年来,免疫治疗在肿瘤治疗领域受到越来越多的关注。细胞程序性死亡蛋白1(ProgrammedCellDeathprotein1,PD-1)是一种通常表达于细胞表面的蛋白,通过降低免疫细胞对细胞的炎症反应而调控免疫系统,防止自身免疫的发生。PD-1的配体PD-L1可以特异性地中和PD-1,从而重新启动免疫系统对细胞的杀伤作用。这种现象又被叫做免疫检查点抑制(immunecheckpointinhibitor,ICI)。通过免疫检查点抑制机制(如CTLA-4和PD-L1)开发的药物已在多种肿瘤治疗中获得显著的临床疗效。但由于缺乏合适的临床分子标志物,PD-1/PD-L1药物的受益人群只有20%-30%。从已经批准的适应症和关键临床研究提供的证据来看,对于PD-L1的免疫治疗疗效预测的潜在生物标记物主要有肿瘤突变负荷(TumorMutationBurden,TMB)、微卫星不稳定(microsatelliteinstability,MSI)和错配基因修复缺失(MismatchRepair,MMR)。多个大规模临床研究发现,免疫检查点抑制剂的疗效很大程度上取决于患者癌细胞中所携带的基因突变的数量,因此,TMB的精确测量可以预测免疫检查点抑制剂的疗效,使癌症患者有机会获得更加精准的治疗。肿瘤突变负荷(TMB)被定义为一份肿瘤样本中,所评估体细胞基因的外显子编码区每百万碱基中发生置换和插入/缺失突变的总数,是反映肿瘤细胞中总的基因突变程度的一个指标。体细胞的突变可转录表达成蛋白水平,产生新的抗原、蛋白片段或多肽段等,这些新的蛋白被自身免疫系统识别为非自身抗原,激活T细胞,引起免疫反应。因此,肿瘤突变负荷越高,产生新抗原的概率越高,从而更能被免疫系统识别。当使用了免疫检查点抑制剂来对抗免疫逃逸的肿瘤细胞,TMB水平越高的患者可能接受免疫治疗效果越好。随着测序成本越来越低,运用二代测序技术预测分析TMB的需求越来越高。现有技术多数都是采取肿瘤样本与其对应的配对样本进行全基因组测序、全外显子组测序或目标区域基因靶向捕获(Panel)测序来对TMB进行预测分析,虽然此种方法可以得到较为准确的体细胞突变结果并以此来计算TMB,但在成本上对于同一个样本要做样本-对照两次实验测序,不仅相对的增加了实验及测序成本,同时也增加了数据分析及解读的复杂度,而且临床实践中经常没有正常对照。2017年底,FDA批准的FoundationOneCDx基因检测试剂盒采用了单样本测量TMB的方法,即只对癌症样本测序,然后通过统计方法和人群数据库信息在基因突变中确定胚系突变并过滤。这在一定程度上降低了TMB检测的成本要求。但是这类方法仍有几个缺陷。首先,不同癌种间TMB的差异较大,用同样的数据库过滤方法并不能保证对所有癌种的胚系基因突变进行精确的去除;其次,这种方法高度依赖公共数据库的质量和多样性,对不在数据库中的人种的突变背景无法做出精确的描述。
技术实现思路
因此,本专利技术的目的在于提供一种基于单样本的肿瘤突变负荷检测方法和装置。同时,本专利技术还提供一种探针组合物、一种捕获芯片和一种人肿瘤多基因检测试剂盒。一种探针组合物,包括捕获表1所示基因的外显子区域的探针,捕获表2所示基因的内含子、启动子、融合断点区域的探针,以及捕获表3所示基因的编码区区域的探针。本专利技术提供的一种捕获芯片,包括所述的探针组合物。本专利技术提供的一种人肿瘤多基因检测试剂盒,包括靶序列捕获组分;所述靶序列捕获组分包括所述的探针组合物。所述试剂盒还包括核酸纯化组分、文库构建与质控组分;所述靶序列捕获组分还包括杂交反应液、洗脱反应液、引物、接头和DNA聚合酶反应液。本专利技术提供一种基于单样本的肿瘤突变负荷检测方法,包括,利用所述的人肿瘤多基因检测试剂盒对待测肿瘤样本进行核酸纯化、文库构建和探针捕获,所得捕获序列上机测序,获取待测肿瘤样本的目标区域测序数据;将所述测序数据与参考基因组比对,获得比对结果;基于所述比对结果,以正常基线数据库作为其中一个输入文件,进行变异位点检测,得到原始变异结果;过滤所述原始变异结果中与正常样本正常基线数据库重合的位点,即过滤掉含有panelofnormals标签的突变位点,得到第一体细胞突变数据集;过滤所述第一体细胞突变数据集中的高频率生殖突变位点,得到第二体细胞突变数据集;筛选出所述第二体细胞突变数据集中的克隆类型体细胞突变位点;计算肿瘤突变负荷TMB,TMB=s/n;所述n为编码区碱基百万数,s为克隆类型体细胞突变位点的数量。所述的基于单样本的肿瘤突变负荷检测方法,还包括,对所述测序数据进行过滤及质控:过滤测序数据中的接头序列,并对过滤后数据的碱基质量大于20的百分比(Q20)、碱基质量大于30的百分比(Q30)、GC含量、N含量(N_Rate)、平均读长长度(Average_read_length)和过滤后碱基占比(Clean_base_ratio)进行筛选,选择符合设定阈值的数据;对所述比对结果进行质控:比对结果进行去重和排序处理,并对比对上的数据进行比对率、捕获效率、污染率、目标区域平均测序深度的筛选,选择符合设定阈值的数据;所述对比对上参考基因组的数据进行筛选之前,还包括利用GATKRealignerTargetCreator和IndelRealigner模块对比对过程中发现的有潜在序列插入或者序列删除的区域进行重新比对,并应用GATKBaseRecalibrator模块对重新比对后的文件进行碱基质量值校正。其中,上述各参数的设定阈值可以根据试验需求而定。所述变异位点包括单核苷酸位点突变和/或插入缺失突变;所述变异位点检测使用GATKMuTect2单样本模式和/或Freebayes软件,采用目标捕获区域和/或非目标捕获区域组合模式;所述变异位点检测时,进行变异位点深度阈值过滤;所述阈值≤该突变位点的测序深度。正常样本正常基线数据库的构建包括:获取正常样本的测序数据,将所述测序数据与参考基因组比对,所得比对结果构建正常样本的正常基线数据库;优选地,使用GATK的CreateSomaticPanelOfNormals模块构建正常基线数据库;所述正常基线数据库内的突变位点含有panelofnormals标签;所述正常样本为非肿瘤血液样本和/或组织样本;所述正常样本的测序数据与所述待测肿瘤样本的测序数据采用的试剂盒、测序平台、测序读长相同;所述正常样本的测序深度≥目标捕获区域平均测序深度/5。所述正常样本的测序数据进行与所述待测肿瘤样本相同的过滤和质控、比对及质控。对所述第一体细胞突变数据集进行数据库注释,以过滤所述第一体细胞突变数据集中的高频率生殖突变位点;所述数据库为人群数本文档来自技高网
...

【技术保护点】
1.一种探针组合物,其特征在于,所述探针组合物包括捕获表1所示基因的外显子区域的探针,捕获表2所示基因的内含子、启动子、融合断点区域的探针,以及捕获表3所示基因的编码区区域的探针。/n

【技术特征摘要】
1.一种探针组合物,其特征在于,所述探针组合物包括捕获表1所示基因的外显子区域的探针,捕获表2所示基因的内含子、启动子、融合断点区域的探针,以及捕获表3所示基因的编码区区域的探针。


2.一种捕获芯片,其特征在于,包括权利要求1所述的探针组合物。


3.一种人肿瘤多基因检测试剂盒,其特征在于,包括靶序列捕获组分;
所述靶序列捕获组分包括权利要求1所述的探针组合物。


4.根据权利要求3所述的人肿瘤多基因检测试剂盒,其特征在于,所述试剂盒还包括核酸纯化组分、文库构建与质控组分;
所述靶序列捕获组分还包括杂交反应液、洗脱反应液、引物、接头和DNA聚合酶反应液。


5.一种基于单样本的肿瘤突变负荷检测方法,其特征在于,包括,
利用权利要求4所述的人肿瘤多基因检测试剂盒对待测肿瘤样本进行核酸纯化、文库构建和探针捕获,所得捕获序列上机测序,获取待测肿瘤样本的目标区域测序数据;
将所述测序数据与参考基因组比对,获得比对结果;
基于所述比对结果,以正常基线数据库作为其中一个输入文件,进行变异位点检测,得到原始变异结果;
过滤所述原始变异结果中与正常样本正常基线数据库重合的位点,得到第一体细胞突变数据集;
过滤所述第一体细胞突变数据集中的高频率生殖突变位点,得到第二体细胞突变数据集;
筛选出所述第二体细胞突变数据集中的克隆类型体细胞突变位点;
计算肿瘤突变负荷TMB,TMB=s/n;
所述n为编码区碱基百万数,s为克隆类型体细胞突变位点的数量。


6.根据权利要求5所述的基于单样本的肿瘤突变负荷检测方法,其特征在于,还包括,
对所述测序数据进行过滤及质控:过滤测序数据中的接头序列,并对过滤后数据的碱基质量大于20的百分比、碱基质量大于30的百分比、GC含量、N含量、平均读长长度和过滤后碱基占比进行筛选,选择符合设定阈值的数据;
对所述比对结果进行质控:比对结果进行去重和排序处理,并对比对上的数据进行比对率、捕获效率、污染率、目标区域平均测序深度的筛选,选择符合设定阈值的数据;
所述对比对上参考基因组的数据进行筛选之前,还包括利用GATKRealignerTargetCreator和IndelRealigner模块对比对过程中发现的有潜在序列插入或者序列删除的区域进行重新比对,并应用GATKBaseRecalibrator模块对重新比对后的文件进行碱基质量值校正。


7.根据权利要求5所述的基于单样本的肿瘤突变负荷检测方法,其特征在于,所述变异位点包括单核苷酸位点突变和/或插入缺失突变;
所述变异位点检测使用GATKMuTect2单样本模式和/或Freebayes软件,采用目标捕获区域和/或非目标捕获区域组合模式;
所述变异位点检测时,进行变异位点深度阈值过滤;所述阈值≤该突变位点的测序深度。


8.根据权利要求5所述的基于单样本的肿瘤突变负荷检测方法,其特征在于,正常样本正常基线数据库的构建包括:获取正常样本的测序数据,将所述测序数据与参考基因组比对,所得比对结果构建正常样本的正常基线数据库;优选地,使用GATK的CreateSomaticPanelOfNormals模块构建正常基线数据库;
所述正常基线数据库内的突变位点含有panelofnormals标签;
所述正常样本为非肿瘤血液样本和/或组织样本;
所述正常样本的测序数据与所述待测肿瘤样本的测序数据采用的试剂盒、测序平台、测序读长相同;
所述正常样本的测序深度≥目标捕获区域平均测序深度/5。


9.根据权利要求5所述的基于单样本的肿瘤突变负荷检测方法,其特征在于,对所述第一体细胞突变数据集进行数据库注释,以过滤所述第一体细胞突变数据集中的高频率生殖突变位点;
所述数据库为人群数据库;所述人群数据库包括ESP6500数据库、千人基因组计划数据库、ExAC人类外显子组整合数据库、COSMIC肿瘤基因体细胞突变的数据库和GENOMAD;
对任一所述数据库中人群频率为n的突变位点进行注释并做标...

【专利技术属性】
技术研发人员:黄毅易鑫裴士美吴玲清刘久成李俊王长希杨玲
申请(专利权)人:苏州吉因加生物医学工程有限公司深圳吉因加医学检验实验室
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1