本发明专利技术公开了一种用于血液肿瘤、淋巴瘤基因检测的探针组,基于血液肿瘤和淋巴瘤相关的163个基因组成的目标区域设计获得,其中捕获ARID2、BRCA2、ATG2B、B2M、BRCA1、BCL2、APC、ARID1B、IKZF1区域的120条探针序列如:SEQ ID NO:1-120所示。本发明专利技术的探针组为了将目标区域的覆盖率提高至100%,经过多次优化实验,获得120条探针,缺少这120条探针序列,目标区域的覆盖率只能达到98%。覆盖率只能达到98%。
【技术实现步骤摘要】
用于血液肿瘤、淋巴瘤基因检测的探针组、试剂盒
[0001]本专利技术涉及基因检测
,尤其涉及一种用于血液肿瘤、淋巴瘤基因检测的探针组、包括该探针组的试剂盒,及采用该探针组、试剂盒提高血液肿瘤、淋巴瘤基因检测精确率的方法。
技术介绍
[0002]《2015年中国恶性肿瘤流行情况分析》数据显示,白血病和淋巴瘤居中国城乡肿瘤死亡的前十位,死亡率分别为53.4
‰
和52.1
‰
。血液肿瘤是一类具有高度异质性的疾病,目前国际上采用MICM诊断体系即综合形态检测(Morphology)、免疫检测(Immunology)、细胞遗传学检测(Cytogenetics)以及分子生物学分型(Molecular biology)对患者进行临床诊断、分子分型及危险度分层。在此基础上选择最有效的治疗方案,从而实现血液肿瘤的精准诊疗。随着分子生物学及其相关技术的迅速发展,基于高通量测序技术的多基因组合检测在血液肿瘤的诊断分型、预后评估、治疗指导和微小残留监测(minimal residual disease,MRD)等方面的临床应用日益增多,已成为指导血液肿瘤临床诊疗和探索其分子机制的重要手段。2016年WHO造血与淋巴系统肿瘤分型指南、NCCN指南等国内外权威指南共识都提出了与血液肿瘤诊断、鉴别诊断、预后判断、靶向治疗相关的基因突变。《二代测序技术在血液肿瘤中的应用中国专家共识(2018年版)》指出,基因突变检测是多种血液系统肿瘤诊断和辅助诊断、以及预后判断的重要依据。
[0003]采用高通量测序技术(NGS)对不同类型的血液肿瘤基因突变进行全面检测,能够为临床提供更为全面的分子遗传学信息,不仅有助于血液肿瘤患者的临床诊断和预后评估,同时还能为患者的个体化治疗方案提供指导。
[0004]目标区域是否能够100%覆盖,决定了血液肿瘤和淋巴瘤基于NGS的检测方法是否完备,即是否需要进行补齐。原因是血液肿瘤中的基因突变,除了目前已经报道的致病性明确的位点,还有一部分数量未知的新的致病位点,其位置可分布在相关基因整个编码区。目前国内市场检测血液肿瘤和淋巴瘤的NGS方法主要有两种建库方法:多重引物PCR方法,杂交捕获探针方法,不论哪种方法,罕有能够实现100%覆盖目标区域的富集建库方法。
技术实现思路
[0005]为了解决现有针对血液肿瘤和淋巴瘤检测方法中,无法实现100%覆盖目标区域的问题,本专利技术的目的是提供一种用于血液肿瘤、淋巴瘤基因检测的探针组,采用该探针组,目标区域的覆盖度提升至100%,提升了检测的召回率;本专利技术还提供了一种包括该探针组的试剂盒;另外,本专利技术还将提供采用该探针组、试剂盒提高血液肿瘤、淋巴瘤基因检测精确率的方法,采用该方法进一步筛选去掉假阳性结果,精确率达到99%以上。
[0006]为了实现上述目的,本专利技术采用如下技术方案:
[0007]本专利技术的第一方面,提供一种用于血液肿瘤、淋巴瘤基因检测的探针组,基于血液肿瘤和淋巴瘤相关的163个基因组成的目标区域设计获得,其中捕获ARID2、BRCA2、ATG2B、
B2M、BRCA1、BCL2、APC、ARID1B、IKZF1区域的探针序列如:SEQ ID NO:1-120所示。
[0008]本专利技术的第二方面,提供采用上述探针组的试剂盒。
[0009]其中,所述的试剂盒还包括文库构建试剂盒、杂交捕获试剂盒和PCR反应液。本专利技术的第三方面,提供一种提高血液肿瘤、淋巴瘤基因检测精确率的生物信息分析方法,包括如下步骤:
[0010]S1、核酸提取并构建样本库;
[0011]S2、将上述的探针组与样本库杂交,实现目标区域的富集;
[0012]S3、PCR反应、纯化及测序;
[0013]S4、变异位点检测,获得变异位点的合集;
[0014]S5、通过构建ML模型,去掉假阳性位点::
[0015]S51、随机获得多例血液肿瘤、淋巴瘤患者,采用步骤S1-S4获得变异位点合集,并统计与每个变异位点相关的多个参数;
[0016]S52、找出基因数据库中人群频率与变异位点合集中人群频率不在同一个数量级的位点,分为假阳性候选位点和假阴性候选位点,其中,假阳性候选位点为变异位点合集中人群频率大于基因数据库中人群频率的位点,且该位点不是已报道致病或可能致病的位点;其中,假阴性候选位点为变异位点合集中人群频率小于基因数据库中人群频率的位点;
[0017]S53、基于与每个变异位点相关的多个参数,采用支持向量机找出疑似假阳性候选位点和疑似假阴性候选位点,并进一步验证确认,得到假阳性位点,获得假阳位点的合集;
[0018]S54、将假阳性位点在待检样本的人群频率是否大于基因数据库中的人群频率,作为判断待检样品中假阳性位点的最终依据,以此制作PoN文件,作为ML模型;
[0019]S6、将S4中变异位点的合集经过ML模型筛选,去掉假阳性位点,获得最终变异位点的合集,完成血液肿瘤、淋巴瘤基因检测。
[0020]其中,所述S51中的患者不少于1000例。
[0021]其中,所述S51中的参数包括覆盖深度,突变比例,正反向序列支持数,正反向变异序列支持数,基因型质量值,碱基质量值中位数,单倍型相位。
[0022]其中,所述S52中的基因数据库为gnomAD-WES数据库。
[0023]其中,所述S53中与每个变异位点相关的参数不少于15个。
[0024]与现有技术相比,本专利技术实现的有益效果:本专利技术的探针组是基于血液肿瘤和淋巴瘤相关的163个基因组成的目标区域设计获得,通过对ARID2、BRCA2、ATG2B、B2M、BRCA1、BCL2、APC、ARID1B、IKZF1共9个基因目标区域的捕获探针进行优化,获得120条探针序列,替换原有对应目标区域的探针序列,目标区域覆盖度由原来的98%提升至100%;本专利技术提高血液肿瘤、淋巴瘤基因检测精确率的方法是以上述设计的探针组捕获目标区域,经扩增、纯化、测序、常规变异检测后,引入ML模型,进一步筛选去掉假阳性位点,提高检测的精确率,尤其是血液肿瘤中低频(1%数量级)插入缺失变异的精确率,精确率可以达到99%以上。
附图说明
[0025]以下结合附图和具体实施方式来进一步详细说明本专利技术:
[0026]图1为191010-5重复4次实验对应的实验结果;
[0027]图2为191010-8重复4次实验对应的实验结果;
[0028]图3为191010-9重复4次实验对应的实验结果;
[0029]图4为191012-13重复4次实验对应的实验结果;
[0030]图5为191012-16重复4次实验对应的实验结果;
[0031]图6为验证191个插入缺失变异位点是否为假阳性位点的实验结果。
具体实施方式
[0032]在本文中所使用的术语“高通量测序技术”指的是第二代高通量测序技术及之后发展的更高通量的测序方法。第二代高通量测序本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种用于血液肿瘤、淋巴瘤基因检测的探针组,基于血液肿瘤和淋巴瘤相关的163个基因组成的目标区域设计获得,其特征在于,其中捕获ARID2、BRCA2、ATG2B、B2M、BRCA1、BCL2、APC、ARID1B、IKZF1区域的探针序列如:SEQ ID NO:1-120所示。2.一种用于血液肿瘤、淋巴瘤基因检测的试剂盒,其特征在于,包括权利要求1所述的探针组。3.如权利要求2所述的用于血液肿瘤、淋巴瘤基因检测的试剂盒,其特征在于,还包括文库构建试剂盒、杂交捕获试剂盒和PCR反应液。4.一种提高血液肿瘤、淋巴瘤基因检测精确率的生物信息分析方法,其特征在于,包括如下步骤:S1、核酸提取并构建样本库;S2、将权利要求1所述的探针组与样本库杂交,实现目标区域的富集;S3、PCR反应、纯化及测序;S4、变异位点检测,获得变异位点的合集;S5、通过构建ML模型,去掉假阳性位点:S51、随机获得多例血液肿瘤、淋巴瘤患者,采用步骤S1-S4获得变异位点合集,并统计与每个变异位点相关的多个参数;S52、找出基因数据库中人群频率与变异位点合集中人群频率不在同一个数量级的位点,分为假阳性候选位点和假阴性候选位点,其中,假阳性候选位点...
【专利技术属性】
技术研发人员:周洋,
申请(专利权)人:苏州安智因医学检验所有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。