一种检测SMN1和SMN2基因拷贝数变化的方法及其应用技术

技术编号:36469614 阅读:28 留言:0更新日期:2023-01-25 23:11
本发明专利技术提供了一种检测SMN1和SMN2基因拷贝数变化的方法及其应用,所述方法包括:基于多重PCR扩增对SMN1和SMN2基因进行建库,高通量测序后进行数据质控和比对;计算样本测序数据中的每个扩增子的测序序列数目,生成其他基因基础部分深度矩阵、差异位点深度矩阵和同源区域深度矩阵,将相应深度矩阵合并到一起生成最终样本的深度矩阵文件;对所述深度矩阵文件进行数据校正,得到校正后的矩阵文件,将矩阵文件每行取平均数或中位数,用测试样本的某个扩增子所在行的平均数或中位数,除以对照样本对应于测试样本的某个扩增子所在行的平均数或中位数,得到比值,根据比值结果判断SMN1和SMN2的拷贝数变异结果。SMN2的拷贝数变异结果。SMN2的拷贝数变异结果。

【技术实现步骤摘要】
一种检测SMN1和SMN2基因拷贝数变化的方法及其应用


[0001]本专利技术属于基因诊断领域,具体涉及一种检测SMN1和SMN2基因拷贝数变化的方法及其应用。

技术介绍

[0002]脊髓性肌萎缩症(SMA),是一类由脊髓前角运动神经元变性导致肌无力、肌萎缩的疾病。SMA在人群中的携带频率约为1/40

1/50,发病率约1/(8000

10000),是第二常见的致死性常染色体隐性遗传病。SMA患者的主要致病基因是运动神经元存活基因(survival motor neuron,SMN)。SMN基因位于5号染色体长臂1区3带(5q13)上,具有9个外显子(外显子1,2a,2b,3

8),全长约27 kb,编码294个氨基酸的RNA结合蛋白SMN,这是高效组装小核内核糖核蛋白(snRNP)复合物所必需的。有2个高度同源拷贝SMN1(OMIM 600354)和SMN2(OMIM 601627),端粒侧称SMN[T]或SMN1,着丝粒侧称SMN[C]或SMN2。两者仅在各自的3

端有5个碱基的差别,其中2个碱基位于外显子7、8,另3个碱基在内含子6、7中。其中,在外显子7的c.840C>T突变最为关键,导致SMN2的外显子剪接增强器功能受到抑制和SMN2外显子7跳跃。第8号外显子中的碱基变化对功能没有明显影响。
[0003]SMA患者中,约95%为SMN1基因第7和第8外显子纯合缺失或第7外显子纯合缺失所致,5%为SMN1杂合缺失、点突变或SMN1基因转化为SMN2基因所致。SMN1变异会减少SMN蛋白的产生,从而导致脊髓中前角细胞的丧失。虽然SMN1的缺失可以由SMN2来弥补,SMN2可以产生足够的SMN蛋白以允许除运动神经元之外的细胞类型的相对正常的发育。然而,SMN2并不能完全弥补SMN1的缺失,因为虽然SMN2的转录水平与SMN1相当,但大部分SMN2转录本缺乏外显子7,导致产生截短的不太稳定的SMN蛋白。SMN1/SMN2拷贝数检测是SMA携带者筛查与临床确诊的重要手段。
[0004]随着高通量测序技术的发展,基因检测可以在一个较快的时间内完成多个基因甚至全外显子组或全基因组测序分析。对于临床关注的特定基因,靶向测序技术可以将感兴趣的基因组区域富集出来测序,单个样本测序数据产出少且分析速度较快,因此更能经济高效地发挥NGS技术的优势,广泛应用到临床检测、健康筛查等众多领域。另外,靶向测序可以对目标区域进行深度测序,增加了目标区域内遗传变异的检测灵敏度和准确性。靶向测序的方法主要分为两种:杂交捕获测序和多重扩增子测序。多重PCR(multiplex PCR),又称多重引物PCR或复合PCR,多重扩增子测序即针对感兴趣的目标区域,设计多重PCR引物进行扩增富集并进行测序的技术。通常适用于检测几十到几千个位点,或几十kb以下的区域。杂交捕获测序,目前应用的主要是液相杂交捕获测序,即基于碱基互补配对原理,设计合成核酸探针,对DNA文库进行基于液相环境的目标区域杂交富集,并进行测序。但液相杂交捕获操作难度较高、操作时间较长、且容易受到探针捕获效率的影响,因此扩增子测序相比来说,更适合非专业技术人员操作。多重PCR作为一种快速构建靶向测序文库的方法,由于其高效性、系统性、和经济简便性在目前的临床基因检测及研究领域中发挥越来越大的作用。多重PCR应用在SMA上,可针对性地将SMN1与SMN2差异位点和完全同源区域均进行扩增,还
可以达到快速筛查的效果。
[0005]因此,开发一种稳定以及准确的对SMN1和SMN2基因进行变异分析的方法对SMA携带者筛查与临床确诊具有重要作用。

技术实现思路

[0006]针对现有技术存在的不足,本专利技术的目的在于提供一种检测SMN1和SMN2基因拷贝数变化的方法及其应用。本专利技术基于多重PCR高通量测序的panel数据,开发了一种分析SMN1和SMN2拷贝数变异的分析方法,可在CNV(Copy number variations,拷贝数目变异)检测流程中增加对同源区域的检测,辅助对SMN1和SMN2基因拷贝数检测结果的判读,可稳定以及准确的检测SMN1和SMN2基因上拷贝数变化。
[0007]为达到此专利技术目的,本专利技术采用以下技术方案:第一方面,本专利技术提供一种检测SMN1和SMN2基因拷贝数变化的方法,所述方法包括如下步骤:(1)基于多重PCR扩增对SMN1和SMN2基因进行建库,高通量测序后进行数据质量控制和比对;(2)计算样本测序数据中的每个扩增子的测序序列数目;生成其他基因基础部分深度矩阵、差异位点深度矩阵和同源区域深度矩阵,将相应深度矩阵合并到一起生成最终样本的深度矩阵文件;(3)对所述深度矩阵文件进行数据校正,得到校正后的矩阵文件,将矩阵文件每行取平均数或中位数,用测试样本的某个扩增子所在行的平均数或中位数,除以对照样本对应于测试样本的某个扩增子所在行的平均数或中位数,得到比值,根据比值结果判断SMN1和SMN2的拷贝数变异结果。
[0008]常规CNV的检测流程会对序列的比对质量值进行限制,避免一些低复杂区域对数据的影响。针对同源区域,序列比对的比对质量值一般为0,根据比对质量值的阈值设定,同源区域在CNV检测生成样本的深度矩阵计算时会排除同源区域。因此本专利技术基于多重PCR的高通量测序的数据开发了一种对SMN1和SMN2基因进行变异分析的方法,可在CNV检测流程中增加对同源区域的检测,辅助对SMN1和SMN2基因拷贝数检测结果的判读。
[0009]优选地,步骤(1)中,所述建库和测序采用如下步骤进行:提取样本DNA,扩增基因组目的片段,特异性PCR引物酶解,PCR产物纯化,进行文库扩增,文库纯化以及环化,再进行上机测序。
[0010]本专利技术采用多重扩增体系检测SMN1和SMN2基因拷贝数,通过序列位置匹配引物位置进行深度计算,可在临床应用上达到快速检测的效果以及减少多重PCR中的错误序列引入的噪音。
[0011]优选地,步骤(1)中,所述数据质控和比对采用如下步骤进行:对测试样本和对照样本的测序原始数据进行质控,质控后的数据使用比对软件得到比对后未排序的文件,再根据基因组坐标排序,得到最终的比对数据。
[0012]优选地,所述质控的内容包括数据量在1.5 G以上;平均测序深度3000X;数据质量Q20>90%,Q30>85%。
[0013]优选地,步骤(2)中,所述测序序列数目采用如下步骤进行计算:
根据引物设计文件,统计每对扩增子的起始坐标与终止坐标。
[0014]优选地,所述引物设计文件中包括正向引物的起始坐标和终止坐标,反向引物的起始坐标和终止坐标;以正向引物的起始坐标和反向引物的终止坐标构建得到引物扩增区域文件。
[0015]本专利技术中所述引物扩增区域文件包含3列信息:1)染色体编号;2)正向引物的起始坐标;3)反向引物的终止坐标。
[0016]优选地,步骤(2)中,所本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种检测SMN1和SMN2基因拷贝数变化的方法,其特征在于,所述方法包括如下步骤:(1)基于多重PCR扩增对SMN1和SMN2基因进行建库,高通量测序后进行数据质控和比对;(2)计算样本测序数据中的每个扩增子的测序序列数目,生成其他基因基础部分深度矩阵、差异位点深度矩阵和同源区域深度矩阵,将相应深度矩阵合并到一起生成最终样本的深度矩阵文件;(3)对所述深度矩阵文件进行数据校正,得到校正后的矩阵文件,将矩阵文件每行取平均数或中位数,用测试样本的某个扩增子所在行的平均数或中位数,除以对照样本对应于测试样本的某个扩增子所在行的平均数或中位数,得到比值,根据比值结果判断SMN1和SMN2的拷贝数变异结果。2.根据权利要求1所述的检测SMN1和SMN2基因拷贝数变化的方法,其特征在于,步骤(1)中,所述建库和测序采用如下步骤进行:提取样本DNA,扩增基因组目的片段,特异性PCR引物酶解,PCR产物纯化,进行文库扩增,文库纯化以及环化,再进行上机测序。3.根据权利要求1所述的检测SMN1和SMN2基因拷贝数变化的方法,其特征在于,步骤(1)中,所述数据质控和比对采用如下步骤进行:对测试样本和对照样本的测序原始数据进行质控,质控后的数据使用比对软件得到比对后未排序的文件,再根据基因组坐标排序,得到最终的比对数据;所述质控的内容包括数据量在1.5 G以上;平均测序深度3000X;数据质量Q20>90%,Q30>85%。4.根据权利要求1所述的检测SMN1和SMN2基因拷贝数变化的方法,其特征在于,步骤(2)中,所述测序序列数目采用如下步骤进行计算:根据引物设计文件,统计每对扩增子的起始坐标与终止坐标;所述引物设计文件中包括正向引物的起始坐标和终止坐标,反向引物的起始坐标和终止坐标;以正向引物的起始坐标和反向引物的终止坐标构建得到引物扩增区域文件;步骤(2)中,所述深度矩阵采用如下步骤获得:其他基因基础部分深度矩阵:将扩增同一基因外显子的扩增子序列数目进行叠加,得到样本的其他基因基础部分深度矩阵;差异位点深度矩阵:将SMN1和SMN2基因差异位点的扩增子序列数目进行计数分析,得到差异位点深度矩阵;同源区域深度矩阵:将SMN1和SMN2基因同源区域的扩增子序列数目进行计数分析,得到同源区域深度矩阵。5.根据权利要求1所述的检测SMN1和SMN2基因拷贝数变化的方法,其特征在于,步骤(3)中,所述对所述深度矩阵文件进行校正的方法如下:M为校正前矩阵文件,矩阵文件中每列代表一个样本,每行代表一个扩增子的测序序列数目文件,a代表每个样本在每个引物扩增区间计算得到的测序深度,g代表每个引物扩增区间所有样本取几何平均数;
先按行进行几何平均:得到如下矩阵:再计算列的中位数Corr:校正:得到的M*为校正后矩阵文件,Test为待测样本,Ctrl为对照样本,b代表每个样本在每个引物扩增区间的测序深度校正后的数值,med为每列取中位数即每个样本所有引物扩增区间的深度取中位数,mean为取平均数,mean为对所有对照样本校正后的深度按行计算平均数;。6.根据权利要求1所述的检测SMN1和SMN2基因拷贝数变化的方法,其特征在于,步骤(3)中,根据比值结果判断SMN1和SMN2的拷贝数变异结果,所述判断的标准如下所示:对于差异位点的比值结果:正常拷贝数的比值为1;比值0.5则表示杂合缺失;比值0为
纯合缺失;对于同源区域的比值结果:正常拷贝数的比值为1,则表示SMN1和SMN2基因的1

6号外显子的总拷贝数为4;比值为0.75,则表示SMN1或SMN2基因的1

...

【专利技术属性】
技术研发人员:李珉文曙朱娜栗海波姜玥
申请(专利权)人:苏州赛福医学检验有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1