System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术属于生物信息学及高通量测序,具体涉及一种基于高通量测序的肿瘤单样本同源重组缺陷的检测方法。
技术介绍
1、人类细胞的基因组由dna双螺旋缠绕形成,细胞分裂时双链dna解旋,分别作为模板链复制子链,因此dna复制的准确性对于生存与繁衍非常重要,准确复制不仅是物种稳定遗传的基础,也是维持基因组完整性的保障,是细胞维持基本生长和发挥正常功能的必要条件。但dna复制并非100%准确,其错配几率约为10-10,且环境因素,如辐射、紫外光照射、化学诱变物等,也可引起dna序列上的错误或损伤。当dna发生单链错配或损伤时,有碱基切补修复、核苷酸切补修复、错配修复三种主要修复方式,主要以亲代链为模板对损伤地方进行修复。当dna发生双链错配或损伤时,有同源重组修复和非同源末端连接修复两种修复方式。非同源末端连接修复直接将断裂的两处链接,修复过程中可能会随机的引入和去除若干碱基,属于高效率低准确率的修复方式,同源重组修复是以未受伤的姐妹染色单体的同源序列作为修复的模板,属于低效率高准确率的修复方式。
2、当同源重组修复出现功能异常,即出现同源重组缺陷hrd时,双链损伤主要由非同源重组方式修复,这会导致dna上出现片段的插入、缺失、拷贝数异常等错误,随着时间的推移,错误不断累积,导致细胞凋亡或者向癌细胞转变。hrd在不同肿瘤中都有发生,常见的包括卵巢癌、膀胱癌、乳腺癌、子宫内膜癌、前列腺癌和胰腺癌等。目前已知导致hrd的原因包括:brca1/2基因发生突变、brca1启动子甲基化、同源重组修复通路其他基因突变以及其他因素导致的b
3、由于hrd是由多种原因造成的结果,仅检测同源修复重组通路上的基因的突变难以完整评估hrd状态。研究发现当细胞发生hrd时,过度依赖非同源重组方式修复,引入的插入、缺失、拷贝数异常导致基因组上出现特定的痕迹,称为基因组瘢痕。基因组瘢痕有三种表现形式:杂合性缺失、大片段迁移、端粒等位基因不平衡,通过这三种指标组合可判断基因组hrd状态。高hrd状态的肿瘤患者对引起dna断裂的铂类药物以及parp抑制剂高度敏感,尤其是卵巢癌患者,hrd已成为卵巢癌parp抑制剂治疗相关的重要标志物之一。
4、早期人们通过snp芯片技术评估hrd状态,但价格昂贵。随着二代测序ngs的发展,全基因组测序wgs和全外显子测序wes测序成本逐渐降低,hrd评估逐渐转移到ngs平台上。但用wgs和wes评估hrd状态,各自存在缺陷,wgs评估hrd准确,但是数据冗余,成本过高,wes成本较低,但wes并不均匀覆盖整个基因组,因此在判断hrd上存在偏差,且目前判断hrd状态需要肿瘤单样本和对照样本配对计算,大大增加了分析成本。除此之外,因为某些癌种的患者癌旁对照样本难取得、对照样本保存不当、或患者本身原因导致的对照样本无法取得等因素,患者hrd状态无法判断,影响患者后续用药指导。
技术实现思路
1、本专利技术的目的在于提供一种基于高通量测序的肿瘤单样本同源重组缺陷的检测方法,所述检测方法可以实现基于肿瘤单样本的同源重组缺陷的检测。
2、本专利技术提供了一种基于高通量测序的肿瘤单样本同源重组缺陷的检测方法,包括如下步骤:
3、提供正常群体bam文件;
4、基于所述正常群体bam文件进行snp检测分析,获取正常群体中各个样本的snp信息,并将正常群体中各个样本的snp信息进行合并和均一化,得到正常群体的snp数据库;
5、将所述正常群体bam文件进行拷贝数变异检测分析,并将得到的正常群体拷贝数变异数据进行均一化,得到正常群体的拷贝数变异数据库;
6、对肿瘤单样本进行高通量测序和质控,将得到的肿瘤单样本数据与人类参考基因组进行比对和过滤,得到肿瘤单样本bam文件;
7、将所述肿瘤单样本bam文件分别进行snp检测分析和拷贝数变异检测分析,分别得到肿瘤单样本snp信息和肿瘤单样本拷贝数变异信息;
8、在所述肿瘤单样本snp信息中补充所述正常群体的snp数据库,得到模拟的体细胞snp数据;
9、在所述肿瘤单样本拷贝数变异信息中补充所述正常群体的拷贝数变异数据库,得到模拟的体细胞拷贝数变异数据;
10、以所述模拟的体细胞snp数据和模拟的体细胞拷贝数变异数据联合分析,得到同源重组缺陷检测结果。
11、优选的,所述正常群体的snp数据库获得的方法包括如下步骤:
12、统计所述正常群体bam文件中比对质量大于1的reads序列,并统计所述reads序列在人类参考基因组比对覆盖位点下与参考基因组一致的碱基和不一致的碱基数目,形成数据文件;
13、对所述数据文件进行分析,得到正常群体中各个样本的snp信息,所述snp信息包括snp所在染色体,snp在染色体上的位置,snp与人类参考基因组一致的碱基ref碱基和突变碱基alt碱基,以及ref和alt碱基的测序序列reads支持数;
14、合并所述正常群体中各个样本的snp信息,将不同正常群体样本的snp位点进行均一化,计算均一化后snp位点频率,得到正常群体的snp信息;
15、对所述正常群体bam文件中各个样本的每一个位点的深度信息进行计算,并将所述正常群体中各个样本的位点深度信息合并,取平均值,得到正常群体的深度信息;
16、将所述正常群体的snp信息和正常群体的深度信息进行整合,得到所述正常群体的snp数据库。
17、优选的,将所述正常群体的snp信息和正常群体的深度信息进行整合的步骤包括:如果所述正常群体的深度信息中的深度信息位点同时存在于所述正常群体的snp信息中,则对所述深度信息位点补充对应的snp信息以及所述snp信息的均一化后的ref和alt的reads支持数和突变频率;对于未在所述正常群体的深度信息中检测到的深度信息位点,则将均一化深度归为refreads支持数,alt的reads支持数和突变频率为0。
18、优选的,所述正常群体的拷贝数变异数据库的获得方法包括以下三种方法中的任意一种;
19、方法一:1)以120bp窗口对所述正常群体bam文件中的捕获区域进行滑窗;2)计算正常群体样本在120bp滑窗内的均一化深度,得到正常群体拷贝数变异数据库;
20、方法二:1)以120bp窗口对所述正常群体bam文件中的捕获区域进行滑窗;2)计算所述步骤1)120bp滑窗捕获区域内的深度信息和深度信息log2值,形成正常群体的深度信息文件;3)对所述正常群体的深度信息文件进行整合,得到正常群体拷贝数变异数据库;
21、方法三:1)以120bp窗口对所述正常群体bam文件中的捕获区域进行滑窗;2)对人类参考基因组在捕获区域120bp滑窗内log2等于0,深度等于1,构建得到正常群体拷贝数变异数据库。
22、优选的,所述模拟的体细胞snp变异数据的获得步骤包括:依据所述肿瘤单样本snp信息中snp的位本文档来自技高网...
【技术保护点】
1.一种基于高通量测序的肿瘤单样本同源重组缺陷的检测方法,其特征在于,包括如下步骤:
2.根据权利要求1所述的检测方法,其特征在于,所述正常群体的SNP数据库获得的方法包括如下步骤:
3.根据权利要求2所述的检测方法,其特征在于,将所述正常群体的SNP信息和正常群体的深度信息进行整合的步骤包括:如果所述正常群体的深度信息中的深度信息位点同时存在于所述正常群体的SNP信息中,则对所述深度信息位点补充对应的SNP信息以及所述SNP信息的均一化后的ref和alt的reads支持数和突变频率;
4.根据权利要求1所述的检测方法,其特征在于,所述正常群体的拷贝数变异数据库的获得方法包括以下三种方法中的任意一种;
5.根据权利要求1-3任一项所述的检测方法,其特征在于,所述模拟的体细胞SNP数据的获得步骤包括:依据所述肿瘤单样本SNP信息中SNP的位置坐标,在所述正常群体的SNP数据库中找到相同位置坐标的SNP突变,补充至所述肿瘤单样本SNP信息中对应SNP的后面,得到所述模拟的体细胞SNP变异数据。
6.根据权利要求4所述的检测方
7.根据权利要求1所述的检测方法,其特征在于,在所述高通量测序的过程中,采用全基因组等间距SNP位点捕获的方式构建DNA文库,SNP位点间的间隔为50Kb,SNP位点为52000个。
8.根据权利要求1所述的检测方法,其特征在于,所述质控的参数包括如下几项:
9.根据权利要求1所述的检测方法,其特征在于,所述人类参考基因组包括hg19参考基因组。
10.根据权利要求1所述的检测方法,其特征在于,所述同源重组缺陷的获得包括:基于所述模拟的体细胞SNP数据和模拟的体细胞拷贝数变异数据分析得到肿瘤单样本中杂合性缺失、大片段迁移和端粒等位基因不平衡的数目,按照预定的公式(1)计算得到所述同源重组缺陷:
11.一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序或指令,其特征在于,所述计算机程序或指令被处理器执行时实现权利要求1-10任一所述检测方法的步骤。
12.一种计算机程序产品,包括计算机程序或指令,其特征在于,所述计算机程序或指令被处理器执行时实现权利要求1-10任一项所述检测方法的步骤。
13.权利要求1-10任一项所述的检测方法、权利要求11所述的计算机可读存储介质或权利要求12所述的计算机程序产品在制备指导肿瘤用药的产品中的应用。
...【技术特征摘要】
1.一种基于高通量测序的肿瘤单样本同源重组缺陷的检测方法,其特征在于,包括如下步骤:
2.根据权利要求1所述的检测方法,其特征在于,所述正常群体的snp数据库获得的方法包括如下步骤:
3.根据权利要求2所述的检测方法,其特征在于,将所述正常群体的snp信息和正常群体的深度信息进行整合的步骤包括:如果所述正常群体的深度信息中的深度信息位点同时存在于所述正常群体的snp信息中,则对所述深度信息位点补充对应的snp信息以及所述snp信息的均一化后的ref和alt的reads支持数和突变频率;
4.根据权利要求1所述的检测方法,其特征在于,所述正常群体的拷贝数变异数据库的获得方法包括以下三种方法中的任意一种;
5.根据权利要求1-3任一项所述的检测方法,其特征在于,所述模拟的体细胞snp数据的获得步骤包括:依据所述肿瘤单样本snp信息中snp的位置坐标,在所述正常群体的snp数据库中找到相同位置坐标的snp突变,补充至所述肿瘤单样本snp信息中对应snp的后面,得到所述模拟的体细胞snp变异数据。
6.根据权利要求4所述的检测方法,其特征在于,所述模拟的体细胞拷贝数变异数据的获得步骤包括如下两项中的任意一项:
7.根据权利要求1所述...
【专利技术属性】
技术研发人员:蒋才,程陶然,尹书剑,
申请(专利权)人:纳昂达南京生物科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。