【技术实现步骤摘要】
一种三代群体基因组结构变异联合检测方法
[0001]本专利技术涉及基因变异检测
,具体为一种三代群体基因组结构变异联合检测方法。
技术介绍
[0002]第三代测序技术如PacBio(Pacific BioSciences)和ONT(Oxford Nanopore Technologies),利用了边合成边测序的思想,利用碱基配对阶段,加入不同碱基时会发出不同的光,根据光的波长与峰值判断进入的碱基类型。相比于其他测序技术,第三代测序技术产生的测序片段拥有很长的读长,最长甚至可以超过1Mbp,同时平均长度也可以达到10kbp,因此它们可以覆盖到很长的基因组区域。较长的读长使得其能够检测出更多的结构变异,研究表明,在人类个体的基因组变异检测中,利用第三代测序数据相比于利用第二代测序数据能够多检测出两倍数量的结构变异,这为结构变异检测的发展提供了很大的机遇。
[0003]结构变异是指一整段连续的DNA序列发生了缺失(Deletion)、插入(Insertion)、重复(Duplication)、倒位(Inversion)、易位(Translocation)等重排性变化,影响的碱基长度一般大于50碱基对。相关研究表明,与单核苷酸变异(SNV)、短插入删除变异(Indel)相比,它的长度更长,结构也更加复杂。相关研究表明,平均每个人类个体基因组上包含大约两万个SV,虽然SV数量相较于SNV和Indel较少,但是由于其涉及的DNA片段区间跨度较大,在空间上对基因组的影响范围是最广的,因此,结构变异的精准检测对于基因组 ...
【技术保护点】
【技术特征摘要】
1.一种三代群体基因组结构变异联合检测方法,其特征在于包括以下步骤:步骤一:获取多个个体的结构变异信息,并根据个体的结构变异信息提取结构变异,即SV,之后将SV根据变异所在染色体区间与变异类型进行分组,得到多组待合并SV集合;步骤二:针对每组合并SV集合,将待合并SV集合中的SV以基因组坐标位点为第一关键字、SV长度为第二关键字进行排序,得到一个有序的待合并SV集合;步骤三:将有序的待合并SV集合中的SV进行合并,合并的具体步骤为:采用两轮合并;第一轮合并中按照SV在基因组上的坐标位点,并定义一个阈值,将有序的待合并SV集合中相邻SV的坐标位点之差小于阈值的收集在一起;第二轮合并中利用二分图最大匹配算法对第一轮合并的结果进行划分,得到多个候选SV集合;步骤四:获取候选SV集合中SV的坐标位点的中位数以及SV长度的中位数,并将其作为群体SV的坐标位点与长度;步骤五:多组待合并SV集合处理完毕,得到群体SV的坐标位点与长度的集合,即完成联合检测。2.根据权利要求1所述的一种三代群体基因组结构变异联合检测方法,其特征在于所述步骤一的具体步骤为:首先提取个体的结构变异信息中一条染色体上长度为10Mbp的区域内的所有SV,下一轮提取从上一轮提取的结尾区域回溯10kbp开始并向后延伸10Mbp;在提取过程中,定义一个类,根据个体的结构变异信息中每一行的内容,提取SV所在染色体、SV的变异类型、SV的基因组坐标位点、SV的长度,同时记录该SV所在的个体,并将该SV所在的个体、SV所在染色体、SV的变异类型、SV的基因组坐标位点和SV的长度作为变异特征;收集完区域内的所有SV后,将SV按照不同变异类型存储,形成多组待合并SV集合。3.根据权利要求2所述的一种三代群体基因组结构变异联合检测方法,其特征在于所述步骤二的具体步骤为:首先建立一个小根堆,将变异特征作为堆内的元素,设定堆内排序的关键字为SV的基因组坐标位点;初始化小根堆,堆的大小为待合并SV集合中个体的数量,然后遍历待合并SV集合中的每个个体,将每个个体中SV的基因组坐标位点最小的SV加入堆中,若堆顶元素不是具有最小基因组坐标位点的SV,则将堆内最小基因组坐标位点的SV与堆顶元素对应的SV互换,然后将堆内最小基因组坐标位点的SV从堆中移出,加入排序列表中,随后从移出的SV所在的个体中取出SV的基因组坐标位点第二小的SV加入小根堆中,当移出的SV所在的个体中没有剩余的SV时,则将堆的大小减小1,并重复上述步骤,直至SV中的个体处理完毕,得到的排序列表,即为有序的待合并SV集合。4.根据权利要求3所述的一种三代群体基因组结构变异联合检测方法,其特征在于所述第一轮合并中阈值为1500bp。5.根据权利要求4所述的一种三代群体基因组结构变异联合检测方法,其特征在于所述第一轮合并的具体步骤为:
遍历有序的待合并SV集合,并判断相邻两个SV的位点坐标之差是否小于1500bp,并将连续的、位点坐标之差小于1500bp的SV收集到同一个子集合中。6.根据权利要求5所述的一种三代群体基因组...
【专利技术属性】
技术研发人员:姜涛,曹舒淇,刘博,王亚东,
申请(专利权)人:哈尔滨工业大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。