基于酶切建库双末端测序的长度多态性标记的引物设计开发方法技术

技术编号：8105921 阅读：533 留言：0更新日期：2012-12-21 04:57

本发明专利技术公开了基于酶切建库双末端测序的长度多态性标记的引物设计开发方法，它采用了生物信息学分析方法，处理RAD双末端测序的测序数据，从而寻找RAD测序片段上的Indel位点信息，以突破非模式生物缺少参考序列的瓶颈，简化了基因组的复杂度，同时也减少了测序成本。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及一种基因组长度多态性标记的引物设计方法。具体为基于酶切建库双末端(Pair-end)测序的长度多态性标记的弓I物设计开发方法；在缺少参考序列的情况下，寻找到个体间的Indel标记，并能够在两端设计引物。属于生物信息学
这对于缺少参考序列的非模式生物的研究具有重要的意义。
技术介绍
InDel (insertion-deletion)插入缺失标记，指的是两种亲本中在基因组上的差异，相对另一个亲本而言，其中一个亲本的基因组中有一定数量的核苷酸插入或缺失。Indel位点信息的获得可以有许多重要的应用，如构建遗传图谱，基因分型，分子标记辅助育种，疾病检测等。如今，第二代DNA测序技术是一种高通量低成本的测序技术，基本原理是边合成边测序。以solexa测序方法为例，先用物理方法将DNA链随机打断，然后在片段两端加上特定接头，接头上有扩增引物序列。测序时，DNA聚合酶合成待测片段的互补链，通过检测新合成碱基所携带的荧光信号读取碱基序列，从而获得待测片段的序列。第二代测序技术已经广泛应用于生物科学的许多领域，特别是研究一个物种不同个体之间的多态性。传统Call Indel标记的方法是将测序个体得到的短reads通过比对软件比对回参考序列，从而得到测序个体的Indel信息。常见的流程有使用BWA软件将reads比对回参考序列，使用SAMtools软件处理比对结果寻找Indel位点^2。大体过程如图I所示。目前，有参考序列的物种都可以很方便的进行Indel标记的查找，并在两端设计引物进行实验验证。但是对于那些非模式生物而言，基本上是不存在参考序列的...

【技术保护点】
基于酶切建库双末端测序的长度多态性标记的引物设计开发方法，其特征在于：其步骤如下：1）在获得RAD高通量测序技术的测序结果后，对RAD双末端测序序列进行过滤以去除不合格的测序序列；2）根据测序个体基因组酶切一端的测序序列，利用序列的全同性生成每个个体堆的信息；将每个个体过滤后的酶切一端的测序序列信息作为哈希的键，哈希的值指向一个链表，用于存放另一端的序列信息，并计算测序深度信息；3）过滤掉酶切一端序列测序深度为1的结果；4）两个个体内分别将酶切一端的测序序列数据进行不容许空隙的两两比对，对堆进行聚类以确定个体内在酶切一端序列上的杂合SNP信息；5）在两个个体内部，对每个堆的另一端数据进行局部组装；6）利用两个个体酶切一端的测序序列信息将两个个体堆的信息相互进行两两对齐，即在个体A和个体B中，个体A的某个堆能够和个体B的某个堆对齐，当且仅当两个个体堆中的酶切一端的测序序列完全相同；对能够对齐的堆，两个个体之间的另一端的组装结果序列相互进行比对，来寻找Indel位点信息；进而得到两个个体之间高可信度的Indel位点信息，还得到在Indel位点周围的侧翼序列信息；7）最后在Indel位点周围...

【技术特征摘要】

【专利技术属性】
技术研发人员：郑泽群，任一，陶晔，胡秋萍，黄华生，
申请(专利权)人：上海美吉生物医药科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人