一种基于簇图结构的并行基因拼接方法技术

技术编号：9991218 阅读：149 留言：0更新日期：2014-05-02 05:07

本发明专利技术提供一种基于簇图结构的并行基因拼接算法。本发明专利技术以多个其他基因拼接算法的拼接得到的长序列（scaffold）和双端测序仪生成的短读长基因序列（read‑pair）为输入，通过构建索引、映射read‑pair、scaffold聚簇、构建簇图、搜索路径等步骤将具有互补的scaffold拼接成更长的序列。构建索引和读长映射两个步骤旨在通过读长找到不同算法获得的长序列scaffold之间的相关性和匹配度，然后通过相关性和匹配度进行聚簇，簇内的所有scaffold具有互补性，是潜在的可拼接的序列。最后构建簇图，求解图的全局最长路径，得到拼接的长基因序列。

全部详细技术资料下载

【技术实现步骤摘要】
【专利摘要】本专利技术提供。本专利技术以多个其他基因拼接算法的拼接得到的长序列（scaffold）和双端测序仪生成的短读长基因序列（read-pair）为输入，通过构建索引、映射read-pair、scaffold聚簇、构建簇图、搜索路径等步骤将具有互补的scaffold拼接成更长的序列。构建索引和读长映射两个步骤旨在通过读长找到不同算法获得的长序列scaffold之间的相关性和匹配度，然后通过相关性和匹配度进行聚簇，簇内的所有scaffold具有互补性，是潜在的可拼接的序列。最后构建簇图，求解图的全局最长路径，得到拼接的长基因序列。【专利说明】
本专利技术属于生物信息学
，具体涉及一种新的基于簇图结构的并行基因拼接算法。
技术介绍
自从2006年5月18日《自然》杂志报道称，科学家已对含有2.23亿个碱基对占人类基因组中碱基对总量的8%左右的人类第一号染色体完成测序宣告持续16年的人类基因组计划全部完成。作为人类自然科学史上重要的里程碑，“人类基因组”的研究已从“结构基因组”阶段进入“功能基因组”阶段。在人类基因组计划后相继推出的水稻基因组计划、马铃薯基因组计划、草鱼基因组计划等和快速增长的微生物基因测序“海量”的基因信息的积累催生了 “功能基因组”时代的来临。针对充分利用“海量”基因组信息的生物信息学不仅应运而生而且为以注释、阐明基因功和利用基因生物学功能的“后基因组时代”的研究发挥了重大作用。基因组测序的目的就是要确定DNA分子的碱基序列，而DNA序列拼接则是基因组测序的关键技术之一。DNA序列拼接的定义可概括为:从DNA片段集合F...
一种<a href="http://www.xjishu.com/zhuanli/55/201310666751.html" title="一种基于簇图结构的并行基因拼接方法原文来自X技术">基于簇图结构的并行基因拼接方法</a>

【技术保护点】

【技术特征摘要】

【专利技术属性】
技术研发人员：陈科，徐魁，
申请(专利权)人：天津工业大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人