用于散列表基因组映射的灵活种子延伸制造技术

技术编号:31500945 阅读:22 留言:0更新日期:2021-12-22 23:13
本发明专利技术公开了用于生成和使用被配置为改进读段映射的散列表的方法、系统和装置,包括计算机程序,该方法、系统和装置包括:从参考序列获得K个核苷酸的第一种子,生成具有节点的种子延伸树,其中该节点中的每个节点对应于(i)延伸种子,该延伸种子是第一种子的延伸并具有K*的核苷酸长度,和(ii)种子延伸表中的一个或多个位置,该一个或多个位置包括描述与该延伸种子匹配的参考序列位置的数据,并且对于每个节点:在该散列表的对应于延伸种子的索引键的位置存储区间信息,其中该区间信息引用该种子延伸表中的一个或多个位置,该一个或多个位置包括与和该节点相关联的该延伸种子匹配的参考序列位置。的参考序列位置。的参考序列位置。

【技术实现步骤摘要】
【国外来华专利技术】用于散列表基因组映射的灵活种子延伸
[0001]相关专利申请的交叉引用
[0002]本申请要求2019年5月24日提交的美国临时专利申请62/852,965的权益,该临时专利申请全文以引用方式并入本文。

技术介绍

[0003]核酸测序仪是被配置为使核酸测序过程自动化的仪器。核酸测序是确定核酸序列中核苷酸的顺序的过程。核酸可包括脱氧核糖核酸(DNA)或核糖核酸(RNA)。
[0004]核酸测序仪被配置为接收核酸样品并生成表示核酸样品中的核苷酸的顺序的输出数据,该输出数据被称为一个或多个“读段”(read)。DNA样品中的核苷酸可包括一种或多种核苷酸碱基,这些核苷酸碱基包括形成任何组合的鸟嘌呤(G)、胞嘧啶(C)、腺嘌呤(A)和胸腺嘧啶(T)。RNA样品中的核苷酸可包括一种或多种碱基,这些碱基包括形成任何组合的G、C、A和尿嘧啶(U)。
[0005]可使用映射和比对引擎来将由DNA测序仪生成的读段映射到参考基因组的已知核苷酸序列。将读段映射到参考基因组的核苷酸序列可由使用散列表索引的映射和比对引擎来实现。

技术实现思路

[0006]本公开描述了散列表索引的构建和使用,该散列表索引有利于灵活的种子延伸以改进基因组映射和比对系统的性能。具体地讲,本公开可用于以如下方式执行灵活的种子延伸:(i)减少计算资源和功率的消耗,以及(ii)解决本文所述的常规种子延伸方法的问题。为了实现这些优点,本公开特别提供了可存储在散列表位置中的“区间记录”。
[0007]本公开的各方面使得映射和比对单元能够单独使用区间记录,或结合一个或多个延伸记录使用区间记录,以减少要由所述映射和比对单元通过种子延伸处理的匹配位置的数量,同时还在确定使用动态种子延伸识别的匹配参考位置是否准确时,或者在一些情况下,确定是否应发生使用一个或多个延伸记录的种子延伸时,提供所述映射和比对单元的灵活性。这产生了一种映射和比对单元,它比利用常规种子延伸技术的其他映射和比对单元使用更少的功率和更少的计算资源,同时还更加准确。
[0008]在一个方面,本公开提供了生成用于将样品读段映射到参考的散列表的方法。在一个方面,所述方法可包括以下动作:由计算机系统从参考序列获得第一核苷酸种子,其中所述第一种子具有K个核苷酸的长度;由所述计算机系统确定所述第一种子与超过预先确定数量的参考序列位置匹配;基于确定所述第一种子与超过预先确定数量的参考序列位置匹配,由所述计算机系统生成具有多个节点的种子延伸树,其中所述多个节点中的每个节点对应于(i)延伸种子,所述延伸种子是所述第一种子的延伸并且具有K*的核苷酸长度,其中K*为大于K的一个或多个核苷酸,和(ii)种子延伸表中的一个或多个位置,所述一个或多个位置包括描述与所述延伸种子匹配的参考序列位置的数据,并且对于所述多个节点中的每个节点:由所述计算机系统在所述散列表的对应于所述延伸种子的索引键的位置存储区
间信息,其中所述区间信息引用所述种子延伸表中的一个或多个位置,所述一个或多个位置包括描述与和所述节点相关联的所述延伸种子匹配的参考序列位置的数据。
[0009]其他方面包括执行如本文所公开的方法的动作的对应系统、装置和计算机程序,如由在计算机可读存储设备上编码的指令所定义的。
[0010]这些和其他方面可任选地包括以下特征中的一个或多个特征。例如,在一些具体实施中,每个所述匹配的参考序列位置包括所述第一种子的K个核苷酸。
[0011]在一些具体实施中,所述方法还可包括:由所述计算机系统从所述参考序列获得与所述第一种子不同的第二核苷酸种子;由所述计算机系统确定所述第二种子不与超过所述预先确定数量的参考序列位置匹配;以及基于由所述计算机系统确定所述第二种子不与超过所述预先确定数量的参考序列位置匹配:由所述计算机系统获得描述与所述第二种子匹配的每个所述参考序列位置的数据,以及由所述计算机系统在所述散列表的对应于所述第二种子的索引键的第二位置存储描述与所述第二种子匹配的所述参考序列位置的所述数据。
[0012]在一些具体实施中,所述种子延伸表中的包括描述与所述延伸种子匹配的参考序列位置的数据的所述一个或多个位置可包括所述种子延伸表中的包括描述与所述延伸种子匹配的参考序列位置的数据的位置的连续区间。
[0013]在一些具体实施中,所述种子延伸表中的包括描述与和所述节点相关联的所述延伸种子匹配的参考序列位置的数据的所述一个或多个位置可包括与和所述节点相关联的所述延伸种子匹配的参考序列位置的延伸表中的连续区间。
[0014]在一些具体实施中,由计算机系统从参考序列获得第一核苷酸种子,所述第一种子表示具有K个核苷酸的核苷酸长度的核苷酸序列,所述获得可包括:由所述计算机系统确定参考序列内的种子存取窗口的位置;以及由所述计算机系统获得所述参考序列的由所述种子存取窗口识别的子集。
[0015]在一些具体实施中,所述方法还可包括:由所述计算机系统将所述种子延伸窗口沿着所述参考序列向前调节K个核苷酸,以从所述参考序列识别具有K个核苷酸的核苷酸长度的第二核苷酸种子;由所述计算机系统从所述参考序列获得所述第二种子;由所述计算机系统确定所述第二种子与超过预先确定数量的参考序列位置匹配;基于确定所述第二种子与超过预先确定数量的参考序列位置匹配,由所述计算机系统生成具有多个第二节点的第二种子延伸树,其中所述多个第二节点中的每个第二节点对应于(i)第二延伸种子,所述第二延伸种子是所述第二种子的延伸并且具有K*的核苷酸长度,其中K*是大于K的一个或多个核苷酸,和(ii)第二种子延伸表中的第二一个或多个位置,所述第二一个或多个位置包括描述与所述第二延伸种子匹配的参考序列位置的数据,并且对于所述多个第二节点中的每个第二节点:由所述计算机系统在所述散列表的对应于所述第二延伸种子的索引键的位置存储第二区间信息,其中所述第二区间信息引用所述第二种子延伸表中的一个或多个位置,所述一个或多个位置包括描述与和所述第二节点相关联的所述第二延伸种子匹配的参考序列位置的数据。
[0016]在一些具体实施中,所述方法还可包括:对于所述多个节点中的每个节点:由所述计算机系统确定所述种子延伸树的所述节点是否为叶节点,并且基于由所述计算机系统确定所述延伸树的所述节点不是叶节点,由所述计算机系统在所述散列表的对应于所述延伸
种子的所述索引键的所述位置存储延伸记录。
[0017]在一些具体实施中,所述延伸记录包括一个或多个指令,所述一个或多个指令在由所述计算机系统执行时,使得所述计算机系统将一个或多个附加的核苷酸添加到与所述延伸记录相关联的种子。
[0018]在一些具体实施中,所述方法还可包括:基于由所述计算机系统确定所述延伸树的所述节点是叶节点,由所述计算机系统确定不在所述散列表的对应于所述延伸种子的所述索引键的所述位置存储延伸记录。
[0019]在一些具体实施中,所述方法还可包括由所述计算机系统生成所述种子延伸表。在此类具体实施中,生成所述种子延伸表可包括:由所述计算机系统识别与所述第一种子匹配的所述参考本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种生成用于将样品读段映射到参考序列的散列表的方法,所述方法包括:由计算机系统从参考序列获得第一核苷酸种子,其中所述第一种子具有K个核苷酸的长度;由所述计算机系统确定所述第一种子与超过预先确定数量的参考序列位置匹配;基于确定所述第一种子与超过预先确定数量的参考序列位置匹配,由所述计算机系统生成具有多个节点的种子延伸树,其中所述多个节点中的每个节点对应于延伸种子,所述延伸种子是所述第一种子的延伸并且具有K*的核苷酸长度,其中K*是大于K的一个或多个核苷酸,和种子延伸表中的一个或多个位置,所述一个或多个位置包括描述与所述延伸种子匹配的参考序列位置的数据;并且对于所述多个节点中的每个节点:由所述计算机系统在所述散列表的对应于所述延伸种子的索引键的位置存储区间信息,其中所述区间信息引用所述种子延伸表中的一个或多个位置,所述一个或多个位置包括描述与和所述节点相关联的所述延伸种子匹配的参考序列位置的数据。2.根据权利要求1所述的方法,其中每个所述匹配的参考序列位置包括所述第一种子的所述K个核苷酸。3.根据权利要求1所述的方法,还包括:由所述计算机系统从所述参考序列获得与所述第一种子不同的第二核苷酸种子;由所述计算机系统确定所述第二种子不与超过所述预先确定数量的参考序列位置匹配;并且基于由所述计算机系统确定所述第二种子不与超过所述预先确定数量的参考序列位置匹配由所述计算机系统获得描述与所述第二种子匹配的每个所述参考序列位置的数据;并且由所述计算机系统在所述散列表的对应于所述第二种子的索引键的第二位置存储描述与所述第二种子匹配的所述参考序列位置的所述数据。4.根据权利要求1至3中任一项所述的方法,其中所述种子延伸表中的包括描述与所述延伸种子匹配的参考序列位置的数据的所述一个或多个位置包括所述种子延伸表中的包括描述与所述延伸种子匹配的参考序列位置的数据的位置的连续区间。5.根据权利要求1至3中任一项所述的方法,其中所述种子延伸表中的包括描述与所述延伸种子匹配的参考序列位置的数据的所述一个或多个位置包括与所述延伸种子匹配的参考序列位置的延伸表中的非连续区间。6.根据权利要求1至5中任一项所述的方法,其中由计算机系统从参考序列获得第一核苷酸种子,所述第一种子表示具有K个核苷酸的核苷酸长度的核苷酸序列,所述获得包括:由所述计算机系统确定参考序列内的种子存取窗口的位置;并且由所述计算机系统获得所述参考序列的由所述种子存取窗口识别的子集。7.根据权利要求6所述的方法,还包括:由所述计算机系统将所述种子延伸窗口沿着所述参考序列向前调节K个核苷酸,以从所述参考序列识别具有K个核苷酸的核苷酸长度的第二核苷酸种子;
由所述计算机系统从所述参考序列获得所述第二种子;由所述计算机系统确定所述第二种子与超过预先确定数量的参考序列位置匹配;基于确定所述第二种子与超过预先确定数量的参考序列位置匹配,由所述计算机系统生成具有多个第二节点的第二种子延伸树,其中所述多个第二节点中的每个第二节点对应于(i)第二延伸种子,所述第二延伸种子是所述第二种子的延伸并且具有K*的核苷酸长度,其中K*是大于K的一个或多个核苷酸,和(ii)第二种子延伸表中的第二一个或多个位置,所述第二一个或多个位置包括描述与所述第二延伸种子匹配的参考序列位置的数据;并且对于所述多个第二节点中的每个第二节点:由所述计算机系统在所述散列表的对应于所述第二延伸种子的索引键的位置存储第二区间信息,其中所述第二区间信息引用所述第二种子延伸表中的一个或多个位置,所述一个或多个位置包括描述与和所述第二节点相关联的所述第二延伸种子匹配的参考序列位置的数据。8.根据权利要求1至7中任一项所述的方法,还包括:对于所述多个节点中的每个节点:由所述计算机系统确定所述种子延伸树的所述节点是否为叶节点;并且基于由所述计算机系统确定所述延伸树的所述节点不是叶节点,由所述计算机系统在所述散列表的对应于所述延伸种子的所述索引键的所述位置存储延伸记录。9.根据权利要求8所述的方法,其中所述延伸记录包括一个或多个指令,所述一个或多个指令在由所述计算机系统执行时,使得所述计算机系统将一个或多个附加的核苷酸添加到与所述延伸记录相关联的种子。10.根据权利要求1至7中任一项所述的方法,还包括:基于由所述计算机系统确定所述延伸树的所述节点是叶节点,由所述计算机系统确定不在所述散列表的对应于所述延伸种子的所述索引键的所述位置存储延伸记录。11.根据权利要求1至7中任一项所述的方法,还包括:由所述计算机系统生成所述种子延伸表,包括:由所述计算机系统识别与所述第一种子匹配的所述参考序列的每个种子;并且由所述计算机系统将识别所识别的种子的数据存储在所述种子延伸表中。12.根据权利要求1至11中任一项所述的方法,还包括:由所述计算机系统对所述种子延伸表中的所识别的种子进行排序。13.根据权利要求1至12中任一项所述的方法,还包括:由所述计算机系统生成散列表安装包,所述散列表安装包包括指令,所述指令在由接收所述散列表安装包的一个或多个计算机处理时,使得所述一个或多个计算机在能够由可编程逻辑电路访问的存储器中安装所述散列表。14.根据权利要求13所述的方法,其中所述散列表安装包包括所述种子延伸表,并且其中所述散列表安装包包括用于指示(i)所述可编程逻辑电路或(ii)另一个计算机将所述种子延伸表存储在能够由所述可编程逻辑电路访问的存储器设备中的指令。15.根据权利要求13或14中任一项所述的方法,所述方法还包括由所述计算机系统向另一个计算机提供所述散列表安装包。
16.根据权利要求15所述的方法,其中所述另一个计算机包括(i)被配置为与所述可编程逻辑电路通信的计算机或(ii)所述可编程逻辑电路。17.根据权利要求1至16的权利要求中的任一项所述的方法,其中所述计算机系统包括多个计算机。18.一种用于生成将样品读段映射到参考序列的散列表的系统,包括:一个或多个计算机,和存储指令的一个或多个存储设备,所述指令在由所述一个或多个计算机执行时,可操作以使得所述一个或多个计算机执行操作,所述操作包括:由所述一个或多个计算机从参考序列获得第一核苷酸种子,其中所述第一种子具有K个核苷酸的长度;由所述一个或多个计算机确定所述第一种子与超过预先确定数量的参考序列位置匹配;基于确定所述第一种子与超过预先确定数量的参考序列位置匹配,由所述一个或多个计算机生成具有多个节点的种子延伸树,其中所述多个节点中的每个节点对应于(i)延伸种子,所述延伸种子是所述第一种子的延伸并且具有K*的核苷酸长度,其中K*是大于K的一个或多个核苷酸,和(ii)种子延伸表中的一个或多个位置,所述一个或多个位置包括描述与所述延伸种子匹配的参考序列位置的数据;并且对于所述多个节点中的每个节点:由所述一个或多个计算机在所述散列表的对应于所述延伸种子的索引键的位置存储区间信息,其中所述区间信息引用所述种子延伸表中的一个或多个位置,所述一个或多个位置包括描述与和所述节点相关联的所述延伸种子匹配的参考序列位置的数据。19.根据权利要求18所述的系统,其中每个所述匹配的参考序列位置包括所述第一种子的所述K个核苷酸。20.根据权利要求18所述的系统,所述操作还包括:由所述一个或多个计算机从所述参考序列获得与所述第一种子不同的第二核苷酸种子;由所述一个或多个计算机确定所述第二种子不与超过所述预先确定数量的参考序列位置匹配;并且基于由所述一个或多个计算机确定所述第二种子不与超过所述预先确定数量的参考序列位置匹配:由所述一个或多个计算机获得描述与所述第二种子匹配的每个所述参考序列位置的数据;并且由所述一个或多个计算机在所述散列表的对应于所述第二种子的索引键的第二位置存储描述与所述第二种子匹配的所述参考序列位置的所述数据。21.根据权利要求18至20中任一项所述的系统,其中所述种子延伸表中的包括描述与所述延伸种子匹配的参考序列位置的数据的所述一个或多个位置包括所述种子延伸表中的包括描述与所述延伸种子匹配的参考序列位置的数据的位置的连续区间。22.根据权利要求18至20中任一项所述的系统,其中所述种子延伸表中的包括描述与所述延伸种子匹配的参考序列位置的数据的所述一个或多个位置包括与所述延伸种子匹配的参考序列位置的延伸表中的非连续区间。
23.根据权利要求18至22中任一项所述的系统,其中由一个或多个计算机从参考序列获得第一核苷酸种子,所述第一种子表示具有K个核苷酸的核苷酸长度的核苷酸序列,所述获得包括:由所述一个或多个计算机确定参考序列内的种子存取窗口的位置;并且由所述一个或多个计算机获得所述参考序列的由所述种子存取窗口识别的子集。24.根据权利要求23所述的系统,所述操作还包括:由所述一个或多个计算机将所述种子延伸窗口沿着所述参考序列向前调节K个核苷酸,以从所述参考序列识别具有K个核苷酸的核苷酸长度的第二核苷酸种子;由所述一个或多个计算机从所述参考序列获得所述第二种子;由所述一个或多个计算机确定所述第二种子与超过预先确定数量的参考序列位置匹配;基于确定所述第二种子与超过预先确定数量的参考序列位置匹配,由所述一个或多个计算机生成具有多个第二节点的第二种子延伸树,其中所述多个第二节点中的每个第二节点对应于(i)第二延伸种子,所述第二延伸种子是所述第二种子的延伸并且具有K*的核苷酸长度,其中K*是大于K的一个或多个核苷酸,和(ii)第二种子延伸表中的第二一个或多个位置,所述第二一个或多个位置包括描述与所述第二延伸种子匹配的参考序列位置的数据;并且对于所述多个第二节点中的每个第二节点:由所述一个或多个计算机在所述散列表的对应于所述第二延伸种子的索引键的位置存储第二区间信息,其中所述第二区间信息引用所述第二种子延伸表中的一个或多个位置,所述一个或多个位置包括描述与和所述第二节点相关联的所述第二延伸种子匹配的参考序列位置的数据。25.根据权利要求18至24中任一项所述的系统,所述操作还包括:对于所述多个节点中的每个节点:由所述一个或多个计算机确定所述种子延伸树的所述节点是否为叶节点;并且基于由所述一个或多个计算机确定所述延伸树的所述节点不是叶节点,由所述一个或多个计算机在所述散列表的对应于所述延伸种子的所述索引键的所述位置存储延伸记录。26.根据权利要求25所述的系统,其中所述延伸记录包括一个或多个指令,所述一个或多个指令在由所述一个或多个计算机执行时,使得所述一个或多个计算机将一个或多个附加的核苷酸添加到与所述延伸记录相关联的种子。27.根据权利要求18至25中任一项所述的系统,所述操作还包括:基于由所述一个或多个计算机确定所述延伸树的所述节点是叶节点,由所述一个或多个计算机确定不在所述散列表的对应于所述延伸种子的所述索引键的所述位置存储延伸记录。28.根据权利要求18至25中任一项所述的系统,所述操作还包括:由所述一个或多个计算机生成所述种子延伸表,包括:由所述一个或多个计算机识别与所述第一种子匹配的所述参考序列的每个种子;并且由所述一个或多个计算机将识别所识别的种子的数据存储在所述种子延伸表中。29.根据权利要求18至28中任一项所述的系统,所述操作还包括:
由所述一个或多个计算机对所述种子延伸表中的所识别的种子进行排序。30.根据权利要求18至28中任一项所述的系统,所述操作还包括:由所述一个或多个计算机生成散列表安装包,所述散列表安装包包括指令,所述指令在由接收所述散列表安装包的一个或多个计算机处理时,使得所述一个或多个计算机在能够由可编程逻辑电路访问的存储器中安装所述散列表。31.根据权利要求30所述的系统,其中所述散列表安装包包括所述种子延伸表,并且其中所述散列表安装包包括用于指示(i)所述可编程逻辑电路或(ii)另一个计算机将所述种子延伸表存储在能够由所述可编程逻辑电路访问的存储器设备中的指令。32.根据权利要求30或31所述的系统,所述操作还包括:由所述一个或多个计算机向另一个计算机提供所述散列表安装包。33.根据权利要求32所述的系统,其中所述另一个计算机包括(i)被配置为与所述可编程逻辑电路通信的计算机或(ii)所述可编程逻辑电路。34.根据权利要求18至32中任一项所述的系统,其中所述一个或多个计算机包括多个计算机。35.一种存储软件的非暂态计算机可读介质,所述软件包括能够由一个或多个计算机执行的指令,所述指令在经历此类执行时,使得所述一个或多个计算机执行操作,所述操作包括:由所述一个或多个计算机从参考序列获得第一核苷酸种子,其中所述第一种子具有K个核苷酸的长度;由所述一个或多个计算机确定所述第一种子与超过预先确定数量的参考序列位置匹配;基于确定所述第一种子与超过预先确定数量的参考序列位置匹配,由所述一个或多个计算机生成具有多个节点的种子延伸树,其中所述多个节点中的每个节点对应于(i)延伸种子,所述延伸种子是所述第一种子的延伸并且具有K*的核苷酸长度,其中K*是大于K的一个或多个核苷酸,和(ii)种子延伸表中的一个或多个位置,所述一个或多个位置包括描述与所述延伸种子匹配的参考序列位置的数据;并且对于所述多个节点中的每个节点:由所述一个或多个计算机在所述散列表的对应于所述延伸种子的索引键的位置存储区间信息,其中所述区间信息引用所述种子延伸表中的一个或多个位置,所述一个或多个位置包括描述与和所述节点相关联的所述延伸种子匹配的参考序列位置的数据。36.根据权利要求35所述的计算机可读介质,其中每个所述匹配的参考序列位置包括所述第一种子的所述K个核苷酸。37.根据权利要求35所述的计算机可读介质,所述操作还包括:由所述一个或多个计算机从所述参考序列获得与所述第一种子不同的第二核苷酸种子;由所述一个或多个计算机确定所述第二种子不与超过所述预先确定数量的参考序列位置匹配;并且基于由所述一个或多个计算机确定所述第二种子不与超过所述预先确定数量的参考
序列位置匹配:由所述一个或多个计算机获得描述与所述第二种子匹配的每个所述参考序列位置的数据;并且由所述一个或多个计算机在所述散列表的对应于所述第二种子的索引键的第二位置存储描述与所述第二种子匹配的所述参考序列位置的所述数据。38.根据权利要求35至37中任一项所述的计算机可读介质,其中所述种子延伸表中的包括描述与所述延伸种子匹配的参考序列位置的数据的所述一个或多个位置包括所述种子延伸表中的包括描述与所述延伸种子匹配的参考序列位置的数据的位置的连续区间。39.根据权利要求35至37中任一项所述的计算机可读介质,其中所述种子延伸表中的包括描述与所述延伸种子匹配的参考序列位置的数据的所述一个或多个位置包括与所述延伸种子匹配的参考序列位置的延伸表中的非连续区间。40.根据权利要求35至39中任一项所述的计算机可读介质,其中由一个或多个计算机从参考序列获得第一核苷酸种子,所述第一种子表示具有K个核苷酸的核苷酸长度的核苷酸序列,所述获得包括:由所述一个或多个计算机确定参考序列内的种子存取窗口的位置;并且由所述一个或多个计算机获得所述参考序列的由所述种子存取窗口识别的子集。41.根据权利要求40所述的计算机可读介质,所述操作还包括:由所述一个或多个计算机将所述种子延伸窗口沿着所述参考序列向前调节K个核苷酸,以从所述参考序列识别具有K个核苷酸的核苷酸长度的第二核苷酸种子;由所述一个或多个计算机从所述参考序列获得所述第二种子;由所述一个或多个计算机确定所述第二种子与超过预先确定数量的参考序列位置匹配;基于确定所述第二种子与超过预先确定数量的参考序列位置匹配,由所述一个或多个计算机生成具有多个第二节点的第二种子延伸树,其中所述多个第二节点中的每个第二节点对应于(i)第二延伸种子,所述第二延伸种子是所述第二种子的延伸并且具有K*的核苷酸长度,其中K*是大于K的一个或多个核苷酸,和(ii)第二种子延伸表中的第二一个或多个位置,所述第二一个或多个位置包括描述与所述第二延伸种子匹配的参考序列位置的数据;并且对于所述多个第二节点中的每个第二节点:由所述一个或多个计算机在所述散列表的对应于所述第二延伸种子的索引键的位置存储第二区间信息,其中所述第二区间信息引用所述第二种子延伸表中的一个或多个位置,所述一个或多个位置包括描述与和所述第二节点相关联的所述第二延伸种子匹配的参考序列位置的数据。42.根据权利要求35至41中任一项所述的计算机可读介质,所述操作还包括:对于所述多个节点中的每个节点:由所述一个...

【专利技术属性】
技术研发人员:迈克尔
申请(专利权)人:伊鲁米那股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1