一种验证目标位点的方法及装置制造方法及图纸

技术编号:37158375 阅读:14 留言:0更新日期:2023-04-06 22:21
一种验证目标位点的方法及装置,该方法包括参考基因组序列获取步骤、参考基因组种子序列提取步骤、测序结果种子序列寻找步骤、临时目标位点确定步骤,获取测序结果中包含临时目标位点的目标区段序列步骤,目标区段与参考基因组对应序列进行双序列比对的步骤,由于待验证目标位点在来自参考基因组的序列中的位置是确定的,因此根据双序列比对结果中待验证目标位点在比对结果中的新位置,即可较为精确地定位到目标位点。本发明专利技术可以十分准确地自动绘制出测序结果中包含待验证目标位点及其上下游一段序列的测序峰图,并对目标位点进行标注,免去了手动寻找目标位点并标注的麻烦。免去了手动寻找目标位点并标注的麻烦。免去了手动寻找目标位点并标注的麻烦。

【技术实现步骤摘要】
一种验证目标位点的方法及装置


[0001]本专利技术涉及生物信息学领域,具体涉及一种验证目标位点的方法及装置。

技术介绍

[0002]目前二代测序是最为广泛使用的测序方案,其优点在于通量高和测序快,能适应当前科研或者医疗行业大批量基因测序的需求。对于二代测序数据的分析往往会为科研或者疾病诊断带来丰富的信息,在对测序结果的分析中变异检测是非常重要的步骤,其能提供测序样本中发生的所有突变信息。在获取到突变信息后,对于某些在数据库中有记录的与疾病紧密相关的突变,可以通过一代测序的方式对突变进行二次验证。
[0003]一代测序的特点是通量低,读长长,测序准,因此其极为适合做针对目标位点的验证,对于包含目标位点的目标区段进行测序之后,即可根据测序结果获知突变等目标位点发生的情况。当前能够读取一代测序结果并显示峰图的软件有Bioedit、Chromas、SnapGene、Geno me compiler等,但是通过手动方式在测序结果中寻找目标位点的方法比较困难,且耗费精力;同时,在某些情况下,若待验证目标位点的附近也有少量的突变存在,则加大了定位目标位点的难度。

技术实现思路

[0004]根据第一方面,在一实施例中,提供一种验证目标位点的方法,包括:
[0005]参考基因组序列获取步骤,包括根据待验证的目标位点在参考基因组中的位置,从参考基因组中获取包含目标位点对应碱基位的序列;
[0006]参考基因组种子序列提取步骤,包括按照预设的种子序列长度,从参考基因组中提取离参考基因组中待验证目标位点对应碱基位最近的前N组种子序列;
[0007]测序结果种子序列寻找步骤,包括将提取自参考基因组的所述N组种子序列与待测样本的一代测序结果序列进行比较,在一代测序结果序列中寻找种子序列;若某段种子序列在一代测序结果序列中被找到,则判定为匹配成功;如果所有的种子序列在一代测序结果序列中都没有出现,则判定匹配失败;
[0008]临时目标位点确定步骤,包括获取一代测序结果序列中匹配成功的种子序列,通过参考基因组中的种子序列与待验证目标位点之间的相对关系,预测目标位点在一代测序结果序列中的位置,即为临时目标位点。
[0009]在一实施例中,还包括双序列比对步骤,包括根据临时目标位点在一代测序结果序列中的位置,从一代测序结果序列中提取出包含该临时目标位点且覆盖其上下游各M个碱基的序列,将提取出的序列与参考基因组序列获取步骤中从参考基因组中提取出的序列进行双序列比对;
[0010]判定步骤,包括根据双序列比对结果,判断比对情况并输出匹配结果。
[0011]在一实施例中,还包括位置确定步骤,包括根据判定步骤中判定为可准确定位的双序列比对的结果,确定目标位点在一代测序结果序列中的位置。
[0012]在一实施例中,还包括绘图步骤,根据位置确定步骤已经确定的突变位点和一代测序结果序列绘制出结果图。
[0013]根据第二方面,在一实施例中,提供一种验证目标位点的装置,包括:
[0014]参考基因组序列获取模块,用于根据待验证的目标位点在参考基因组中的位置,从参考基因组中获取包含目标位点对应碱基位的序列;
[0015]参考基因组种子序列提取模块,用于按照预设的种子序列长度,从参考基因组中提取离参考基因组中待验证目标位点对应碱基位最近的前N组种子序列;
[0016]测序结果种子序列寻找模块,用于将提取自参考基因组的所述N组种子序列与待测样本的一代测序结果序列进行比较,在一代测序结果序列中寻找种子序列;若某段种子序列在一代测序结果序列中被找到,则判定为匹配成功;如果所有的种子序列在一代测序结果序列中都没有出现,则判定匹配失败;
[0017]临时目标位点确定模块,用于获取一代测序结果序列中匹配成功的种子序列,通过参考基因组中的种子序列与待验证目标位点之间的相对关系,预测目标位点在一代测序结果序列中的位置,即为临时目标位点。
[0018]在一实施例中,还包括双序列比对模块,用于根据临时目标位点在一代测序结果序列中的位置,从一代测序结果序列中提取出包含该临时目标位点且覆盖其上下游各M个碱基的序列,将提取出的序列与参考基因组序列获取步骤中从参考基因组中提取出的序列进行双序列比对;
[0019]判定模块,用于根据双序列比对结果,判断比对情况并输出匹配结果。
[0020]在一实施例中,还包括位置确定模块,用于根据判定步骤中判定为可准确定位的双序列比对的结果,确定目标位点在一代测序结果序列中的位置。
[0021]在一实施例中,位置确定模块中,在双序列比对结果中,与参考基因组序列中待验证目标位点的位置相对应的一代测序结果序列中的碱基位置即为此模块定位到的目标位点位置。
[0022]在一实施例中,还包括绘图模块,用于根据位置确定模块已经确定的目标位点位置和一代测序结果序列绘制出结果图。
[0023]根据第三方面,在一实施例中,提供一种验证目标位点的装置,包括:
[0024]存储器,用于存储程序;
[0025]处理器,用于通过执行所述存储器存储的程序以实现如第一方面任意一项的方法。
[0026]根据第四方面,在一实施例中,提供一种计算机可读存储介质,所述介质上存储有程序,所述程序能够被处理器执行以实现如第一方面任意一项的方法。
[0027]依据上述实施例的一种验证目标位点的方法及装置,利用多种长度的多个种子序列在测序结果中进行匹配,大幅增加了定位到真实目标位点的概率。
[0028]在一实施例中,利用双序列比对的方法定位目标位点,能够比手动或者通过离目标位点的固定长度对目标位点位置进行推断的方法更为准确。
[0029]在一实施例中,对双序列比对匹配结果设定阈值,在未达到阈值时不能出图,能够在测序结果不佳的情况下提前做出判定而不必执行后续步骤,从而避免浪费多余精力。
[0030]在一实施例中,本专利技术可以自动绘制出测序结果中包含目标位点(例如待验证突
变)及其上下游一段序列的测序峰图,并对目标位点进行标注,免去了手动寻找目标位点并标注的麻烦。
[0031]在一实施例中,自动出图对大批量目标位点(例如突变)数据的验证而言非常有必要和有意义。
附图说明
[0032]图1为一种实施例中绘制一代测序突变位点峰图的流程示意图。
[0033]图2为一种实施例的双序列比对结果。
具体实施方式
[0034]下面通过具体实施方式结合附图对本专利技术作进一步详细说明。在以下的实施方式中,很多细节描述是为了使得本申请能被更好的理解。然而,本领域技术人员可以毫不费力的认识到,其中部分特征在不同情况下是可以省略的,或者可以由其他材料、方法所替代。在某些情况下,本申请相关的一些操作并没有在说明书中显示或者描述,这是为了避免本申请的核心部分被过多的描述所淹没,而对于本领域技术人员而言,详细描述这些相关操作并不是必要的,他们根据说明书中的描述以及本领域的一般技术知识即可完整了解相关操本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种验证目标位点的方法,其特征在于,包括:参考基因组序列获取步骤,包括根据待验证的目标位点在参考基因组中的位置,从参考基因组中获取包含目标位点对应碱基位的序列;参考基因组种子序列提取步骤,包括按照预设的种子序列长度,从参考基因组中提取离参考基因组中待验证目标位点对应碱基位最近的前N组种子序列;测序结果种子序列寻找步骤,包括将提取自参考基因组的所述N组种子序列与待测样本的一代测序结果序列进行比较,在一代测序结果序列中寻找种子序列;若某段种子序列在一代测序结果序列中被找到,则判定为匹配成功;如果所有的种子序列在一代测序结果序列中都没有出现,则判定匹配失败;临时目标位点确定步骤,包括获取一代测序结果序列中匹配成功的种子序列,通过参考基因组中的种子序列与待验证目标位点之间的相对关系,预测目标位点在一代测序结果序列中的位置,即为临时目标位点。2.如权利要求1所述的方法,其特征在于,还包括双序列比对步骤,包括根据临时目标位点在一代测序结果序列中的位置,从一代测序结果序列中提取出包含该临时目标位点且覆盖其上下游各M个碱基的序列,将提取出的序列与参考基因组序列获取步骤中从参考基因组中提取出的序列进行双序列比对;判定步骤,包括根据双序列比对结果,判断比对情况并输出匹配结果。3.如权利要求2所述的方法,其特征在于,参考基因组序列获取步骤中,所述包含目标位点的序列为包含了目标位点对应碱基位上下游各X个碱基的序列;优选地,所述X与M相等;优选地,参考基因组序列获取步骤中,X≥10;优选地,参考基因组序列获取步骤中,X为10~50;优选地,双序列比对步骤中,M≥10。4.如权利要求1所述的方法,其特征在于,参考基因组种子序列提取步骤中,预设的种子序列长度≥6nt;优选地,参考基因组种子序列提取步骤中,预设的种子序列长度≥10nt;优选地,参考基因组种子序列提取步骤中,N≥1;优选地,参考基因组种子序列提取步骤中,N≥2;优选地,参考基因组种子序列提取步骤中,N≥3;优选地,测序结果种子序列寻找步骤中,如果匹配失败,且此时种子序列长度>6nt,则将种子序列的预设长度减少1nt后再重新执行参考基因组种子序列提取步骤以及测序结果种子序列寻找步骤;如果匹配失败时种子序列长度已经≤5nt,则判定不能绘图并结束程序;优选地,测序结果种子序列寻找步骤中,在匹配时,若某段种子序列在测序结果序列中出现多次,也判定为匹配失败。5.如权利要求2所述的方法,其特征在于,判定步骤中,根据相似率获得比对结果;优选地,所述相似率是指匹配的碱基数占序列总碱基数的比例;优选地,所述序列总碱基数包含比对后多出的空位数;优选地,判定步骤中,根据相似率与预设阈值的大小关系,获得比对结果;
优选地,判定步骤中,如果相似率≥预设阈值,则判定两段序列匹配,目标位点对应的碱基位能准确地被定位;如果相似率<预设阈值,则判定两段序列不相似,目标位点的碱基位不准确,且判定不能绘图。6.如权利要求2所述的方法,其特征在于,还包括位置确定步骤,包括根据...

【专利技术属性】
技术研发人员:何杰窦浩宇刘永初燕攀刘阳李阳
申请(专利权)人:深圳安吉康尔医学检验实验室
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1