DNA自动测序中小概率序列判读错误的人工纠错方法技术

技术编号:13404226 阅读:206 留言:0更新日期:2016-07-25 01:32
本发明专利技术提供一种DNA自动测序中小概率序列判读错误的人工纠错方法,以便能够纠正自动测序结果判读过程中容易出现的几种错误,这些差错一般是由电脑测序软件在判读或打印时发生的误差所致,人工纠错方法的流程包括以下步骤:(1)人工图文对比、(2)正向判读序列、(3)存储正向判读结果、(4)反向读写序列、(5)对比正反向结果、(6)人工修正错误、(7)重复两次步骤、(8)打印最终结果,本发明专利技术由于采用上述多重纠错方法,其优点是可以避免由计算机测序软件在判读或打印时发生的误差,以便能够获得更为准确和可信的DNA序列,这对DNA克隆、基因重组、基因表达和分子进化等分子生物学研究都具有十分重要的意义。

【技术实现步骤摘要】

本专利技术涉及生物信息处理领域,特别涉及一种DNA序列的自动测序中出现计算机软件判读错误的人工纠错方法,属于生物

技术介绍
DNA序列分析首先是序列的测定和测序结果的判读;序列的测定分为手工测序和自动测序两种,目前随着自动测序仪和测序费用的减低,绝大多数试验室越来越多的选择自动测序对DNA进行序列测定,在完成了序列测定后,就是对序列的判读,序列判读这一过程看似简单,但却非常重要,稍有不慎就有可能把序列读错,特别是在有大量的序列需要判读时这种情况就更容易发生,从而影响到整个实验的进程;在序列的判读过程中,一般都以测序电泳图为准,测序图分为两个部分:上面的文字部分和下面的图形部分;一般来说只要图中的峰形较好,上面对应的文字即ATGC的不同排列是不会有错的,但是在特定的情况下也会发生极少部分的差错,这些差错一般是由电脑测序软件在判读或打印时发生的误差所致。
技术实现思路
本专利技术的目的是提供一种DNA自动测序中小概率序列判读错误的人工纠错方法,以便能够纠正自动测序结果判读过程中容易出现的几种错误,使获得的DNA序列更加准确和可信。本专利技术的技术方案是:DNA自动测序中小概率序列判读错误的人工纠错方法,其特征在于:所述方法的流程包括以下步骤:(1)人工图文对比:先人工核对由DNA序列测试仪自动测试的并由电脑测序软件判读和打印的图文DNA序列电泳图,查看图文DNA序列电泳图中的文字部分和峰形图之间的对应关系,r>如果没有误差,就执行下一步骤;如果有误差就以峰形图为准,然后再执行下一步骤;(2)正向判读序列:对DNA序列测试仪生成的测序报告按正向进行人工判读DNA序列;(3)存储正向判读结果:将上述步骤(2)的DNA序列判读结果存储到计算机中,作为对比文件一;(4)反向读写序列:对DNA序列测试仪生成的测序报告按反向读写DNA序列,并将其结果翻译成反向读写序列的互补序列,存储到计算机中,作为对比文件二;(5)对比正反向结果:将上述步骤(3)的对比文件一和步骤(4)的对比文件二用计算机软件进行比对,看两者的DNA序列判读结果是否有误差;若没有误差,就执行步骤(7);若有误差,就执行下一步骤;(6)人工修正错误:如果正向判读的对比文件一与反向读写序列之互补序列的对比文件二两者之间的DNA序列判读结果有误差,就必须对出错的地方作为重点进行人工核查,对错误进行纠错,直到两者的DNA序列判读结果完全一致;(7)重复两次步骤:重新按照上述步骤(1)至步骤(6)核对DNA序列两次,即一共做三次人工DNA序列核对,看三次的判读结果是否一致,如果一张序列电泳图核对三遍,其DNA序列的判读结果是一致的,基本上就可以认为此时的DNA序列判读结果是正确的,就执行下一步骤;若重复的步骤不足两次,就重新按照上述步骤(1)至步骤(6)核对DNA序列;(8)打印最终结果:打印和生成DNA序列判读的最终结果,作为DNA序列的正式报告。本专利技术由于采用上述多重纠错方法,其优点是可以避免由计算机测序软件在判读或打印时发生的误差,以便能够获得到准确和可信的DNA序列,这对DNA克隆、基因重组、基因表达和分子进化等分子生物学研究都具有十分重要的意义。附图说明图1为本专利技术DNA自动测序中小概率序列判读错误的人工纠错方法的基本流程图;图2为实施例判读中发现多出一个碱基A的电泳图;图3为实施例判读中发现多出一个碱基T的电泳图;图4为实施例判读中发现多出一个碱基C的电泳图;图5为实施例判读中发现G变C的电泳图;图6为实施例判读中发现判读不出结果而出现N的电泳图;图7为实施例判读中发现少读一个碱基A的电泳图;图8为实施例判读中发现换行时重复出现碱基A的电泳图。具体实施方式1.参见图1,本专利技术的DNA自动测序中小概率序列判读错误的人工纠错方法的流程包括以下步骤:(1)人工图文对比:先人工核对由DNA序列测试仪自动测试的并由电脑测序软件判读和打印的图文DNA序列电泳图,查看图文DNA序列电泳图中的文字部分和峰形图之间的对应关系,如果没有误差,就执行下一步骤;如果有误差就以峰形图为准,然后再执行下一步骤;(2)正向判读序列:对DNA序列测试仪生成的测序报告按正向进行人工判读DNA序列;(3)存储正向判读结果:将上述步骤(2)的DNA序列判读结果存储到计算机中,作为对比文件一;(4)反向读写序列:对DNA序列测试仪生成的测序报告按反向读写DNA序列,并将其结果翻译成反向读写序列的互补序列,存储到计算机中,作为对比文件二;(5)对比正反向结果:将上述步骤(3)的对比文件一和步骤(4)的对比文件二用计算机软件进行比对,看两者的DNA序列判读结果是否有误差;若没有误差,就执行步骤(7);若有误差,就执行下一步骤;(6)人工修正错误:如果正向判读的对比文件一与反向读写序列之互补序列的对比文件二两者之间的DNA序列判读结果有误差,就必须对出错的地方作为重点进行人工核查,对错误进行纠错,直到两者的DNA序列判读结果完全一致;(7)重复两次步骤:重新按照上述步骤(1)至步骤(6)核对DNA序列两次,即一共做三次人工DNA序列核对,看三次的判读结果是否一致,如果一张序列电泳图核对三遍,其DNA序列的判读结果是一致的,基本上就可以认为此时的DNA序列判读结果是正确的,就执行下一步骤;若重复的步骤不足两次,就重新按照上述步骤(1)至步骤(6)核对DNA序列;(8)打印最终结果:打印和生成DNA序列判读的最终结果,作为DNA序列的正式报告。2.本专利技术DNA自动测序中小概率序列判读错误的人工纠错方法的图文DNA序列电泳图的判断例子:(1)参见图2、图3和图4所示,虽然图文DNA序列电泳图的峰形较好,但对应的文字部分分别多出了一个A、T和C,即多出一个碱基,这种情况比较隐蔽,如果注意不够,就很可能判读错误;(2)参见图5,在测序电泳图中,不同的碱基其峰形图和相应的文字分别用不同的颜色表示,一般G用黑色表示;图5中碱基的峰形图是G,但其文字部分却被打印成了C,即峰形图和对应的文字不一致,这种情况发生的概率最小;(3)参见图6,峰形图都非常清晰,但上面的文字部分却打出一个N,即判读不出,这种情况一般在判读时,肯定会引起读序者的注意,只要对峰形再次进行核对并纠正,一般不会影响最终的读序结果;(4)参见图7,这种情况一般发生在峰形不是最高时,这里缺少一个A,少读一个碱基,在文字部分的相应处会出现一个小的空缺,一般在读序时,由于文字排列的疏密不同,本文档来自技高网...

【技术保护点】
一种DNA自动测序中小概率序列判读错误的人工纠错方法,其特征在于:所述方法的流程包括以下步骤:(1)人工图文对比:先人工核对由DNA序列测试仪自动测试的并由电脑测序软件判读和打印的图文DNA序列电泳图,查看图文DNA序列电泳图中的文字部分和峰形图之间的对应关系,如果没有误差,就执行下一步骤;如果有误差就以峰形图为准,然后再执行下一步骤;(2)正向判读序列:对DNA序列测试仪生成的测序报告按正向进行人工判读DNA序列;(3)存储正向判读结果:将上述步骤(2)的DNA序列判读结果存储到计算机中,作为对比文件一;(4)反向读写序列:对DNA序列测试仪生成的测序报告按反向读写DNA序列,并将其结果翻译成反向读写序列的互补序列,存储到计算机中,作为对比文件二;(5)对比正反向结果:将上述步骤(3)的对比文件一和步骤(4)的对比文件二用计算机软件进行比对,看两者的DNA序列判读结果是否有误差;若没有误差,就执行步骤(7);若有误差,就执行下一步骤;(6)人工修正错误:如果正向判读的对比文件一与反向读写序列之互补序列的对比文件二两者之间的DNA序列判读结果有误差,就必须对出错的地方作为重点进行人工核查,对错误进行纠错,直到两者的DNA序列判读结果完全一致;(7)重复两次步骤:重新按照上述步骤(1)至步骤(6)核对DNA序列两次,即一共做三次人工DNA序列核对,看三次的判读结果是否一致,如果一张序列电泳图核对三遍,其DNA序列的判读结果是一致的,基本上就可以认为此时的DNA序列判读结果是正确的,就执行下一步骤;若重复的步骤不足两次,就重新按照上述步骤(1)至步骤(6)核对DNA序列;(8)打印最终结果:打印和生成DNA序列判读的最终结果,作为DNA序列的正式报告。...

【技术特征摘要】
1.一种DNA自动测序中小概率序列判读错误的人工纠错方法,其特征在于:所述方法的
流程包括以下步骤:
(1)人工图文对比:先人工核对由DNA序列测试仪自动测试的并由电脑测序软件判读和打
印的图文DNA序列电泳图,查看图文DNA序列电泳图中的文字部分和峰形图之间的对应关系,
如果没有误差,就执行下一步骤;如果有误差就以峰形图为准,然后再执行下一步骤;
(2)正向判读序列:对DNA序列测试仪生成的测序报告按正向进行人工判读DNA序列;
(3)存储正向判读结果:将上述步骤(2)的DNA序列判读结果存储到计算机中,作为对比
文件一;
(4)反向读写序列:对DNA序列测试仪生成的测序报告按反向读写DNA序列,并将其结果
翻译成反向读写序列的互补序列,存储到计算机中,作为对比文件二;
(5)对比正反向结果:将上述步骤(3)的对比文件一和步骤(4)的对比文件二用计算...

【专利技术属性】
技术研发人员:唐伯平冯越周春霖张代臻刘秋宁张华彬李超峰宣富君姜森颢葛宝明崔军杨丽
申请(专利权)人:盐城师范学院
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1