【技术实现步骤摘要】
本专利
涉及用于自动处理核酸色谱的计算机系统和方法。使用该方法可容易地在杂合核酸序列示踪过程中进行多态性检测和表征。计算机程序列表附件包括计算机程序列表附件的一个光盘已在本专利技术的副本中提交。在下表1中可看到计算机程序列表附件所含文件的大小、生成日期、生成时间及文件名称。在表1中栏一以字节提供了文件大小。栏二和栏三分别表示文件产生日期和时间,而第四栏表示文件名称。表1.计算机程序列表附件内容 表1所披露的计算机程序列表附件及其所包含的文件名目录作为整体在此作为参考引用。
技术介绍
大量DNA序列信息的可用性已开始影响生物学实践。作为当今大规模序列输出量的结果,分析方法已不适于与急速增长的数据并驾齐驱。为跟上这种增长要求,需要改进的自动化控制,并且在序列数据处理中较大地减少或消除人为涉及因素也特别重要。在这方面的进展不仅需要改进数据处理软件的准确性而且需要可靠的准确方式来减少在错误勘正中对人为涉及因素的需要并使人工复查更加有效率。现在,通常用Sanger的酶双脱氧链终止法(Sanger等1977,Proc.Natl.Acad.Sci.745463-5467)在自动测序仪中进行DNA测序,这样的自动测序仪如AppliedBiosystems公司(ABI,Norwalk,Connecticut)3730×1DNA分析仪、3730DNA分析仪、ABI PRISM3100基因分析仪、3100-Avant毛细管DNA测序仪/基因分型仪或310毛细管DNA测序仪/基因分型仪。这样的测序仪可产生列出多于一千个碱基的序列数据。这样的测序开始于目标DNA模板及与模板 ...
【技术保护点】
一种处理具有多个基本同时发生的迹线的输入核酸色谱的方法,在所述多个迹线中的每条迹线具有多个数据点,每一多个所述数据点中的每一个分别的数据点表示在迹线中相应于各自数据点的位置处的信号幅度,该方法包括: 识别所述多条迹线中第一迹线的第一峰,该峰基本与所述多条迹线中第二迹线的第二峰重叠;及 输出所述第一峰为第一输出纯合表示,第二峰为第二输出纯合表示。
【技术特征摘要】
US 2004-9-15 10/9425381.一种处理具有多个基本同时发生的迹线的输入核酸色谱的方法,在所述多个迹线中的每条迹线具有多个数据点,每一多个所述数据点中的每一个分别的数据点表示在迹线中相应于各自数据点的位置处的信号幅度,该方法包括识别所述多条迹线中第一迹线的第一峰,该峰基本与所述多条迹线中第二迹线的第二峰重叠;及输出所述第一峰为第一输出纯合表示,第二峰为第二输出纯合表示。2.如权利要求1的方法,其中所述第一输出纯合表示是所述输入核酸色谱的第一纯合序列表示;及所述第二输出纯合表示是所述输入核酸色谱的第二纯合序列表示。3.如权利要求1的方法,其中所述第一输出纯合表示是第一纯合核酸色谱;及所述第二输出纯合表示是第二纯合核酸色谱。4.如权利要求1的方法,其中所述识别包括(A)对于在所述的第一迹线中一个或多个峰中的每一个分别的峰,标记具有所述分别峰中的最大值的数据点,第一迹线中所述的一个或多个峰包括所述第一峰;(B)对于在所述的第二迹线中一个或多个峰中的每一个分别的峰,标记具有所述分别峰中的最大值的数据点,第二迹线中所述的一个或多个峰包括所述第二峰;(C)识别所述输入核酸色谱中的坐标,该坐标在下述数据点的重叠阈值数量的数据点内(i)具有所述第一峰中的最大值的第一数据点和(ii)具有所述第二峰中的最大值的第二数据点。5.如权利要求4的方法,其中当所述第一数据点与第二数据点间隔2个数据点至7个数据点时,所述第一峰基本与所述第二峰重叠。6.如权利要求4的方法,其中当所述第一数据点与第二数据点间隔小于3个数据点时,所述第一峰基本与所述第二峰重叠。7.如权利要求1的方法,其中所述第一峰和第二峰各自独立地包括5-40个数据点。8.如权利要求1的方法,其中所述输入色谱为ABI迹线文件格式、SCF文件格式、ZTR文件格式或ALF文件格式。9.如权利要求1的方法,其中将所述第一输出核酸色谱和第二输出核酸色谱各自写成ABI迹线文件格式、SCF文件格式、ZTR文件格式或ALF文件格式。10.如权利要求4的方法,其中当在所述输入色谱中关于所述坐标的预定区域中存在大于阈值数量的峰时,将所述第一峰和第二峰各自都写成第一输出纯合表示和第二输出纯合表示。11.如权利要求10的方法,其中所述阈值数量峰为2-5个峰。12.如权利要求10的方法,其中所述预定区域为关于所述坐标的2个数据点-20个数据点。13.如权利要求4的方法,其中当第一峰的第一数据点与第二峰的第二数据点之间的比率大于阈值比率值时,将所述第一峰和所述第二峰各自写成第一输出纯合表示和第二输出纯合表示。14.如权利要求13的方法,其中所述的阈值比率值为至少0.20。15.如权利要求13的方法,其中所述的阈值比率值为至少0.40。16.如权利要求4的方法,其中当第一峰的第一数据点与第二峰的第二数据点之间的比率小于阈值比率值时,将所述第一峰和所述第二峰各自写成第一输出纯合表示和第二输出纯合表示。17.如权利要求4的方法,该方法进一步包括为所述输入核酸色谱确定平均峰背景值,及当所述第一峰的第一数据点或第二峰的第二数据点小于所述平均峰背景值时,将所述第一峰和所述第二峰写成所述第一输出纯合表示和第二输出纯合表示。18.如权利要求17的方法,其中通过下述方法计算平均峰背景值(i)比较(a)多条迹线的试验迹线中的数据点,该数据点具有所述试验迹线中峰的最大值,与(b)在多条迹线中另一条迹线的相应区域中具有最大值的相应数据点;(ii)重复将试验迹线的所述数据点与多条迹线中另一条的相应区域中具有最大值的相应数据点进行比较,直到多条迹线中每一条都已进行了所述比较(i)中的比较,其中当试验迹线中的数据点具有大于多条迹线中的每一条其它迹线的相应数据点所具有的值时,将该数据点的值加到计数器中;(iii)用具有在试验迹线中的不同峰的最大值的不同数据点重复比较步骤(i)和重复步骤(ii),直到通过所述比较步骤(i)对试验迹线中所有或部分峰都进行了比较;(iv)用多条迹线中的不同试验迹线重复所述比较步骤(i)、重复步骤(ii)和重复步骤(iii),直到多条迹线中每一条都作为在所述比较步骤(i)中的试验迹线被考虑过;及(v)通过加到计数器上的多个峰平均所述的计数器,从而获得所述平均峰背景值。19.如权利要求4的方法,其中所述的输入核酸色谱表示来自杂合核酸样品的核酸序列,该方法进一步包括对所述杂合核酸样品中的插入或删除点扫描所述输入核酸色谱;其中当发现所述插入或删除点并且所述坐标在该点之后时,将第一峰和第二峰各自写成所述的第一输出纯合表示和第二输出纯合表示。20.如权利要求19的方法,其中所述扫描包括计数发生在所述坐标之后的多个迹线中的峰的数量,其中当峰的数量超过插入/删除阈值数量时,确定所述坐标为所述杂合核酸样品中的插入或删除点。21.如权利要求20的方法,其中所述的插入/删除阈值数量为25-75。22.如权利要求20的方法,其中所述插入/删除阈值数量为75-200。23.如权利要求19的方法,其中所述扫描包括确定在所述坐标后多个迹线中重叠峰的百分比,其中,当重叠峰的百分比超过插入/删除阈值百分比时,确定所述坐标为杂合核酸样品中所述的插入或删除点。24.如权利要求23的方法,其中所述插入/删除阈值百分比为2-90%。25.如权利要求23的方法,其中所述插入/删除阈值百分比为10-50%。26.如权利要求1的方法,其中所述输入核酸色谱表示来自杂合核酸样品的核酸序列,其中在所述输出之前...
【专利技术属性】
技术研发人员:G廖,JA乌苏卡,GA佩尔茨,
申请(专利权)人:霍夫曼拉罗奇有限公司,
类型:发明
国别省市:CH[瑞士]
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。