用于每簇强度校正和碱基检出的系统和方法技术方案

技术编号:36842989 阅读:25 留言:0更新日期:2023-03-15 15:58
本发明专利技术所公开的技术在逐簇基础上生成变化校正系数,以校正簇间强度分布变化,从而改进碱基检出。放大系数校正缩放变化。通道特异性偏移系数校正沿着相应强度通道的移位变化。基于将在测序运行的先前测序循环处针对目标簇生成的历史强度数据的分析与在该测序运行的当前测序循环处针对该目标簇生成的当前强度数据的分析相结合,生成针对该目标簇的该变化校正系数。然后,使用该变化校正系数来校正在该测序运行的下一个测序循环处针对该目标簇生成的下一个强度数据。然后,该经过校正的下一个强度数据用于在该下一个测序循环处碱基检出该目标簇。基检出该目标簇。基检出该目标簇。

【技术实现步骤摘要】
【国外来华专利技术】DATA”的美国非临时专利申请第15/153,953号;
[0016]2013年9月6日提交的名称为“CENTROID MARKERS FOR IMAGE ANALYSIS OF HIGH DENSITY CLUSTERS IN COMPLEX POLYNUCLEOTIDE SEQUENCING”的美国非临时专利申请第14/020,570号;
[0017]2014年10月31日提交的名称为“IMAGE ANALYSIS USEFUL FOR PATTERNED OBJECTS”的美国非临时专利申请第14/530,299号;
[0018]2009年9月23日提交的名称为“METHOD AND SYSTEM FOR DETERMINING THE ACCURACY OF DNA BASE IDENTIFICATIONS”的美国非临时专利申请第12/565,341号;
[0019]2007年3月30日提交的名称为“SYSTEMS AND DEVICES FOR SEQUENCE BY SYNTHESIS ANALYSIS”的美国非临时专利申请第12/295,337号;
[0020]2008年1月28日提交的名称为“IMAGE DATA EFFICIENT GENETIC SEQUENCING METHOD AND SYSTEM”的美国非临时专利申请第12/020,739号;
[0021]2013年3月15日提交的名称为“BIOSENSORS FOR BIOLOGICAL OR CHEMICAL ANALYSIS AND SYSTEMS AND METHODS FOR SAME”的美国非临时专利申请第13/833,619号(代理人案卷号IP

0626

US);
[0022]2016年6月7日提交的名称为“BIOSENSORS FOR BIOLOGICAL OR CHEMICAL ANALYSIS AND METHODS OF MANUFACTURING THE SAME”的美国非临时专利申请第15/175,489号(代理人案卷号IP

0689

US);
[0023]2013年4月26日提交的名称为“MICRODEVICES AND BIOSENSOR CARTRIDGES FOR BIOLOGICAL OR CHEMICAL ANALYSIS AND SYSTEMS AND METHODS FOR THE SAME”的美国非临时专利申请第13/882,088号(代理人案卷号IP

0462

US);
[0024]2012年9月21日提交的名称为“METHODS AND COMPOSITIONS FOR NUCLEIC ACID SEQUENCING”的美国非临时专利申请第13/624,200号(代理人案卷号IP

0538

US);
[0025]2019年3月21日提交的名称为“TRAINING DATA GENERATION FOR ARTIFICIAL INTELLIGENCE

BASED SEQUENCING”的美国临时专利申请第62/821,602号(代理人案卷号ILLM 1008

1/IP

1693

PRV);
[0026]2019年3月21日提交的名称为“ARTIFICIAL INTELLIGENCE

BASED GENERATION OF SEQUENCING METADATA”的美国临时专利申请第62/821,618号(代理人案卷号ILLM 1008

3/IP

1741

PRV);
[0027]2019年3月21日提交的名称为“ARTIFICIAL INTELLIGENCE

BASED BASE CALLING”的美国临时专利申请第62/821,681号(代理人案卷号ILLM 1008

4/IP

1744

PRV);
[0028]2019年3月21日提交的名称为“ARTIFICIAL INTELLIGENCE

BASED QUALITY SCORING”的美国临时专利申请第62/821,724号(代理人案卷号ILLM 1008

7/IP

1747

PRV);
[0029]2019年3月21日提交的名称为“ARTIFICIAL INTELLIGENCE

BASED SEQUENCING”的美国临时专利申请第62/821,766号(代理人案卷号:ILLM 1008

9/IP

1752

PRV);
[0030]2019年6月14日提交的名称为“TRAINING DATA GENERATION FOR ARTIFICIAL INTELLIGENCE

BASED SEQUENCING”的荷兰申请第2023310号(代理人案卷号ILLM 1008

11/IP

1693

NL);
ANALYSIS SYSTEM”的美国临时专利申请第62/979,412号(代理人案卷号ILLM 1020

1/IP

1866

PRV);
[0047]2020年2月20日提交的名称为“DATA COMPRESSION FOR ARTIFICIAL INTELLIGENCE

BASED BASE CALLING”的美国临时专利申请第62/979,411号(代理人案卷号ILLM 1029

1/IP

1964

PRV);以及
[0048]2020年2月20日提交的名称为“SQUEEZING LAYER FOR ARTIFICIAL INTELLIGENCE

BASED BASE CALLING”的美国临时专利申请第62/979,399号(代理人案卷号ILLM 1030

1/IP

1782

PRV)。

技术介绍

[0049]本部分中讨论的主题不应仅因为在本部分中有提及就被认为是现有技术。类似地,在本部分中提及的或与作为
技术介绍
提供的主题相关联的问题不应被认为先前在现有技术中已被认识到。本部分中的主题仅表示不同的方法,这些方法本身也可对应于受权利要求书保护的技术的具体实施。
[0050]本公开涉及在测序运行期间分析图像本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种碱基检出目标簇的计算机实现的方法,所述方法包括:针对目标簇,从碱基特异性强度分布中读取针对测序运行的当前测序循环记录的当前通道特异性强度,在所述当前测序循环处将所述目标簇碱基检出到所述碱基特异性强度分布,从所述碱基特异性强度分布的质心读取当前通道特异性分布强度,基于所述当前通道特异性强度和所述当前通道特异性分布强度,确定用于所述当前测序循环的一组当前强度校正参数,通过累加用于所述测序运行的先前测序循环的所述一组当前强度校正参数和一组先前累加强度校正参数,确定用于所述当前测序循环的一组当前累加强度校正参数,基于所述一组当前累加强度校正参数确定用于所述当前测序循环的当前放大系数和当前通道特异性偏移系数,以及使用所述当前放大系数和所述当前通道特异性偏移系数来校正针对所述测序运行的下一个测序循环记录的下一个通道特异性强度,并针对所述下一个测序循环生成经过校正的下一个通道特异性强度;以及基于所述经过校正的下一个通道特异性强度,在所述下一个测序循环处碱基检出所述目标簇。2.根据权利要求1所述的计算机实现的方法,其中所述一组当前强度校正参数包括当前通道特异性分布强度、当前通道特异性强度误差、当前分布质心到原点的距离和当前分布强度到强度误差相似性度量。3.根据权利要求1和2中任一项所述的计算机实现的方法,其中所述当前通道特异性强度误差是所述当前通道特异性强度和所述当前通道特异性分布强度之间的逐通道差异。4.根据权利要求1至3中任一项所述的计算机实现的方法,其中所述当前分布质心到原点的距离是多维空间的所述质心和原点之间的欧几里得距离,所述多维空间包含所述碱基特异性强度分布。5.根据权利要求1至4中任一项所述的计算机实现的方法,其中所述多维空间是笛卡尔空间、极空间、柱形空间和球形空间中的至少一者。6.根据权利要求1至5中任一项所述的计算机实现的方法,其中所述当前分布强度到强度误差相似性度量是所述当前通道特异性分布强度和所述当前通道特异性强度误差之间的逐通道点积的总和。7.根据权利要求1至6中任一项所述的计算机实现的方法,其中所述一组当前累加强度校正参数是所述一组当前强度校正参数中的当前强度校正参数和所述一组先前累加强度校正参数中的先前累加强度校正参数的强度校正逐参数总和。8.根据权利要求1至7中任一项所述的计算机实现的方法,其中所述一组当前累加强度校正参数是所述当前强度校正参数和所述先前累加强度校正参数的强度校正逐参数平均值。9.根据权利要求1至8中任一项所述的计算机实现的方法,其中所述一组先前累加强度校正参数和所述一组当前累加强度校正参数以量化的固定位宽格式存储。10.根据权利要求1至9中任一项所述的计算机实现的方法,其中所述当前通道特异性偏移系数被配置为相同。
11.根据权利要求1至10中任一项所述的计算机实现的方法,其中所述一组当前累加强度校正参数中的当前累加强度校正参数包括用于所述当前通道特异性分布强度的第一公共当前累加强度校正参数,以及用于所述当前通道特异性强度误差的第二公共当前累加强度校正参数。12.根据权利要求1至11中任一项所述的计算机实现的方法,其中从所述下一个通道特异性强度中逐通道地减去所述当前通道特异性偏移系数,以生成下一个通道特异性移位强度,并且所述下一个通道特异性移位强度除以所述当前放大系数,以生成所述经过校正的下一个通道特异性强度。13.根据权利要求1至12中任一项所述的计算机实现的方法,所述方法还包括使用加权函数来组合初始放大系数与所述当前放大系数,以及初始通道特异性偏移系数与所述当前通道特异性偏移系数,以生成用于所述当前测序循环的加权当前放大系数和加权当前通道特异性偏移系数。14.根据权利要求1至13中任一项所述的计算机实现的方法,其中所述加权函数将最小权重(w
min
)应用于初始放大系数和所述初始通道特异性偏移系数,并将最大权重(w
max
)应用于所述当前放大系数和所述当前通道特异性偏移系数,其中w
min
=(1

w
max
)。15.根据权利要求1至14中任一项所述的计算机实现的方法,其中所述最大权重(w
max
)被定义为(c

p)/c,其中c是用于所述当前测序循环的索引,并且p是2至7之间的数...

【专利技术属性】
技术研发人员:E
申请(专利权)人:因美纳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1