System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 扩增子序列解复用方法、装置、电子设备和存储介质制造方法及图纸_技高网

扩增子序列解复用方法、装置、电子设备和存储介质制造方法及图纸

技术编号:43063877 阅读:6 留言:0更新日期:2024-10-22 14:42
本公开的实施例提供的扩增子序列解复用方法、装置、电子设备和存储介质,所述方法包括:获取目标混合样本中所包括的每个样本的样本标识以及对应的第一正向识别标签和第一反向识别标签,获取待解析测序序列集合,其中,待解析测序序列集合为基于对待测序混合样本进行多重复用测序所得到的测序结果所生成的,对于每个待解析测序序列,分别按照预设正向识别标签位置信息和预设反向识别标签位置信息对该待解析测序序列进行解析,得到相应第二正向识别标签和第二反向识别标签,以及根据第二正向识别标签和第二反向识别标签确定该待解析测序序列对应的样本标识。实现了同时对多个实验板中的扩增子序列进行测序,同时减少了测序数据的浪费。

【技术实现步骤摘要】

本公开的实施例涉及生物信息分析,具体涉及一种扩增子序列解复用方法、装置、电子设备和存储介质


技术介绍

1、高通量测序技术因其能够在短时间内产生大量遗传信息而成为生物学研究的重要工具。在高通量测序技术中,多重复用(multiplexing)技术可以允许在同一次测序中同时处理多个测序样本,这种技术通过为每个测序样本分配独特的dna条形码(barcode)实现,使得不同样本在混合后可以进行区分。测序完成后,通常通过解复用(demultiplexing)技术将混合测序样本的测序数据根据各自的barcode分离出来。

2、然而,现有的测序技术,在同一次测序运行中通常支持的测序样本混合数量不多于96个(单个96孔实验板),这在一定程度上限制了测序通量的进一步提升,此外,由于测序样本碱基长度偏短,对每个测序样本进行分析所需的测序数据也较小,在测序仪每次测序产出的测序数据总量一定的情况下,在测序实验中可能会出现大量测序数据浪费的现象。

3、因此,有必要提出一种扩增子序列解复用方法,以解决上述至少一个技术问题。


技术实现思路

1、本公开的实施例提出了一种扩增子序列解复用方法、装置、电子设备和存储介质。

2、第一方面,本公开提供了一种扩增子序列解复用方法,包括:

3、获取目标混合样本中所包括的每个样本的样本标识以及对应的第一正向识别标签和第一反向识别标签,其中,所述目标混合样本混合有至少两个样本;

4、获取待解析测序序列集合,其中,所述待解析测序序列集合为基于对所述待测序混合样本进行多重复用测序所得到的测序结果所生成的,在所述多重复用测序前,对每个所述样本的扩增子序列的前端和后端分别添加了该样本的样本标识对应的第一正向识别标签和第一反向识别标签;对于每个待解析测序序列,分别按照预设正向识别标签位置信息和预设反向识别标签位置信息对该待解析测序序列进行解析,得到相应第二正向识别标签和第二反向识别标签,以及根据所述第二正向识别标签和第二反向识别标签确定该待解析测序序列对应的样本标识。

5、在一些可选的实施方式中,所述根据所述第二正向识别标签和第二反向识别标签确定该待解析测序序列对应的样本标识,包括:

6、将所述待测序混合样本中第一正向识别标签和第一反向识别标签分别为所述第二正向识别标签和第二反向识别标签的样本标识,确定为该待解析测序序列对应的样本标识。

7、在一些可选的实施方式中,所述每个样本的样本标识对应的第一正向识别标签和第一反向识别标签分别用于表征该样本所在的实验板和在实验板中的孔位。

8、在一些可选的实施方式中,所述待测序混合样本中各样本设置在至少一个实验板中的不同孔位,通过pcr实验对每个所述样本的扩增子序列的前端和后端分别绑定了该样本对应的第一正向识别标签和第一反向识别标签。

9、在一些可选的实施方式中,所述分别按照预设正向识别标签位置信息和预设反向识别标签位置信息对该待解析测序序列进行解析,得到相应第二正向识别标签和第二反向识别标签,包括:

10、将从该待解析测序序列的前端开始解析第一预设正向长度得到相应第二正向识别标签;

11、将从该待解析测序序列的后端开始解析第二预设正向长度得到相应第二反向识别标签。

12、第二方面,本公开提供了一种扩增子序列解复用装置,包括:

13、目标混合样本获取单元,用于获取目标混合样本中所包括的每个样本的样本标识以及对应的第一正向识别标签和第一反向识别标签,其中,所述目标混合样本混合有至少两个样本;

14、待解析测序序列获取单元,用于获取待解析测序序列集合,其中,所述待解析测序序列集合为基于对所述待测序混合样本进行多重复用测序所得到的测序结果所生成的,在所述多重复用测序前,对每个所述样本的扩增子序列的前端和后端分别添加了该样本的样本标识对应的第一正向识别标签和第一反向识别标签;对于每个待解析测序序列,分别按照预设正向识别标签位置信息和预设反向识别标签位置信息对该待解析测序序列进行解析,得到相应第二正向识别标签和第二反向识别标签,以及根据所述第二正向识别标签和第二反向识别标签确定该待解析测序序列对应的样本标识。

15、第三方面,本公开提供了一种电子设备,包括:

16、一个或多个处理器;

17、存储装置,其上存储有一个或多个程序,

18、当上述一个或多个程序被上述一个或多个处理器执行时,使得上述一个或多个处理器实现如本公开第一方面和/或第二方面任一实施方式描述的方法。

19、第四方面,本公开提供了一种计算机可读存储介质,其上存储有计算机程序,其中,上述计算机程序被一个或多个处理器执行时实现如本公开第一方面和/或第二方面任一实施方式描述的方法。

20、第五方面,本公开提供了一种计算机程序产品,包括计算机程序/指令,所述计算机程序/指令被处理器执行时实现如如本公开第一方面和/或第二方面任一实施方式描述的方法。

21、本公开的实施例提供的扩增子序列解复用方法,首先,获取目标混合样本中所包括的每个样本的样本标识以及对应的第一正向识别标签和第一反向识别标签,其中,目标混合样本混合有至少两个样本,然后,获取待解析测序序列集合,其中,待解析测序序列集合为基于对待测序混合样本进行多重复用测序所得到的测序结果所生成的,在多重复用测序前,对每个样本的扩增子序列的前端和后端分别添加了该样本的样本标识对应的第一正向识别标签和第一反向识别标签;对于每个待解析测序序列,分别按照预设正向识别标签位置信息和预设反向识别标签位置信息对该待解析测序序列进行解析,得到相应第二正向识别标签和第二反向识别标签,以及根据第二正向识别标签和第二反向识别标签确定该待解析测序序列对应的样本标识。如此,由于每个样本添加该样本的样本标识对应了第一正向识别标签和第一反向识别标签,在对于每个待解析测序序列进行解析后,可以根据解析后的待解析测序序列的第二正向识别标签和第二反向识别标签,从而可以根据第二正向识别标签和第二反向识别标签确定待解析测序序列对应的样本标识,实现了同时对多个实验板中的扩增子序列进行测序,提升了测序通量,在测序数据总量一定的情况下,还可以减少了测序数据的浪费。

本文档来自技高网...

【技术保护点】

1.一种扩增子序列解复用方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述根据所述第二正向识别标签和第二反向识别标签确定该待解析测序序列对应的样本标识,包括:

3.根据权利要求1所述的方法,其特征在于,所述每个样本的样本标识对应的第一正向识别标签和第一反向识别标签分别用于表征该样本所在的实验板和在实验板中的孔位。

4.根据权利要求1所述的方法,其特征在于,所述待测序混合样本中各样本设置在至少一个实验板中的不同孔位,通过PCR实验对每个所述样本的扩增子序列的前端和后端分别绑定了该样本对应的第一正向识别标签和第一反向识别标签。

5.根据权利要求1所述的方法,其特征在于,所述分别按照预设正向识别标签位置信息和预设反向识别标签位置信息对该待解析测序序列进行解析,得到相应第二正向识别标签和第二反向识别标签,包括:

6.一种扩增子序列解复用装置,包括:

7.一种电子设备,包括:

8.一种计算机可读介质,其上存储有计算机程序,其中,所述程序被处理器执行时实现如权利要求1-5中任一所述的方法。

9.一种计算机程序产品,包括计算机程序/指令,所述计算机程序/指令被处理器执行时实现如权利要求1-5中任一所述的方法。

...

【技术特征摘要】

1.一种扩增子序列解复用方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述根据所述第二正向识别标签和第二反向识别标签确定该待解析测序序列对应的样本标识,包括:

3.根据权利要求1所述的方法,其特征在于,所述每个样本的样本标识对应的第一正向识别标签和第一反向识别标签分别用于表征该样本所在的实验板和在实验板中的孔位。

4.根据权利要求1所述的方法,其特征在于,所述待测序混合样本中各样本设置在至少一个实验板中的不同孔位,通过pcr实验对每个所述样本的扩增子序列的前端和后端分别绑定了该样本对应的第一正向识...

【专利技术属性】
技术研发人员:李泽南李佳佳
申请(专利权)人:杭州恩和生物科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1