System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及质谱分析领域,并且更具体地,涉及处理质谱数据的方法。
技术介绍
1、自软电离技术的发现使得能够进行完整小分子、肽和蛋白质的质谱分析以来已经有一段时间了。使用这些技术,非常有限的源内碎裂显著地简化了所获得的光谱。然而,单个化合物仍表现为一系列质荷比(m/z)信号。除了同位素之外,这些信号包括溶剂加合物、同源二聚体或异源二聚体、不同电荷状态和任何剩余的源内碎片。这些多个m/z信号的正确“组合”是定性分析和定量分析两者中的重要步骤。
2、据信,用于处理质谱数据的方法仍有改进的余地。
技术实现思路
1、提供了一种处理样本的质谱数据的方法。该质谱数据包括多个ms1质谱和多个msn质谱,该多个ms1质谱和该多个msn质谱中的每个质谱具有相应的相关联的保持时间。该方法包括检测该多个ms1质谱中的特征组,其中该组的每个特征具有相应的质量,并且其中该组的该特征具有对应的保持时间。该方法包括基于该特征组识别该样本中的一种或多种化合物。
2、如下面更详细地描述的,各种实施方案提供处理质谱数据的改进的方法。
3、在实施方案中,质谱数据由包括色谱分离装置(诸如,液相色谱(lc)分离装置或气相色谱(gc)分离装置)和质谱仪的分析仪器产生。该色谱分离装置可以在色谱分离扫描中分离该样本,并且该质谱仪可以在该色谱分离扫描期间获得质谱数据。因此,该多个ms1质谱和该多个msn质谱中的每个质谱将具有相应的相关联的保持时间,即,将在该色谱分离扫描期间在相应的色谱保持时间获
4、如下文进一步描述,在一些实施方案中,每个msn质谱为ms2质谱。然而,每个msn可替代地为更高阶碎裂谱,诸如ms3谱。通常,n是≥2的整数。
5、质谱数据可以由至少一个样本文件组成(即,可以由其形成),其中每一样本文件为来自质谱仪的来自相应的色谱分离扫描的数据输出。每个样本文件的质谱数据可以包括多个ms1质谱中的多个ms1质谱和多个msn质谱中的多个msn质谱。质谱数据可以包括单个此类样本文件或多个样本文件。在存在多个样本文件的情况下,每个样本文件可以从同一样本的不同分级的色谱分离扫描中获得。
6、该方法包括检测该多个ms1质谱中的特征组。该组的每个特征可以具有相应的质量和与其相关联的相应的保持时间。该组的特征可以具有对应的(例如,在第一容差内相等的)保持时间,但是具有不同质量。该方法可以包括检测该多个ms1质谱中的一个或多个另外的特征组,其中每个相应的不同组具有相应的不同保持时间。尽管下面详细描述了仅单个特征组的处理,但是应当理解,可以以类似的方式处理每个另外的特征组。
7、在一些实施方案中,通过首先检测该多个ms1质谱中的特征,然后将具有对应的(即,在第一容差内相等的)保持时间的检测到的特征划分来检测每个特征组。继而,通过首先在每个样本文件的ms1质谱中检测每文件特征,然后跨具有对应的质量和保持时间的样本文件对每文件特征进行划分以形成特征,可以在该多个ms1质谱中检测特征。
8、因此,检测该多个ms1质谱中的特征组的步骤可以包括:对于每个样本文件:检测该样本文件中的多个每文件特征,每个每文件特征具有相应的质量和相应的保持时间;从该每文件特征形成多个特征,每个特征具有相应的质量和相应的保持时间;以及通过对具有对应的保持时间的特征进行划分来形成特征组。
9、在这些实施方案中,可以通过首先针对样本文件的该多个ms1质谱中的每个独特质荷比(m/z)构建色谱图并且确定针对每个色谱图的特性保持时间来检测该样本文件中的每个每文件特征。针对色谱图的特性保持时间可以是在色谱图的中心或顶点处的保持时间,并且可以例如使用峰检测算法或类似算法来确定。然后可以根据色谱图的特性保持时间将色谱图划分为集合,并且可以将去同位素算法应用于每个色谱图集合以便形成每文件特征组。
10、因此,每个每文件特征是在去同位素ms1质谱数据中出现的特征,该特征具有质量和保持时间的独特组合。然后,每个每文件特征组的每个每文件特征将具有相应的质量和相应的保持时间,并且每个组的每文件特征将具有对应的(即在第二容差内相同的)保持时间。
11、同样地,检测样本文件中多个每文件特征的步骤可以包括:从该样本文件的该多个ms1质谱构造多个色谱图,每个色谱图具有相应的质荷比(m/z);确定针对每个色谱图的特性保持时间;将具有对应的特性保持时间的色谱图划分为色谱图的一个或多个集合;以及将去同位素算法应用于每个色谱图集合以形成每文件特征组。
12、如上所述,每个特征组中的特征可以具有在第一容差内相等的保持时间,而每个每文件特征组中的每文件特征可以具有在第二容差内相等的保持时间。该第二容差可以小于该第一容差。如下面进一步描述的,这具有适当地考虑不同样本文件之间的保持时间差的效果。
13、因此,具有对应的保持时间的特征进行划分的步骤可以包括对具有在第一容差内相等的保持时间的特征进行划分;该对具有对应的特性保持时间的色谱图进行划分的步骤可以包括对具有在第二容差内相等的保持时间的色谱图进行划分;并且该第二容差可以小于该第一容差。
14、在一些实施方案中,该方法包括:对于特征组中的一个或多个特征中的每个特征:(i)向质谱搜索引擎提交对应的msn质谱以便获得该特征的识别结果,以及(ii)基于与该特征相关联的质量与来自该识别结果的预期质量之间的任何质量差来确定针对该特征的候选离子类型(诸如候选加合物离子类型)。在这种情况下,识别该样本中一种或多种化合物的步骤可以基于特征组和候选(加合物)离子类型两者。
15、在这些实施方案中,步骤(i)和(ii)可以针对该组中对应的msn数据在质谱数据中可用的那些特征来执行。在存在多个样本文件的情况下,可以从样本文件中的任何样本文件取得对应的msn质谱。因此,对应于特征的msn质谱可以为对应于特征的每文件特征中的任一个每文件特征的msn谱(来自多个msn质谱)。
16、如上所述,质谱数据可以仅包括单个样本文件,在这种情况下,该多个特征中的每个特征由该多个每文件特征中的一个每文件特征形成。
17、在这些实施方案中,基于该特征组识别一种或多种化合物的步骤可以包括:
18、(i)确定一个或多个特征簇,其中每个特征簇包括该组的一个或多个
19、特征,并且可能对应于相应的(单个)化合物;
20、(ii)为该特征组确定该特征簇的一个或多个排布结构,其中每个排布
21、结构包括一个或多个不冲突的特征簇;以及
22、(iii)为该特征组从特征簇的一个或多个排布结构中选择优选排布结构;
23、以及然后:
24、基于特征簇的优选排布结构来识别一种或多种化合物。
25、然而,在特定实施方案中,质谱数据包括多个样本文件,并且该多个特征中的每个特征通过跨越具有对应的质量和对应的保持时间的样本文件对每文件特征进行划分而形成。在这种情本文档来自技高网...
【技术保护点】
1.一种处理质谱数据的方法,所述质谱数据包括多个MS1质谱和多个MSN(N≥2)质谱,每个质谱具有相应的相关联的保持时间,所述方法包括:
2.根据权利要求1所述的方法,其中(ii)确定针对所述特征的候选离子类型的步骤包括:基于所述特征的所述质量与来自所述识别结果的所述预期质量之间的所述质量差来确定针对所述特征的候选加合物离子类型。
3.根据权利要求1或2所述的方法,其中所述质谱数据包括至少一个样本文件,每个样本文件对应于相应的色谱分离扫描并且包括多个MS1质谱和多个MSN质谱,并且其中检测所述多个MS1质谱中的特征组的步骤包括:
4.根据权利要求3所述的方法,其中在样本文件中检测多个每文件特征的步骤包括:
5.根据权利要求4所述的方法,其中:
6.根据权利要求3、4或5所述的方法,其中所述质谱数据包括多个样本文件,并且所述多个特征中的每个特征是通过对每文件特征进行划分而形成的,所述每文件特征具有对应的质量和对应的保持时间。
7.根据权利要求6所述的方法,其中每个特征组由每个样本文件中对应的每文件特征组形成,并
8.一种处理质谱数据的方法,所述质谱数据包括多个样本文件,每个样本文件包括多个MS1质谱和多个MSN(N≥2)质谱,每个质谱具有相应的相关联的保持时间,所述方法包括:
9.根据权利要求7或8所述的方法,其中对于相应的样本文件中的每个每文件特征组,确定一个或多个每文件特征簇的步骤包括:
10.根据权利要求9所述的方法,其中每个每文件特征具有相应的电荷,并且其中将一种或多种候选离子类型分配给所述组的每个每文件特征的步骤包括:
11.根据权利要求9或10所述的方法,其中:
12.根据权利要求11所述的方法,所述方法还包括通过以下步骤获得每文件特征的预期源内碎片的所述质量:
13.根据权利要求11或12所述的方法,所述方法还包括通过以下步骤获得每文件特征的预期源内碎片的所述质量:
14.一种处理质谱数据的方法,所述质谱数据包括多个MS1质谱和多个MSN(N≥2)质谱,每个质谱具有相应的相关联的保持时间,所述方法包括:
15.根据权利要求13或14所述的方法,其中从被配置为模拟源内碎裂的一个或多个MSN质谱确定被作为所述识别结果的一部分提供的所述质量。
16.根据权利要求9至15中任一项所述的方法,其中确定所述组的每文件特征之间的一个或多个候选关系的步骤包括:
17.根据权利要求7至16中任一项所述的方法,其中从簇的所述一个或多个排布结构中选择簇的优选排布结构的步骤包括:
18.根据权利要求17所述的方法,其中确定簇的每个排布结构的评分的步骤包括:
19.一种质谱分析方法,所述质谱分析方法包括:
20.一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机软件代码,所述计算机软件代码当在处理器上执行时,执行根据前述权利要求中任一项所述的方法。
21.一种用于分析仪器的控制系统,所述控制系统被配置为使所述分析仪器执行根据权利要求1至19中任一项所述的方法。
22.一种分析仪器,所述分析仪器包括根据权利要求21所述的控制系统。
...【技术特征摘要】
1.一种处理质谱数据的方法,所述质谱数据包括多个ms1质谱和多个msn(n≥2)质谱,每个质谱具有相应的相关联的保持时间,所述方法包括:
2.根据权利要求1所述的方法,其中(ii)确定针对所述特征的候选离子类型的步骤包括:基于所述特征的所述质量与来自所述识别结果的所述预期质量之间的所述质量差来确定针对所述特征的候选加合物离子类型。
3.根据权利要求1或2所述的方法,其中所述质谱数据包括至少一个样本文件,每个样本文件对应于相应的色谱分离扫描并且包括多个ms1质谱和多个msn质谱,并且其中检测所述多个ms1质谱中的特征组的步骤包括:
4.根据权利要求3所述的方法,其中在样本文件中检测多个每文件特征的步骤包括:
5.根据权利要求4所述的方法,其中:
6.根据权利要求3、4或5所述的方法,其中所述质谱数据包括多个样本文件,并且所述多个特征中的每个特征是通过对每文件特征进行划分而形成的,所述每文件特征具有对应的质量和对应的保持时间。
7.根据权利要求6所述的方法,其中每个特征组由每个样本文件中对应的每文件特征组形成,并且其中基于所述特征组识别一种或多种化合物的步骤包括:
8.一种处理质谱数据的方法,所述质谱数据包括多个样本文件,每个样本文件包括多个ms1质谱和多个msn(n≥2)质谱,每个质谱具有相应的相关联的保持时间,所述方法包括:
9.根据权利要求7或8所述的方法,其中对于相应的样本文件中的每个每文件特征组,确定一个或多个每文件特征簇的步骤包括:
10.根据权利要求9所述的方法,其中每个每文件特征具有相应的电荷,并且其...
【专利技术属性】
技术研发人员:M·斯特罗霍姆,R·陶滕哈恩,
申请(专利权)人:塞莫费雪科学不来梅有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。