System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 使用质谱进行化合物识别制造技术_技高网

使用质谱进行化合物识别制造技术

技术编号:43261691 阅读:9 留言:0更新日期:2024-11-08 20:41
接收测量的质谱和被提供作为m/z和至少一个附加维度的函数的强度数据。将测量的谱的峰与多个库质谱中的每个库质谱的峰进行比较。使用拟合评分识别库质谱的集合。对于集合中的每个谱,重新计算使用解卷积算法计算的测量的谱的相关峰的组。重新计算在库谱的匹配的峰贡献于拟合评分的情况下降低用于组中的选择的阈值。对每个库谱产生测量的谱的相关峰的组。对于集合中的每个谱,将组的峰与库谱的峰进行比较,以及计算纯度评分。识别集合中的具有最高纯度评分的至少一个库谱。

【技术实现步骤摘要】
【国外来华专利技术】

本文的教导涉及识别与测量的质谱匹配的已知化合物的库质谱。更具体地说,本文的教导涉及系统和方法,该系统和方法用于使用拟合评分识别质谱库中的与测量的质谱匹配的谱的子集合,针对集合中的每个谱重新计算从解卷积算法找到的相关峰的组,其基于拟合评分变化针对每个离子的置信阈值,使用纯度评分将测量的谱的针对每个库谱找到的重新计算的相关峰与库谱的峰进行比较,以及识别具有最佳纯度评分的库谱作为与测量的谱匹配。本文的系统和方法可以与处理器、控制器或计算机系统(诸如图1的计算机系统)结合执行。


技术介绍

1、单向化合物识别工作流程

2、单向质谱化合物识别工作流程通常涉及将测量的产物离子谱与已知化合物的产物离子质谱的库进行比较,或与从已知化合物的数据库生成的计算机生成的产物离子质谱进行比较。然后选择其库质谱或计算机生成的质谱与测量的谱最佳地匹配的已知化合物作为识别的化合物。

3、单向化合物识别工作流程对于来自信息依赖采集(ida)质谱法方法或数据依赖采集(dda)质谱法方法的数据效果好。然而,对于来自数据非依赖采集(dia)质谱法方法的数据,这种类型的化合物识别带来若干挑战和缺点,经常导致假阳性结果或假阴性结果。关于ida、dda和dia的更多内容在下面提供。

4、由dia方法带来的一个挑战是前体离子(q1)质量过滤器不像ida方法中的前体离子质量过滤器那样特异。这种降低的特异性导致测量的谱是来自多个不同的前体离子的产物离子的混合物。因此,来自dia方法的产物离子谱在进行库搜索或数据库搜索之前需要执行解卷积算法。此外,没有解卷积算法始终提供正确的解。

5、由dia方法带来的第一个缺点是它们通常除了强度和质荷比(m/z)之外还沿一个或多个维度执行。这些一个或多个维度包括但不限于保留时间、迁移分离和扫描前体离子m/z。因此,在dia解卷积中,强度与解卷积精度不相关。

6、在其他质谱法方法中,解卷积的产物离子数据通常包括分配给每个m/z峰并与解卷积结果不确定性相关的概率。替代地,在dia解卷积中,基于某种二元标准(属于是或否)选择所得到的产物离子谱中的产物离子。此外,包含的所有产物离子被化合物识别工具以同等的相关性(有时更强的产物离子被给予一些优势,但这与解卷积精度无关)对待。

7、由dia方法带来的另一个缺点是难以使用库搜索来自信地从产物离子谱识别化合物。在库搜索中,拟合评分是库谱与测量的谱匹配得有多好的度量。拟合评分不受测量的谱中的与库谱中的峰不匹配的额外的峰的影响。拟合评分的范围是0到1。

8、例如,如果在测量的谱中找到库谱中的峰,则拟合评分高(更接近1)。相反,如果库谱中的峰没有出现在未知的谱中,则拟合评分低(更接近0)。然而,如果未知的谱有额外的峰(来自相同隔离窗中的干扰化合物),这些额外的碎片峰对拟合评分没有影响。然后,单独地使用拟合评分的缺点是它可能导致识别的高的假阳性率。本质上,假阳性是对于错误识别的高评分。

9、在库搜索中用来从产物离子谱中识别化合物的另一种类型的评分是纯度评分。纯度评分是测量的谱与库谱彼此匹配得有多好的度量。来自两个谱的所有峰被使用。纯度评分的范围也从0到1。

10、例如,如果在测量中找到库谱中的峰,并且来自干扰化合物的附加的峰很少或没有,那么纯度评分高(更接近1)。如果测量的谱具有附加的峰(来自相同隔离窗中的干扰化合物),则纯度评分低(更接近0)。单独地使用纯度评分的缺点是,当存在一些干扰峰时,它可能会错过化合物的识别。由于dia中使用的大隔离窗,原始dia产物离子谱可能包含来自若干化合物的碎片。这导致差的纯度评分和错误识别。

11、此外,在一些情况下,dia数据是扣除了背景的。对于经背景扣除的dia谱,紧密洗脱的异构体(例如,吗啡和氢吗啡酮)具有类似的碎片,并且背景扣除错误地消除来自这些碎片的信号。这导致差的拟合评分和纯度评分。

12、如上所述,为了处理包括来自多个不同的前体离子的产物离子的质谱,dia方法通常需要使用解卷积算法。示例性的无监督聚类算法、解卷积算法、线性映射算法或非线性映射算法是具有变量分组的主成分分析(pcvg)。关于pcvg的更多内容在下面提供。

13、例如,pcvg用于处理dia谱。pcvg将具有类似的提取离子色谱(xic)曲线图的产物离子分组在一起。pcvg帮助去除来自干扰化合物的产物离子,并且导致更准确的纯度评分。然而,最终pcvg计算产物离子属于相同的组的置信值(基于主成分(pc)空间中的相关性)。

14、通常,置信阈值被应用于从经pcvg分析的dia谱中获取谱。这个阈值通常对所有数据是相同的。pcvg算法在相同的尺度上在组变异(group variance)之间或之内映射组。例如,组变异是不同成分的产物离子之间的平均差异相对相同成分的产物离子中的平均差异。选择的阈值对应于最佳组变异比,而无论数据复杂性和噪声水平。置信阈值被选择为足够敏感,以检测前体液相色谱(lc)曲线图中的小差异(最小化假阴性),但不会由于噪声导致的lc差异而拆分产物离子(最小化假阳性)。

15、针对pcvg使用相同的置信阈值对于在隔离m/z过滤窗和lc峰区域内的前体独特的产物离子效果好。然而,共享的产物离子lc曲线图是对应的前体的曲线图的线性组合,因此可能无法通过置信阈值。因此,在两个化合物或非常紧密洗脱的化合物之间的共享的产物离子可能导致不正确的谱以及差的拟合评分和纯度评分。

16、置信阈值只是pcvg参数中的可以被使用的参数之一。它只是应用在聚类的最后阶段的参数。本文所述的各种实施例适用于任何参数。例如,特别是对于pcvg,通过变异解释的阈值确定pc的数量。变化这个参数导致对于组成员的更严格的片段lc曲线图(或“除mz维度之外”的维度)相似性要求,而具有较少的pc(不同的变异阈值)导致容忍一些非理想相似性的分组。

17、导致差的拟合评分和纯度评分的另一个问题可能是噪声。pcvg参数和置信阈值通常被优化以与有噪声的数据一起工作,但仍然被设计为足够敏感,以检测高度类似但不同的lc峰曲线图。可能发生的是,由于噪声,来自相同的前体的离子具有小的lc峰差异,该差异会被pcvg识别为类似但不同的峰的组,并会被分成两个接近的组。

18、相比于一些其他解卷积技术(像可以分离共享的碎片并将一部分观察到的强度分配给两个或更多个组的非负分解方法),pcvg具有限制。然而,这些其他解卷积技术方法存在噪声问题,并且也可能将观察到的强度“过度拆分”到太多的组中,以及分配不正确的组。最一般而言,任何解卷积算法具有灵敏度/特异性权衡,这可能导致所得到的解卷积谱不完整或受干扰。

19、如上所述,关键是以两种不同的方式识别化合物。可以使用任何分离方法。

20、在一些情况下,也使用前体离子分析(ms分析)。ms分析用于减少要考虑的可能库谱的数量,这减少了时间和可能的假阳性。

21、通常地,需要额外的系统和方法来优化无监督聚类算法、解卷积算法、线性映本文档来自技高网...

【技术保护点】

1.一种用于识别与测量的质谱匹配的已知化合物的库质谱的方法,包括:

2.根据前述方法权利要求的任何组合的方法,

3.根据前述方法权利要求的任何组合的方法,其中,无监督聚类算法、解卷积算法、线性映射算法或者非线性映射算法包括具有变量分组的主成分分析PCVG。

4.根据前述方法权利要求的任何组合的方法,其中,所述至少一个附加维度包括保留时间,或者所述至少一个附加维度包括前体离子m/z。

5.根据前述方法权利要求的任何组合的方法,其中,所述至少一个附加维度包括差分迁移谱法DMS装置的补偿电压CoV。

6.根据前述方法权利要求的任何组合的方法,其中,所述至少一个附加维度包括离子迁移谱法IMS装置的漂移时间或者碰撞截面。

7.根据前述方法权利要求的任何组合的方法,其中,质谱法方法包括数据非依赖采集DIA方法。

8.根据前述方法权利要求的任何组合的方法,其中,第一评分包括拟合评分,以及第二评分包括纯度评分。

9.根据前述方法权利要求的任何组合的方法,其中,对于针对集合中的每个库质谱添加到测量的质谱的相关峰的组中的每个峰,第一评分和第二评分中的一个或多个被重新计算并与先前的第一评分和先前的第二评分中的一个或多个进行比较,以确定是否达到阈值降低限制。

10.一种计算机程序产品,包括非暂态有形计算机可读存储介质,所述非暂态有形计算机可读存储介质的内容使得处理器执行用于识别与测量的质谱匹配的已知化合物的库质谱的方法,包括:

11.根据前述计算机程序产品权利要求的任何组合的计算机程序产品,

12.根据前述计算机程序产品权利要求的任何组合的计算机程序产品,其中,无监督聚类算法、解卷积算法、线性映射算法或者非线性映射算法包括具有变量分组的主成分分析PCVG。

13.根据前述计算机程序产品权利要求的任何组合的计算机程序产品,其中,第一评分包括拟合评分,以及第二评分包括纯度评分。

14.一种用于识别与测量的质谱匹配的已知化合物的库质谱的系统,包括:

15.根据前述系统权利要求的任何组合的系统,

...

【技术特征摘要】
【国外来华专利技术】

1.一种用于识别与测量的质谱匹配的已知化合物的库质谱的方法,包括:

2.根据前述方法权利要求的任何组合的方法,

3.根据前述方法权利要求的任何组合的方法,其中,无监督聚类算法、解卷积算法、线性映射算法或者非线性映射算法包括具有变量分组的主成分分析pcvg。

4.根据前述方法权利要求的任何组合的方法,其中,所述至少一个附加维度包括保留时间,或者所述至少一个附加维度包括前体离子m/z。

5.根据前述方法权利要求的任何组合的方法,其中,所述至少一个附加维度包括差分迁移谱法dms装置的补偿电压cov。

6.根据前述方法权利要求的任何组合的方法,其中,所述至少一个附加维度包括离子迁移谱法ims装置的漂移时间或者碰撞截面。

7.根据前述方法权利要求的任何组合的方法,其中,质谱法方法包括数据非依赖采集dia方法。

8.根据前述方法权利要求的任何组合的方法,其中,第一评分包括拟合评分,以及第二评分包括纯度评分。

9.根据前述方法权利要求的...

【专利技术属性】
技术研发人员:D·M·考克斯G·伊沃什夫
申请(专利权)人:DH科技发展私人贸易有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1