用于前体推理的扫描带数据和概率框架的实时编码的方法技术

技术编号:30747990 阅读:22 留言:0更新日期:2021-11-10 11:58
前体离子传输窗口跨前体离子质量范围以重叠的步长移动。由质量过滤器在每个重叠步长传输的前体离子被裂解或传输。针对每个重叠窗口检测形成质谱数据的每个重叠窗口的一个或多个结果所得的产物离子或前体离子中的每一个的强度或计数。检测到的每个独特产物离子在数据获取期间被实时编码。这种编码包括检测到重叠窗口的每个独特离子的计数或强度的总和以及与每个总和相关联的窗口的位置。用于每个独特离子的编码存储在存储器设备中,而不是质谱数据。去模糊算法或数值方法被用于从编码的数据中确定每个独特离子的前体离子。数据中确定每个独特离子的前体离子。数据中确定每个独特离子的前体离子。

【技术实现步骤摘要】
【国外来华专利技术】用于前体推理的扫描带数据和概率框架的实时编码的方法
[0001]相关申请
[0002]本申请要求于2019年5月31日提交的美国临时专利申请序列No.62/855,242的权益,其内容通过引用整体并入本文。


[0003]本文的教导涉及编码和存储扫描SWATH质谱数据。更具体而言,本文的教导涉及用于通过基于四极响应函数或前体离子推断概率函数应用扫描四极维度的实时编码来减小存储扫描SWATH数据所需的文件尺寸的系统和方法。

技术介绍

[0004]如下所述,扫描SWATH是一种串联质谱方法,其中跨质量范围扫描前体离子质量选择窗口或前体离子传输窗口,使得连续的窗口具有大面积重叠和小面积非重叠。这种扫描使结果所得的产物离子成为被扫描的前提离子传输窗口的函数。这个附加信息在识别负责每个产物离子的一个或多个前体离子方面是有用的,这在传统SWATH中有时很难做到。
[0005]扫描SWATH的一个问题是它要求长期(例如,文件)存储比常规SWATH多得多的数据。增加的文件存储量与前体离子传输窗口重叠的量大致成比例。因此,如果n个前体离子传输窗口在扫描SWATH中重叠,那么对于被分析的相同的前体离子质量范围,在扫描SWATH实验中至少需要将比常规SWATH实验中多大致n倍的数据存储到文件中。
[0006]虽然文件存储本身不断变得越来越便宜,但就所需的处理时间和所需的处理能力而言,对此类大文件的后处理具有显著的成本。扫描存储在文件中的SWATH数据被后处理,例如,以推断被测产物离子的前体离子。大量的数值分解或概率推理方法可以用于扫描SWATH数据。
[0007]传统上,对于扫描SWATH实验,从每个重叠的前体离子传输窗口产生的用于每个产物离子的原始质量分析器检测(例如,例如,飞行时间(TOF)质量分析器计数)被存储到文件。可替代地,也可以使用中间类型的数据。例如,用于每个重叠的前体离子传输窗口的每个产物离子谱可以存储到文件。遗憾的是,在这两种方法中,如果n是重叠的前体离子传输窗口的数量,那么存储尺寸仍然至少是存储相同类型数据的常规SWATH所需的存储尺寸的大致n倍。
[0008]因此,需要附加的系统和方法来减小存储扫描SWATH数据所需的文件尺寸,而不会丢失对数据进行后处理以获得如前体离子推断之类的信息所需的任何信息。
[0009]串联质谱法和扫描SWATH
[0010]一般而言,串联质谱法或MS/MS是用于分析化合物的众所周知的技术。串联质谱法涉及从样本中电离一种或多种化合物、选择一种或多种化合物的一种或多种前体离子、将一种或多种前体离子裂解为产物离子以及对产物离子进行质量分析。
[0011]串联质谱法可以提供定性和定量信息。产物离子谱可以被用于识别感兴趣的分子。一种或多种产物离子的强度可以被用于定量样本中存在的化合物的量。
[0012]可以使用串联质谱仪执行大量不同类型的实验方法或工作流程。这些工作流程的三大类是靶向获取、信息相关的获取(IDA)或数据相关的获取(DDA)和数据独立的获取(DIA)。
[0013]在靶向获取方法中,为感兴趣的化合物预定义从前体离子到产物离子的一个或多个过渡。当样本被引入串联质谱仪时,在多个时间段或循环中的每个时间段或循环期间询问一个或多个过渡。换句话说,质谱仪选择并裂解每个过渡的前体离子,并对过渡的产物离子执行目标质量分析。因此,为每个过渡产生质谱。靶向获取方法包括但不限于多反应监视(MRM)和选择的反应监视(SRM)。
[0014]在IDA方法中,随着样本被引入串联质谱仪,用户可以指定用于执行产物离子的靶向或非靶向质量分析的准则。例如,在IDA方法中,执行前体离子或质谱法(MS)调查扫描以生成前体离子峰列表。用户可以选择准则来过滤峰列表以找到峰列表上前体离子的子集。然后对前体离子的子集的每个前体离子执行MS/MS。为每个前体离子产生产物离子谱。随着样本被引入串联质谱仪,对前体离子的子集的前体离子重复执行MS/MS。
[0015]但是,在蛋白质组学和许多其它样本类型中,化合物的复杂性和动态范围非常大。这对传统的靶向和IDA方法提出了挑战,要求非常高速的MS/MS获取来深入询问样本,以便既识别又量化范围广泛的分析物。
[0016]因此,开发了DIA方法,串联质谱法的第三大类。这些DIA方法已被用于提高从复杂样本收集数据的重现性和全面性。DIA方法也可以被称为非特定裂解方法。在传统的DIA方法中,串联质谱仪的动作在基于先前前体或产物离子扫描中获取的数据的MS/MS扫描之间没有变化。而是选择前体离子质量范围。然后前体离子传输窗口跨前体离子质量范围步进。前体离子传输窗口中的所有前体离子被裂解,并且前体离子传输窗口中的所有前体离子的所有产物离子都被质量分析。
[0017]用于扫描质量范围的前体离子传输窗口可以非常窄,使得窗口内多个前体的可能性小。这种类型的DIA方法称为例如MS/MS
ALL
。在MS/MS
ALL
方法中,大约1amu的前体离子传输窗口在整个质量范围内被扫描或步进。为每个1amu前体质量窗口产生产物离子谱。通过组合每个质量选择窗口的产物离子谱,产生整个前体离子质量范围的产物离子谱。分析或扫描整个质量范围一次所需的时间被称为一个扫描周期。但是,在每个周期期间跨宽的前体离子质量范围扫描窄的前体离子传输窗口对于一些仪器和实验来说是不切实际的。
[0018]因此,更大的前体离子传输窗口或具有更大宽度的选择窗口跨整个前体质量范围步进。这种类型的DIA方法被称为例如SWATH获取。在SWATH获取中,在每个周期中跨前体质量范围步进的前体离子传输窗口的宽度可以是5

25amu,或者甚至更大。与MS/MS
ALL
方法一样,每个前级离子传输窗口中的所有前体离子都被裂解,并且每个质量选择窗口中所有前体离子的所有产物离子都进行质量分析。但是,因为使用了更宽的前体离子传输窗口,所以与MS/MS
ALL
方法的周期时间相比,周期时间可以显著减少。或者,对于液相色谱(LC),可以增加累积时间。一般而言,对于LC,周期时间由LC峰定义。必须跨LC峰获得足够多的点(强度作为周期时间的函数)才能确定其形状。当周期时间由LC定义时,一个周期中可以执行的实验或质谱法扫描的次数定义每次实验或扫描可以累积离子观察的时间。因此,更宽的前体离子传输窗口可以增加累积时间。
[0019]美国专利No.8,809,770描述了可以如何使用SWATH获取来提供关于感兴趣的化合
物的前体离子的定量和定性信息。特别地,将从裂解前体离子传输窗口中发现的产物离子与感兴趣的化合物的已知产物离子的数据库进行比较。此外,分析从裂解前体离子传输窗口中发现的产物离子的离子痕量或提取的离子色谱图(XIC),以提供定量和定性信息。
[0020]但是,例如,在使用SWATH获取分析的样本中识别感兴趣的化合物会是困难的。这会是困难的,因为或者没有随前体离子传输窗口提供本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种用于编码和存储从重叠前体离子传输窗口测得的串联质谱法数据的系统,包括:串联质谱仪的质量过滤器,其跨前体离子质量范围以步长尺寸S m/z在重叠步长中移动具有前体离子质荷比(m/z)宽度W的前体离子传输窗口,产生跨质量范围的一系列重叠传输窗口,其中质量过滤器在每个重叠步长处在传输窗口内传输前体离子;质谱仪的裂解设备,其裂解或传输由质量过滤器在每个重叠步长处传输的前体离子,为该系列的每个重叠窗口产生一个或多个结果所得的产物离子;质谱仪的质量分析器,其针对该系列的每个重叠窗口检测形成该系列的每个重叠窗口的质谱数据的所述一个或多个结果所得的产物离子中的每一个的强度或计数;以及与质谱仪通信的处理器,代替将该系列的每个重叠窗口的质谱数据存储在存储器设备中,通过以下在数据获取期间实时地编码由质量分析器检测到的每个独特的产物离子:识别具有每个独特离子的第一次出现的该系列的第一次出现重叠窗口,选择紧接在第一次出现重叠窗口之前的该系列的一组G个重叠窗口,使得该组跨越至少传输窗口的宽度W,计算从该组的G个重叠窗口的每个窗口检测到的每个独特离子的计数或强度的总和,并将该总和与组的重叠窗口的位置相关联,以及将所选择的系列的G个重叠窗口的组向前移一个重叠窗口,计算从该组的G个重叠窗口的每个窗口检测到的每个独特离子的计数或强度的总和,将总和与组的重叠窗口的位置相关联,将总和和位置存储在存储器设备中,并重复这些步骤,直到组的至少一个重叠窗口不再与第一次出现的重叠窗口重叠。2.如权利要求1所述的系统,其中处理器还减少每个独特离子的存储的总和和位置的数量,同时仍然维持每个独特离子的原始存储的总和和位置的形状,以便压缩这个数据。3.如权利要求1所述的系统,其中处理器还通过使用去模糊算法从每个独特离子的存储的总和和位置移除编码所造成的影响,其中所述去模糊算法将存储的总和和位置等同于去模糊的总和和位置和概率分布函数的卷积,所述概率分布函数取决于质量过滤器的不确定性区间,并求解每个独特离子的去模糊的总和和位置。4.如权利要求3所述的系统,其中处理器还使用每个独特离子的去模糊的总和和位置确定每个独特离子的前体离子。5.如权利要求3所述的系统,其中处理器还存储每个独特的去模糊的总和和位置来代替存储的总和和位置,以减少存储器设备中所需的空间。6.如权利要求1所述的系统,其中每个独特离子的存储的总和和位置具有三角形形状。7.如权利要求4所述的系统,其中处理器还将每个独特离子的前体离子确定为与三角形形状的顶点对应的前体离子。8.如权利要求1所述的系统,其中处理器还使用数值方法确定每个独特离子的前体离子,所述数值方法将存储的总和和位置布置为长度为n的列矩阵、将该列矩阵等同于质量过滤器的已知的n
×
m质量过滤器矩阵乘以长度为m的未知前体离子列矩阵、并求解未知的前体离子列矩阵以确定前体离子。9.如权利要求6所述的系统,其中数值方法包括非负矩阵分解(NNMF)。10.如权利要求6所述的系统,其中数值方法包括非负最小二乘法(NNLS)。
11.如权利要求1所述的系统,其中处理器还通过移除多个总和和位置同时仍然维持存储的总和和位置的相同形状来压缩每个独特离子的存储的总和和位置。12.如权利要求1所述的系统,其中根据G≥W/S计算组中重叠窗口G的数量。...

【专利技术属性】
技术研发人员:N
申请(专利权)人:DH科技发展私人贸易有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1