质谱数据的反卷积制造技术

技术编号:26532891 阅读:55 留言:0更新日期:2020-12-01 14:17
一种用于对所测量的质谱数据进行反卷积的方法,所述方法包含:接收表示各自具有相应同位素模式的至少两个分子部分的所测量的质谱数据,其中所述同位素模式中的至少两个重叠;迭代填充一组质量通道以产生所述质谱数据的近似版本,所述迭代填充包含多个迭代,每一迭代包含根据选用于所述迭代的两个或更多个分子部分中的相应一个的所述同位素模式,用强度数据块填充所述质量通道中的一个或多个;当满足指示所述质谱数据的所述近似版本符合所述所测量的质谱数据的适合性标准时,终止所述迭代填充;并根据所述分子部分的所述相应同位素模式,基于总填充量确定产生所述测量的质谱数据的每个分子部分的量。

【技术实现步骤摘要】
质谱数据的反卷积
本专利技术涉及用于分析和反卷积质谱数据的获取后方法。确切地说,质谱数据包含重叠的同位素模式。本专利技术适用于如蛋白质组学、蛋白质分析、肽分析、代谢组学、核酸分析、化合物识别和疾病检测、药物和毒理学标记物的领域中的质谱数据的定量分析。本专利技术尤其(但非排他地)适用于已使用质量标签(例如串联质量标签(TMT))获取的质谱数据的分析。
技术介绍
最近,质谱领域中使用可裂解地附接到所关注的相关分子的质量标签(也称为质量标记)已得以发展。标签用于识别和定量生物大分子,如蛋白质、肽和核酸。使用串联质量标签(TMT)的方法描述于WO01/68664和Thompson等人《分析化学(Anal.Chem.)》2003,75,1895-1904。TMT含有四个区或部分,即质量报告子区或部分(M)、可裂解连接子区或部分(F)、质量标准化区或部分(N)和蛋白质反应性基团(R)。所有标签的化学结构均相同,但各自含有在不同位置处经取代的同位素,使得质量报告子和质量标准化区在每一标签中具有不同分子质量。标签的组合M-F-N-R区具有相同的总分子量和结构,使得在色谱或电泳分离期间和在单一MS模式下,无法区分标记有不同标签的分子。在MS/MS模式下片段化后,由肽骨架的片段化获得序列信息且同时由标签的片段化获得定量数据,得到质量报告离子(https://en.wikipedia.org/w/index.php?title=Tandem_mass_tag&oldid=882091680)。实际的质量标签试剂由于制造过程而具有杂质,例如由于制造中标记不完全或分离不完全所致。因此,质量标签不仅具有单一质量,而且通常具有可能干扰(即,重叠)同一实验中所用的其它质量标签的“卫星”,因为质量可能相同,例如特定质量标签的同位素变异体(同位素体)的质量可能与不同质量标签的(主要)质量相同。一系列商业质量标签的实例可能具有以下组成(表1):每标称质量具有超过一个标签离子的一系列商业标签系统的实例可能具有以下组成(表2):大多数标记在主峰外部仅具有较小组分,但在130N报告离子的情况下,存在高达四个卫星。取决于制备方法,可能仅在某些子集之间存在关系(即,“N”标记具有“N型”卫星且“C”标记具有“C型”卫星)。通常已知可以解析这种质谱特征的重叠的方式,例如如比曼(Biemann),《质谱有机化学应用(MASSSPECTROMETRYOrganicChemicalApplications)》,McGRAW-HILL1962;Goraczko,《计算化学杂志(JournalofComputationalChemistry)》,第22卷,第3号,354-365(2001);US7193705(施吕特尔(Schlüter));和US7105806(帕潘(Pappin))所述。举例来说,US7105806公开了用于重叠的串联质量标签的同位素反卷积和减除相邻质量标签的卫星的影响的算法。以上参考文献中所述的共同算法为由个别质量标签的已知同位素分布和所测量的光谱Mp构建线性方程组和对质量标签的量(或浓度)Cq求解的所有基本方式,即随后使用已知线性代数方法(例如高斯算法(Gaussianalgorithm)、SV或LU分解或各种近似法,包括在US7105806中经略微调整的托马斯算法(Thomas-Algorithm))求解此方程组。可以通过略去任一侧的第一个卫星峰以外的所有分量并使用托马斯算法(https://en.wikipedia.org/w/index.php?title=Tridiagonal_matrix_algorithm&oldid=880475866)找到快速近似法。实际上,诸多因素让求解变得复杂。举例来说,所测量的光谱可能具有来自仪器或化学噪声的额外强度分量,其对数值解的精确度具有不利影响(尤其是在“朴素”高斯或托马斯方法的情况下);所述分析可能需要应用于LC/MS实验中的数千个光谱;且对于具有大量不同标签(例如,10个或更多个标签)的质量标签试剂盒,卫星峰的量可能相当高。
技术实现思路
根据本专利技术的一个方面,提供一种用于对所测量的质谱数据进行反卷积的方法,所述质谱数据包含至少两个分子部分的重叠的同位素模式。根据本专利技术的第一方面,提供一种用于对所测量的质谱数据进行反卷积的方法,所述方法包含:接收表示各自具有相应同位素模式的至少两个分子部分的所测量的质谱数据,其中所述同位素模式中的至少两个重叠;迭代填充一组质量通道以产生所述质谱数据的近似版本,所述迭代填充包含多个迭代,每一迭代包含根据选用于所述迭代的两个或更多个分子部分中的相应一个的所述同位素模式,用强度数据块填充所述质量通道中的一个或多个;当满足指示所述质谱数据的近似版本符合所述所测量的质谱数据的适合性标准时,终止所述迭代填充;并根据所述分子部分的所述相应同位素模式,基于总填充量确定产生所述所测量的质谱数据的每个分子部分的量。在一些实施例中,对于每一迭代(a),所述强度数据块包含各自对应于相应质量通道的强度组,其中根据所述强度数据的所述同位素模式按比例调整所述强度组;或(b)所述强度数据块是相应质量通道的强度,其中根据基于所述强度数据的所述同位素模式的概率分布选择所述相应质量通道。可以基于在所述迭代处的所测量的质谱数据与所述质谱数据的近似版本之间的偏差的量度来选择选用于每一迭代的所述分子部分。质谱数据通常是质谱。在另一方面,所述方法可以包含接收所测量的质谱数据,即,由质谱实验得到质谱数据。质谱数据可以从实验直接得到,或可以从由早先质谱实验产生的存储质谱数据的库得到。所述方法可以包含识别质谱数据内的多个质量通道1……n。质量通道可以对应于(即,表示)分子部分的质量(即,标称或单同位素质量)和/或质量通道可以对应于所测量的质谱数据的峰。所述方法可以包含通过用质谱数据块(确切地说,同位素数据块)迭代填充质量通道来形成模拟质谱数据(产生模拟质谱),即执行所测量的质谱数据的模拟,其中每一块包含分子部分中的一个的同位素模式。因此,同位素数据块通常包含分子部分中的一个的单同位素质量和每一同位素卫星质量(同位素质量)的强度。每一块的大小或量值(即,强度)是指表示分子部分的质量通道中块的大小(即,强度)。块大小优选地大于所测量的质谱数据中确定的噪声。取决于所述方法的期望精确度选择每一块的大小或量值(即,总强度),愈小(强度较低)的块通常提供更准确的反卷积但也使过程更长。块大小可以是固定的或可变化的,如下文所述。在优选实施例中,在每一迭代处,用于填充的同位素数据块包含具有对应于质量通道的质量的分子部分的同位素模式,所述质量通道在模拟质谱数据与所测量的质谱数据之间具有最大(强度)差异。然而,在其它实施例中,可以根据另一标准(例如,按其质量通道升序(或降序))用分子部分的同位素数据块填充模拟光谱。如果质谱同位素数据块的填充导致模拟质谱数据的质量通道的强度高于所测量的质谱数据的质量通道的强度超过限定容差,那本文档来自技高网
...

【技术保护点】
1.一种用于对所测量的质谱数据进行反卷积的方法,所述方法包含:/n接收表示各自具有相应同位素模式的至少两个分子部分的所测量的质谱数据,其中所述同位素模式中的至少两个重叠;/n迭代填充一组质量通道以产生所述质谱数据的近似版本,所述迭代填充包含多个迭代,每一迭代包含根据选用于所述迭代的两个或更多个分子部分中的相应一个的所述同位素模式,用强度数据块填充所述质量通道中的一个或多个;/n当满足指示所述质谱数据的所述近似版本符合所述所测量的质谱数据的适合性标准时,终止所述迭代填充;并且/n根据所述分子部分的所述相应同位素模式,基于总填充量确定产生所述所测量的质谱数据的每个分子部分的量。/n

【技术特征摘要】
20190802 EP 19189886.5;20190531 GB 1907792.41.一种用于对所测量的质谱数据进行反卷积的方法,所述方法包含:
接收表示各自具有相应同位素模式的至少两个分子部分的所测量的质谱数据,其中所述同位素模式中的至少两个重叠;
迭代填充一组质量通道以产生所述质谱数据的近似版本,所述迭代填充包含多个迭代,每一迭代包含根据选用于所述迭代的两个或更多个分子部分中的相应一个的所述同位素模式,用强度数据块填充所述质量通道中的一个或多个;
当满足指示所述质谱数据的所述近似版本符合所述所测量的质谱数据的适合性标准时,终止所述迭代填充;并且
根据所述分子部分的所述相应同位素模式,基于总填充量确定产生所述所测量的质谱数据的每个分子部分的量。


2.根据权利要求1所述的方法,其中对于每一迭代,所述强度数据块包含各自对应于相应质量通道的强度组,其中根据所述强度数据的所述同位素模式按比例调整所述强度组。


3.根据权利要求1所述的方法,其中对于每一迭代,所述强度数据块是相应质量通道的强度,其中根据基于所述强度数据的所述同位素模式的概率分布选择所述相应质量通道。


4.根据任一前述权利要求所述的方法,其中基于在所述迭代处的所述所测量的质谱数据与所述质谱数据的所述近似版本之间的偏差的量度来选择选用于每一迭代的所述分子部分。


5.根据任一前述权利要求所述的方法,其中在每一迭代处,选择具有对应于所述质量通道的质量的所述分子部分,所述质量通道在所述质谱数据的所述近似版本与所述所测量的质谱数据之间具有最大强度差异。


6.根据任一前述权利要求所述的方法,其进一步包含如果填充导致所述质谱数据的所述近似版本的质量通道的强度高于所述所测量的质谱数据的质量...

【专利技术属性】
技术研发人员:R·马雷克F·伯格K·弗里策迈耶
申请(专利权)人:塞莫费雪科学不来梅有限公司
类型:发明
国别省市:德国;DE

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1