一种串联质谱谱图鉴定方法技术

技术编号：10715479 阅读：154 留言：0更新日期：2014-12-03 18:25

本发明专利技术提供一种串联质谱谱图鉴定方法，其特征在于，包括下列步骤：1)对于待鉴定谱图数据集中的每张谱图，分别在全局序列库中进行限制性搜索，获得各谱图的匹配肽段；2)根据步骤1)所得各谱图的匹配肽段，构建局部序列库，对于待鉴定谱图数据集的每张谱图，分别在所述局部序列库中进行开放式搜索，获得与一部分谱图相匹配的带修饰的肽段，并获得所带修饰的质量和误差区间；3)对于待鉴定谱图数据集中的每张谱图，根据步骤2)所匹配的修饰的质量和误差区间以及当前待鉴定谱图的质量，设定限制性搜索区间，并在全局序列库中进行搜索，获得最终的匹配结果。本发明专利技术能够提高串联质谱谱图鉴定的鉴定率和准确度，并且具有较高的搜索速度。

全部详细技术资料下载

【技术实现步骤摘要】
一种串联质谱谱图鉴定方法
本专利技术涉及生物信息学
，具体地说，本专利技术涉及一种串联质谱谱图鉴定方法。
技术介绍
串联质谱鉴定技术是蛋白质组学研究中的关键技术，也是大规模蛋白质序列和修饰鉴定的主要方法。序列库搜索是一种常规的串联质谱谱图鉴定方法。在进行通常的序列库搜索时，对每张谱图均划定一个以该谱图质量m为中心的质量区间，然后把该谱图与序列库中处于相应质量区间内的所有肽段(肽段也可称为肽段序列)进行匹配，得到肽-谱匹配打分，打分最好的肽段即作为这张谱图的鉴定结果。由于序列库包含待测序物种的所有已知肽段，如人类库的肽段数目的数量级大致为109，因此在常规的序列库搜索中，所划定的质量区间很狭窄，一般不超过1Da，例如[m-0.00002m,m+0.00002m]，这样落在这个质量区间范围内的肽段数目相对较小，可以较为快速的完成串联质谱谱图的鉴定。然而，众所周知，蛋白质翻译后修饰会造成由蛋白质得到的肽段额外多加一个基团或者丢失一个基团。肽段加上修饰之后，会引起其质量的改变。因此，由带修饰的肽段生成的谱图的质量同肽段的原始质量之间存在一个质量差。这个质量差一般很大，甚至可以达到上百Da。因此，用带修饰的谱图(即由带修饰的肽段生成的谱图)去查询数据库中的肽段(数据库中的肽段都是不带修饰的原始形式)，如果只开小窗口，如1Da，就无法把谱图鉴定出来。所以，上述串联质谱鉴定方法无法鉴定带有未知修饰的肽段，对于同批次蛋白质酶切样品所得的谱图数据集，其鉴定率(又称为解析率)较低，通常不到30％。另一方面，现有技术中还存在一种开放式序列库搜索，为了提高鉴定率，它考虑到了...
一种串联质谱谱图鉴定方法

【技术保护点】
一种串联质谱谱图鉴定方法，其特征在于，包括下列步骤：1)对于待鉴定谱图数据集中的每张谱图，分别在全局序列库中进行限制性搜索，获得各谱图的匹配肽段；2)根据步骤1)所得各谱图的匹配肽段，构建局部序列库，对于待鉴定谱图数据集的每张谱图，分别在所述局部序列库中进行开放式搜索，获得与一部分谱图相匹配的带修饰的肽段，并获得所带修饰的质量和误差区间；3)对于待鉴定谱图数据集中的每张谱图，根据步骤2)所匹配的修饰的质量和误差区间以及当前待鉴定谱图的质量，设定限制性搜索区间，并在全局序列库中进行搜索，获得最终的匹配结果。

【技术特征摘要】
1.一种串联质谱谱图鉴定方法，其特征在于，包括下列步骤：1)对于待鉴定谱图数据集中的每张谱图，分别在全局序列库中进行限制性搜索，获得各谱图的匹配肽段；所述限制性搜索中，以待鉴定谱图的质量为中心，结合肽段的质量误差，确定肽段质量区间；2)根据步骤1)所得各谱图的匹配肽段，构建局部序列库，对于待鉴定谱图数据集的每张谱图，分别在所述局部序列库中进行开放式搜索，获得与一部分谱图相匹配的带修饰的肽段，并获得所带修饰的质量和误差区间；所述开放式搜索中，以待鉴定谱图的质量为中心，结合修饰所引起的肽段质量变化，确定肽段质量区间；3)对于待鉴定谱图数据集中的每张谱图，根据步骤2)所匹配的修饰的质量和误差区间以及当前待鉴定谱图的质量，设定限制性搜索区间，并在全局序列库中进行搜索，获得最终的匹配结果；其中，所述步骤2)包括下列子步骤：21)根据步骤1)所得各谱图的匹配肽段，构建局部序列库，对于待鉴定谱图数据集的每张谱图，分别在所述局部序列库中进行开放式搜索，鉴定出待鉴定谱图数据集中部分带有修饰的肽段；22)对于步骤21)所获得的带有修饰的肽段，在已知的修饰数据库搜索与其匹配的修饰，抛弃无法获得匹配修饰的肽段；23)对经过步骤22)处理的带有修饰的肽段，计算其所带修饰的质量和误差区间。2.根据权利要...

【专利技术属性】
技术研发人员：何昆，曾文锋，付岩，迟浩，贺思敏，
申请(专利权)人：中国科学院计算技术研究所，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人