本发明专利技术提供一种交联二肽快速鉴定方法,包括:1)提取待鉴定串联谱图中的有效谱峰,根据各个有效谱峰对应的质量,查找碎片索引得到相应的肽段序列作为候选α肽序列,其中所述碎片索引记录了各个碎片质量及其对应的肽段序列;2)对于每个候选α肽序列,根据所述待鉴定串联谱图的母离子质量计算相应的β肽质量,进而得到相应的候选β肽序列,将候选α肽序列和相应的候选β肽序列组合得到候选交联二肽;3)将步骤2)所得的候选交联二肽与串联谱图进行精细匹配,得出鉴定结果。本发明专利技术不需使用特殊交联剂;搜索速度快,鉴定效率高;搜索灵敏度高。
【技术实现步骤摘要】
本专利技术涉及生物信息学
,具体地说,本专利技术涉及一种交联二肽快速鉴定方法。
技术介绍
化学交联结合质谱技术(简称交联质谱技术)是规模化研究蛋白质间相互作用与蛋白质折叠的有效方法,其核心研究和鉴定的对象是交联二肽,这源于交联二肽的交联位点提供了序列相距远而空间相距近的信息。交联质谱技术中,鉴定交联二肽主要通过串联谱图的数据库搜索技术实现。然而不同于传统单肽序列搜索,交联二肽的数据库搜索的候选空间增长到了原单肽序列数量的平方级的规模,这给大规模数据库搜索带来了挑战。现有的解决方案分三种技术路线,分别是以xQuest为代表的同位素标记方法,以PIR技术(Protein Interaction Reporter)为代表的三级谱鉴定方法和以pLink为代表的开放式搜索方法,这三种路线从不同的角度降低了搜索难度。接下来分别介绍这三种技术。xQuest的同位素标记方法利用轻重相差12道尔顿的交联剂在一级谱上形成的固定质量差能够找到轻重对的交联串联谱图。进一步,通过比对两张串联谱图,区分出普通离子和交联离子。先利用普通离子查询离子标签做一次匹配筛选,再结合交联离子做进一步的筛选,取前5000名。最后对5000名候选肽两两组合,以母离子质量作为限制筛选出误差范围内的候选肽段对,进行细打分。xQuest方案利用同位素标记交联剂和离子标签粗步筛选,可以将每张谱图的单肽候选缩减在5,000名以内,有助于提高交联二肽的鉴定速度。然而,xQuest方案需要使用相差12道尔顿的轻重标记的交联剂,这限制了该方法应用到更广泛的交联鉴定中,例如xQuest方案无法用于二硫键鉴定。PIR技术使用了一种能够在质谱仪中低能量碎裂的交联剂,并且该交联剂释放的特征离子能够被检测出,以此判断出交联信号的存在。进一步,对剩下的两条完整的子序列扫描三级谱图,用单肽搜索的方法鉴定。由于
PIR技术通过设计能够在质谱仪中低能量被碎裂和被检测的交联剂来将问题转化为常规肽段的鉴定问题,因此能够有效降低候选规模。然而,PIR技术不仅对交联剂有要求,对质谱仪也有要求,并且需要集成特殊的信号离子检测软件。此外,这种PIR技术所需的交联剂容易设计得过长、水溶性差。这些都导致PIR技术的适用范围较窄。pLink的开放式搜索方法将两条交联肽段当作彼此的修饰,将修饰质量加在每条候选单肽上,先和谱图进行粗打分,分别筛选出打分最高的前500名的α肽段(质量大于等于谱图母离子质量一半的肽段)和500名的β肽(质量小于谱图母离子质量一半的肽段),而后两两组合两个列表中的肽段序列,进行细打分。pLink开放式的方法相比前两种方法的优势在于不需使用特殊的交联剂,容易推广到内源交联的形式上,实验成本低、应用面广。然而,这种方法中序列库中接近一半的肽段都要与每张谱图进行粗打分,存在计算量大的问题,进而造成鉴定效率低。
技术实现思路
因此,本专利技术的任务是提供一种不需使用特殊交联剂的鉴定效率高的交联二肽快速鉴定解决方案。根据本专利技术的一个方面,提供了一种交联二肽快速鉴定方法,包括下列步骤:1)提取待鉴定串联谱图中的有效谱峰,根据各个有效谱峰对应的质量,查找碎片索引得到相应的肽段序列作为候选α肽序列,所述碎片索引记录了各个碎片质量及其对应的肽段序列;2)对于每个候选α肽序列,根据所述待鉴定串联谱图的母离子质量计算相应的β肽质量,进而得到相应的候选β肽序列,将候选α肽序列和相应的候选β肽序列组合得到候选交联二肽;3)将步骤2)所得的候选交联二肽与串联谱图进行精细匹配,得出鉴定结果。其中,所述步骤1)中,所述碎片索引根据酶切序列列表建立,酶切序列列表是计算机模拟酶切蛋白质序列库中的蛋白质序列后,得到的肽段序列列表。其中,所述步骤1)中,所述碎片索引包括与前缀碎片对应的b离子索引和与后缀碎片对应的y离子索引,所述碎片索引的建立方法如下:1a)对肽段序列列表的每条肽段序列,分析该条序列碎裂时所有可能产生的前缀碎片,得出对应的前缀碎片质量和肽段序列,进而获得b离子索引;1b)对肽段序列列表的每条肽段序列,分析该条序列碎裂时所有可能产生的后缀碎片,得出对应的后缀碎片质量和肽段序列,进而获得y离子索引。其中,所述步骤1)包括下列子步骤:11)提取待鉴定串联谱图中的有效谱峰;12)对于每个有效谱峰,计算其所对应的碎片质量,然后根据b离子索引和y离子索引,得到该有效谱峰所对应的可能的肽段序列作为候选α肽序列;13)从待鉴定串联谱图的各个有效谱峰的候选α肽序列中,选出该待鉴定串联谱图的候选α肽序列。其中,所述步骤12)还包括:根据有效谱峰的特征,判断该有效谱峰是普通b离子,交联b离子,普通y离子,还是交联y离子所形成的谱峰,然后再选择对应的b离子索引或者y离子索引进行查找,得到该有效谱峰所对应的可能的肽段序列作为候选α肽序列。其中,所述步骤11)中,通过滤除待鉴定串联谱图中的噪音峰、母离子峰、失水峰、失氨峰和同位素峰得到所述有效谱峰。其中,所述步骤13)还包括:在待鉴定串联谱图的各个有效谱峰的候选α肽序列中,选择在碎片索引查找中匹配次数最多的那些候选α肽序列作为该待鉴定串联谱图的候选α肽序列。其中,所述步骤13)还包括:对各个有效谱峰的候选α肽段与待鉴定串联谱图中的匹配程度进行粗打分,根据粗打分结果选出待鉴定串联谱图的候选α肽序列。其中,所述步骤2)包括下列子步骤:21)对于每个候选α肽序列,用所述待鉴定串联谱图的母离子质量减去该候选α肽序列的质量,得出相应的β肽质量;22)基于步骤21)所得出的β肽质量查找肽段索引,得出相应的候选β肽序列,进而将候选α肽序列和相应的候选β肽序列组合得到候选交联二肽。其中,所述步骤21)中,根据所述待鉴定串联谱图的一级谱图得到其
母离子质量。与现有技术相比,本专利技术具有下列技术效果:1、本专利技术不需使用特殊交联剂。2、本专利技术的搜索速度快,鉴定效率高。3、本专利技术的搜索灵敏度高。4、本专利技术在维持高灵敏度的情况下,相比传统的pLink开放式搜索至少加速10倍。附图说明以下,结合附图来详细说明本专利技术的实施例,其中:图1示出了本专利技术一个实施例中碎片索引的创建的流程示意图;图2示出了本专利技术一个实施例中肽段索引的创建的流程示意图;图3示出了本专利技术一个实施例中基于碎片索引和肽段索引的交联二肽快速鉴定的流程示意图。具体实施方式为帮助读者更好地理解本专利技术,首先给出本专利技术所涉及的一些专业词汇的解释。肽段:由氨基酸排列成的字符串,长度范围通常在4到100个氨基酸之间。肽段的质量是指将构成肽段的氨基酸的质量求和后的质量。肽段一般由蛋白质水解得到,蛋白质可以理解为很长的肽段。在本领域中,肽段常常也被称为肽段序列。氨基酸:常见的有二十种,一般用二十个大写英文字母表示,通常每个氨基酸有唯一的质量,但也有两个氨基酸质量相同。交联二肽:两条肽段通过交联剂链接在一起的肽段对。α肽:本专利技术中将一条交联二肽中匹配相对好的那条肽段称为α肽。β肽:本专利技术中将一条交联二肽中匹配相对差的那条肽段称为β肽。以上匹配相对好或者匹配相对差指的是同一条交联二肽中的α肽和β肽的相对好或者差。每条交联二肽中必然有一条α肽和一条β肽。碎片:肽段的一部分片段。前缀碎片:肽段中间断裂后,所形成的左侧(指分子式结构的左侧)本文档来自技高网...
【技术保护点】
一种交联二肽快速鉴定方法,其特征在于,包括下列步骤:1)提取待鉴定串联谱图中的有效谱峰,根据各个有效谱峰对应的质量,查找碎片索引得到相应的肽段序列作为候选α肽序列,其中所述碎片索引记录了各个碎片质量及其对应的肽段序列;2)对于每个候选α肽序列,根据所述待鉴定串联谱图的母离子质量计算相应的β肽质量,进而得到相应的候选β肽序列,将候选α肽序列和相应的候选β肽序列组合得到候选交联二肽;3)将步骤2)所得的候选交联二肽与串联谱图进行精细匹配,得出鉴定结果。
【技术特征摘要】
1.一种交联二肽快速鉴定方法,其特征在于,包括下列步骤:1)提取待鉴定串联谱图中的有效谱峰,根据各个有效谱峰对应的质量,查找碎片索引得到相应的肽段序列作为候选α肽序列,其中所述碎片索引记录了各个碎片质量及其对应的肽段序列;2)对于每个候选α肽序列,根据所述待鉴定串联谱图的母离子质量计算相应的β肽质量,进而得到相应的候选β肽序列,将候选α肽序列和相应的候选β肽序列组合得到候选交联二肽;3)将步骤2)所得的候选交联二肽与串联谱图进行精细匹配,得出鉴定结果。2.根据权利要求1所述的交联二肽快速鉴定方法,其特征在于,所述步骤1)中,所述碎片索引根据酶切序列列表建立,酶切序列列表是计算机模拟酶切蛋白质序列库中的蛋白质序列后,得到的肽段序列列表。3.根据权利要求2所述的交联二肽快速鉴定方法,其特征在于,所述步骤1)中,所述碎片索引包括与前缀碎片对应的b离子索引和与后缀碎片对应的y离子索引,所述碎片索引的建立方法如下:1a)对肽段序列列表的每条肽段序列,分析该条序列碎裂时所有可能产生的前缀碎片,得出对应的前缀碎片质量和肽段序列,进而获得b离子索引;1b)对肽段序列列表的每条肽段序列,分析该条序列碎裂时所有可能产生的后缀碎片,得出对应的后缀碎片质量和肽段序列,进而获得y离子索引。4.根据权利要求3所述的交联二肽快速鉴定方法,其特征在于,所述步骤1)包括下列子步骤:11)提取待鉴定串联谱图中的有效谱峰;12)对于每个有效谱峰,计算其所对应的碎片质量,然后根据b离子索引和y离子索引,得到该有效谱峰所对应的可能的肽段序列作为候选α肽序列;13)从待鉴定串联谱图的各个有效谱峰的候选α肽序列中,选出该待...
【专利技术属性】
技术研发人员:孟佳明,樊盛博,迟浩,卢珊,孙瑞祥,董梦秋,贺思敏,
申请(专利权)人:中国科学院计算技术研究所,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。