一种基于串联质谱鉴定蛋白质乙酰化修饰位点的方法技术

技术编号:9794694 阅读:812 留言:0更新日期:2014-03-21 19:57
本发明专利技术公开了一种基于串联质谱鉴定蛋白质乙酰化修饰位点的方法,本发明专利技术首先进行乙酰化修饰肽段的数据库检索,即利用开源软件将质谱采集的原始数据转化为可视化格式的数据,并利用MASCOT或pFind检索程序进行数据库检索,筛选假阳性概率FDR值小于1%的乙酰化修饰肽段;其次,对鉴定获得的蛋白质乙酰化修饰位点重新定位及评估;最后,提取蛋白质乙酰化修饰位点对应的高分辨率的质谱图。本发明专利技术具有操作简单,修饰位点定位信息可信度高以及提取的质谱图分辨率高等优点,在蛋白质组学研究领域具有良好的应用前景。

【技术实现步骤摘要】

本专利技术涉及生物信息领域,具体涉及。
技术介绍
蛋白质乙酰化是生物界最普遍,也是最重要的一种蛋白质翻译后修饰。在细胞中,乙酰化修饰广泛存在并具有较高的保守性。可逆的蛋白质乙酰化修饰介导的信号转导通路在细胞代谢过程中具有重要的作用,这种可逆、保守且高度调控的蛋白质翻译后修饰,参与调控代谢,转录活性,蛋白质稳定性,信号通路及病原微生物的感染等众多重要的生理功能,几乎参与了所有的生命活动。因此,蛋白质乙酰化的分析以及乙酰化位点的鉴定已成为目前众多生物化学家以及蛋白质组学家所关心的内容。运用蛋白质组学的理念和分析方法研究蛋白质乙酰化修饰,可以从整体上观察细胞或组织中乙酰化修饰的状态以及蛋白质中乙酰化修饰位点。随着生物质谱的灵敏度、精确度,以及高通量的不断发展,其在蛋白质组学研究中扮演着越来越重要的角色,它在蛋白质鉴定及翻译后修饰位点鉴定等方面已得到了较广泛的应用。在液相-质谱仪中,乙酰化肽段经碰撞诱导解离(Collision Induced dissociation,CID)产生碎片离子,相比于不含修饰的肽段,带有乙酰化修饰的肽段质量会发生42Da的质量偏移,通过检测所产生的全部碎片离子,并根据其质量数通过数据库检索来推断肽段序列和乙酰化位点。运用质谱鉴定蛋白乙酰化修饰位点具有高选择性,高灵敏度的特点。但是,在进行数据库检索时,由于将乙酰化修饰选择为可变修饰,数据库匹配过程时理论肽段中乙酰化肽段的数目要远高于非乙酰化肽段,导致乙酰化肽段的错误鉴定数目要远高于非乙酰化肽段,即乙酰化肽段鉴定的假阳性概率较高,蛋白质乙酰化位点鉴定的准确性和通量都受到了很大的限制。因此,数据库检索得到的蛋白质乙酰化修饰位点的数据需要再进行评估。目前,针对蛋白磷酸化修饰位点评估的软件较多,包括MaxQuant中PTMScore,Ascore以及PhosphoRS等,而针对蛋白乙酰化位点修饰位点评估的软件只有MaxQuant中的PTMScore,但其局限性较高,仅试用于Thermo公司质谱仪器产生的数据。本专利技术提出一种基于串联质谱鉴定蛋白乙酰化修饰位点的方法,实现了蛋白质乙酰化位点的重新定位及可信度评估,并且本方法可自动导出重新定位的蛋白质乙酰化位点对应的高分辨质谱图。由于不同类型质谱仪器产生的原始数据,都可以通过现有的开源免费软件ProteoWizard,将质谱原始数据转化为mgf格 式数据,而本方法主要基于mgf格式数据(mascot genericfile),并根据文献 Jesper V.0lsen, BlagoyBlagoev, Florian Gnad, Boris Macek,ChanchalKumar,Peter Mortensen, and Matthias Mann, “Global, In Vivo, andSite-Specific Phosphorylation Dynamics in Signaling Networks”, 2006, 127 (3),635-48.中的打分算法公式:p_ value= (k!/ (n! (n_k) !) * pk* (1-p)(n_k) = (k!/(n! (n_k) !) * 0.04k * 0.96(n_k)Score = _10*Log10(p)对乙酰化修饰位点进行重新定位、可信度评估以及谱图自动导出,因此,本专利技术方法兼容所有质谱的数据分析。
技术实现思路
本专利技术的目的是在于提供了,方法易行,操作简便,对蛋白质乙酰化修饰位点重新定位以及可信度评估,从而提高了乙酰化修饰鉴定的准确性和可信度;并且能够自动导出乙酰化修饰可信位点的质谱图。为了达到上述目的,本专利技术采用如下技术方案。—种基于串联质谱鉴定蛋白质乙酰化修饰位点的方法,步骤如下: I)乙酰化修饰肽段的数据库检索: 步骤1、利用开源免费软件ProteoWizard将质谱采集的原始数据转化为可视化的mgf格式的数据(mascot generic file); 步骤2、利用本地MASCOT数据库以及pFind数据库进行检索,筛选假阳性概率FDR(False Discovery Rate)值小于1%的乙酰化修饰肽段。2)蛋白质乙酰化修饰位点重新定位及评估: 步骤1、有效质谱峰选择:使用Perl语言程序编写的程序,处理质谱标准数据格式文件(mascot generic file, mgf格式数据),选择质谱有效峰,过滤噪音基线;在二级质谱数据(MS2)中,采取每100个质荷比(m/z)区间,选取四个最高的二级质谱峰策略,过滤数据(过滤后数据含有质荷比与峰强度)。`步骤2、蛋白质乙酰化修饰位点重新定位及可信度评估:使用peri语言程序编写的蛋白质乙酰化修饰位点重新定位与可信度评估程序,处理MASCOT以及pFind数据库检索结果文件,通过解析MASCOT以及pFind数据库检索结果文件,获取所有乙酰化肽段信息,包括乙酰化肽段谱图名称,乙酰化肽段序列及分子量,乙酰化修饰位点数,乙酰化肽段价态等。根据文献中报道的评估乙酰化修饰位点方法(Jesper V.0lsen, BlagoyBlagoev,Florian Gnadj Boris Macekj ChanchalKumarj Peter Mortensen, and Matthias Mann,“Global, In Vivo, and Site-Specific Phosphorylation Dynamics in SignalingNetworks, 2006,127 (3),635-48.),结合上一步过滤的数据以及乙酰化肽段信息,重新计算匹配的b或y系列离子,并采用以下公式对修饰位点进行新的打分计算:p_ value= (k!/ (n! (n_k) !) * pk* (1-p)(n_k) = (k!/(n! (n_k) !) * 0.04k * 0.96(n_k)Score = _10*Log10(p) 其中n为乙酰化肽段所有匹配的b或y系列离子数,k为所有匹配的有乙酰化修饰的b或y系列离子数'p_value为重新定位后的乙酰化修饰位点可信度值,Score即为重新定位后乙酰化修饰位点对应的得分;对数据库鉴定到的蛋白质乙酰化修饰位点(假阳性概率FDR值小于1%的乙酰化修饰肽段)进行重新定位和可信度评估。3)蛋白质乙酰化修饰位点对应谱图的提取: 步骤1、采用上述步骤2)中相同方法选择有效质谱峰,使用peri语言程序编写程序,处理质谱标准数据格式文件(mascot generic file, mgf格式数据),选择质谱有效峰,过滤噪音基线;在二级质谱数据(MS2)中,采取每100个质荷比(m/z)区间,选取四个最高的二级质谱峰策略,过滤数据(过滤后数据含有质荷比与峰强度)。步骤2、蛋白质乙酰化修饰位点对应谱图的提取:使用peri语言程序编写的蛋白质乙酰化修饰位点谱图提取程序,利用乙酰化修饰位点定位方法,将重新匹配的b或y系列离子以及重新定位的乙酰化修饰位点注释谱图,并自动提取重新定位的蛋白质乙酰化修饰位点对应的谱图,最终获得到高分辨率的质谱图。与现有技术相比,本专利技术的优点在于: I)本专利技术中所需质谱数据为mgf格式,所有质谱产生的原始数据,均可本文档来自技高网
...

【技术保护点】
一种基于串联质谱鉴定蛋白质乙酰化修饰位点的方法,步骤如下:1)乙酰化修饰肽段的数据库检索:步骤1、利用开源软件ProteoWizard将质谱采集的原始数据转化为可视化的mgf格式的数据;步骤2、利用MASCOT以及pFind检索程序进行数据库检索,筛选假阳性概率FDR值小于1%的乙酰化修饰肽段;2)蛋白质乙酰化修饰位点重新定位及评估:步骤1、质谱峰选择:使用perl语言程序编写的程序,处理质谱标准数据格式文件,选择质谱有效峰,过滤噪音基线;在二级质谱数据中,采取每100个质荷比区间,选取四个最高的二级质谱峰策略,过滤数据;步骤2、蛋白质乙酰化修饰位点重新定位及评估:使用perl语言程序编写的蛋白质乙酰化修饰位点重新定位与评估程序,处理MASCOT以及pFind数据库检索结果文件,通过解析MASCOT以及pFind数据库检索结果文件,获取所有乙酰化肽段信息,包括乙酰化肽段谱图名称,乙酰化肽段序列及分子量,乙酰化修饰位点数,乙酰化肽段价态,根据文献中报道的评估乙酰化修饰位点方法,结合上一步过滤的数据以及乙酰化肽段信息,重新计算匹配的b或y系列离子,采用以下公式对修饰位点进行新的打分计算:p_value=?(k!/(n!(n?k)!)?*?pk*?(1?p)(n?k)?=?(k!/(n!(n?k)!)?*?0.04k?*?0.96(n?k)Score?=??10*Log10(p)其中n为乙酰化肽段所有匹配的b或y系列离子数,k为所有匹配的有乙酰化修饰的b或y系列离子数;p_value为重新定位后的乙酰化修饰位点可信度值,Score为重新定位后乙酰化修饰位点对应的得分;对数据库鉴定到的蛋白质乙酰化修饰位点进行重新定位和评估;3)蛋白质乙酰化修饰位点对应谱图的提取:步骤1、采用上述步骤2)中相同方法选择有效质谱峰,使用perl语言程序编写程序,处理质谱标准数据格式文件,选择质谱有效峰,过滤噪音基线;在二级质谱数据中,采取每100个质荷比区间,选取四个最高的二级质谱峰策略,过滤数据;步骤2、蛋白质乙酰化修饰位点对应谱图的提取:使用perl语言程序编写的蛋白质乙酰化修饰位点谱图提取程序,利用乙酰化修饰位点定位方法,将重新匹配的b或y系列离子以及重新定位的乙酰化修饰位点注释谱图,并自动提取重新定位的蛋白质乙酰化修饰位点对应的谱图,最终获得到高分辨率的质谱图。...

【技术特征摘要】
1.一种基于串联质谱鉴定蛋白质乙酰化修饰位点的方法,步骤如下: . 1)乙酰化修饰肽段的数据库检索: 步骤1、利用开源软件ProteoWizard将质谱采集的原始数据转化为可视化的mgf格式的数据; 步骤2、利用MASCOT以及pFind检索程序进行数据库检索,筛选假阳性概率FDR值小于1%的乙酰化修饰肽段; .2)蛋白质乙酰化修饰位点重新定位及评估: 步骤1、质谱峰选择:使用peri语言程序编写的程序,处理质谱标准数据格式文件,选择质谱有效峰,过滤噪音基线;在二级质谱数据中,采取每100个质荷比区间,选取四个最高的二级质谱峰策略,过滤数据; 步骤2、蛋白质乙酰化修饰位点重新定位及评估:使用peri语言程序编写的蛋白质乙酰化修饰位点重新定位与评估程序,处理MASCOT以及pFind数据库检索结果文件,通过解析MASCOT以及pFind数据库检索结果文件,获取所有乙酰化肽段信息,包括乙酰化肽段谱图名称,乙酰化肽段序列及分子量,乙酰化修饰位点数,乙酰化肽段价态,根据文献中报道的评估乙酰化修饰位点方法,结合上一步过滤的数据以及乙酰化肽段信息,重新计算匹配的b或y系列离子,采用以下公式对修饰位点进行新...

【专利技术属性】
技术研发人员:杨明坤张珈葛峰熊倩莫然王炎
申请(专利权)人:中国科学院水生生物研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1