一种蛋白质三维结构中金属离子结合位点单配体残基模板库的建立方法及基于此的预测方法,该方法开发了一种以天然存在的单配体残基金属结合态为模板,以关键几何量D、G、C值为模板与潜在配体残基是否匹配的检索筛选条件之一,以先由潜在第一、第二配体残基确定金属的可能位置,再逐步加入其他配体残基的搜索筛选策略,以计算预测位点与天然和标准位点构象偏差Deviation值为计分法的最后总排序筛选方式的新方法。并且,本发明专利技术以锌位点预测为例,对该方法的预测性能进行了检测,得到了优于现有其他方法的良好预测效果。
【技术实现步骤摘要】
本专利技术设及生物信息学、结构生物学、计算生物学领域,尤其设及基于蛋白质Ξ维 空间结构的金属位点研究领域,更具体地设及一种蛋白质Ξ维结构中金属离子结合位点单 配体残基模板库的建立方法及基于此的预测方法。
技术介绍
包含金属离子的金属蛋白约占蛋白质总量的Ξ分之一,广泛存于自然界中发挥着 丰富多彩的生物学功能。金属离子结合位点往往是酶的催化中屯、或起到结构稳定或调节等 重要作用。确定天然未知蛋白包含哪种金属离子、结合位点位置W及W何种方式结合有助 于预测和研究该金属蛋白的功能。然而,现代分子生物学研究往往采用异源表达方式得到 目标蛋白,在表达和分离纯化过程中金属离子也可能丢失或被替换,最终制备的未知蛋白 未必是其天然活性态的金属结合形式。另一方面,随着结构基因组计划广泛开展,大量未知 功能蛋白结构被测定,如何预测运些未知蛋白功能成为一个重要领域。其中,如何预测未知 蛋白中的金属离子是一个重要方向,已有多种方法报道。现有报道的方法对已知蛋白的预 测效果较好,但对未知蛋白特别是蛋白折叠类型或金属离子配体残基组合类型等未曾报道 的未知蛋白的预测效果较差。然而只有对未知蛋白预测是真正有意义的,如何实现对未知 蛋白中金属结合位点更高的预测性能(高敏感性及高特异性),且能推广应用于多种金属离 子类型的结合位点是科研工作者亟需解决的问题。 本专利技术人在2011年发表了基于模板残基对匹配预测锋结合位点的TEMSP方法 ("Structure-b曰sed de novo prediction of zinc-binding sites inproteins ofunknown function",《Bioinfo;rmatics》(W下简称文献1))。在该文中详述了,TEMSP方法 W残基对(residue pairs)为单位,基于未知蛋白中的残基对与天然蛋白中金属结合位点 配体残基对的构象相近的原理做初始预测。TEMSP方法较其他方法预测性能有较大提升,但 对未知蛋白的预测性能仍然较低。仍存在不足是,因为TEMSP方法W残基对为单位同时依据 模板构象预测潜在配体残基侧链构象,当预测的金属结合位点残基数目是奇数时,至少有 一个潜在配体残基侧链构象预测会用到两个模板,导致会同时输出两个侧链构象预测结 构。本专利是W单残基为模板基础,实现了很大跨越,可W良好的解决前述方法的不足。由 于起始基础不同,上层构架和后面的很多分析处理环节也和2011年文章有很大不同。文献1 的所有内容都通过引用的方式并入本文。
技术实现思路
有鉴于此,本专利技术的主要目的在于提供一种蛋白质Ξ维结构中金属离子结合位点 单配体残基模板库的建立方法,W及一种基于其的预测方法。 为了实现上述目的,作为本专利技术的一个方面,本专利技术提供了一种蛋白质Ξ维结构 中金属离子结合位点单配体残基模板库的建立方法,包括W下步骤: 收集蛋白质Ξ维结构中金属离子结合位点的单残基匹配信息; 从获得的所述匹配信息中提取蛋白质链上规则的金属结合位点局域结构; 分解所述金属结合位点,建立单配体残基与金属离子相对空间位置关系的模板 库。 作为本专利技术的另一个方面,本专利技术还提供了一种基于蛋白质Ξ维结构中金属离子 结合位点的单配体残基模板库的预测方法,其特征在于,包括W下步骤: 通过预先建立的蛋白质Ξ维结构中金属离子结合位点单配体残基模板库中的模 板与待预测蛋白质上的同类型残基进行匹配,W此对蛋白质Ξ维结构中金属离子结合位点 的单配体残基是否匹配进行预测; 其中,所述预先建立的蛋白质Ξ维结构中金属离子结合位点单配体残基模板库是 根据如上所述蛋白质Ξ维结构中金属离子结合位点单配体残基模板库的建立方法建立的。 作为本专利技术的再一个方面,本专利技术还提供了一种基于蛋白质Ξ维结构中金属离子 结合位点的单配体残基模板库的预测方法,其特征在于,包括W下步骤: a. W两个残基的Ce-Ca-C原子叠合方式,将预先建立的单配体残基模板库中每个与 目标残基类型一致的模板逐个叠合代入待预测蛋白质的结构中,W叠合后的模板残基侧链 构象,预测待预测蛋白质的结构中该潜在配体残基结合相同金属离子时的构象态; b.分析两两潜在配体残基结合相应金属离子时的构象态组合在一起是否也满足 结合该金属离子的空间立体构象必要条件,W此筛选出结合该金属离子的第一潜在配体残 基和第二潜在配体残基W及初步预测结合的金属离子坐标; C.W初步预测结合的金属离子坐标与周围残基的相对位置关系,W关键几何量D、 G、C值作为筛选待预测蛋白质上潜在配体残基的指标,确定出少数可能的模板,其中D值为 金属离子Μ与单配体残基Ce原子的距离;G值为M-Ce-CaS原子形成夹角;C值为M-Ce-Ca-C四原 子形成的二面角;再W步骤a中所述的方法预测出第Ξ潜在配体残基结合相同金属离子时 的构象态,再次筛选Ξ个潜在配体残基在各自模板指导下的构象态组合在一起是否也满足 结合该金属离子的空间立体构象必要条件; d.如步骤C所述,筛选潜在的其它配体残基; e.当一个金属结合位点中所有潜在配体残基逐次筛选完后,采用位点整体评估打 分排序的策略做最终筛选,其中所述的打分通过计算偏差值实现,打分函数基于预测的构 象态与来自天然的单配体模板及金属结合位点空间几何特性双重偏差得到。 基于上述技术方案可知,本专利技术的方法可实现不依赖待检索蛋白质残基侧链构象 的预测,即仅提供待检索蛋白质的主链结构及Ce坐标,加上输入蛋白质序列,而不必输入每 个残基侧链构象坐标,本方法仍能预测出相应的金属结合位点。【附图说明】 图1为作为本专利技术一个优选实施例的本专利技术预测方法的总流程图; 图2为本专利技术建立蛋白质Ξ维结构中金属离子结合位点的单残基匹配组合模板库 的方法流程图; 图3为本专利技术预测蛋白质Ξ维结构中金属离子结合位点的单残基匹配组合的方法 流程图。【具体实施方式】 下面结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整 地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本 专利技术的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施 例,都属于本专利技术的保护范围。 本专利技术公开了一种预测蛋白质Ξ维结构中金属离子结合位点的单残基匹配组合 的方法,该方法开发了一种W天然存在的单配体残基金属结合态为模板,W关键几何量D、 G、C值为模板与潜在配体残基是否匹配的检索筛选条件,先由潜在第一、第二配体残基确定 金属的可能位置,再逐步加入第Ξ甚至第四配体残基,最后计算预测位点与天然和标准位 点构象偏差Deviation值,对其作为计分法的最后总排序,由此筛选出最终结果。 更具体地,本专利技术公开了一种蛋白质Ξ维结构中金属离子结合位点单配体残基模 板库的建立方法,包括W下步骤: 收集蛋白质Ξ维结构中金属离子结合位点的单残基匹配信息;当前第1页1 2 3 4 本文档来自技高网...
【技术保护点】
一种蛋白质三维结构中金属离子结合位点单配体残基模板库的建立方法,其特征在于,包括以下步骤:收集蛋白质三维结构中金属离子结合位点的单残基匹配信息;从获得的所述匹配信息中提取蛋白质链上规则的金属结合位点局域结构;分解所述金属结合位点,建立单配体残基与金属离子相对空间位置关系的模板库。
【技术特征摘要】
【专利技术属性】
技术研发人员:赵伟,
申请(专利权)人:中国科学技术大学,
类型:发明
国别省市:安徽;34
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。