建立和分析氨基酸序列构象的方法技术

技术编号:2848889 阅读:422 留言:0更新日期:2012-04-11 18:40
本发明专利技术涉及建立和分析氨基酸序列构象的方法。特别涉及确认给定的基于氨基酸的分子构象的方法,从线性氨基酸序列开始的构象确定的方法,以及对比两个或更多个氨基酸序列的方法。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及。特别涉及确认给定的基于氨基酸的分子构象的方法,从线性氨基酸序列开始的构象确定的方法,以及对比(alignment)两个或更多个氨基酸序列的方法。
技术介绍
分子生物信息学的重要任务是对复杂的、大量的生物科学数据的组织和在“数据挖掘(data mining)”意义上新信息关系的发现。在许多情况下,通过基因排序获得的信息仅在特定(基因)序列的功能被揭示时才能被实际利用。然而,关于现代生物技术这个方面,基因序列仅具有有限的信息价值,而被表达的蛋白质在生物功能上却扮演着主要的角色。近年来,已经提供了人类基因组序列和其他重要的基因组的高质量数据,并且这以后研究的下一个大的阶段是确定细胞蛋白质组的组分的重要生物学功能。在这一点上,在通过序列预测蛋白质三级结构方面,通过对比准备来比较两个氨基酸序列方面以及对给定的蛋白质结构进行确认方面,本专利技术是重要的和有价值的。对蛋白质的生物和功能性能的重要理解的关键最终在于它们精细的、明确的三维结构(构象);“构象”和“三维结构”这两个术语在下面作为同义词使用。生命科学伴随着对这样的生物性能的需求,例如对实验工作的评价和优化,以及寻找蛋白质新的功能和性能。用于建模结构的计算机的方法可以迅速地被执行并且是成本有效的,可以在没有材料(其制备是费劳力的)的情况下实施,并通常甚至可以在蛋白质的结构被艰辛的实验说明检验之前就准确的证明目标蛋白质的基本性能。因此,确定这样的结构模型就成为现代分子生物信息学的一个重要部分;折叠问题,即根据序列信息预测蛋白质的三级结构,被认为是当今生物信息学的关键学科。迄今为止,还没有理解哪个机理是使给定氨基酸序列折叠成天然的、功能性蛋白质三级结构的基础,因此也不存在任何明确的根据序列信息得出三级结构的数学运算法则。由于这个原因,本专利技术能够确定蛋白质的可信的模型结构,并且确认(可信性的评价)结构。此外,蛋白质可以通过人为引入为影响蛋白质性能而设计的点突变而被改变,而对这样的点突变的选择可以基于本专利技术以比相对于一直以来所使用的标准方式更为合理的途径实施。蛋白质三级结构的预测主要是基于基本知识的、目前被认为是最可靠的结构预测程序方法(Bhm,Biophys.Chem.59,1-32,1996)。为此目的,当知道一个未知蛋白质的序列和与其“相关的”模板结构时,就能尝试通过比较建模(同调建模(homology modeling))推导出三级结构模型。然而,仍然未知的折叠拓扑不能用这种方法进行预测;但是到大约2010年在“结构几何学”的框架下,预期将了解初步的所有有关天然拓扑。此后,将极少期待完全新的蛋白质拓扑(Berman等,Nature Struct.Biol.7,975-959,2000)。典型使用的比较建模方法在未知蛋白质和模板有大约50%序列一致性的特定相关度的情况下是相对稳定和可靠的(Hilbert等,ProteinsStruct.Funct.Genet.7,138-151,1993),但是即便如此,这些方法仅以有限的分辨率确定例如蛋白质活性中心的电动力学差异这样的细节。因此,确定每个三级结构模型以及其可信度以避免对模型的过度解释是非常重要的。目前,有几个商业的和非商业的方法和运算法则用于比较建模。基本上可以根据以下步骤进行建模·通过基于序列的比较(序列同源性)或通过其他方法(例如穿线法(threading))对相关蛋白质的识别;·未知蛋白质和亲本结构序列的对比;应涉及常规折叠拓扑的尽可能多(不同)的亲本结构。该对比是建模的重要步骤,并由本专利技术协助进行;·保守结构和可变部分(蛋白质核心和环(loop))的识别;·通过已知的方法和程序对蛋白质核心(结构保守区域,特别是具有二级结构的重复区域的部分)的坐标的推导;·环(结构可变区域)构象的预测包括在这些区段的插入和删除的建模;为此也已建立了多种技术方法;·模型结构和性质分析的确认,以及该模型结构的优化几何的改进。这最后的步骤也由本专利技术协助进行。蛋白质空间结构的知识是识别细胞生物关系和功能,识别调控机理和酶催化的基本要求,是对体外实验的解释和对抗体、疫苗以及在分子药物中其他活性制剂进行合理设计的基本要求。对于根据X射线结构分析的实验检测来说,限制步骤是在适于获得高分辨率结构数据条件下的结晶体;在多维NMR的情况下,可溶结构的分子尺寸被限制,但是这不断地被推向更高的限制。在任何情况下,对用于实验结构说明的材料的要求很多,而且通常不能保证成功。相反,蛋白质的序列(基于基因序列)通常能迅速地以相对小的代价被测定。因此,目前提供的基因和蛋白质序列的数量的增长远远超过已知结构数量的增长。主要在医药领域和细胞生物学的研究领域的进一步重大的科学进展需要对折叠问题进行尽可能有效的解决。此外,如果使用对生物大分子结构计算的可靠工具,例如,用于开发新制剂的基本动物实验的数量可通过计算机程序对该制剂的生物活性进行潜在药物模拟而被大大降低。对分子结构计算的区域最基本的努力之一是根据氨基酸序列预测二级结构。因为基于这样的观点,即一旦预测了正确的二级结构,那么从二级结构折叠成为三维模型要比从头开始预测结构容易得多。最近的对该区别的比较,目前发表的对二级结构预测的方法可在McGuffin和Jones的工作中找到,ProteinsStruct.Funct.Genet.Vol.52,pp.116-175,2003。Chou和Fasman最初的方法是基于已知蛋白质结构中氨基酸在二级结构单元中频率的分布。在对全部20种天然氨基酸建立构象参数后,搜寻目标序列中能作为相应的二级结构类型起始物的4到6个氨基酸长度的成核中心。平均预测性为57%的Chou/Fasman方法被认为是成功率不高的方法;显然对每个氨基酸单独地检查不适于作为预测性测量。相反,本专利技术采用由低聚肽,即2个或更多个氨基酸长度的短氨基酸链段获取的信息。GOR方法(根据第一次公开出版物的作者Garnier,Osguthorpe和Robson;Garnier等,J.Mol.Biol.Vol.120,97-120,1978)通过从每种二级结构类型获取的对数信息函数扩展了Chuo/Fasman的方法。该方法选择与其他两种二级结构类型差异最大的一种构象作为最可能的构象。在该情况下,可以预期63%的平均预测率。上述方法可以通过考虑与已知结构的序列同源性而被改进;在这种情况下,平均预测率将达到约88%。如果使用Neuronal网络,可达到64%的平均预测率,并且如果也考虑同源序列,则正确预测率为约88%。其他方法试图以“联合预测(joint predition)”的形式加入不同的方法以改进精确度。已经断定,到目前为止仍然限制预测性的是不可预测的、决定大约20-30%局部构象的远距离相互作用(kabsch和Sander,Biopolymers Vol.22,2577-2637,1983);然而后来显示,基本蛋白质数据库有限的大小成为限制这些方法的主要原因(Rooman和Wodak,Nature Vol.335,46-49,1988)。总之,基于目前已知的这些方法对二级结构的预测是有限的并且通常不可靠。因此,本专利技术超越仅对二级结构的预测。系统的分子能量,即蛋白质与周围溶剂间所有本文档来自技高网...

【技术保护点】
一种用于确认给定的基于氨基酸的分子构象的方法,该方法包括如下步骤:a)将该基于氨基酸的分子分成相同长度的低聚肽,其中该低聚肽的数量优选由下式定义:n-(m-1) 其中n是在该基于氨基酸的分子中氨基酸的数量,m是在该低 聚肽中氨基酸的数量,并确定这些低聚肽的Ψ和φ角(观测值);b)提供或准备低聚肽数据库,该数据库包含这些低聚肽的Ψ和φ角的值;c)从该数据库信息中为步骤a)中确定的每个低聚肽确定Ψ和φ角(预期值);d)从观测值中减去预 期值;e)评价每个氨基酸位置的差异,其中预期值和观测值之间的差异越小,所述给定结构精确的概率越高。

【技术特征摘要】
【国外来华专利技术】EP 2003-9-8 03020301.21.一种用于确认给定的基于氨基酸的分子构象的方法,该方法包括如下步骤a)将该基于氨基酸的分子分成相同长度的低聚肽,其中该低聚肽的数量优选由下式定义n-(m-1)其中n是在该基于氨基酸的分子中氨基酸的数量,m是在该低聚肽中氨基酸的数量,并确定这些低聚肽的Ψ和Φ角(观测值);b)提供或准备低聚肽数据库,该数据库包含这些低聚肽的Ψ和Φ角的值;c)从该数据库信息中为步骤a)中确定的每个低聚肽确定Ψ和Φ角(预期值);d)从观测值中减去预期值;e)评价每个氨基酸位置的差异,其中预期值和观测值之间的差异越小,所述给定结构精确的概率越高。2.根据权利要求1所述的方法,其中预期值是在步骤c)中确定的Ψ和Φ角的概率密度函数的最大值,观测值是在步骤a)中对每个低聚肽观测的Ψ/Φ值。3.根据权利要求1或2所述的方法,其中在步骤c)中,对低聚肽确定所述预期值,所述低聚肽与以类似法则的形式在给定的基于氨基酸的分子中的低聚肽相比,其中一个或多个氨基酸或特定长度的序列段被取代,其中观测值和预期值之间的差异量是对由取代而产生的预期的构象变化的衡量。4.一种从线性氨基酸序列开始的构象确定的方法,该方法包括以下步骤a)将该氨基酸序列分成相同长度的低聚肽,其中该低聚肽的数量由下式定义n-(m-1)其中n是在该基于氨基酸的分子中氨基酸的数量,m是在该低聚肽中氨基酸的数量;b)提供或准备低聚肽数据库,该数据库包含这些低聚肽的Ψ和Φ角的值;c)从该数据库信息中为步骤a)中确定的每个低聚肽确定Ψ和Φ角;d)根据步骤c)中对每个低聚肽确定的Ψ和Φ角,产生该氨基酸序列的构...

【专利技术属性】
技术研发人员:杰拉尔德伯姆罗马达鲁格
申请(专利权)人:ACGT前基因组公司
类型:发明
国别省市:DE[德国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1