一种蛋白质二级结构预测方法技术

技术编号：2862299 阅读：304 留言：0更新日期：2012-04-11 18:40

本发明专利技术属于蛋白质二级结构预测方法领域。本发明专利技术涉及一种基于组成已知结构蛋白质的三肽结构微环境的构象（或折叠）倾向因子数据库的数据建模方法以及基于此种数据库的蛋白质二级结构预测方法。并在此基础上，我们设计并编写了一个计算机应用程序。本发明专利技术可用于全新蛋白质或蛋白质突变的分子设计，有利于指导基于结构的全新药物设计，有助于功能基因组特别是蛋白质结构与功能关系的研究，更有益于多维核磁共振中二级结构的指认以及晶体结构的解析等。（*该技术在2024年保护过期，可自由使用*）

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于蛋白质二级结构预测方法领域，尤其是一种基于三肽结构微环境下的氨基酸构象(或折叠)倾向因子数据库的建模方法以及基于此种数据库的蛋白质二级结构预测方法。
技术介绍
蛋白质结构预测是后基因组时代的一项重要任务，蛋白质二级结构预测是蛋白质结构、功能预测的关键步骤。尽管上世纪50年代初，Anfinsen就提出了蛋白质特定的空间结构是由其氨基酸排列顺序所决定的假说，即蛋白质的一级结构决定其空间结构，并因此获得了诺贝尔奖。但是目前人们试图从蛋白质一级序列直接预测其空间结构时，仍遇到了种种困难，预测准确率一直不高。在这种情况下，蛋白质二级结构预测就显得尤为重要。它不仅成为联系蛋白质一级结构和三级结构的纽带，而且也是从一级结构预测其三维空间结构的关键步骤。另外在实际工作中蛋白质二级结构预测也具有广泛用途。如可用于全新蛋白质的设计或蛋白质突变的设计；有助于确定蛋白质空间结构与功能的关系；有助于多维核磁共振中二级结构的指认以及晶体结构的解析等。蛋白质二级结构预测始于20世纪60年代中期，至今已有30多年的历史，其发展过程大致可分为三个阶段。第一阶段是以单残基、单一序列的分析为重点，以Chou-Fasman方法和GOR等方法为代表。但是预测准确率普遍较低，大致在50％-59％之间。第二阶段则考虑了局部残基的相互影响，预测准确率有所提高，尤其是使用了神经网络方法以后预测准确率首次提高到了70％以上。第三个阶段是在前两个阶段的基础上，进一步提出了结合多重序列比对的思想，使预测准确率较以往又有了明显的提高，大致在72％-80％之间。近期，我国学者也在蛋白质二级结构预测...

【技术保护点】
一种基于氨基酸构象或折叠倾向因子数据库的蛋白质二级结构预测方法，其特征是采用下列步骤：包括预测算法、评价指标和检验集；预测算法根据螺旋规则、折叠规则、其他构象规则和重叠区规则，采用不同的规则进行计算；采用国际上通用的评价指标，即三态准确率Ｑ↓［ｉ］和整体准确率Ｑ↓［３］进行评价；Ｑ↓［ｉ］＝Ｐ↓［ｉ］／（Ｐ↓［ｉ］＋Ｏ↓［ｉ］）ｉ∈（Ｈ，Ｅ，Ｃ）；Ｑ↓［３］＝（Ｐ↓［α］＋Ｐ↓［β］＋Ｐ↓［ｃ］）／Ｔ；在这里，Ｐｉ表示被正确预测为ｉ态的残基个数，Ｏｉ表示被错误预测为ｉ态的残基个数；Ｐ↓［α］、Ｐ↓［β］和Ｐ↓［ｃ］分别表示被正确预测为螺旋、折叠和其他构象的残基个数，Ｔ表示蛋白质样本的氨基酸残基总数量。

【技术特征摘要】

【专利技术属性】
技术研发人员：杨洁，董咸池，
申请(专利权)人：南京大学，
类型：发明
国别省市：84[中国|南京]

全部详细技术资料下载我是这个专利的主人