本发明专利技术公开了一种基于氨基酸广义信息因子分析标度的抗原肽定量结构-亲和性关系分析方法,能够用于对抗原肽的亲和性预测,为设计具有特定亲和性抗原肽新品种提供参考,包括如下步骤:a)基于因子分析方法,建立氨基酸广义信息因子分析标度;b)应用氨基酸广义信息因子分析标度对抗原肽的结构进行表征;c)用遗传算法-偏最小二乘方法挑选与抗原肽活性密切相关的结构特征;d)用偏最小二乘法建立抗原肽定量结构-亲和性关系分析模型;e)对抗原肽各位点的性质参数进行方差分析。
【技术实现步骤摘要】
本专利技术涉及一种肽的定量结构-功能关系分析方法,特别是一种抗原肽 的定量结构-亲和性关系分析方法。
技术介绍
T细胞是重要的免疫细胞之一,其主要作用是介导细胞免疫,调节机体的 免疫功能。抗原肽可存在于由T细胞识别的细胞表面(称T细胞表位,TCE); T 细胞经受体在细胞表面识别T细胞表位。这个过程涉及到主要组织相容性复合 体(MHC)分子,MHC可结合表位并将其表达给T细胞。免疫体系对一独特抗原 作出反应的能力据其MHC基因不同而有所不同,MHC基因呈现广泛多样性。 MHC分子含有以一种高度复杂方式结合肽的沟槽,该沟槽包含由一个|3碎片支 撑的两个a螺旋。I型MHC分子表达肽主要含8 11个氨基酸残基,仅有一少 部分例外。 一个I型MHC分子可容纳亲和沟槽中亲和肽的整个长度。肽结合 到MHC分子是T细胞识别的前提,但是只有其本身是不足够的。多肽亲和沟 槽内多形态的残基决定着多肽的亲和能力。肽-亲和沟槽之间的作用受一级与二 级锚点影响,这些锚点对肽亲和性提供最大贡献。虽然大量的肽已被合成与检 测,但对肽与MHC (主要组织相容性复合体分子)之间亲和作用本质特点还不完 全清楚。如,对一具有9个残基的最常见I型MHC分子的配体,理论上可形 成20^5.12xl0"个肽,若用试验方法确定其亲和活性将极其费时费力,故发展 一种有效方法获得与MHC结合肽的一些重要信息很有意义。另外,各种各样 MHC亲和基序的识别,成千上万的特定等位基因和杂乱的MHC亲和体和T细 胞表位,为人们利用模拟预测MHC-亲和肽活性提供大量可靠信息。定量矩阵, 人工神经网络,支持向量机及隐马尔可夫矩阵等方法已经用于MHC-肽亲和特 异性预测,但上述各种预测方法大多集中于算法描述,未能提供较多的关于结构与功能之间的有用信息。此外,分子动力学模拟、同源才莫建、比较分子场分析(CoMFA)和比较分子相似性指数(CoMSIA)也用于MHC-肽亲和关系研究,但 是这些方法较为复杂且有时并不有效。 一种优良的抗原肽亲和性预测方法,.不 仅要能够提供一些关于特定位置的氨基酸残基信息,而且要能够提供一些关于 活性肽的特定基序信息。
技术实现思路
有鉴于此,为了解决上述问题,本专利技术提供了一种基于氨基酸广义信息 因子分析标度的抗原肽定量结构-亲和性关系分析方法,能够用于对抗原肽的亲 和性预测及其结构-亲和性关系分析,为设计具有特定亲和性的抗原肽新品种提 供参考。本专利技术的目的是这样实现的 一种基于氨基酸广义信息因子分析标度的 抗原肽定量结构-亲和性关系分析方法,包括如下步骤a) 基于因子分析方法,建立氨基酸广义信息因子分析标度;b) 应用氨基酸广义信息因子分析标度对抗原肽的结构进行表征;c) 用遗传算法-偏最小二乘方法挑选与抗原肽活性密切相关的结构特征;d) 用偏最小二乘法建立抗原肽定量结构-亲和性关系分析才莫型;e) 对抗原肽各位点的性质参数进行方差分析。 进一步,在于步骤a)具体包括如下步骤al)选取天然氨基酸的变量参数,按照相对负栽大小、变量共同度、可 解释性及对序列结构贡献的重要性进行变量筛选;a2)用因子分析法处理精选得到的变量,通过斜交旋转,并用主成分法 提取疏水性、a-螺旋与转角倾向、体积性质、构成特征、局部柔性和静电性这 6个因子;a3)计算各因子得分,将得分矢量定义为氨基酸广义信息因子分析标度; 进一步,步骤b)具体包括用氨基酸广义信息因子分析标度所涉及的疏 水性、a-螺旋与转角倾向、体积性质、构成特征、局部柔性和静电性6个因子对抗原肽序列进行表征,其中的每个氨基酸残基用6个矢量表征,并将表征结 果作为定量结构-亲和性关系分析模型的自变量;进一步,步骤c)具体包括如下步骤用遗传算法-偏最小二乘方法挑选变 量,参数设置如下初始群体大小500;最大遗传代数200;收敛标准 80%;交叉频率50%;变异概率0.5%;适应度函数为留一法交互检验的 累计复相关系数;进一步,步骤d)具体包括如下步骤将抗原肽的半抑制率IC5o值转换为 pIC50,以pIC5o值结构-亲和性关系模型的因变量,选择偏最小二乘建立才元原 肽定量结构-亲和性关系分析模型,以留一法交互检验的累计复相关系数评价 模型的预测能力;进一步,步骤e)具体包括如下步骤将抗原肽按照其亲和性大小分为三 类,其中低活性pIC50<6.301,中活性7.301>pIC50>6.301,高活性pIC50>7.301; 对抗原肽的各位点的性质参数进行方差齐性检验,对属于方差齐性的,进行费 歇尔检验,对不属于方差齐性的,使用布朗-菲奥思近似方差分析;显著水平为 P=0.05。本专利技术的基于氨基酸广义信息因子分析标度的抗原肽定量结构-亲和性关 系分析方法,其中选取的氨基酸广义信息因子分析标度所含信息量大、表征能 力强、使用操作方便及物化意义明显;遗传算法-偏最小二乘方法能够较好地挑 选与抗原肽亲和性密切相关的结构变量参数;偏最小二乘方法集多元线性回归 分析、典型相关分析和主成分分析的基本功能为一体,可分析包含多重共线性 以及较大噪声的众多自变量,特别适合在样本容量小于变量个数的情况下进行 回归建模,同时,其将建模类型的预测分析方法与非模型式的数据内涵分析方 法有机地结合起来。而方差分析,可分析具有不同亲和活性的抗原肽组相应残 基不同性质的差异程度,进而为设计具有特定亲和性的抗原肽新品种提供参考。本专利技术的其他优点、目标和特征在某种程度上将在随后的说明书中进行 阐述,并且在某种程度上,基于对下文的考察研究对本领域技术人员而言将 是显而易见的,或者可以从本专利技术的实践中得到教导。本专利技术的目标和其他优点可以通过下面的说明书,权利要求书,以及附图中所特别指出的结.构来 实现和获得。附图说明为了使本专利技术的目的、技术方案和优点更加清楚,下面将结合附图对本专利技术作进一步的详细描述,其中图l是本专利技术的偏最小二乘模型的得分示意图2是本专利技术的Y随机变换验证示意图3是本专利技术的疏水性方差分析示意图4是本专利技术的a-螺旋与转角倾向方差分析示意图5是本专利技术的体积性质方差分析示意图6是本专利技术的构成特征方差分析示意图7是本专利技术的局部柔性方差分析示意图8是本专利技术的静电性方差分析示意图。具体实施例方式以下将参照附图,对釆用本专利技术的方法用于人类I型HLA-A*0201抗原 九肽亲和性预测及特异性分析为例进行详细的描述,包括以下步骤 a)基于因子分析方法,建立氨基酸广义信息因子分析标度; 从AAindex数据库(参见Kawashima S., Kanehisa M.. Nucleic Acids Res. , 2000,28:374)中选择20种天然氨基酸的516个变量参数。按照相对负载大小、 变量共同度、可解释性及对序列结构贡献的重要性等原则对这516个变量进 行筛选,得到335个变量。这些变量表征氨基酸的如下性质,a-螺旋与转角倾 向性质,如P-转角构象参数及C末端螺旋的标准化频率等;p倾向性质,如N 末端P-折叠的标准化频率等;疏水性,如三氟乙酸中的保留系数及疏水性指数 等;物理化学性质,如表观偏特定体积及分子大小等;构成特征,如电荷转移 给予能力参数及热能参数等;其它特性,如侧链角e及N末端非螺旋区域的标 准化频率本文档来自技高网...
【技术保护点】
一种基于氨基酸广义信息因子分析标度的抗原肽定量结构-亲和性关系分析方法,其特征在于包括如下步骤: a)基于因子分析方法,建立氨基酸广义信息因子分析标度; b)应用氨基酸广义信息因子分析标度对抗原肽的结构进行表征; c)用遗传算法-偏最小二乘方法挑选与抗原肽活性密切相关的结构特征; d)用偏最小二乘法建立抗原肽定量结构-亲和性关系分析模型; e)对抗原肽各位点的性质参数进行方差分析。
【技术特征摘要】
【专利技术属性】
技术研发人员:梁桂兆,牛维环,梅虎,杨力,李志良,
申请(专利权)人:重庆大学,
类型:发明
国别省市:85[中国|重庆]
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。