本发明专利技术涉及蛋白质结构预测领域,涉及了一种基于小生境遗传和算法禁忌搜索算法的结合算法的蛋白质结构预测方法。该方法将禁忌搜索算法引入小生境遗传算法中来解决蛋白质结构预测问题,并对小生境遗传算法过程中的交叉、变异、小生境淘汰进行了一定的改进。从实验得出的数据和与其他方法的比较结果来看,该方法可以更加全面的搜索出相应的蛋白质最小自由能量值,从而能得到更稳定的蛋白质结构,说明了本方法在解决蛋白质结构预测问题上是有效的。
【技术实现步骤摘要】
【专利摘要】本专利技术涉及蛋白质结构预测领域,涉及了一种基于小生境遗传和算法禁忌搜索算法的结合算法的蛋白质结构预测方法。该方法将禁忌搜索算法引入小生境遗传算法中来解决蛋白质结构预测问题,并对小生境遗传算法过程中的交叉、变异、小生境淘汰进行了一定的改进。从实验得出的数据和与其他方法的比较结果来看,该方法可以更加全面的搜索出相应的蛋白质最小自由能量值,从而能得到更稳定的蛋白质结构,说明了本方法在解决蛋白质结构预测问题上是有效的。【专利说明】基于NGA-TS算法的蛋白质结构预测方法
本专利技术设及小生境遗传算法和禁忌算法,具体讲的是通过小生境遗传算法和禁忌 算法捜索到最小的蛋白质自由能量值,并改进了捜索过程中的交叉算子、变异算子和小生 境淘汰算子。
技术介绍
在生物信息学领域中,蛋白质工程一直是一口重要的研究课题。蛋白质作为人体 生命活动的基本体现者,是人体不可或缺的物质,可是生物体内存在的天然蛋白质,有的往 往不尽人意,需要加 W改造。蛋白质工程是按人们的意志改变蛋白质的结构和功能来改造 或创建新的蛋白质的过程。由于蛋白质是由许多氨基酸按一定顺序结构组合而成的,每一 种蛋白质都有独特的氨基酸序列,蛋白质中氨基酸序列的结构也决定了蛋白质的功能和性 质。所W,改变蛋白质中的氨基酸序列结构就能改变蛋白质的性质,蛋白质结构预测问题是 蛋白质工程中重要的研究问题之一。 蛋白质结构预测问题又被称为蛋白质折叠问题。在医学上,有许多因蛋白质折叠 错误、结构发生改变而引起的疾病,例如:疯牛病(bovine spongiform encephalopathy, BSE)、新型克雅病(CJD)、构象病(由航蛋白又名蛋白质传染因子引起的疾病)、肌萎缩性侧 索硬化症、家族性淀粉样屯、肌病、阿尔茨海默病(ADI)等。因此,研究蛋白质结构预测对运些 疾病机制的研究和治疗药物的研究都有重大的实践意义。 蛋白质结构预测问题也是对蛋白质结构中的氨基酸的空间折叠的预测,W达到蛋 白质的最低能量和最稳定结构(能量越低,蛋白质结构越稳定)。通常对蛋白质结构的预测 问题的解决一般采用更为方便有效的模拟仿真技术,首先要将根据问题建立合适的数学模 型和物理模型,其次是找到合适的寻优算法。 前人提出了多种研究蛋白质结构预测的适用模型,其中应用最广泛的是按照氨基 酸的亲疏水性分为疏水氨基酸和亲水氨基酸的两种简化模型:HP格点模型和AB非格点模 型。两种模型最主要的区别在于,HP格点模型中两个残基键之间的角度是直角或者平角,而 AB非格点模型中两个键之间的角度是任意的并且被记作两平面的折叠角和同一平面的扭 转角,同时AB非格点模型不仅考虑了相邻两个氨基酸间的相互作用还考虑了不相邻氨基酸 之间的非局部作用对蛋白质结构的影响。因此,AB非格点模型比HP格点模型更接近真实的 蛋白质结构。目前,采用AB非格点模型的研究人员较多,而且大部分研究人员都在寻找更好 的寻优算法,W提高研究的精确度。 当前,国内外很多研究者对蛋白质结构预测问题的研究提出了许多算法,例如:遗 传算法、粒子群算法、蚁群算法、蜂群算法、禁忌算法、模拟退火算法、免疫算法等智能算法 或是多种算法的混合算法。化eng等提出一种基于AB非格点模型的改进禁忌捜索算法,它适 用于短的蛋白质结构序列。Zheng等采用遗传、禁忌算法的混合算法,并采取了许多改进策 略,如:排队选择、交叉操作、变异操作、变种群策略等等。化U等提出改进的遗传、粒子群混 合算法和改进的遗传、粒子群、禁忌混合算法两种解决方法,结合了遗传算法、粒子群算法 和禁忌算法的优点,提高全局最优捜索,提高结果的捜索精度。Li等采用平衡进化人工蜂群 算法来解决蛋白质结构预测问题,并且获得了好的结果。但是,对蛋白质结构预测方法进行 改进,有效提高了捜索的效率,提高精确度仍是十分必要的。
技术实现思路
本专利技术的目的在于提出一种基于NGA-TS算法的蛋白质结构预测方法,将小生境遗 传算法和禁忌捜索算法用于蛋白质结构预测中,捜索出更小的自由能值和对应的更稳定的 结构,并有效提高了捜索的效率,提高精确度。其基本思想是先对种群进行竞技选择、自适 应交叉、自适应变异后,再根据种群个体之间的欧氏距离进行小生境淘汰,淘汰掉较为相似 的个体,从而增加种群个体的多样性,最后用禁忌捜索算法进行全局性领域捜索找到全局 最优解。 为达到上述目的,本专利技术的技术方案为:首先进行种群初始化,并对种群进行选 择、交叉、变异操作,然后再对种群进行小生境淘汰选择操作,在进化后期对种群进行全局 性的禁忌捜索运样就可W捜索出最小自由能的蛋白质结构。在捜索稳定蛋白质结构的过程 中,对使用的交叉操作、变异操作和小生境淘汰操作进行一些的改进:交叉操作采用自适应 交叉算子,避免过早收敛现象和停滞现象的产生;变异操作采用自适应的随机线性变异算 子,可W增强局部捜索能力,加快收敛速度;小生境淘汰操作也采用动态函数求得距离参 数,使参数更灵活精确,使小生境淘汰更有效。基于NGA-TS算法的蛋白质结构预测方法,其 特征在于:其包括W下步骤: 步骤1:初始化参数及种群; 步骤2:进行迭代循环,计算种群适应度; 步骤3:对种群进行竞技选择、自适应交叉、自适应随机线性变异,更新种群; 步骤4:对新种群进行小生境淘汰选择,更新种群; 步骤5:在进化后期,对新种群进行禁忌捜索算法,更新种群; 步骤6:判断是否满足终止条件,若满足则退出循环,继续运行步骤7,否则跳到步 骤3; 步骤7:结束循环后,对最优值再进行一次禁忌捜索,最后输出结果。 该方法具体步骤如下: 1)初始化种群《=財,町...而,其中11为种群大小;[001引2)计算种群X中个体的适应度值Fi,其中i = l,2,···,η;根据适应度值的大小进行 升序排序,并记忆保留前rV2个个体记作记忆种群Ρ; 3)设置代数计数器t = l; 4)先将种群X中的前k个适应度值小的个体复制到新种群XI中,再将XI中的n-k个 个体通过对种群X进行竞技选择选出,其中竞技选择的个数为y,即从X中随机选择y个个体, 选取适应度值好的保留到新种群XI中,运样进行n-k次选择,形成种群XI; 5)对种群XI进行自适应交叉:在进化初期,交叉概率化0等于0.8;在进化后期,即 I > I,其中T为迭代次数,交叉概率化用自适应公式:化= Pc〇X(l-i/n)i/2, 其中i为交叉个体在种群中的下标索引确定,Pco等于0.8,判断随机数a(a为一个 (〇,1)范围内的正态分布随机数,且每个个体交叉判断都要重新生成的随机数)与交叉概率 的大小:当a小于交叉概率时,随机确定交叉点对XI中的个体xi和个体xn-i+i进行交叉;当a大 于交叉概率时,不进行交叉。运样进行rV2次交叉后形成种群X2; 6)对种群X2进行自适应随机线性变异:在进化初期,即t<^xT,其中T为迭代次 4 数,变异概率化用自适应公式: 其中i为变异个体在种群中的下标索引确定,在进化后期变异概率化0等于0.08, 判断随机数b(b为一个(0,1)范围内的正态分布随机数,且每个个体交叉判断都要重新生成 的随机数)与变异概率的大小:当b大于变异概率时,不进行变异;当b小于变异概率时,对XI 中的个体本文档来自技高网...
【技术保护点】
基于NGA‑TS算法的蛋白质结构预测方法,其特征在于:其包括以下步骤:步骤1:初始化参数及种群;步骤2:进行迭代循环,计算种群适应度;步骤3:对种群进行竞技选择、自适应交叉、自适应随机线性变异,更新种群;步骤4:对新种群进行小生境淘汰选择,更新种群;步骤5:在进化后期,对新种群进行禁忌搜索算法,更新种群;步骤6:判断是否满足终止条件,若满足则退出循环,继续运行步骤7,否则跳到步骤3;步骤7:结束循环后,对最优值再进行一次禁忌搜索,最后输出结果。
【技术特征摘要】
【专利技术属性】
技术研发人员:周昌军,魏雪,郑学东,王宾,
申请(专利权)人:大连大学,
类型:发明
国别省市:辽宁;21
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。