一种基于量子退火的蛋白质折叠方法技术

技术编号:33352707 阅读:40 留言:0更新日期:2022-05-08 10:02
本发明专利技术提供一种基于量子退火的蛋白质折叠方法,属于量子计算技术领域。因为该方法将蛋白质折叠问题编码为可计算的优化问题(QUBO形式),具体采用正四面体格点模型模拟氨基酸多肽链分子在三维空间中的构成,并定义编码后的二进制氨基酸序列中任一氨基酸在预定方向上的步长、坐标及任意两个氨基酸之间的距离,通过添加约束条件构建对应的伊辛哈密顿量,最后利用量子退火演化伊辛哈密顿量并得到最终的演化结果,即演化得到的能量最优解即为蛋白质对应的最稳定构像。因此该方法利用量子退火中的量子隧穿效应来解决上述蛋白质问题,可以大大压缩空间和时间复杂度,耗时少,具有广泛的应用前景。的应用前景。的应用前景。

【技术实现步骤摘要】
一种基于量子退火的蛋白质折叠方法


[0001]本专利技术涉及量子计算
,具体涉及一种基于量子退火的蛋白质折叠方法。

技术介绍

[0002]蛋白质折叠(Protein folding)是蛋白质获得其功能性结构和构象的过程。通过这一物理过程,蛋白质从无规则卷曲折叠成特定的功能性三维结构。而“蛋白质折叠”的主要研究目的是依据蛋白质具体的氨基酸序列,对应预测蛋白质折叠的选取路径并确定其三维最终结构。
[0003]现有技术中提出的蛋白质随机构象在搜寻研究中具有一系列各种亚稳定中间态的假设来解决折叠时间的莱氏悖论

蛋白质折叠问题,如果通过遍历搜寻自由能最小的构象,利用现有技术提出的方法,需要耗费接随序列指数倍增长的时间。
[0004]量子退火算法(Quantum annealing algorithm)是根据经典的模拟退火算法改进的一类新的量子优化算法。不同于经典模拟退火算法利用热波动来搜寻问题的最优解,量子退火算法利用量子波动产生的量子隧穿效应来使算法摆脱局部最优,而实现全局优化。通常来说,量子退火能够自然地返回低能量解决方案,即应用在优化问题,寻找问题的低能态;或者提供良好的低能量样本(概率抽样问题),因此本专利技术提出一种基于量子退火的蛋白质折叠方法。

技术实现思路

[0005]本专利技术是为了解决上述问题而进行的,目的在于提供一种基于量子退火的蛋白质折叠方法。
[0006]本专利技术提供了一种基于量子退火的蛋白质折叠方法,具有这样的特征,包括:将待处理氨基酸序列中的每一个氨基酸映射到正四面体格点模型的每一个格点上;根据正四面体格点模型的预定结构将待处理氨基酸序列编码为对应的二进制氨基酸序列;定义二进制氨基酸序列中任一氨基酸在预定方向上的步长、坐标及任意两个氨基酸之间的距离;基于二进制氨基酸序列构建伊辛哈密顿量;利用量子退火机对伊辛哈密顿量进行演化,演化得到的能量最优解即为蛋白质对应的最稳定构像。
[0007]在本专利技术提供的方法中,还具有这样的特征:其中,正四面体格点模型中所有晶格包括第一类格点A与第二类格点B,一个第一类格点A分别指向四个第二类格点B,并将该指向的方向采用预定的方式进行编码。
[0008]在本专利技术提供的方法中,还具有这样的特征,还包括:其中,正四面体格点模型中所有晶格包括第一类格点A与第二类格点B,四个第一类格点A分别指向一个第二类格点B,并将该指向的方向采用预定的方式进行编码。
[0009]在本专利技术提供的方法中,还具有这样的特征:其中,二进制氨基酸序列包括:
[0010]q=11 00 q
1 q
2 q
3 q4ꢀ…
q(2N

7)q(2N

6)
[0011]1100为待处理氨基酸序列中前三个氨基酸的编码方式。
[0012]在本专利技术提供的方法中,还具有这样的特征:任一氨基酸在预定方向上的步长的表达式如下:
[0013][0014][0015][0016][0017]其中,所述所述及所述分别表示氨基酸j在预定方向a、b、c、d上的步长。
[0018]在本专利技术提供的方法中,还具有这样的特征:基于任一氨基酸在预定方向上的步长任一氨基酸在预定方向上的坐标的表达式示如下:
[0019]其中,氨基酸j在预定方向a的坐标a
j
的表达式如下:
[0020][0021]氨基酸j在预定方向b的坐标b
j
的表达式如下:
[0022][0023]氨基酸j在预定方向c的坐标c
j
的表达式如下:
[0024][0025]氨基酸j在预定方向d的坐标d
j
的表达式如下:
[0026][0027]在本专利技术提供的方法中,还具有这样的特征:其中,任意两个氨基酸之间的距离表示为氨基酸j与氨基酸k之间的距离D
jk
,该D
jk
的表达式及范围分别如下:
[0028]D
jk
=(a
j

a
k
)2+(b
j

b
k
)2+(c
j

c
k
)2+(d
j

d
k
)2[0029][0030]在本专利技术提供的方法中,还具有这样的特征:伊辛哈密顿量H0(q)的表达式如下:
[0031]H0(q)=H
back
(q)+H
olap
(q)+H
pair
(q)
[0032]其中,q为二进制氨基酸序列,H
back
(q)用于惩罚氨基酸折返,H
olap
(q)用于惩罚氨基酸重叠,H
pair
(q)表示对应晶格上相邻的非键合氨基酸之间的相互作用。
[0033]在本专利技术提供的方法中,还具有这样的特征:其中,基于步长的表达式,H
back
(q)的表达式如下:
[0034][0035]λ
back
为常数,
[0036]H
olap
(q)的表达式如下:
[0037][0038]g(k,j)表示是否引入松弛项,表达式如下:
[0039][0040]γ
jk
=λ
olap
[2
μjk

D
jk

α
jk
]2,γ
jk
表示修改后的松弛项为了避免松弛变量α
jk
为负值,λ
olap
为常数,α
jk
表示氨基酸j与氨基酸k的松弛变量,该松弛变量的范围为0≤α
jk
≤(j

k)2‑
1,μjk为每个松弛变量需要编码的量子比特数,并且该量子比特数μjk的表达式如下:μjk=[2log2(k

j)]g(k,j)。
[0041]在本专利技术提供的方法中,还具有这样的特征:其中,H
pair
(q)的表达式如下:
[0042][0043]P
jk
为第j个氨基酸与第k个氨基酸之间的非键和相互作用,
[0044]ω
jk
代表是否引入非键合相互作用,该ω
jk
的表达式如下:
[0045][0046]专利技术的作用与效果
[0047]根据本专利技术所涉及的基于量子退火的蛋白质折叠方法,因为该方法将蛋白质折叠问题编码为可计算的优化问题(QUBO形式),具体采用正四面体格点模型模拟氨基酸多肽链分子在三维空间中的构成,并定义编码后的二进制氨基酸序列中任一氨基酸在预定方向上的步长、坐标及任意两个氨基酸之间的距离,通过添加约束条件构建对应的伊辛哈密顿量,最后利用本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于量子退火的蛋白质折叠方法,其特征在于,包括:将待处理氨基酸序列中的每一个氨基酸映射到正四面体格点模型的每一个格点上;根据所述正四面体格点模型的预定结构将所述待处理氨基酸序列编码为对应的二进制氨基酸序列;定义所述二进制氨基酸序列中任一氨基酸在预定方向上的步长、坐标及任意两个氨基酸之间的距离;基于所述二进制氨基酸序列构建伊辛哈密顿量;利用量子退火机对所述伊辛哈密顿量进行演化,演化得到的能量最优解即为蛋白质对应的最稳定构像。2.根据权利要求1所述的方法,其特征在于:其中,所述正四面体格点模型中所有晶格包括第一类格点A与第二类格点B,一个所述第一类格点A分别指向四个所述第二类格点B,并将该指向的方向采用预定的方式进行编码。3.根据权利要求1所述的方法,其特征在于,还包括:其中,所述正四面体格点模型中所有晶格包括第一类格点A与第二类格点B,四个所述第一类格点A分别指向一个所述第二类格点B,并将该指向的方向采用预定的方式进行编码。4.根据权利要求1所述的方法,其特征在于:其中,所述二进制氨基酸序列包括:q=11 00 q
1 q
2 q
3 q4…
q(2N

7)q(2N

6)所述1100为所述待处理氨基酸序列中前三个氨基酸的编码方式。5.根据权利要求1所述的方法,其特征在于:所述任一氨基酸在预定方向上的步长的表达式如下:所述任一氨基酸在预定方向上的步长的表达式如下:所述任一氨基酸在预定方向上的步长的表达式如下:所述任一氨基酸在预定方向上的步长的表达式如下:其中,所述所述所述及所述分别表示氨基酸j在预定方向a、b、c、d上的步长。6.根据权利要求5所述的方法,其特征在于:基于所述任一氨基酸在预定方向上的步长所述任一氨基酸在预定方向上的所述坐标的表达式示如下:其中,氨基酸j在预定方向a的坐标a
j
的表达式如下:
氨基酸j在预定方向b的坐标b
j
的表达式如下:氨基酸j在预定方向c的坐标c
j
的表达式如下:氨基酸j在预定方向d的坐标d
j
的表达式如下:7.根据权利要求1所述的方法,其特征在于:其中,所述任意两个氨基酸之间的距离表示为氨基酸j与氨基酸k之间的距离D
jk
,该D
jk
的表达式及范围分别如下:D
jk
=(a
j

【专利技术属性】
技术研发人员:钱龙
申请(专利权)人:上海图灵智算量子科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1