System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于深度强化学习和课程学习的片段连接小分子化合物的优化方法技术_技高网
当前位置: 首页 > 专利查询>中山大学专利>正文

一种基于深度强化学习和课程学习的片段连接小分子化合物的优化方法技术

技术编号:43581292 阅读:4 留言:0更新日期:2024-12-06 17:46
本发明专利技术公开了一种基于深度强化学习和课程学习的片段连接小分子化合物的优化方法,涉及人工智能和药物分子优化领域。所述方法包括:建立监督训练集;建立初始的基于图神经网络的先验模型,利用监督训练集确定若干个针对不同药物设计任务的先验模型;在课程学习框架下,利用先验模型进行强化学习,得到具备目标属性的生产模型;利用生产模型进行大规模的分子生成。相较于现有技术,本发明专利技术所述方法解决了过往模型生成较多无效性分子以及非真实结构化合物的问题,通过较小的计算成本即可生成具有复杂的期望属性的药物分子。

【技术实现步骤摘要】

本专利技术涉及人工智能和药物分子优化,更具体地,涉及一种基于深度强化学习和课程学习的片段连接小分子化合物的优化方法


技术介绍

1、基于片段的药物设计(fragment-based drug discovery,fbdd)从低分子量片段的筛选开始,然后逐步进行分子优化,由于其筛选成本低和能够高效识别先导化合物的能力而受到制药行业的广泛关注。在fbdd中,一种有用的分子优化策略是片段连接,将结合在不同但相邻的子口袋中的两个分子片段通过适当的连接物连接在一起。传统的计算连接物设计方法基于片段数据库搜索,结合通过物理模拟来确定链接化合物子集的优先级。这些方法本质上受到所用片段数据库的小化学空间和物理模拟的计算复杂性的限制。最近,基于深度学习的生成方法的发展使得能够以数据驱动的方式探索更大的化学空间以进行连接物设计。

2、基于深度学习的模型方法中,人们提出了各种生成架构,例如循环神经网络(rnn)、变压器(transformer)神经网络和自动编码器(vae),以生成用于从头药物设计和先导化合物优化的所需分子,这些生成策略也被有效地用于fbdd中的连接物设计。yang等人提出了一种基于smiles的模型syntalinker,该模型通过条件变换器神经网络将片段链接视为句子完成任务,并生成具有链接器长度约束的完整分子;imrie等人开发了基于图形的模型delinker,该模型通过链接器设计过程中两个片段之间的相对方向和距离明确合并3d结构信息。e(3)-等变接头设计模型,包括huang等人开发的3dlinker和igashov等人开发的difflinker,其性能与初始坐标无关,已被开发用于生成保留两个片段的空间构型的分子接头。与传统的计算方法相比,这些深度学习模型能够搜索更大的化学空间并生成更多样化的连接物。

3、尽管这些深度生成模型在chembl、zinc等数据集上训练后生成连接物取得了不错的效果,然而很多方法无法针对特异性靶点或特定目标性质设计药物分子。例如syntalinker等模型在chembl数据集上生成的smiles只有极低的合法性,完全无法得到正确的连接物;而delinker等模型是基于图的方式进行训练的,其合法性得到了保证,但生成的连接物与真实的连接物结构差距较大。同时此类预训练模型习得的是训练集分子分布,故生成的连接物属性也只能接近于训练集,无法生成具有任意期望属性的分子,从而无法很好的解决一些药物分子成药性、合成可行性之类的问题。对于部分引入了强化学习技术的模型,尽管可以缓解生成目标属性分子的问题,但当目标属性过于复杂时,强化学习的计算成本较高,甚至无法达到收敛状态。


技术实现思路

1、本专利技术为克服上述现有技术所述的无法兼顾合法性、真实性和期望属性的缺陷,提供一种基于深度强化学习和课程学习的片段连接小分子化合物的优化方法。

2、为解决上述技术问题,本专利技术的技术方案如下:

3、第一方面,一种基于深度强化学习和课程学习的片段连接小分子化合物的优化方法,包括:

4、建立监督训练集;其中,所述监督训练集包括分子图表示形式的若干个片段分子四元组和解码路线;

5、建立初始的基于图神经网络的先验模型,利用所述监督训练集确定若干个针对不同药物设计任务的所述先验模型;

6、在课程学习框架下,利用所述先验模型进行强化学习,得到具备目标属性的生产模型;

7、利用所述生产模型进行大规模的分子生成。

8、第二方面,一种电子设备,包括:

9、存储器,用于存储计算机可执行指令或者计算机程序;

10、处理器,用于执行所述存储器中存储的计算机可执行指令或者计算机程序时,实现第一方面所述方法。

11、第三方面,一种计算机程序产品,包括计算机程序或计算机可执行指令,所述计算机程序或计算机可执行指令被处理器执行时,实现第一方面所述方法。

12、与现有技术相比,本专利技术技术方案的有益效果是:

13、本申请公开了一种基于深度强化学习和课程学习的片段连接小分子化合物的优化方法,通过在监督训练集上训练出基于图神经网络的先验模型,解决了过往模型生成较多无效性分子以及非真实结构化合物的问题,保证了模型基本的生成能力;在此基础上,引入强化学习从而灵活的改变模型生成分布,使得模型生成具有期望属性的药物分子;还通过引入课程学习框架,弥补强化学习在生成复杂目标属性任务的短板,使模型通过较小的计算成本生成具有复杂属性的药物分子。

本文档来自技高网...

【技术保护点】

1.一种基于深度强化学习和课程学习的片段连接小分子化合物的优化方法,其特征在于,包括:

2.根据权利要求1所述的一种基于深度强化学习和课程学习的片段连接小分子化合物的优化方法,其特征在于,所述在课程学习框架下,利用所述先验模型进行强化学习,包括:

3.根据权利要求2所述的一种基于深度强化学习和课程学习的片段连接小分子化合物的优化方法,其特征在于,所述强化学习的过程包括:

4.根据权利要求3所述的一种基于深度强化学习和课程学习的片段连接小分子化合物的优化方法,其特征在于,所述策略梯度方法,包括:

5.根据权利要求1所述的一种基于深度强化学习和课程学习的片段连接小分子化合物的优化方法,其特征在于,所述监督训练集的建立过程包括:

6.根据权利要求1所述的一种基于深度强化学习和课程学习的片段连接小分子化合物的优化方法,其特征在于,所述利用所述监督训练集确定若干个针对不同药物设计任务的所述先验模型,包括:

7.根据权利要求1-6任一项所述的一种基于深度强化学习和课程学习的片段连接小分子化合物的优化方法,其特征在于,所述先验模型包括GGNN区块以及全局读出区块;其中,

8.根据权利要求7所述的一种基于深度强化学习和课程学习的片段连接小分子化合物的优化方法,其特征在于,所述全局读出区块由多个多层感知机MLP构成;所述动作概率APD通过下式计算得到:

9.一种电子设备,其特征在于,包括:

10.一种计算机程序产品,包括计算机程序或计算机可执行指令,其特征在于,所述计算机程序或计算机可执行指令被处理器执行时,实现权利要求1-8任一项所述方法。

...

【技术特征摘要】

1.一种基于深度强化学习和课程学习的片段连接小分子化合物的优化方法,其特征在于,包括:

2.根据权利要求1所述的一种基于深度强化学习和课程学习的片段连接小分子化合物的优化方法,其特征在于,所述在课程学习框架下,利用所述先验模型进行强化学习,包括:

3.根据权利要求2所述的一种基于深度强化学习和课程学习的片段连接小分子化合物的优化方法,其特征在于,所述强化学习的过程包括:

4.根据权利要求3所述的一种基于深度强化学习和课程学习的片段连接小分子化合物的优化方法,其特征在于,所述策略梯度方法,包括:

5.根据权利要求1所述的一种基于深度强化学习和课程学习的片段连接小分子化合物的优化方法,其特征在于,所述监督训练集的建立过程包括:

6.根据权利要求1所述的一种基于深度...

【专利技术属性】
技术研发人员:雷金平张昊陈红明徐明远
申请(专利权)人:中山大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1