System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 综合逆合成、条件、反应预测的合成路线开发方法及装置制造方法及图纸_技高网

综合逆合成、条件、反应预测的合成路线开发方法及装置制造方法及图纸

技术编号:41579397 阅读:22 留言:0更新日期:2024-06-06 23:56
综合逆合成、条件、反应预测的合成路线开发方法及装置,该方法构造单步逆合成模型,通过单步反应数据库对单步逆合成模型进行训练;构造多步搜索算法模型,与训练好的单步逆合成模型组合成逆合成规划模型;将目标化合物输入合成规划模型,获得反应物和若干合成路线;构造反应条件预测模型,将若干合成路线输入模型;预测合成路线中每一步反应的反应条件;构造基于计算化学的反应预测模型,将合成路线和反应条件输入模型;将不能实现的合成路线删除,将能实现的合成路线按照可实现性进行排序,将最优的合成路线推荐给用户。本发明专利技术可以预测合成路线的反应条件,并以此评估反应合理性,将合理路线及其反应条件推荐给用户。

【技术实现步骤摘要】

本专利技术属于化学应用人工智能的,具体涉及一种综合逆合成、条件、反应预测的合成路线开发方法及装置


技术介绍

1、计算机辅助合成路线开发是化学领域应用人工智能技术的重要研究方向,成为药物发现等领域不可缺少的一部分。其任务是寻找目标化合物的合成路线,且末端分子是市售或已知的简单分子。随着深度学习的发展,合成路线的开法方法已经得到了巨大的进步,研究者们已经提出了很多优秀的方法。对于一个目标化合物,这些优秀的方法往往能够生成成百上千条合成路线可供选择。然而,这些合成路线中存在着大量的不合理的、现实中不可行的反应。如果依靠人工的方式从中筛选出合理的路线需要大量的时间和人力成本,这对使用者来说是不可行的。

2、目前,现有的评估反应合理性的方法,如使用正确反应与人造错误反应训练深度学习模型等,这些方法存在可解释性差、性能表现不佳的问题,不被化学家们所接受。此外,反应合理性问题并没有关注反应条件,因为一个反应是否合理与反应条件有直接关系。

3、因此,如何预测合成路线的反应条件,并以此评估反应合理性,从而将合理路线及其反应条件推荐给用户,成为亟需解决的问题。


技术实现思路

1、为此,本专利技术提供一种综合逆合成、条件、反应预测的合成路线开发方法及装置,可以预测合成路线的反应条件,并以此评估反应合理性,将合理路线及其反应条件推荐给用户。

2、为了实现上述目的,本专利技术提供如下技术方案:综合逆合成、条件、反应预测的合成路线开发方法,包括:

3、构造单步逆合成模型,通过单步反应数据库对所述单步逆合成模型进行训练;

4、构造多步搜索算法模型,将所述多步搜索算法模型与训练好的所述单步逆合成模型组合成逆合成规划模型;将目标化合物输入所述合成规划模型,获得反应物和若干合成路线;

5、构造反应条件预测模型,将所述若干合成路线输入所述反应条件预测模型;通过所述反应条件预测模型预测所述合成路线中每一步反应的反应条件;所述反应条件包括溶剂、试剂、催化剂和温度;

6、构造基于计算化学的反应预测模型,将所述合成路线和所述反应条件预测模型预测的反应条件输入所述反应预测模型;通过所述反应预测模型,将不满足预设规则的合成路线删除;将满足预设规则的合成路线按照可实现性进行排序,并将最优的个合成路线推荐给用户。

7、作为综合逆合成、条件、反应预测的合成路线开发方法优选方案,构造反应条件预测模型步骤包括:

8、构建包含反应条件的数据集,从所述数据集中提取单步反应的smiles表达式和所述单步反应的反应条件;提取的所述反应条件包括催化剂、第一溶剂、第二溶剂、第一试剂、第二试剂和温度;

9、将提取的所述反应条件视为一个序列关系,构建利用序列关系预测所述反应条件的rcnn序列模型,所述rcnn序列模型包括若干个隐藏层和若干个预测层;

10、将反应smiles作为所述rcnn序列模型的训练输入数据;将提取的所述反应条件作为所述rcnn序列模型的训练标签数据;将所述训练输入数据、所述训练标签数据均划分为训练集、验证集和测试集;将所述训练集数据输入所述rcnn序列模型,对所述rcnn序列模型进行批次训练;通过批次训练后,将所述验证集输入所述rcnn序列模型,对所述rcnn序列模型进行迭代训练;将所述测试集输入所述rcnn序列模型,对所述rcnn序列模型进行性能验证。

11、作为综合逆合成、条件、反应预测的合成路线开发方法优选方案,构造基于计算化学的反应预测模型的步骤包括:

12、将通过所述逆合成规划模型得到的合成路线中的simles结果转化为三维笛卡尔坐标;将提取的所述反应条件输入所述反应预测模型;

13、将所述合成路线的初始反应物作为起始点,通过所述反应预测模型进行反应路径搜索计算,根据初始反应物与产物的差异,判断参与化学反应的原子对;

14、根据选择的原子对坐标计算出搜索方向,通过计算最优转动角对所述搜索方向进行优化,使所述搜索方向指向过渡态;通过重复计算最优转动角对所述搜索方向进行迭代优化,直至发生化学反应,结束优化过程;

15、通过对原子对的搜索方向优化,获得产物信息;将所述搜索方向优化过程中出现的势能最高点作为过渡态位置接近点;根据所述过渡态位置接近点构造二聚体结构,通过计算所述二聚体结构最优转动角,对所述二聚体结构的搜索方向进行优化;优化完成后,通过平移力公式更新所述二聚体结构的位置,使所述二聚体结构逐步靠近过渡态;所述平移力公式为:

16、;

17、式中,为二聚体结构转动力;为二聚体结构的力沿二聚体方向的分量;为二聚体结构的局域曲率;

18、将过渡态能量与反应物能量之间的差值作为反应是否可实现性的定性指标;将获得的产物作为反应物,并验证所有合成路线的可实现性。

19、作为综合逆合成、条件、反应预测的合成路线开发方法优选方案,通过所述反应预测模型,将不满足预设规则的合成路线删除;将满足预设规则的合成路线按照可实现性进行排序,并将最优的个合成路线推荐给用户的步骤包括:

20、设置一个过渡态阈值作为判断合成路线是否可实现的标准;

21、将获得所述合成路线的所有反应的过渡态与所述过渡态阈值进行比较,若合成路线中最大的过渡态大于该过渡态阈值,则该合成路线不能实现并删除;若合成路线中最大的过渡态小于该过渡态阈值,则该合成路线能实现并保留;

22、将所有能实现的反应的过渡态进行归一化,得到反应可行性值;

23、将所述合成路线上所有反应的所述可行性值的算术平均值作为所述合成路线的可行性值;

24、将所述合成路线的可行性值按照大小进行排序,输出最优的个合成路线。

25、作为综合逆合成、条件、反应预测的合成路线开发方法优选方案,所述最优转动角计算公式为:

26、;

27、;

28、;

29、式中,为最优转动角;为二聚体结构的局域曲率;为二聚体结构的测试转动角;为局域曲率随转动角度的变化率;和为变量;和通过构造二聚体结构进行计算,计算步骤为:

30、将所述原子对的当前结构沿着确定方向移动距离,得到所述原子对的新的结构,所述原子对的新的结构和所述原子对的当前结构一起构成二聚体结构;计算得出的梯度为,的梯度为,、和计算公式为:

31、;

32、;

33、;

34、式中,为沿二聚体结构转动力方向的单位张量;的计算公式为:

35、;

36、;

37、式中,为二聚体结构转动力;

38、通过计算得到最优转动角,将所述原子对的初始搜索方向进行转动,完成搜索方向优化的公式为:

39、;

40、式中,为优化后的搜索方向;

41、确定优化后的搜索方向后,将所述原子对的当前结构沿着优化后的搜索方向移动,步长为s,并添加本文档来自技高网...

【技术保护点】

1.综合逆合成、条件、反应预测的合成路线开发方法,其特征在于,包括:

2.根据权利要求1所述的综合逆合成、条件、反应预测的合成路线开发方法,其特征在于,构造反应条件预测模型步骤包括:

3.根据权利要求2所述的综合逆合成、条件、反应预测的合成路线开发方法,其特征在于,构造基于计算化学的反应预测模型的步骤包括:

4.根据权利要求3所述的综合逆合成、条件、反应预测的合成路线开发方法,其特征在于,通过所述反应预测模型,将不满足预设规则的合成路线删除;将满足预设规则的合成路线按照可实现性进行排序,并将最优的个合成路线推荐给用户的步骤包括:

5.根据权利要求4所述的综合逆合成、条件、反应预测的合成路线开发方法,其特征在于,所述最优转动角计算公式为:

6.综合逆合成、条件、反应预测的合成路线开发装置,采用权利要求1至5任一项所述的综合逆合成、条件、反应预测的合成路线开发方法,其特征在于,包括:

7.根据权利要求6所述的综合逆合成、条件、反应预测的合成路线开发装置,其特征在于,所述反应条件预测模型构造及预测模块中,还包括:</p>

8.根据权利要求7所述的综合逆合成、条件、反应预测的合成路线开发装置,其特征在于,所述反应预测模型构造及预测模块中,还包括:

9.根据权利要求8所述的综合逆合成、条件、反应预测的合成路线开发装置,其特征在于,所述反应预测模型构造及预测模块中,通过所述反应预测模型,将不满足预设规则的合成路线删除;将满足预设规则的合成路线按照可实现性进行排序,并将最优的个合成路线推荐给用户;所述反应预测模型构造及预测模块中还包括;

...

【技术特征摘要】

1.综合逆合成、条件、反应预测的合成路线开发方法,其特征在于,包括:

2.根据权利要求1所述的综合逆合成、条件、反应预测的合成路线开发方法,其特征在于,构造反应条件预测模型步骤包括:

3.根据权利要求2所述的综合逆合成、条件、反应预测的合成路线开发方法,其特征在于,构造基于计算化学的反应预测模型的步骤包括:

4.根据权利要求3所述的综合逆合成、条件、反应预测的合成路线开发方法,其特征在于,通过所述反应预测模型,将不满足预设规则的合成路线删除;将满足预设规则的合成路线按照可实现性进行排序,并将最优的个合成路线推荐给用户的步骤包括:

5.根据权利要求4所述的综合逆合成、条件、反应预测的合成路线开发方法,其特征在于,所述最优转动角计算公式为:

6.综合逆...

【专利技术属性】
技术研发人员:李中伟祝艺玮肖瑞胡策柳彦宏
申请(专利权)人:烟台国工智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1