一种基于图注意力网络的反应产率预测方法及装置制造方法及图纸

技术编号：44049727 阅读：44 留言：0更新日期：2025-01-15 01:30

本发明专利技术公开一种基于图注意力网络的反应产率预测方法及装置，该方法从原始数据集中，提取设定信息数据，并对所述设定信息数据进行清洗处理，获得清洗后的信息数据；将所述清洗后的信息数据生成训练数据集；基于图注意力网络和量子化学描述符，构建反应产率预测模型；通过所述训练数据集对所述反应产率预测模型进行训练，获得训练好的反应产率预测模型；将目标反应输入所述训练好的反应产率预测模型进行预测处理，获得所述目标反应的反应产率。本发明专利技术能够充分捕捉不同反应条件对反应产率的影响，提高产率预测的性能。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及反应产率预测，具体涉及一种基于图注意力网络的反应产率预测方法及装置。

技术介绍

1、反应产率预测为化学和材料科学领域提供了重要支持，是一个备受关注的研究领域。反应产率预测旨在通过分析反应物的性质和反应条件等因素，预测化学反应的产率。在化学和材料的生产过程中，产率预测能够大大缩短化学合成规划的实验过程，降低实验成本。依赖于实验数据和人工经验的传统方法需要很多人力成本，且效率低、泛化能力弱。计算化学和机器学习技术的成功应用使得数据驱动的产率预测方法成为主流，这些方法能够从大量数据中学习到潜在的规律，实现了更准确的预测。近年来，随着深度学习的发展，产率预测方法得到了显著的进步，在药物研发和新材料设计等领域起到了重要的作用。

2、目前，基于深度学习的方法通过计算电子描述符、几何描述符等量子化学特征来描述反应物和反应条件的化学性质，利用随机森林、mlp和cnn等机器学习和深度学习模型学习这些化学性质和产率之间的潜在关系。然而，目前的方法面临两个问题：忽略了不同原子的性质对化学反应的重要性以及反应物和产物之间的局部结构变化；难以捕捉同一反应不同反应条件下的产率变化。

3、因此，如何专利技术一种反应产率预测方法，能够解决目前产率预测方法的缺点，提高产率预测的性能，成为亟需解决的问题。

技术实现思路

1、为此，本专利技术提供一种基于图注意力网络的反应产率预测方法及装置，通过量子化学描述符提取计算化学特征，将其融入到图的消息传递中实现同时学习计算化学特征和分子结

2、为了实现上述目的，本专利技术提供如下技术方案：一种基于图注意力网络的反应产率预测方法，包括：

3、从原始数据集中，提取设定信息数据，并对所述设定信息数据进行清洗处理，获得清洗后的信息数据；将所述清洗后的信息数据生成训练数据集；

4、基于图注意力网络和量子化学描述符，构建反应产率预测模型；

5、通过所述训练数据集对所述反应产率预测模型进行训练，获得训练好的反应产率预测模型；

6、将目标反应输入所述训练好的反应产率预测模型进行预测处理，获得所述目标反应的反应产率。

7、作为一种基于图注意力网络的反应产率预测方法的优选方案，在从原始数据集中，提取所述设定信息数据的过程中，所述设定信息数据包括：反应物、产物、反应条件的smiles和产率信息。

8、作为一种基于图注意力网络的反应产率预测方法的优选方案，构建所述反应产率预测模型的步骤为：

9、对反应物、产物、反应条件进行计算，获得反应物、产物和反应条件的量子化学描述符；所述量子化学描述符包括电子信息描述符和空间几何描述符；

10、根据反应物及产物的所述量子化学描述符，通过卷积神经网络学习反应物及产物的计算化学特征；

11、根据反应条件的所述量子化学描述符，通过全局注意力网络学习反应条件的计算化学特征；

12、通过基于图注意力网络的反应表示学习策略，得到反应的表示；

13、通过由全连接网络组成的预测层对所述反应的表示进行预测处理，得到产率的预测值。

14、作为一种基于图注意力网络的反应产率预测方法的优选方案，在根据反应物及产物的所述量子化学描述符，通过卷积神经网络学习反应物及产物的计算化学特征的过程中，通过卷积神经网络分别提取所述电子信息描述符和所述空间几何描述符的计算化学特征，得到电子特征和几何特征；将所述电子特征和所述几何特征，拼接得到分子中每个原子的计算化学特征。

15、作为一种基于图注意力网络的反应产率预测方法的优选方案，在根据反应条件的所述量子化学描述符，通过全局注意力网络学习反应条件的计算化学特征的过程中，对反应条件的分子，通过全局注意力网络将反应条件分子中原子的计算化学特征进行融合，得到反应条件分子的计算化学特征向量；将所有反应条件分子的所述计算化学特征向量进行融合，作为反应条件的全局表示。

16、作为一种基于图注意力网络的反应产率预测方法的优选方案，在通过基于图注意力网络的反应表示学习策略，得到反应的表示的过程中，通过图注意力网络学习反应物的局部表示；通过多层全连接网络将反应条件的所述计算化学特征进行特征变化，作为反应条件的全局表示；将所述反应物的局部表示和所述反应条件的全局表示进行融合更新，得到反应物端的表示；通过图注意力网络学习产物的局部表示，作为产物端的表示；将所述反应物端的表示和所述产物端的表示进行融合，得到反应的表示。

17、作为一种基于图注意力网络的反应产率预测方法的优选方案，所述反应产率预测模型的训练步骤为：

18、将所述训练数据集按照设定比例划分为训练集和测试集；

19、将所述训练集按批次输入所述反应产率预测模型，进行预测训练；

20、将所述测试集输入所述反应产率预测模型，计算所述反应产率预测模型的均方误差损失；根据所述均方误差损失对所述反应产率预测模型进行参数优化；

21、通过所述训练集和所述测试集对所述反应产率预测模型进行迭代训练，直至所述均方误差损失停止下降或达到迭代次数，停止训练，获得所述训练好的反应产率预测模型。

22、本专利技术还提供一种基于图注意力网络的反应产率预测装置，基于以上一种基于图注意力网络的反应产率预测方法，包括：

23、训练数据集生成模块，用于从原始数据集中，提取设定信息数据，并对所述设定信息数据进行清洗处理，获得清洗后的信息数据；将所述清洗后的信息数据生成训练数据集；

24、反应产率预测模型构建模块，用于基于图注意力网络和量子化学描述符，构建反应产率预测模型；

25、反应产率预测模型训练模块，用于通过所述训练数据集对所述反应产率预测模型进行训练，获得训练好的反应产率预测模型；

26、反应产率获取模块，用于将目标反应输入所述训练好的反应产率预测模型进行预测处理，获得所述目标反应的反应产率。

27、作为一种基于图注意力网络的反应产率预测装置的优选方案，所述训练数据集生成模块中，在从原始数据集中，提取所述设定信息数据的过程中，所述设定信息数据包括：反应物、产物、反应条件的smiles和产率信息。

28、作为一种基于图注意力网络的反应产率预测装置的优选方案，所述反应产率预测模型构建模块中，反应产率预测模型构建子模块包括：

29、量子化学描述符获取子模块，用于对反应物、产物、反应条件进行计算，获得反应物、产物和反应条件的量子化学描述符；所述量子化学描述符包括电子信息描述符和空间几何描述符；

30、反应物及产物的计算化学特征学习子模块，用于根据反应物及产物的所述量子化学描述符，通过卷积神经网络学本文档来自技高网...

【技术保护点】

1.一种基于图注意力网络的反应产率预测方法，其特征在于，包括：

2.根据权利要求1所述的一种基于图注意力网络的反应产率预测方法，其特征在于，在从原始数据集中，提取所述设定信息数据的过程中，所述设定信息数据包括：反应物、产物、反应条件的SMILES和产率信息。

3.根据权利要求2所述的一种基于图注意力网络的反应产率预测方法，其特征在于，构建所述反应产率预测模型的步骤为：

4.根据权利要求3所述的一种基于图注意力网络的反应产率预测方法，其特征在于，在根据反应物及产物的所述量子化学描述符，通过卷积神经网络学习反应物及产物的计算化学特征的过程中，通过卷积神经网络分别提取所述电子信息描述符和所述空间几何描述符的计算化学特征，得到电子特征和几何特征；将所述电子特征和所述几何特征，拼接得到分子中每个原子的计算化学特征。

5.根据权利要求4所述的一种基于图注意力网络的反应产率预测方法，其特征在于，在根据反应条件的所述量子化学描述符，通过全局注意力网络学习反应条件的计算化学特征的过程中，对反应条件的分子，通过全局注意力网络将反应条件分子中原子的计算化

6.根据权利要求5所述的一种基于图注意力网络的反应产率预测方法，其特征在于，在通过基于图注意力网络的反应表示学习策略，得到反应的表示的过程中，通过图注意力网络学习反应物的局部表示；通过多层全连接网络将反应条件的所述计算化学特征进行特征变化，作为反应条件的全局表示；将所述反应物的局部表示和所述反应条件的全局表示进行融合更新，得到反应物端的表示；通过图注意力网络学习产物的局部表示，作为产物端的表示；将所述反应物端的表示和所述产物端的表示进行融合，得到反应的表示。

7.根据权利要求6所述的一种基于图注意力网络的反应产率预测方法，其特征在于，所述反应产率预测模型的训练步骤为：

8.一种基于图注意力网络的反应产率预测装置，采用权利要求1-7任一项所述的一种基于图注意力网络的反应产率预测方法，其特征在于，包括：

9.根据权利要求8所述的一种基于图注意力网络的反应产率预测装置，其特征在于，所述反应产率预测模型构建模块中，反应产率预测模型构建子模块包括：

10.根据权利要求9所述的一种基于图注意力网络的反应产率预测装置，其特征在于，所述反应产率预测模型训练模块中，反应产率预测模型训练子模块包括：

...

【技术特征摘要】

1.一种基于图注意力网络的反应产率预测方法，其特征在于，包括：

2.根据权利要求1所述的一种基于图注意力网络的反应产率预测方法，其特征在于，在从原始数据集中，提取所述设定信息数据的过程中，所述设定信息数据包括：反应物、产物、反应条件的smiles和产率信息。

3.根据权利要求2所述的一种基于图注意力网络的反应产率预测方法，其特征在于，构建所述反应产率预测模型的步骤为：

5.根据权利要求4所述的一种基于图注意力网络的反应产率预测方法，其特征在于，在根据反应条件的所述量子化学描述符，通过全局注意力网络学习反应条件的计算化学特征的过程中，对反应条件的分子，通过全局注意力网络将反应条件分子中原子的计算化学特征进行融合，得到反应条件分子的计算化学特征向量；将所有反应条件分子的所述计算化学特征向量进...

【专利技术属性】
技术研发人员：李中伟，肖瑞，司如同，张翔宇，柳彦宏，
申请(专利权)人：烟台国工智能科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人