一种模型训练方法及装置制造方法及图纸

技术编号：37605054 阅读：19 留言：0更新日期：2023-05-18 11:56

本申请提供了一种模型训练方法及装置。包括：获取模型训练样本，模型训练样本包括蛋白口袋；将模型训练样本输入至待训练蛋白口袋内分子生成模型，待训练蛋白口袋内分子生成模型包括：N个循环连接的网络层；调用N个循环连接的网络层对蛋白口袋进行逐个原子预测处理，得到蛋白口袋对应的预测原子类型、预测中心原子、预测原子位置和预测原子键连关系；基于预测原子类型、预测中心原子、预测原子位置和预测原子键连关系，计算得到待训练蛋白口袋内分子生成模型的损失值；在损失值处于预设范围内的情况下，将训练后的待训练蛋白口袋内分子生成模型作为最终的蛋白口袋内分子生成模型。本申请可以实现可靠有效的基于口袋的三维分子从头设计，提高模型训练效率。提高模型训练效率。提高模型训练效率。

全部详细技术资料下载

【技术实现步骤摘要】
一种模型训练方法及装置

[0001]本申请涉及人工智能
，特别是涉及一种模型训练方法及装置。

技术介绍

[0002]分子从头设计是理性药物设计当中的重要一环，但是目前的分子从头设计方法大部分是通过对化学空间采样，然后生成对应的二维分子，无法显式地捕捉到小分子和蛋白口袋结构的相互作用。同时，2D分子生成模型面临过拟合，难以泛化的问题。
[0003]目前基于深度学习框架的全新药物设计方法按照训练模型时使用的分子表征类型可以分为两类：第一类是基于2D的全新药物设计方法；第二类是基于3D的全新药物设计方法。
[0004]而2D的全新药物设计方法，存在没有底层物理的支持，模型面临过拟合，泛化能力低以及生成的分子合理但随机的问题。而3D的全新药物设计方法，则无法有效捕捉和蛋白质口袋之间的作用力模式，生成的分子结构不合理，亲和力无法超过原位配体，对算力显存消耗大，训练低效，难以直接应用于现实世界的药物设计。

技术实现思路

[0005]本申请实施例所要解决的技术问题是提供一种模型训练方法及装置，以捕捉到更高尺度的相互作用，使得模型生成的分子与蛋白口袋发生合理的几何匹配和能量匹配，实现了可靠的，有效的基于口袋的三维分子从头设计。同时，引入了两个尺度的自回归模式，即全局尺度和原子组件尺度，完成对口袋内分子的几何和拓扑结构学习，在给定口袋结构之后即可以生成与这个口袋相匹配的分子。
[0006]第一方面，本申请实施例提供了一种模型训练方法，所述方法包括：
[0007]获取模型训练样本，所...

【技术保护点】

【技术特征摘要】
1.一种模型训练方法，其特征在于，所述方法包括：获取模型训练样本，所述模型训练样本包括：蛋白口袋；将所述模型训练样本输入至待训练蛋白口袋内分子生成模型，所述待训练蛋白口袋内分子生成模型包括：N个循环连接的网络层，N为正整数；调用N个所述循环连接的网络层对所述蛋白口袋进行逐个原子预测处理，得到所述蛋白口袋对应的预测原子类型、预测中心原子、预测原子位置和预测原子键连关系；基于所述预测原子类型、所述预测中心原子、所述预测原子位置和所述预测原子键连关系，计算得到所述待训练蛋白口袋内分子生成模型的损失值；在所述损失值处于预设范围内的情况下，将训练后的待训练蛋白口袋内分子生成模型作为最终的蛋白口袋内分子生成模型。2.根据权利要求1所述的方法，其特征在于，每个所述网络层包括：特征提取网络层、向量表征网络层和原子预测网络层，所述调用N个所述循环连接的网络层对所述蛋白口袋进行逐个原子预测处理，得到所述蛋白口袋对应的预测原子、预测中心原子、预测原子位置和预测原子键连关系，包括：在采用第M个网络层对所述蛋白口袋进行处理时，调用所述第M个网络层的特征提取网络层提取所述蛋白口袋内的第M个原子的原子特征；M为大于1的正整数，且M≤N；调用所述第M个网络层的向量表征网络层对所述原子特征进行向量表征处理，得到所述第M个原子的原子特征向量；调用所述第M个网络层的原子预测网络层对所述原子特征向量进行处理，得到所述蛋白口袋的第M个原子对应的预测原子、预测中心原子、预测原子位置和预测原子键连关系。3.根据权利要求2所述的方法，其特征在于，所述原子预测网络层包括：位置预测层、原子类型预测层、中心原子预测层和键类型预测层，所述调用所述第M个网络层的原子预测网络层对所述原子特征向量进行处理，得到所述第M个原子对应的预测原子类型、预测中心原子、预测原子位置和预测原子键连关系，包括：调用所述位置预测层根据第M
‑
1个网络层选定的中心原子对所述原子特征向量进行处理，预测得到所述第M个原子的预测原子位置；调用所述原子类型预测层根据第M
‑
1个网络层选定的中心原子对所述原子特征向量进行处理，预测得到所述第M个原子的预测原子类型；调用所述键类型预测层根据第M
‑
1个网络层选定的中心原子对所述原子特征向量进行处理，预测得到所述第M个原子与所述第M
‑
1个网络层生成的原子之间的预测原子键连关系；调用所述中心原子预测层根据已生成的原子的概率值，从M个已生成的原子中筛选出第M个网络层的预测中心原子。4.根据权利要求1所述的方法，其特征在于，所述基于所述预测原子类型、所述预测中心原子、所述预测原子位置和所述预测原子键连关系，计算得到所述待训练蛋白口袋内分子生成模型的损失值，包括：基于所述预测中心原子和所述蛋白口袋的标注中心原子，计算得到原子中心损失值；基于所述预测原子位置，计算得到位置损失值；
基于所述预测原子类型和所述蛋白口袋的标注原子类型，计算得到类型损失值；基于所述预测原子键连关系和所述蛋白口袋的标注原子键连关系，计算得到键类型损失值；基于所述原子中心损失值、所述位置损失值、所述类型损失值和所述键类型损失值，计算得到所述待训练蛋白口袋内分子生成模型的损失值。5.根据权利要求1所述的方法，其特征在于，在所述将训练后的待训练蛋白口袋内分子生成模型作为最终的蛋白口袋内分子生成模型之后，还包括：获取待处理蛋白口袋；将所述待处理蛋白口袋输入至所述蛋白口袋内分子生成模型；调用N个所述循环连接的网络层对所述待处理蛋白口袋进行逐个原子处理，预测得到所述待处理蛋白口袋对应的原子类型、中心原子、原子位置和原子键连关系；基于所述原子类型、所述中心原子、所述原子位置和所述原子键连关系，生成所述待处理蛋白口袋对应的分子三维结构。6.一种模型训练装置，其特征在于，所...

【专利技术属性】
技术研发人员：张昊天，侯廷军，谢昌谕，曹东升，邓亚峰，施慧，
申请(专利权)人：杭州碳硅智慧科技发展有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人