System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及数据处理,特别涉及一种基于扩散模型进行药物分子生成的处理方法和装置。
技术介绍
1、在药物研发领域,基于结构的药物设计(structure-based drug design, sbdd)方式是通过分析靶标蛋白质(又称目标蛋白质)分子的三维构象来设计能与其进行有效结合的配体分子。常规的分析方式是通过分子运动模拟和量子化学计算来进行处理,而通过实践应用我们发现这种常规分析方式的模拟/计算周期较长、分析效率并不高。
技术实现思路
1、本专利技术的目的,就是针对现有技术的缺陷,提供一种基于扩散模型进行药物分子生成的处理方法、装置、电子设备及计算机可读存储介质。本专利技术预先设计一个用于根据模型输入的蛋白质口袋构象进行对应的配体质心坐标和配体原子总数预测处理的模型作为分子预测模型并对其进行训练,并将三类基于扩散模型实现并已训练成熟的配体分子生成模型(diffbp模型、targetdiff模型、d3fg模型)作为对应的配体分子生成模型、原子级优化模型和组件级优化模型;然后使用上述四类模型(分子预测模型、配体分子生成模型、原子级优化模型和组件级优化模型)来自动处理配体分子的批量生成任务,并在任务处理过程中利用计算机辅助药物设计(computer-aided drug design,ccad)工具对每个配体分子的五类指标分数(ba、qed、sa、sim、lpsk)进行计算,并在任务处理结束之前对当次批量任务的五类指标分数进行统计评估。使用本专利技术基于扩散模型的配体分子设计方式对传
2、为实现上述目的,本专利技术实施例第一方面提供了一种基于扩散模型进行药物分子生成的处理方法,所述方法包括:
3、设计一个用于根据模型输入的蛋白质口袋构象进行对应的配体质心坐标和配体原子总数预测处理的模型作为分子预测模型;并基于预设的第一数据集对所述分子预测模型进行训练;并将训练成熟的diffbp模型、targetdiff模型和d3fg模型作为对应的配体分子生成模型、原子级优化模型和组件级优化模型;所述diffbp模型、所述targetdiff模型和所述d3fg模型各为一类基于扩散模型实现的配体分子生成模型;
4、接收用户输入的药物分子生成任务数据集合作为对应的第一数据集合;所述第一数据集合包括第一生成分子数量、第一蛋白质口袋构象、第一参考配体分子构象和第一指标集;所述第一生成分子数量为一个正整数;所述第一蛋白质口袋构象为一个蛋白质口袋对应的三维分子构象;所述第一参考配体分子构象为一个参考配体分子的所述三维分子构象;所述第一指标集至少包括第一ba指标阈值、第一qed指标阈值、第一sa指标阈值、第一sim指标阈值和第一lpsk指标阈值组成;所述三维分子构象由多个原子对象组成;所述原子对象包括原子索引、原子类型和原子坐标;
5、基于所述分子预测模型、所述配体分子生成模型、所述原子级优化模型和所述组件级优化模型根据所述第一数据集合进行配体分子生成任务处理得到对应的第一任务报告向用户反馈。
6、优选的,所述分子预测模型的模型输入为一个蛋白质口袋构象a0,模型输出为一个参数预测向量p;所述分子预测模型用于对模型输入的所述蛋白质口袋构象a0对应的配体分子的质心坐标和原子总数进行预测处理并输出对应的所述参数预测向量p;所述蛋白质口袋构象a0为一个蛋白质口袋对应的所述三维分子构象;所述参数预测向量p包括预测质心坐标和预测原子总数;
7、所述diffbp模型的模型输入包括蛋白质口袋构象a1、配体分子输入构象bin,1和配体分子质心坐标,模型输出为一个对应的配体分子输出构象bout,1;所述diffbp模型用于将模型输入的所述配体分子输入构象bin,1作为一个已加扰的扩散后构象,并根据模型输入的所述蛋白质口袋构象a1和所述配体分子质心坐标对当前扩散后构象中的各原子类型与坐标进行迭代去噪处理得到对应的去噪后配体构象,并将当前得到的去噪后配体构象作为对应的所述配体分子输出构象bout,1输出;其中,所述蛋白质口袋构象a1为一个蛋白质口袋对应的所述三维分子构象;所述配体分子输入构象bin,1和所述配体分子输出构象bout,1为一个与当前蛋白质口袋结合的配体分子在所述diffbp模型处理前后的所述三维分子构象;
8、所述targetdiff模型的模型输入包括蛋白质口袋构象a2和配体分子输入构象bin,2,模型输出为一个对应的配体分子输出构象bout,2;所述targetdiff模型用于将模型输入的所述配体分子输入构象bin,2作为一个已加扰的扩散后构象,并根据模型输入的所述蛋白质口袋构象a2对当前扩散后构象中的各原子类型与坐标进行迭代去噪处理得到对应的去噪后配体构象,并将当前得到的去噪后配体构象作为对应的所述配体分子输出构象bout,2输出;其中,所述蛋白质口袋构象a2为一个蛋白质口袋对应的所述三维分子构象;所述配体分子输入构象bin,2和所述配体分子输出构象bout,2为一个与当前蛋白质口袋结合的配体分子在所述targetdiff模型处理前后的所述三维分子构象;
9、所述d3fg模型的模型输入包括蛋白质口袋构象a3和配体分子输入构象bin,3,模型输出为一个对应的配体分子输出构象bout,3;所述d3fg模型用于对模型输入的所述蛋白质口袋构象a3进行对应的氨基酸组件识别得到对应的氨基酸组件集合,并对模型输入的所述配体分子输入构象bin,2进行对应的官能团与连接器组件识别得到对应的官能团组件集合和连接器组件集合,并根据所述氨基酸组件集合对所述官能团组件集合和所述连接器组件集合中的各官能团组件以及各连接器组件的三维构象进行迭代去噪处理得到对应的去噪后配体构象,并将当前得到的去噪后配体构象作为对应的所述配体分子输出构象bout,3输出;其中,所述蛋白质口袋构象a3为一个蛋白质口袋对应的所述三维分子构象;所述配体分子输入构象bin,3和所述配体分子输出构象bout,3为一个与当前蛋白质口袋结合的配体分子在所述d3fg模型处理前后的所述三维分子构象。
10、优选的,所述第一ba指标阈值为亲和力评估指标阈值;
11、所述第一qed指标阈值为药物性质定量评估指标阈值;
12、所述第一sa指标阈值为可合成性评估指标阈值;
13、所述第一sim指标阈值为结构相似性评估指标阈值;
14、所述第一lpsk指标阈值为lipinski五规则的评估指标阈值。
15、优选的,所述第一数据集包括多个第一数据记录;所述第一数据记录包括第一训练构象、第一口袋原子索引集和第一配体原子索引集;所述第一训练构象为一个复合物分子对应的所述三维分子构象,该复合物分子由一个蛋白质口袋和一个配体分子结合而成;所述第一口袋原子索引集和所述第一配体原子索引集各自都由所述第一训练构象中的多个所述原子索引组成;所述第一口袋原子索引集为当前复合物分子中蛋白质口袋的原子索引集;本文档来自技高网...
【技术保护点】
1.一种基于扩散模型进行药物分子生成的处理方法,其特征在于,所述方法包括:
2.根据权利要求1所述的基于扩散模型进行药物分子生成的处理方法,其特征在于,
3.根据权利要求1所述的基于扩散模型进行药物分子生成的处理方法,其特征在于,
4.根据权利要求2所述的基于扩散模型进行药物分子生成的处理方法,其特征在于,
5.根据权利要求4所述的基于扩散模型进行药物分子生成的处理方法,其特征在于,所述基于预设的第一数据集对所述分子预测模型进行训练,具体包括:
6.根据权利要求2所述的基于扩散模型进行药物分子生成的处理方法,其特征在于,所述基于所述分子预测模型、所述配体分子生成模型、所述原子级优化模型和所述组件级优化模型根据所述第一数据集合进行配体分子生成任务处理得到对应的第一任务报告向用户反馈,具体包括:
7.一种用于执行权利要求1-6任一项所述的基于扩散模型进行药物分子生成的处理方法的装置,其特征在于,所述装置包括:模型准备模块、任务数据接收模块和任务处理模块;
8.一种电子设备,其特征在于,包括:存储器、处
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机指令,当所述计算机指令被计算机执行时,使得所述计算机执行权利要求1-6任一项所述的方法。
...【技术特征摘要】
1.一种基于扩散模型进行药物分子生成的处理方法,其特征在于,所述方法包括:
2.根据权利要求1所述的基于扩散模型进行药物分子生成的处理方法,其特征在于,
3.根据权利要求1所述的基于扩散模型进行药物分子生成的处理方法,其特征在于,
4.根据权利要求2所述的基于扩散模型进行药物分子生成的处理方法,其特征在于,
5.根据权利要求4所述的基于扩散模型进行药物分子生成的处理方法,其特征在于,所述基于预设的第一数据集对所述分子预测模型进行训练,具体包括:
6.根据权利要求2所述的基于扩散模型进行药物分子生成的处理方法,其特征在于,所述基...
【专利技术属性】
技术研发人员:赵国江,林海涛,高志锋,吴立荣,柯国霖,张林峰,
申请(专利权)人:北京深势科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。