System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及人工智能,尤其涉及一种结合蛋白质的小分子生成方法、装置、电子设备和存储介质。
技术介绍
1、分子设计包括构建具有所需特征的分子,是一个关键计算药物发现的任务,它在药物发现中起着关键作用。
2、现有的结合蛋白质的小分子生成方法包括基于分子对接方法和基于深度学习的方法。分子对接是一种计算方法,用于预测蛋白质和小分子之间的结合方式和相互作用强度。分子对接需要用到评估函数来评估每个生成小分子配体的效果,存在着对评估函数比较敏感、准确率低以及耗时比较高等问题。基于深度学习的方法或者采样生成的多样性低,或者需要依赖先验知识。
技术实现思路
1、本专利技术提供一种结合蛋白质的小分子生成方法、装置、电子设备和存储介质,用以解决现有技术中小分子生成方法耗时较高、准确性和多样性较低的缺陷。
2、本专利技术提供一种结合蛋白质的小分子生成方法,包括:
3、获取包含蛋白质的复合物的全原子结构;
4、基于已训练的全原子模型中的编码模块,提取所述全原子结构的编码特征;
5、基于隐空间上已训练的去噪扩散概率模型,应用所述全原子结构的编码特征,生成小分子特征;
6、基于所述全原子模型中的解码模块,对所述小分子特征进行特征解码,得到对应的小分子三维结构,并基于所述小分子三维结构生成对应的小分子序列。
7、根据本专利技术提供的结合蛋白质的小分子生成方法,所述编码模块包括连续编码模块和码本模块,所述基于已训练的全原子模型中的
8、基于所述连续编码模块,提取所述全原子结构的第一连续特征;
9、基于所述码本模块,对所述第一连续特征进行离散化,得到离散特征,并将所述离散特征编码得到的第二连续特征作为所述编码特征。
10、根据本专利技术提供的结合蛋白质的小分子生成方法,所述连续编码模块包括特征提取器、图神经网络和自注意力单元,所述基于所述连续编码模块,提取所述全原子结构的第一连续特征,包括:
11、基于所述特征提取器,提取所述全原子结构的初始节点特征和初始边特征;
12、基于所述图神经网络,对所述初始节点特征和初始边特征进行更新,得到更新节点特征和更新边特征;
13、基于所述自注意力单元,提取所述更新节点特征的注意力节点特征,并基于所述注意力节点特征和所述更新边特征确定所述第一连续特征。
14、根据本专利技术提供的结合蛋白质的小分子生成方法,所述基于所述特征提取器,提取所述全原子结构的初始节点特征和初始边特征,包括:
15、基于所述特征提取器,提取所述全原子结构的初始节点特征中的向量特征和标量特征,以及提取所述初始边特征中的向量特征和标量特征。
16、根据本专利技术提供的结合蛋白质的小分子生成方法,所述基于所述自注意力单元,提取所述更新节点特征的注意力节点特征,包括:
17、对所述更新节点特征中的向量特征进行处理得到三维不变特征;
18、将所述三维不变特征与所述更新节点特征中的标量特征进行拼接,得到拼接特征;
19、基于所述自注意力单元,应用所述拼接特征之间的相关性,提取所述拼接特征的注意力节点特征。
20、根据本专利技术提供的结合蛋白质的小分子生成方法,所述全原子模型的训练步骤包括:获取包含蛋白质的样本复合物的样本全原子结构;
21、基于初始全原子模型中的连续编码模块,提取所述样本全原子结构的样本连续特征;
22、基于所述初始全原子模型中的码本模块,对所述样本连续特征进行离散化,得到样本离散特征;
23、基于所述初始全原子模型中的解码模块,对所述样本离散特征编码得到的连续特征进行解码,得到解码全原子结构;
24、基于所述样本全原子结构与所述解码全原子结构之间的差异,以及所述样本离散特征,对所述初始全原子模型进行参数迭代,得到所述全原子模型。
25、根据本专利技术提供的结合蛋白质的小分子生成方法,所述去噪扩散概率模型在训练过程中基于样本蛋白质的特征编码,以及隐空间下不同长度的噪音小分子特征,生成不同大小的小分子特征估计。
26、本专利技术还提供一种结合蛋白质的小分子生成装置,包括:
27、结构获取单元,用于获取包含蛋白质的复合物的全原子结构;
28、特征提取单元,用于基于已训练的全原子模型中的编码模块,提取所述全原子结构的编码特征;
29、特征生成单元,用于基于隐空间上已训练的去噪扩散概率模型,应用所述全原子结构的编码特征,生成小分子特征;
30、特征解码单元,用于基于所述全原子模型中的解码模块,对所述小分子特征进行特征解码,得到对应的小分子三维结构,并基于所述小分子三维结构生成对应的小分子序列。
31、本专利技术还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述结合蛋白质的小分子生成方法。
32、本专利技术还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述结合蛋白质的小分子生成方法。
33、本专利技术还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述任一种所述结合蛋白质的小分子生成方法。
34、本专利技术提供的结合蛋白质的小分子生成方法、装置、电子设备和存储介质,通过已训练的全原子模型,建模蛋白质各原子和小分子原子间的相互作用以提取全原子结构的编码特征。在此基础上,通过隐空间上已训练的去噪扩散概率模型,应用全原子结构的编码特征,实现对小分子的设计,提高了生成的小分子的多样性,同时提高了小分子生成效率和准确性。
本文档来自技高网...【技术保护点】
1.一种结合蛋白质的小分子生成方法,其特征在于,包括:
2.根据权利要求1所述的结合蛋白质的小分子生成方法,其特征在于,所述编码模块包括连续编码模块和码本模块,所述基于已训练的全原子模型中的编码模块,提取所述全原子结构的编码特征,包括:
3.根据权利要求2所述的结合蛋白质的小分子生成方法,其特征在于,所述连续编码模块包括特征提取器、图神经网络和自注意力单元,所述基于所述连续编码模块,提取所述全原子结构的第一连续特征,包括:
4.根据权利要求3所述的结合蛋白质的小分子生成方法,其特征在于,所述基于所述特征提取器,提取所述全原子结构的初始节点特征和初始边特征,包括:
5.根据权利要求4所述的结合蛋白质的小分子生成方法,其特征在于,所述基于所述自注意力单元,提取所述更新节点特征的注意力节点特征,包括:
6.根据权利要求1至5中任一项所述的结合蛋白质的小分子生成方法,其特征在于,所述全原子模型的训练步骤包括:
7.根据权利要求1至5中任一项所述的结合蛋白质的小分子生成方法,其特征在于,所述去噪扩散概率模型在训练过程中
8.一种结合蛋白质的小分子生成装置,其特征在于,包括:
9.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至7任一项所述结合蛋白质的小分子生成方法。
10.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述结合蛋白质的小分子生成方法。
...【技术特征摘要】
1.一种结合蛋白质的小分子生成方法,其特征在于,包括:
2.根据权利要求1所述的结合蛋白质的小分子生成方法,其特征在于,所述编码模块包括连续编码模块和码本模块,所述基于已训练的全原子模型中的编码模块,提取所述全原子结构的编码特征,包括:
3.根据权利要求2所述的结合蛋白质的小分子生成方法,其特征在于,所述连续编码模块包括特征提取器、图神经网络和自注意力单元,所述基于所述连续编码模块,提取所述全原子结构的第一连续特征,包括:
4.根据权利要求3所述的结合蛋白质的小分子生成方法,其特征在于,所述基于所述特征提取器,提取所述全原子结构的初始节点特征和初始边特征,包括:
5.根据权利要求4所述的结合蛋白质的小分子生成方法,其特征在于,所述基于所述自注意力单元,提取所述更新节点特征的注意力节点特征,包括:
【专利技术属性】
技术研发人员:陈凌辉,徐景明,
申请(专利权)人:安徽元构生物科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。