System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及数据处理,特别涉及一种对分子片段的结合位点进行预测的处理方法和装置。
技术介绍
1、在分子对接、合成化学以及分子编辑等领域,分子片段(或合成砌块)之间的结合位点不同则有可能使得结合分子(由两个分子片段拼接而成、或由两个合成砌块拼接而成)的片段(或砌块)结合效率以及整体分子性质不同。因此在分子对接/合成/编辑等分子设计任务的处理过程中,都需要具备一种预测手段能对两个分子片段(或两个合成砌块)的最佳结合位点进行预测。目前,这种预测手段还主要依赖科研人员的人工经验实现,具体就是在预测之前先使用一些量子计算工具对两个分子片段(或两个合成砌块)的一些经验参数进行测算、再基于测算结果以及人工经验或预设的一系列对接规则进行对接位点分析。很显然,这种常规预测手段的缺陷是比较明显的:1)预测效率比较低;2)受人工经验/规则的局限性限制,对新的连接方式的发现能力较弱。
技术实现思路
1、本专利技术的目的,就是针对现有技术的缺陷,提供一种对分子片段的结合位点进行预测的处理方法、装置、电子设备及计算机可读存储介质。本专利技术构建一个用于对模型输入的第一、第二分子片段进行结合位点预测处理并输出对应的结合概率预测向量的结合位点预测模型;并通过大数据采集构建第一数据集来对结合位点预测模型进行训练;在模型训练结束后利用结合位点预测模型对用户输入的任意两个三维分子片段结构的结合位点信息进行识别并将识别信息向当前用户反馈。通过本专利技术给出的端到端的结合位点预测模型,一方面可以提高预测效率,另一方面也可
2、为实现上述目的,本专利技术实施例第一方面提供了一种对分子片段的结合位点进行预测的处理方法,所述方法包括:
3、构建结合位点预测模型;所述结合位点预测模型用于对模型输入的第一、第二分子片段进行结合位点预测处理并输出对应的结合概率预测向量;
4、构建模型训练数据集记为对应的第一数据集;并基于所述第一数据集对所述结合位点预测模型进行训练;
5、模型训练结束后,接收用户输入的两个三维分子片段结构作为对应的片段结构a、b;并利用所述结合位点预测模型对所述片段结构a、b的结合位点信息进行识别并将识别信息向当前用户反馈。
6、优选的,所述第一、第二分子片段各为一个三维分子片段结构;
7、所述第一分子片段包括第一原子集合和第一化学键集合;
8、所述第一原子集合包括多个第一原子;所述第一原子的原子属性至少包括第一原子标识、第一原子类型、第一原子坐标、第一原子手性属性集;所述第一原子标识为当前所述第一原子的唯一标识;所述第一原子类型为当前所述第一原子的化学元素类型;所述第一原子坐标为当前所述第一原子的三维空间坐标;所述第一原子手性属性集由多个第一手性属性组成;每个所述第一手性属性由对应的属性类型和属性值组成;若所述第一原子为一个手性中心原子,则对应的所述第一原子手性属性集中的所有属性值不为空;若所述第一原子并非手性中心原子,则对应的所述第一原子手性属性集中的所有属性值为空;
9、所述第一化学键集合包括多个第一化学键;所述第一化学键的化学键属性至少包括第一化学键标识、第一化学键类型、第一成键原子组;所述第一化学键标识为当前所述第一化学键的唯一标识;所述第一化学键类型包括多种化学键类型;所述第一成键原子组由当前所述第一化学键连接的两个所述第一原子的所述第一原子标识组成;
10、所述第二分子片段包括第二原子集合和第二化学键集合;
11、所述第二原子集合包括多个第二原子;所述第二原子的原子属性至少包括第二原子标识、第二原子类型、第二原子坐标、第二原子手性属性集;所述第二原子标识为当前所述第二原子的唯一标识;所述第二原子类型为当前所述第二原子的化学元素类型;所述第二原子坐标为当前所述第二原子的三维空间坐标;所述第二原子手性属性集由多个第二手性属性组成;每个所述第二手性属性由对应的属性类型和属性值组成;若所述第二原子为一个手性中心原子,则对应的所述第二原子手性属性集中的所有属性值不为空;若所述第二原子并非手性中心原子,则对应的所述第二原子手性属性集中的所有属性值为空;
12、所述第二化学键集合包括多个第二化学键;所述第二化学键的化学键属性至少包括第二化学键标识、第二化学键类型、第二成键原子组;所述第二化学键标识为当前所述第二化学键的唯一标识;所述第二化学键类型包括多种化学键类型;所述第二成键原子组由当前所述第二化学键连接的两个所述第二原子的所述第二原子标识组成。
13、优选的,所述结合位点预测模型的第一、第二模型输入端分别用于接收模型输入的所述第一、第二分子片段,模型输出端用于输出对应的所述结合概率预测向量;
14、所述结合位点预测模型包括编码初始化模块、图神经编码网络和mlp网络;
15、所述编码初始化模块的第一、第二输入端分别与所述第一、第二模型输入端连接,输出端与所述图神经编码网络的输入端连接;所述图神经编码网络的输出端与所述mlp网络的输入端连接;所述mlp网络的输出端与所述模型输出端连接;
16、所述编码初始化模块用于根据模型输入的所述第一、第二分子片段进行分子图构建得到对应的分子图g;并根据所述分子图g进行状态编码初始化处理得到对应的状态编码张量h0向所述图神经编码网络发送;
17、所述分子图g包括节点集合v和边集合e;
18、所述节点集合v由n1+n2个节点vi组成;所述边集合e由多个边ei,j组成;1≤节点索引i≤n1+n2,1≤节点索引j≤n1+n2,j≠i,n1、n2分别为所述第一、第二分子片段的原子总数;所述节点vi与一个所述第一原子或一个所述第二原子对应;所述边ei,j与一个所述第一化学键或一个所述化学键对应;
19、所述状态编码张量h0包括n1+n2个节点状态向量h0,i;所述节点状态向量h0,i与所述节点vi一一对应;所述节点状态向量h0,i由原子类型特征、原子坐标特征、手性特征集合、关联化学键特征集合和跨片段距离特征集合组成;
20、所述原子类型特征为当前所述节点状态向量h0,i对应的所述第一或第二原子对应的所述第一或第二原子类型的独热编码;
21、所述原子坐标特征为当前所述节点状态向量h0,i对应的所述第一或第二原子对应的所述第一或第二原子原子坐标;
22、所述手性特征集合由多个手性属性特征组成;每个所述手性属性特征为当前所述节点状态向量h0,i对应的所述第一或第二原子对应的所述第一或第二原子手性属性集中的一个所述第一或第二手性属性的特征编码向量;
23、所述关联化学键特征集合由一个或多个关联化学键特征组成;所述关联化学键特征包括化学键类型特征、化学键方向特征;每个所述关联化学键特征与当前所述节点状态向量h0,i对应的所述第一或第二原子对应的一个所述第一或第二化学键对应;所述化学键类型特征为当前对应的所述第一或第二化学键的本文档来自技高网...
【技术保护点】
1.一种对分子片段的结合位点进行预测的处理方法,其特征在于,所述方法包括:
2.根据权利要求1所述的对分子片段的结合位点进行预测的处理方法,其特征在于,
3.根据权利要求2所述的对分子片段的结合位点进行预测的处理方法,其特征在于,
4.根据权利要求3所述的对分子片段的结合位点进行预测的处理方法,
5.根据权利要求4所述的对分子片段的结合位点进行预测的处理方法,所述构建模型训练数据集记为对应的第一数据集,具体包括;
6.根据权利要求4所述的对分子片段的结合位点进行预测的处理方法,所述基于所述第一数据集对所述结合位点预测模型进行训练,具体包括;
7.根据权利要求3所述的对分子片段的结合位点进行预测的处理方法,所述利用所述结合位点预测模型对所述片段结构A、B的结合位点信息进行识别并将识别信息向当前用户反馈,具体包括;
8.一种用于执行权利要求1-7任一项所述的对分子片段的结合位点进行预测的处理方法的装置,其特征在于,所述装置包括:模型构建模块、模型训练模块和模型应用模块;
9.一种电子设备,
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机指令,当所述计算机指令被计算机执行时,使得所述计算机执行权利要求1-7任一项所述的方法。
...【技术特征摘要】
1.一种对分子片段的结合位点进行预测的处理方法,其特征在于,所述方法包括:
2.根据权利要求1所述的对分子片段的结合位点进行预测的处理方法,其特征在于,
3.根据权利要求2所述的对分子片段的结合位点进行预测的处理方法,其特征在于,
4.根据权利要求3所述的对分子片段的结合位点进行预测的处理方法,
5.根据权利要求4所述的对分子片段的结合位点进行预测的处理方法,所述构建模型训练数据集记为对应的第一数据集,具体包括;
6.根据权利要求4所述的对分子片段的结合位点进行预测的处理方法,所述基于所述第一数据集对所述结合位点预测模型进行训练,具体包括;<...
【专利技术属性】
技术研发人员:赵国江,高志锋,柯国霖,张林峰,
申请(专利权)人:北京深势科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。