分子编解码器的训练方法、装置、设备及存储介质制造方法及图纸

技术编号:39247746 阅读:10 留言:0更新日期:2023-10-30 11:59
本申请公开了一种分子编解码器的训练方法、装置、设备及存储介质,属于人工智能领域。该方法包括:获取训练样本分子的第一分子图和属性标签;对第一分子图中的部分节点的特征执行掩码操作,得到第二分子图;通过分子编码器对第二分子图进行编码,得到第一特征向量;对第一特征向量中的部分节点的特征向量执行再掩码操作,得到第二特征向量;基于第二特征向量,生成第三分子图;通过分子解码器对第三分子图进行解码,得到第三特征向量;基于第三特征向量,得到训练样本分子的预测属性值;基于训练样本分子的预测属性值和属性标签之间的误差,训练分子编码器和分子解码器。上述方法降低了分子编码器的训练难度。降低了分子编码器的训练难度。降低了分子编码器的训练难度。

【技术实现步骤摘要】
分子编解码器的训练方法、装置、设备及存储介质


[0001]本申请涉及人工智能领域,特别涉及一种分子编解码器的训练方法、装置、设备及存储介质。

技术介绍

[0002]在电池材料和药物材料研发等场景下,已经出现通过人工智能来寻找合适的分子材料的方案。具体实现时,将通过分子编码器编码得到分子的具有结构感知的特征表示,之后利用具有结构感知的特征表示进行分子属性预测。
[0003]相关技术中,采用对比学习的方式训练得到分子编码器。训练分子编码器的核心步骤在于对正负样本的构建,即将一个训练批次中的某些分子图看作正样本,某些分子图看作负样本,正负样本的选择基于相似度函数,相似度高于阈值的为正样本,反之为负样本。在特征空间通过对比学习训练得到分子编码器。
[0004]采用对比学习的方式训练分子编码器依赖于复杂的数据增强和训练策略,使得分子编码器的训练难度较大。

技术实现思路

[0005]本申请提供了一种分子编解码器的训练方法、装置、设备及存储介质,降低了分子编码器的训练难度。所述技术方案如下:
[0006]根据本申请的一个方面,提供了一种分子编码器和分子解码器的训练方法,所述方法包括:
[0007]获取训练样本分子的第一分子图和属性标签,所述第一分子图是由多个节点和多个边构成的图结构,所述节点与原子相对应,所述边与化学键相对应;
[0008]对所述第一分子图中的部分节点的特征执行掩码操作,得到第二分子图;通过所述分子编码器对所述第二分子图进行编码,得到第一特征向量;
[0009]对所述第一特征向量中的所述部分节点的特征向量执行再掩码操作,得到第二特征向量;基于第二特征向量,生成第三分子图;通过分子解码器对所述第三分子图进行解码,得到第三特征向量;
[0010]基于所述第三特征向量,得到所述训练样本分子的预测属性值;
[0011]基于所述训练样本分子的预测属性值和所述属性标签之间的误差,训练所述分子编码器和所述分子解码器。
[0012]根据本申请的一个方面,提供了一种分子编码器和分子解码器的训练装置,所述装置包括:
[0013]获取模块,用于获取训练样本分子的第一分子图和属性标签,所述第一分子图是由多个节点和多个边构成的图结构,所述节点与原子相对应,所述边与化学键相对应;
[0014]处理模块,用于对所述第一分子图中的部分节点的特征执行掩码操作,得到第二分子图;通过所述分子编码器对所述第二分子图进行编码,得到第一特征向量;
[0015]所述处理模块,还用于对所述第一特征向量中的所述部分节点的特征向量执行再掩码操作,得到第二特征向量;基于所述第二特征向量,生成第三分子图;通过分子解码器对所述第三分子图进行解码,得到第三特征向量;
[0016]预测模块,用于基于所述第三特征向量,得到所述训练样本分子的预测属性值;
[0017]训练模块,用于基于所述训练样本分子的预测属性值和所述属性标签之间的误差,训练所述分子编码器和所述分子解码器。
[0018]根据本申请的一个方面,提供了一种计算机设备,所述计算机设备包括:处理器和存储器,所述存储器存储有计算机程序,所述计算机程序由所述处理器加载并执行以实现如上所述的分子编码器和分子解码器的训练方法。
[0019]根据本申请的另一方面,提供了一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序由处理器加载并执行以实现如上所述的分子编码器和分子解码器的训练方法。
[0020]根据本申请的另一个方面,提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述分子编码器和分子解码器的训练方法。
[0021]本申请实施例提供的技术方案带来的有益效果至少包括:
[0022]通过对分子中部分节点的特征进行掩码操作,再根据分子编码器的编码操作和分子解码器的解码操作,还原得到部分节点的输入特征,输入特征是指在执行第一次掩码操作之前被掩码节点的特征。根据还原后的训练样本分子的整体特征预测训练样本分子的属性,根据预测结果与标签之间的误差,训练分子编码器和分子解码器。即,上述方法避免了采用相关技术对分子编码器进行训练,相关技术的对比学习方式需要依赖的复杂数据增强和训练策略,上述方法降低了分子编码器的训练难度。
[0023]并且,在训练过程中,实质上仅考虑了被掩码节点(分子中的部分节点)的特征对属性预测结果的影响,相比于考虑整个分子对属性预测结果的影响,能减少运算量,提高了分子编码器和分子解码器的训练速度。
附图说明
[0024]为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0025]图1是本申请一个示例性实施例提供的分子编码器和分子解码器的训练原理的示意图;
[0026]图2是本申请一个示例性实施例提供的分子编码器和分子解码器的训练方法的流程图;
[0027]图3是本申请一个示例性实施例提供的分子编码器和分子解码器的训练阶段的示意图;
[0028]图4是本申请另一个示例性实施例提供的分子编码器和分子解码器的训练方法的
流程图;
[0029]图5是本申请另一个示例性实施例提供的分子编码器和分子解码器的训练方法的流程图;
[0030]图6是本申请一个示例性实施例提供的分子编码器的测试方法的流程图;
[0031]图7是本申请一个示例性实施例提供的分子编码器的测试阶段的示意图;
[0032]图8是本申请一个示例性实施例提供的分子编码器的测试方法的示意图;
[0033]图9是本申请一个示例性实施例提供的分子编码器和分子解码器的训练装置的结构框图;
[0034]图10是本申请一个示例性实施例提供的计算机设备的结构框图。
具体实施方式
[0035]为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。
[0036]首先,对本申请实施例中涉及的名词进行简单介绍:
[0037]人工智能(Artificial Intelligence,AI):是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
[0038]人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种分子编码器和分子解码器的训练方法,其特征在于,所述方法包括:获取训练样本分子的第一分子图和属性标签,所述第一分子图是由多个节点和多个边构成的图结构,所述节点与原子相对应,所述边与化学键相对应;对所述第一分子图中的部分节点的特征执行掩码操作,得到第二分子图;通过所述分子编码器对所述第二分子图进行编码,得到第一特征向量;对所述第一特征向量中的所述部分节点的特征向量执行再掩码操作,得到第二特征向量;基于所述第二特征向量,生成第三分子图;通过分子解码器对所述第三分子图进行解码,得到第三特征向量;基于所述第三特征向量,得到所述训练样本分子的预测属性值;基于所述训练样本分子的预测属性值和所述属性标签之间的误差,训练所述分子编码器和所述分子解码器。2.根据权利要求1所述的方法,其特征在于,所述第一分子图、所述第二分子图和所述第三分子图为2D分子图,所述2D分子图未携带有所述节点的空间位置特征;所述分子编码器包括多头注意力网络和前馈神经网络;所述通过所述分子编码器对所述第二分子图进行编码,得到第一特征向量,包括:在所述多头注意力网络中,基于所述第二分子图的查询矩阵Q和键值矩阵K,生成所述第二分子图的注意力权重;基于所述第二分子图的注意力权重和价值矩阵V,生成所述第二分子图的注意力特征向量;在所述前馈神经网络中,基于所述第二分子图的注意力特征向量,编码得到所述第一特征向量;其中,所述查询矩阵Q、所述键值矩阵K和所述价值矩阵V是基于所述第二分子图中的所述多个节点和所述多个边的特征生成的。3.根据权利要求1所述的方法,其特征在于,所述第一分子图、所述第二分子图和所述第三分子图为3D分子图,所述3D分子图携带有所述节点的空间位置特征;所述分子编码器包括多头注意力网络和前馈神经网络;所述通过所述分子编码器对所述第二分子图进行编码,得到第一特征向量,包括:在所述多头注意力网络中,基于所述第二分子图的查询矩阵Q、键值矩阵K和价值矩阵V,得到第一注意力项;将所述第二分子图中所述多个节点之间的间隔距离进行编码,结合所述价值矩阵V,得到第二注意力项;基于所述第一注意力项和所述第二注意力项,生成所述第二分子图的注意力特征向量;在所述前馈神经网络中,基于所述第二分子图的注意力特征向量,编码得到所述第一特征向量;其中,所述第二分子图中所述多个节点之间的间隔距离中与所述部分节点相关的间隔距离被设置为空;所述查询矩阵Q、所述键值矩阵K和所述价值矩阵V是基于所述第二分子图中所述多个节点的特征中除所述空间位置特征之外的特征以及所述多个边的特征生成的,所述第二分子图中所述多个节点之间的间隔距离是根据所述多个节点的空间位置特征确定得到的。4.根据权利要求1所述的方法,其特征在于,所述第一分子图、所述第二分子图和所述第三分子图为3D分子图,所述3D分子图携带有所述节点的空间位置特征;所述方法还包括:
在所述第三特征向量中的所述部分节点的空间位置特征加入噪声;基于加入噪声后的第三特征向量,得到所述训练样本分子的预测空间位置特征;所述基于所述训练样本分子的预测属性值和所述属性标签之间的误差,训练所述分子编码器和所述分子解码器,包括:基于所述训练样本分子的预测属性值和所述属性标签之间的误差,以及所述训练样本分子的预测空间位置特征和所述训练样本分子的真实空间位置特征之间的误差,训练所述分子编码器和所述分子解码器。5.根据权利要求1至4任一所述的方法,其特征在于,所述方法还包括:对所述第一分子图中的多个原子进行基团组合,得到至少一个化学基团;从所述至少一个化学基团中确定出至少一个目标化学基团;将所述至少一个目标化学基团对应的节点确定为所述部分节点。6.根据权利要求1至4任一所述的方法,其特征在于,所述方法还包括:从所述第一分子图中确定出分别仅与一个化学键相连的多个边缘节点;从所述多个边缘节点中确定出至少一个目标边缘节点;从所述第一分子图中确定出处于最长化学链上的至少一个定位节点;从所述至少一个定位节点中确定出至少一个目标定位节点;根据所述至少一个目标边缘节点和所述至少一个目标定位节点,得到所述...

【专利技术属性】
技术研发人员:张昊
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1