基于生物分子对的亲和力数据的模型训练方法及相关装置制造方法及图纸

技术编号:39275601 阅读:7 留言:0更新日期:2023-11-07 10:52
本申请实施例公开了一种基于生物分子对的亲和力数据的模型训练方法及相关装置,其中的方法包括:获取目标生物实验组;利用亲和力关系预测模型对第一生物分子对和第二生物分子对进行亲和力关系预测,得到第一生物分子对和第二生物分子对之间的预测亲和力关系;基于第一生物分子对和第二生物分子对之间的预测亲和力关系,和每个生物分子对的亲和力标签,对亲和力关系预测模型进行预训练;将预训练好的亲和力关系预测模型迁移至亲和力数据预测模型中;对亲和力数据预测模型进行模型微调,以得到微调好的亲和力数据预测模型。采用本申请实施例能够确保亲和力数据预测模型的亲和力预测性能。力预测性能。力预测性能。

【技术实现步骤摘要】
基于生物分子对的亲和力数据的模型训练方法及相关装置


[0001]本申请涉及计算机
,尤其涉及人工智能领域,具体涉及一种基于生物分子对的亲和力数据的模型训练方法、一种基于生物分子对的亲和力数据的模型训练装置、一种计算机设备、一种计算机可读存储介质及一种计算机程序产品。

技术介绍

[0002]药物设计是基于生物学靶点知识寻找新药物的过程;药物设计的基本目标是预测生物分子对(如受体“蛋白质”和配体“药物”)之间的结合亲和力,准确有效的预测生物分子对之间的结合亲和力可以加速新药的发现。
[0003]目前,支持采用模型来实现对生物分子对的亲和力预测。然而,基于生物实验组(或者简称为生物实验)所测定的测定结果(如通过生物实验测定的生物分子对的结合亲和力)来构建用于模型训练的训练数据集的方式,受限于不同生物实验的实验环境差异所带来的测定结果偏差的问题,导致难以利用这些生物实验的测定结果来进行模型训练。

技术实现思路

[0004]本申请实施例提供一种基于生物分子对的亲和力数据的模型训练方法及相关装,能够有效确保训练好的亲和力数据预测模型的预测性能。
[0005]一方面,本申请实施例提供了一种亲和力处理方法,该方法包括:
[0006]获取目标生物实验组,目标生物实验组中包含第一生物分子对,第二生物分子对,以及每个生物分子对的亲和力标签;生物分子对中包含一个受体和一个配体,第一生物分子对和第二生物分子对中的受体相同;
[0007]利用亲和力关系预测模型对第一生物分子对和第二生物分子对进行亲和力关系预测,得到第一生物分子对和第二生物分子对之间的预测亲和力关系,预测亲和力关系用于表征各生物分子对的亲和力数据的比较结果;
[0008]基于第一生物分子对和第二生物分子对之间的预测亲和力关系,和每个生物分子对的亲和力标签,对亲和力关系预测模型进行预训练;
[0009]将预训练好的亲和力关系预测模型迁移至亲和力数据预测模型中;
[0010]对亲和力数据预测模型进行模型微调,以得到微调好的亲和力数据预测模型;微调好的亲和力数据预测模型用于预测生物分子对的亲和力数据。
[0011]另一方面,本申请实施例提供了一种亲和力处理装置,该装置包括:
[0012]获取单元,用于获取目标生物实验组,目标生物实验组中包含第一生物分子对,第二生物分子对,以及每个生物分子对的亲和力标签;生物分子对中包含一个受体和一个配体,第一生物分子对和第二生物分子对中的受体相同;
[0013]处理单元,用于利用亲和力关系预测模型对第一生物分子对和第二生物分子对进行亲和力关系预测,得到第一生物分子对和第二生物分子对之间的预测亲和力关系,预测亲和力关系用于表征各生物分子对的亲和力数据的比较结果;
[0014]处理单元,还用于基于第一生物分子对和第二生物分子对之间的预测亲和力关系,和每个生物分子对的亲和力标签,对亲和力关系预测模型进行预训练;
[0015]处理单元,还用于将预训练好的亲和力关系预测模型迁移至亲和力数据预测模型中;
[0016]处理单元,还用于对亲和力数据预测模型进行模型微调,以得到微调好的亲和力数据预测模型;微调好的亲和力数据预测模型用于预测生物分子对的亲和力数据。
[0017]在一种实现方式中,目标生物实验组中还包含每个生物分子对的一个或多个候选对接构象,一个候选对接构象对应一个对接概率;对接概率用于表征:生物分子对按照候选对接构象进行结合的概率;处理单元,还用于:
[0018]从第一生物分子对的一个或多个候选对接构象中,为第一生物分子对确定目标对接构象;以及,
[0019]从第二生物分子对的一个或多个候选对接构象中,为第二生物分子对确定目标对接构象;
[0020]目标对接构象是相应生物分子对的一个或多个候选对接构象中对接概率最大的候选对接构象。
[0021]在一种实现方式中,处理单元,用于利用亲和力关系预测模型对第一生物分子对和第二生物分子对进行亲和力关系预测,得到第一生物分子对和第二生物分子对之间的预测亲和力关系时,具体用于:
[0022]利用亲和力关系预测模型对第一生物分子对的目标对接构象进行特征表示,得到第一生物分子对的目标对接构象的特征表示;目标对接构象的特征表示用于表征目标对接构象中受体和配体之间的反应特性;以及,
[0023]利用亲和力关系预测模型第二生物分子对的目标对接构象进行特征表示,得到第二生物分子对的目标对接构象的特征表示;
[0024]利用亲和力关系预测模型对第一生物分子对的目标对接构象的特征表示,及第二生物分子对的目标对接构象的特征表示进行亲和力关系预测,得到第一生物分子对和第二生物分子对之间的预测亲和力关系。
[0025]在一种实现方式中,亲和力关系预测模型中包含底层编码器;处理单元,用于利用亲和力关系预测模型对第一生物分子对的目标对接构象进行特征表示,得到第一生物分子对的目标对接构象的特征表示时,具体用于:
[0026]获取第一生物分子对中的受体的三维结构,第一生物分子对中的配体的三维结构及第一生物分子对的目标对接构象;
[0027]基于受体的三维结构构建受体关联的受体图,基于配体的三维结构构建配体关联的配体图,以及基于第一生物分子对的目标对接构象构建第一生物分子对关联的受体配体交互图;
[0028]利用底层编码器对受体图,配体关联的配体图和第一生物分子对关联的受体配体交互图进行编码,得到第一生物分子对的目标对接构象的特征表示。
[0029]在一种实现方式中,处理单元,用于利用底层编码器对受体图,配体关联的配体图和第一生物分子对关联的受体配体交互图进行编码,得到第一生物分子对的目标对接构象的特征表示时,具体用于:
[0030]利用底层编码器对受体图进行编码,得到所述受体图中每个残基的特征表示;所述残基的特征表示用于表征所述残基的残基特性;
[0031]利用所述底层编码器对所述配体图进行编码,得到配体图中每个原子的特征表示,原子的特征表示用于表征原子的原子特性;
[0032]基于每个残基的特征表示和配体图中每个原子的特征表示,构建受体配体交互图中各连边的特征表示;连边的特征表示用于表征连边所连接的原子和残基之间的相互作用;
[0033]基于注意力机制和受体配体交互图中各连边的特征表示,生成第一生物分子对的目标对接构象的特征表示。
[0034]在一种实现方式中,注意力机制包括以下至少一个:求和注意力机制和最大注意力机制;在注意力机制包括求和注意力机制和最大注意力机制时,处理单元,用于基于注意力机制和受体配体交互图中各连边的特征表示,生成第一生物分子对的目标对接构象的特征表示时,具体用于:
[0035]基于求和注意力机制确定第一生物分子对的目标对接构象的第一候选特征表示;第一候选特征表示用于从全局维度表征第一生物分子对的目标对接构象中受体和配体之间的反应特性;以及,
[0036]基于最大注意力机制从本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于生物分子对的亲和力数据的模型训练方法,其特征在于,包括:获取目标生物实验组,所述目标生物实验组中包含第一生物分子对,第二生物分子对,以及每个生物分子对的亲和力标签;所述生物分子对中包含一个受体和一个配体,所述第一生物分子对和所述第二生物分子对中的受体相同;利用亲和力关系预测模型对所述第一生物分子对和所述第二生物分子对进行亲和力关系预测,得到所述第一生物分子对和所述第二生物分子对之间的预测亲和力关系,所述预测亲和力关系用于表征各生物分子对的亲和力数据的比较结果;基于所述第一生物分子对和所述第二生物分子对之间的预测亲和力关系,和所述每个生物分子对的亲和力标签,对所述亲和力关系预测模型进行预训练;将预训练好的亲和力关系预测模型迁移至亲和力数据预测模型中;对所述亲和力数据预测模型进行模型微调,以得到微调好的亲和力数据预测模型;微调好的所述亲和力数据预测模型用于预测生物分子对的亲和力数据。2.如权利要求1所述的方法,其特征在于,所述目标生物实验组中还包含每个生物分子对的一个或多个候选对接构象,一个候选对接构象对应一个对接概率;对接概率用于表征:生物分子对按照所述候选对接构象进行结合的概率;所述利用亲和力关系预测模型对所述第一生物分子对和所述第二生物分子对进行亲和力关系预测,得到所述第一生物分子对和所述第二生物分子对之间的预测亲和力关系之前,还包括:从所述第一生物分子对的一个或多个候选对接构象中,为所述第一生物分子对确定目标对接构象;以及,从所述第二生物分子对的一个或多个候选对接构象中,为所述第二生物分子对确定目标对接构象;所述目标对接构象是相应生物分子对的一个或多个候选对接构象中对接概率最大的候选对接构象。3.如权利要求2所述的方法,其特征在于,所述利用亲和力关系预测模型对所述第一生物分子对和所述第二生物分子对进行亲和力关系预测,得到所述第一生物分子对和所述第二生物分子对之间的预测亲和力关系,包括:利用亲和力关系预测模型对所述第一生物分子对的目标对接构象进行特征表示,得到所述第一生物分子对的目标对接构象的特征表示;所述目标对接构象的特征表示用于表征所述目标对接构象中受体和配体之间的反应特性;以及,利用亲和力关系预测模型对所述第二生物分子对的目标对接构象进行特征表示,得到所述第二生物分子对的目标对接构象的特征表示;利用亲和力关系预测模型对所述第一生物分子对的目标对接构象的特征表示,及所述第二生物分子对的目标对接构象的特征表示进行亲和力关系预测,得到所述第一生物分子对和所述第二生物分子对之间的预测亲和力关系。4.如权利要求3所述的方法,其特征在于,所述亲和力关系预测模型中包含底层编码器;所述利用亲和力关系预测模型对所述第一生物分子对的目标对接构象进行特征表示,得到所述第一生物分子对的目标对接构象的特征表示,包括:获取所述第一生物分子对中的受体的三维结构,所述第一生物分子对中的配体的三维结构及所述第一生物分子对的目标对接构象;
基于所述受体的三维结构构建所述受体关联的受体图,基于所述配体的三维结构构建所述配体关联的配体图,以及基于所述第一生物分子对的目标对接构象构建所述第一生物分子对关联的受体配体交互图;利用所述底层编码器对所述受体图,所述配体关联的配体图和所述第一生物分子对关联的受体配体交互图进行编码,得到所述第一生物分子对的目标对接构象的特征表示。5.如权利要求4所述的方法,其特征在于,所述利用所述底层编码器对所述受体图,所述配体关联的配体图和所述第一生物分子对关联的受体配体交互图进行编码,得到所述第一生物分子对的目标对接构象的特征表示,包括:利用所述底层编码器对所述受体图进行编码,得到所述受体图中每个残基的特征表示;所述残基的特征表示用于表征所述残基的残基特性;利用所述底层编码器对所述配体图进行编码,得到所述配体图中每个原子的特征表示,所述原子的特征表示用于表征所述原子的原子特性;基于所述每个残基的特征表示和所述配体图中每个原子的特征表示,构建所述受体配体交互图中各连边的特征表示;连边的特征表示用于表征所述连边所连接的原子和残基之间的相互作用;基于注意力机制和所述受体配体交互图中各连边的特征表示,生成所述第一生物分子对的目标对接构象的特征表示。6.如权利要求5所述的方法,其特征在于,所述注意力机制包括以下至少一个:求和注意力机制和最大注意力机制;在所述注意力机制包括所述求和注意力机制和所述最大注意力机制时,所述基于注意力机制和所述受体配体交互图中各连边的特征表示,生成所述第一生物分子对的目标对接构象的特征表示,包括:基于所述求和注意力机制确定所述第一生物分子对的目标对接构象的第一候选特征表示;所述第一候选特征表示用于从全局维度表征所述第一生物分子对的目标对接构象中受体和配体之间的反应特性;以及,基于所述最大注意力机制从所述第一生物分子对的目标对接构象的各连边的特征表示中,确定出所述第一生物分子对的目标对接构象的第二候选特征表示;第二候选特征表示用于从局部维度表征所述第一生物分子对的目标对接构象中受体和配体之间的反应特性;将所述第一候选特征表示和所述第二候选特征标识进行拼接运算,得到所述第一生物分子对的目标对接构象的特征表示。7.如权利要求3所述的方法,其特征在于,所述亲和力关系预测模型中包含多个排序任务模块,一个排序任务模块对应一种亲和力类型;所述亲和力类型是生物分子对的亲和力数据所属的数据类型,所述亲和力数据用于指示生物分子对中的受体和配体在结合时的亲和力;所述生物分子对的亲和力标签中包含亲和力类型标签,且所述第一生物分子对和所述第二生物分子对的亲和力类型标签相同;所述利用亲和力关系预测模型对所述第一生物分子对的目标对接构象的特征表示,及所述第二生物分子对的目标对接构象的特征表示进行亲和力关系预测,得到所述第一生物分子对和所述第二生物分子对之间的预测...

【专利技术属性】
技术研发人员:严家贤叶兆丰裘捷中杨子翊张胜誉
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1