一种基于Mamba的药物-靶标相互作用预测方法技术

技术编号：43256429 阅读：18 留言：0更新日期：2024-11-08 20:38

本发明专利技术涉及一种基于Mamba的药物‑靶标相互作用预测方法，属于自然语言处理技术领域。其包括以下步骤：S1.获取药物和靶标蛋白的分子序列，对所述药物和靶标蛋白的分子序列进行处理，得到药物和靶标蛋白的子结构序列；S2.构建基于Mamba的药物‑靶标相互作用预测模型，所述模型包括嵌入层、Mamba层、混合注意力机制层、条件参数卷积层以及全连接层；S3.所述药物和靶标蛋白的子结构序列经过所述基于Mamba的药物‑靶标相互作用预测模型，得到药物靶标相互作用预测概率。本发明专利技术通过结合混合注意力和条件参数卷积提高了药物‑靶标相互作用预测的准确度和效率。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于自然语言处理，具体涉及一种基于mamba的药物-靶标相互作用预测方法。

技术介绍

1、在药物发现和开发过程中，理解和预测药物与其靶标蛋白之间的相互作用是一个关键的研究领域。传统的药物靶标相互作用预测方法通常依赖于大规模的实验筛选，这不仅成本高昂，而且效率较低。随着生物信息学和计算生物学的快速发展，利用计算方法预测药物与蛋白之间的相互作用成为了一种有效的替代策略。现有的计算方法大多基于静态的分子结构模拟或者简单的统计学习模型，这些方法往往忽略了药物和靶标蛋白之间动态变化的复杂性。此外，这些模型在处理大规模的多维度数据时，往往无法有效捕捉药物和蛋白之间的细微交互，导致预测的准确性不足。

2、因此，本专利技术提出了一种基于mamba的药物-靶标相互作用预测方法解决上述问题。

技术实现思路

1、本专利技术针对现有技术的不足，提供了一种基于mamba的药物-靶标相互作用预测方法。

2、本专利技术为实现上述目的，通过以下技术方案实现：

3、一种基于mamba的药物-靶标相互作用预测方法，包括以下步骤：

4、s1.获取药物和靶标蛋白的分子序列，对所述药物和靶标蛋白的分子序列进行处理，得到药物和靶标蛋白的子结构序列；

5、s2.构建基于mamba的药物-靶标相互作用预测模型，所述模型包括嵌入层、编码层、条件参数卷积层以及全连接层，所述编码层包括mamba层、混合注意力机制层；

6、s3.所述药物和靶标蛋白的子结构

7、进一步地，所述步骤s1具体包括：

8、将所述药物的分子序列转换为smiles格式的药物序列，将所述靶标蛋白的分子序列转换为氨基酸序列，然后通过bpe算法将所述smiles格式的药物序列和氨基酸序列分解成药物和靶标蛋白的子结构序列。

9、进一步地，步骤s3中，所述药物和靶标蛋白的子结构序列经过嵌入层和mamba层进行嵌入处理和特征提取，得到药物特征向量和靶标蛋白特征向量：

10、嵌入处理：将所述药物和靶标蛋白的子结构序列中的每个词进行词嵌入和位置嵌入，得到词嵌入和位置嵌入的初步向量表示，然后将所述初步向量表示进行线性组合，得到药物和靶标蛋白子结构序列嵌入向量，公式表示如下：

11、，

12、，

13、，

14、，

15、其中，表示词嵌入矩阵，表示药物和靶标蛋白的子结构序列中的第个词的索引，是位置嵌入矩阵，是词在药物和靶标蛋白的子结构序列中的位置，和分别表示词嵌入和位置嵌入的初步向量表示，和分别表示药物和靶标蛋白的子结构序列中词的数量，和分别表示药物和靶标蛋白子结构序列的嵌入向量；

16、特征提取：所述药物和靶标蛋白子结构序列的嵌入向量经过选择性状态空间模型ssm进行特征提取得到药物和靶标蛋白的特征向量，公式表示如下：

17、，

18、，

19、其中，和分别表示药物和靶标蛋白的特征向量，表示对药物子结构序列嵌入向量的特征提取操作，表示对靶标蛋白子结构序列嵌入向量的特征提取操作。

20、进一步地，步骤s3中，所述药物特征向量和靶标蛋白特征向量经过混合注意力机制层进行特征增强，得到融合的药物特征向量和靶标蛋白特征向量：

21、所述混合注意力机制层包括混合注意力层生成向量单元、双线性变换单元、自注意力得分与输出向量单元和特征向量融合单元；

22、混合注意力层生成向量单元：所述药物和靶标蛋白的特征向量经过混合注意力层生成向量单元生成查询向量、键向量和值向量，公式表示如下：

23、，

24、，

25、，

26、其中，表示查询向量对应的权重矩阵，表示键向量对应的权重矩阵，表示值向量对应的权重矩阵，表示特征向量，为药物特征向量或者靶标蛋白特征向量；

27、双线性变换单元：对所述键向量进行双线性变换得到双线性变换后的键向量，公式表示如下：

28、，

29、其中，表示双线性变换的权重矩阵；

30、自注意力得分与输出向量单元：将所述查询向量和双线性变换后的键向量进行点积计算，得到注意力得分s，然后将所述注意力得分通过缩放因子进行正规化，得到注意力权重，将所述注意力权重与值向量进行乘积得到输出向量，所述输出向量经过输出线性层和层归一化得到最终的输出向量，公式表示如下：

31、，

32、，

33、，

34、，

35、其中，表示每个头部分的维度，表示经过双线性变换的键矩阵的转置，是输出线性变换的权重矩阵，表示层归一化操作，经过上述过程得到药物特征向量对应的输出向量以及最终的输出向量，同理得到靶标蛋白特征向量对应的输出向量以及最终的输出向量；

36、特征向量融合单元：将药物特征向量和最终药物输出向量进行拼接得到融合的药物特征向量，同理得到融合的靶标蛋白特征向量，计算公式如下：

37、，

38、，

39、其中，表示拼接操作。

40、进一步地，步骤s3中，所述融合的药物特征向量和靶标蛋白特征向量经过条件参数卷积层进行特征交互，得到药物-靶标对的输出表征：

41、通过交互函数对所述融合的药物特征向量和靶标蛋白特征向量进行交互处理，得到交互图，公式表示如下：

42、，

43、其中，表示交互函数，表示交互图，是一个维度为的多维张量，表示为融合的药物特征向量的长度，表示为融合的靶标蛋白特征向量的长度，代表函数的输出大小；

44、所述交互图通过条件参数卷积进行处理得到药物-靶标对的输出表征，公式表示如下：

45、，

46、其中，表示条件参数卷积操作，表示药物-靶标对的输出表征。

47、进一步地，步骤s3中，所述药物-靶标对的输出表征经过全连接层进行药物靶标相互作用的预测，通过sigmoid函数得到最终的药物靶标相互作用预测概率，计算公式如下：

48、，

49、，

50、其中，表示权重矩阵，表示偏置参数，为对药物-靶标对的输出表征进行展平后的表示，表示函数操作，表示全连接层的输出，表示最终预测概率，。

51、本专利技术的优点在于：

52、本专利技术提出了一种新的方法，结合混合注意力和条件参数卷积，用于提高药物-靶标相互作用预测中的准确度和效率。首先，通过子结构分解将药物和靶标序列分解成相应的子结构。然后进行词嵌入和位置嵌入得到嵌入向量，再利用mamba层通过选择性状态空间模型（ssm）处理输入向量，逐层提取和编码特征。再引入混合注意力机制允许模型在多个表示子空间中独立地评估药物和蛋白之间的相互作用。最后，通过条件参数卷积动态捕获药物和靶标之间的交互特征。具体来说，本专利技术通本文档来自技高网...

【技术保护点】

1.一种基于Mamba的药物-靶标相互作用预测方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的一种基于Mamba的药物-靶标相互作用预测方法，其特征在于，所述步骤S1具体包括：

3.根据权利要求1所述的一种基于Mamba的药物-靶标相互作用预测方法，其特征在于，步骤S3中，所述药物和靶标蛋白的子结构序列经过嵌入层和Mamba层进行嵌入处理和特征提取，得到药物特征向量和靶标蛋白特征向量：

4.根据权利要求1所述的一种基于Mamba的药物-靶标相互作用预测方法，其特征在于，步骤S3中，所述药物特征向量和靶标蛋白特征向量经过混合注意力机制层进行特征增强，得到融合的药物特征向量和靶标蛋白特征向量：

5.根据权利要求4所述的一种基于Mamba的药物-靶标相互作用预测方法，其特征在于，所述融合的药物特征向量和靶标蛋白特征向量经过条件参数卷积层进行特征交互，得到药物-靶标对的输出表征：

6.根据权利要求1所述的一种基于Mamba的药物-靶标相互作用预测方法，其特征在于，步骤S3中，所述药物-靶标对的输出表征经过全连接层进行药

...

【技术特征摘要】

1.一种基于mamba的药物-靶标相互作用预测方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的一种基于mamba的药物-靶标相互作用预测方法，其特征在于，所述步骤s1具体包括：

3.根据权利要求1所述的一种基于mamba的药物-靶标相互作用预测方法，其特征在于，步骤s3中，所述药物和靶标蛋白的子结构序列经过嵌入层和mamba层进行嵌入处理和特征提取，得到药物特征向量和靶标蛋白特征向量：

4.根据权利要求1所述的一种基于mamba的药物-靶标相互作用预测方法，其特征在于，步骤s3中，所述药物特征...

【专利技术属性】
技术研发人员：王星，孙旭，姚双龙，陈吉，刘烨，王振海，杨亭，
申请(专利权)人：临沂大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人