System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 基于序列的药物-靶点相互作用的预测方法及系统技术方案_技高网

基于序列的药物-靶点相互作用的预测方法及系统技术方案

技术编号:40972990 阅读:11 留言:0更新日期:2024-04-18 21:22
本发明专利技术公开了基于序列的药物‑靶点相互作用的预测方法及系统,属于药物靶点相互作用关系预测技术领域,本发明专利技术要解决的技术问题为如何提高药物‑靶点相互作用预测的准确性,技术方案为:获取待预测的药物SMILES序列和蛋白质的氨基酸序列;通过嵌入技术分别对药物SMILES序列和蛋白质的氨基酸序列进行编码,生成药物嵌入特征向量和蛋白质嵌入特征向量;将药物嵌入特征向量和蛋白质嵌入特征向量分别通过特征提取器生成药物表征特征和蛋白质表征特征;将药物表征特征和蛋白质表征特征通过相互作用块生成药物‑靶点相互作用表示特征向量,并获取药物和蛋白质的全局特征表示;将药物‑靶点相互作用表示特征向量通过全连接层获取药物‑靶点相互作用预测结果。

【技术实现步骤摘要】

本专利技术涉及药物靶点相互作用关系预测,具体地说是一种基于序列的药物-靶点相互作用的预测方法及系统


技术介绍

1、药物与靶点的相互作用是指药物与生物体内的特定部位结合,从而引起生理变化。靶点可以是蛋白质或核酸等生物分子,药物与其结合以实现生理变化。

2、药物-靶点相互作用(drug-target interaction,dti)预测是药物发现过程中的重要步骤之一。它可以加速药物发现过程、降低失败风险、解释副作用与机制,并指导药物组合优化。具体而言,dti预测可快速筛选和评估候选药物,节省时间和成本。通过准确预测药物与靶点的相互作用,可发现潜在药物-靶点对,并识别不良相互作用,提高研发成功率。dti预测的研究对推动药物研发和优化具有重要意义。

3、传统的药物-靶点相互作用预测方法通常分为两类:基于配体的方法和基于结构的方法。基于配体的方法依赖于药物分子的化学特性和活性,但当配体数量有限时,预测准确性较低。基于结构的方法则基于药物和靶点的三维结构信息,但由于计算复杂性和处理时间的限制,其应用受到一定的制约。

4、近年来,深度学习方法在dti预测方面显示出了巨大的潜力。然而,当前方法难以准确地表示复杂的药物和靶点特征,如何恰当地表示药物和靶点成为挑战。难以全面捕获药物和靶点相互作用信息,无法有效考虑局部和全局相互作用,导致预测结果的准确性和泛化能力不足。

5、故如何提高药物-靶点相互作用预测的准确性是目前亟待解决的技术问题。


技术实现思路

>1、本专利技术的技术任务是提供一种基于序列的药物-靶点相互作用的预测方法及系统,来解决如何提高药物-靶点相互作用预测的准确性的问题。

2、本专利技术的技术任务是按以下方式实现的,一种基于序列的药物-靶点相互作用的预测方法,该方法具体如下:

3、获取待预测的药物smiles序列和蛋白质的氨基酸序列;

4、通过嵌入技术分别对药物smiles序列和蛋白质的氨基酸序列进行编码,生成药物嵌入特征向量和蛋白质嵌入特征向量;其中,药物smiles序列和蛋白质的氨基酸序列中的每个符号(例如,smiles字符或氨基酸)均被映射为固定长度的实值向量;

5、将药物嵌入特征向量和蛋白质嵌入特征向量分别通过特征提取器生成药物表征特征和蛋白质表征特征;其中,特征提取器包括cnn(卷积神经网络)块和transformercnn块;cnn块用于从药物嵌入特征向量中提取药物表征特征;transformercnn块用于从蛋白质嵌入向量中提取蛋白质表征特征;

6、将药物表征特征和蛋白质表征特征通过相互作用块生成药物-靶点相互作用表示特征向量,并获取药物和蛋白质的全局特征表示;其中,相互作用块利用注意力机制将药物表征特征和蛋白质表征特征进行交互和融合,进而捕获药物表征特征和蛋白质表征特征之间的相互作用特征,并采用读取函数聚合蛋白质的氨基酸序列和药物smiles序列中的隐藏状态,从而获取蛋白质和药物的全局特征表示;

7、将药物-靶点相互作用表示特征向量通过全连接层获取药物-靶点相互作用预测结果;其中,全连接层进行特征映射和转换,并将相互作用特征转化为最终的药物-靶点相互作用预测结果。

8、作为优选,通过嵌入技术分别对药物smiles序列和蛋白质的氨基酸序列进行编码,生成药物嵌入特征向量dembed和蛋白质嵌入特征向量pembed;

9、其中,药物smiles序列的标记编码设定为介于1到64之间的整数;

10、蛋白质的氨基酸序列的标记编码设定为介于1到24之间的整数;

11、编码完成后,使用0进行填充,以保持药物smiles序列和蛋白质的氨基酸序列的长度固定。

12、更优地,cnn块采用三层卷积神经网络,具体为:

13、对药物smiles序列进行嵌入操作,得到药物嵌入特征向量dembed;

14、将药物嵌入特征向量dembed输入到cnn块中通过卷积和池化操作获取药物特征矩阵dcnn。

15、更优地,通过两层transformercnn块提取蛋白质的氨基酸序列获取蛋白质特征矩阵,具体如下:

16、第i层transformercnn块接收蛋白质嵌入特征向量作为输入;其中,i=1、2;当i=1时,

17、根据蛋白质嵌入特征向量通过线性层生成不同特征空间中的矩阵q,公式如下:

18、

19、

20、

21、其中,wq,wk,wv表示可学习的参数;bq,bk,bv表示偏置向量;

22、给定矩阵q、k、v,自注意力层计算注意力权重,公式如下:

23、

24、其中,ti的维度是k;多头注意层包含h个自注意层;

25、第j个头部的自注意度计算公式如下:

26、headj=attention(qj,kj,vj);

27、多头注意层的输出如下:

28、

29、其中,表示可学习的参数矩阵;bi表示偏置向量;多头注意力层从不同的表示子空间中提取信息,从而增强了模型的鲁棒性;通过自注意力权重的学习,能够捕捉到氨基酸之间跨越整个序列的远距离关系;

30、第一个add&norm层实现了残差连接和层归一化,表达式如下:

31、

32、使用一维卷积神经网络捕捉序列中的局部相关性,表达式如下:

33、

34、在经过第二层在第二个add&norm层后,生成第i个transformercnn的输出,表达式如下:

35、

36、综上,transformercnn块将嵌入后的蛋白质嵌入特征向量pembed作为输入,输出蛋白质特征矩阵ptc;其中,i=2时,

37、更优地,使用一维卷积神经网络捕捉序列中的局部相关性具体如下:

38、输入张量经过层归一化(layer normalization)操作,获取归一化的张量;

39、输入张量进行维度转置(transpose)操作,将维度从(batch_size,seq_len,encoder_dim)转置为(batch_size,encoder_dim,seq_len),得到转置后的张量;

40、对转置后的张量进行一维卷积(1d convolution)操作:使用卷积核大小为conv_kernel_size,步长为1,填充为0,将输入通道数从encoder_dim变为encoder_dim*2,得到卷积后的张量;

41、对卷积输出进行激活操作,通常使用激活函数(如relu)对卷积输出进行非线性映射,得到激活后的张量;

42、对激活后的张量进行第二次一维卷积操作,将输入通道数保持为encoder_dim*2,输出通道数仍为encoder_dim*2;卷积核大小为conv_kernel_siz本文档来自技高网...

【技术保护点】

1.一种基于序列的药物-靶点相互作用的预测方法,其特征在于,该方法具体如下:

2.根据权利要求1所述的基于序列的药物-靶点相互作用的预测方法,其特征在于,通过嵌入技术分别对药物SMILES序列和蛋白质的氨基酸序列进行编码,生成药物嵌入特征向量Dembed和蛋白质嵌入特征向量Pembed;

3.根据权利要求1或2所述的基于序列的药物-靶点相互作用的预测方法,其特征在于,CNN块采用三层卷积神经网络,具体为:

4.根据权利要求3所述的基于序列的药物-靶点相互作用的预测方法,其特征在于,通过两层TransformerCNN块提取蛋白质的氨基酸序列获取蛋白质特征矩阵,具体如下:

5.根据权利要求4所述的基于序列的药物-靶点相互作用的预测方法,其特征在于,使用一维卷积神经网络捕捉序列中的局部相关性具体如下:

6.根据权利要求1所述的基于序列的药物-靶点相互作用的预测方法,其特征在于,将药物表征特征和蛋白质表征特征进行交互和融合具体如下:

7.根据权利要求6所述的基于序列的药物-靶点相互作用的预测方法,其特征在于,将药物-靶点相互作用表示特征向量通过全连接层获取药物-靶点相互作用预测结果具体如下:

8.一种基于序列的药物-靶点相互作用的预测系统,其特征在于,该系统用于实现权利要求1-7中任一项所述的基于序列的药物-靶点相互作用的预测方法;该系统包括:

9.一种电子设备,其特征在于,包括:存储器和至少一个处理器;

10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机程序,所述计算机程序可被处理器执行以实现如权利要求1至7中任一项所述的基于序列的药物-靶点相互作用的预测方法。

...

【技术特征摘要】

1.一种基于序列的药物-靶点相互作用的预测方法,其特征在于,该方法具体如下:

2.根据权利要求1所述的基于序列的药物-靶点相互作用的预测方法,其特征在于,通过嵌入技术分别对药物smiles序列和蛋白质的氨基酸序列进行编码,生成药物嵌入特征向量dembed和蛋白质嵌入特征向量pembed;

3.根据权利要求1或2所述的基于序列的药物-靶点相互作用的预测方法,其特征在于,cnn块采用三层卷积神经网络,具体为:

4.根据权利要求3所述的基于序列的药物-靶点相互作用的预测方法,其特征在于,通过两层transformercnn块提取蛋白质的氨基酸序列获取蛋白质特征矩阵,具体如下:

5.根据权利要求4所述的基于序列的药物-靶点相互作用的预测方法,其特征在于,使用一维卷积神经网络捕捉序列中的局部相关性具体如下:

【专利技术属性】
技术研发人员:张维玉李慧婷周小丁韩慧尚勇鹿文鹏
申请(专利权)人:齐鲁工业大学山东省科学院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1