当前位置: 首页 > 专利查询>中南大学专利>正文

一种基于相似性的新药副作用发生频率预测方法、系统、终端及可读存储介质技术方案

技术编号:31377825 阅读:11 留言:0更新日期:2021-12-15 11:17
本发明专利技术公开了一种基于相似性的新药副作用发生频率预测方法、系统、终端及可读存储介质,其获取药物、副作用相似性信息和已知的药物副作用发生频率信息,再生成药物相似性向量和副作用相似性向量;进而针对每种类型的药物相似性与副作用相似性生成一个交互图并通过神经网络捕获药物与副作用的交互信息;使用多层感知机分别对药物和副作用相似性向量进行编码产生药物嵌入和副作用嵌入;最后将药物嵌入、副作用嵌入和药物

【技术实现步骤摘要】
一种基于相似性的新药副作用发生频率预测方法、系统、终端及可读存储介质


[0001]本专利技术属于计算机生物信息学和机器学习
,具体涉及一种基于相似性的新药副作用发生频率预测方法、系统、终端及可读存储介质。

技术介绍

[0002]药物的副作用发生频率的估计在药物风险

收益评估中至关重要。目前,药物的副作用频率是通过在随机对照试验中使用干预组和安慰剂组估计的。尽管它们是消除临床医学中选择偏倚的标准方法,但是这些试验受到样本量和时间复杂度的限制。另一方面,众所周知,许多药物的副作用不会在临床试验中观察到,它们在已经进入市场之后才会被人们识别。由于这个原因,药物的副作用仍然是医疗保健中发病率和死亡率的主要原因,每年造成数十亿美元的损失。例如,一种名为Fen

Phen的食欲抑制剂在许多服用该抑制剂的患者死亡后退出市场。因此,利用生物信息学手段对药物的副作用进行分析和预测具有重要的现实意义。
[0003]近年来,已经开发了许多计算模型来预测基于药物相关数据库的药物副作用。然而,大多数方法只探讨一种药物是否有一种或多种副作用,而不能确定副作用的发生频率。副作用的发生频率是药物风险收益评估的核心问题。准确估计药物副作用的发生频率不仅对临床实践中的患者护理至关重要,而且对制药公司也很重要,因为它降低了从市场撤出药物的风险。尽管已经提出了两个方法来预测药物副作用的发生频率,但它们都严重依赖于已知的药物副作用关联或频率,不能对新药的副作用发生频率进行预测。例如,基于已知的药物副作用频率,Galeano等人构建了药物副作用邻接矩阵,并提出了一种新的矩阵分解模型来预测潜在药物副作用的频率。该模型实现了良好的预测性能,但是当给定的样本是一种没有副作用信息的新药时,依赖于已知药物副作用频率的方法将无法预测其潜在的副作用。此外,赵等人开发了一种深度学习框架,通过整合化学结构相似性、已知药物副作用频率评分、副作用语义相似性和预训练词向量表示来预测药物的副作用频率。该模型的核心是构建一个药物副作用二部图,并基于注意力机制从节点的直接邻居中学习图中节点的特征表示。然而,不属于训练数据集的药物在构建的异构图中没有邻居节点,因此该模型也无法预测新药的副作用发生频率。
[0004]因此,提供一种能够预测新药的副作用发生频率的方法是极为重要的。

技术实现思路

[0005]本专利技术针对现有技术中缺乏能够预测新药的副作用发生频率方法的技术问题,根据多种类型的药物和副作用相似性信息,提出了一种基于相似性的新药副作用发生频率预测方法、系统、终端及可读存储介质。所述方法充分利用相似性中丰富的信息构成药物相似性向量、副作用相似向量以及药物

副作用对交互图,从而进行网络训练构建出药物副作用发生频率预测模型,能够帮助生物实验研究者进一步准确的发现新药的副作用并确定副作
用的发生频率。
[0006]一方面,本专利技术一种基于相似性的新药副作用发生频率预测方法,其包括以下步骤:
[0007]步骤1:基于已知药物

副作用频率信息构建训练数据集;
[0008]步骤2:获取药物相似性信息以及副作用相似性信息;
[0009]步骤3:基于所述药物相似性信息和副作用相似信息构建每个药物的相似性向量和每个副作用的相似性向量,并映射到同一维度的特征映射空间中得到药物、副作用的特征向量;
[0010]步骤4:基于药物的特征向量和副作用的特征向量构建药物

副作用对交互图;
[0011]步骤5:搭建药物副作用发生频率预测模型的网络架构,并利用所述训练数据集及其药物、副作用数据进行网络训练得到训练好的药物副作用发生频率预测模型;
[0012]其中,所述训练数据集中已知药物

副作用频率信息为标签,步骤5中的所述药物、副作用数据至少包含药物

副作用对交互图;
[0013]步骤6:针对待预测新药物,获取新药物的药物相似性信息,并按照步骤3以及步骤4的方式处理药物数据,再输入至训练好的药物副作用发生频率预测模型得到新药物副作用发生频率预测结果。
[0014]本专利技术提供的所述新药副作用发生频率预测方法实现了新药物的副作用预测。
[0015]可选地,若步骤1中已知药物

副作用频率信息包括以药物与副作用的频率得分是否已知进行编码的数据,则步骤5中所述药物副作用发生频率预测模型用于预测新药物与副作用是否存在关联关系,所述药物副作用发生频率预测模型的训练过程如下:
[0016]步骤5.1:搭建基于深度卷积神经网络和多层感知机的药物副作用发生频率预测模型的网络架构;
[0017]其中,利用深度卷积神经网络对药物

副作用对交互图进行特征提取得到药物

副作用交互嵌入数据,利用多层感知机分别对药物特征向量和副作用特征向量分别进行特征提取得到药物嵌入数据以及副作用嵌入数据;再将所述药物

副作用交互嵌入数据、药物嵌入数据以及副作用嵌入数据进行拼接,输入至多层感知机得到药物

副作用关联对的预测得分;
[0018]当药物

副作用关联对的预测得分小于预设判断阈值,视所述药物不具有对应副作用;当药物

副作用关联对的预测得分大于或等于预设判断阈值,视所述药物具有对应副作用;
[0019]譬如在一些实现方式中,将判断阈值设置为0.5,若药物不具有对应副作用,输出药物与该副作用之间的发生频率得分为0。
[0020]步骤5.2:以药物特征向量、副作用特征向量、药物

副作用对交互图作为网络输入,训练数据集中已知药物

副作用频率信息为标签进行网络训练。
[0021]可选地,若步骤1中已知药物

副作用频率信息包括以药物与副作用的频率得分数值进行编码的数据,则步骤5中所述药物副作用发生频率预测模型用于预测基于编码规则的新药物与副作用的频率数据;所述药物副作用发生频率预测模型的训练过程如下:
[0022]步骤5

1:搭建药物副作用发生频率预测模型的网络架构;
[0023]其中,利用深度卷积神经网络对药物

副作用对交互图进行特征提取得到药物


作用交互嵌入数据,利用多层感知机分别对药物特征向量和副作用特征向量分别进行特征提取得到药物嵌入数据以及副作用嵌入数据;再将所述药物

副作用交互嵌入数据、药物嵌入数据以及副作用嵌入数据进行拼接,拼接后向量输入多层感知机得到基于编码规则的药物

副作用关联对的频率数据;
[0024]步骤5

2:以药物特征向量、副作用特征向量、药物

副作用对交互图作为网络输入,训练数据集中基于编码规则的新药物与副本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于相似性的新药副作用发生频率预测方法,其特征在于:包括以下步骤:步骤1:基于已知药物

副作用频率信息构建训练数据集;步骤2:获取药物相似性信息以及副作用相似性信息;步骤3:基于所述药物相似性信息和所述副作用相似信息构建每个药物的相似性向量和每个副作用的相似性向量,并映射到同一维度的特征映射空间中得到药物、副作用的特征向量;步骤4:基于药物的特征向量和副作用的特征向量构建药物

副作用对交互图;步骤5:搭建药物副作用发生频率预测模型的网络架构,并利用所述训练数据集及其药物、副作用数据进行网络训练得到训练好的药物副作用发生频率预测模型;其中,所述训练数据集中已知药物

副作用频率信息为标签,步骤5中的所述药物、副作用数据至少包含药物

副作用对交互图;步骤6:针对待预测新药物,获取新药物的药物相似性信息,并按照步骤3以及步骤4的方式处理药物数据,再输入至训练好的药物副作用发生频率预测模型得到新药物副作用发生频率预测结果。2.根据权利要求1所述的方法,其特征在于:若步骤1中已知药物

副作用频率信息包括以药物与副作用的频率得分是否已知进行编码的数据,则步骤5中所述药物副作用发生频率预测模型用于预测新药物与副作用是否存在关联关系;所述药物副作用发生频率预测模型的训练过程如下:步骤5.1:搭建基于深度卷积神经网络和多层感知机的药物副作用发生频率预测模型的网络架构;其中,利用深度卷积神经网络对药物

副作用对交互图进行特征提取得到药物

副作用交互嵌入数据,利用多层感知机分别对药物特征向量和副作用特征向量分别进行特征提取得到药物嵌入数据以及副作用嵌入数据;再将所述药物

副作用交互嵌入数据、药物嵌入数据以及副作用嵌入数据进行拼接,输入至多层感知机得到药物

副作用关联对的预测得分;当药物

副作用关联对的预测得分小于预设判断阈值,视所述药物不具有对应副作用;当药物

副作用关联对的预测得分大于或等于预设判断阈值,视所述药物具有对应副作用;步骤5.2:以药物特征向量、副作用特征向量、药物

副作用对交互图作为网络输入,训练数据集中已知药物

副作用频率信息为标签进行网络训练。3.根据权利要求1所述的方法,其特征在于:若步骤1中已知药物

副作用频率信息包括以药物与副作用的频率得分数值进行编码的数据,则步骤5中所述药物副作用发生频率预测模型用于预测基于编码规则的新药物与副作用的频率数据;所述药物副作用发生频率预测模型的训练过程如下:步骤5

1:搭建药物副作用发生频率预测模型的网络架构;其中,利用深度卷积神经网络对药物

副作用对交互图进行特征提取得到药物

副作用交互嵌入数据,利用多层感知机分别对药物特征向量和副作用特征向量分别进行特征提取得到药物嵌入数据以及副作用嵌入数据;再将所述药物

副作用交互嵌入数据、药物嵌入数据以及副作用嵌入数据进行拼接,拼接后向量输入多层感知机得到基于编码规则的药物

副作用关联对的频率数据;步骤5

2:以药物特征向量、副作用特征向量、药物

副作用对交互图作为网络输入,训
练数据集中基于编码规则的新药物与副作用的频率数据为标签进行网络训练。4.根据权利要求1所述的方法,其特征在于:若步骤1中已知药物

副作用频率信息包括以药物与副作用的频率得分是否已知进行编码的邻接矩阵DMA和以药物与副作用的频率得分数值进行编码的邻接矩阵DMF;则步骤5中所述药物副作用发生频率预测模型用于预测新药物与副作用是否存在关联关系,以及针对存在关联关系的新药物与副作用进一步预测基于编码规则的新药物与副作用的频率数据;所述药物副作用发生频率预测模型的训练过程如下:S5

1:搭建基于深度卷积神经网络和多层感知机的药物副作用发生频率预测模型的网络架构;其中,利用深度卷积神经网络对药物

副作用对交互图进行特征提取得到药物

副作用交互嵌入数据,利用多层感知机分别对药物特征向量和副作用特征向量分别进行特征提取得到药物嵌入数据以及副作用嵌入数据;再将所述药物

副作用交互嵌入数据、药物嵌入数据以及副作用嵌入数据进行拼接,输入至多层感知机得到药物

副作用关联对的预测得分;当药物

副作用关联对的预测得分小于预设判断阈值,视所述药物不具有对应副作用;...

【专利技术属性】
技术研发人员:王建新赵皓晨郑凯赵其昌
申请(专利权)人:中南大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1