一种基于相似性的新药副作用发生频率预测方法、系统、终端及可读存储介质技术方案

技术编号：31377825 阅读：11 留言：0更新日期：2021-12-15 11:17

本发明专利技术公开了一种基于相似性的新药副作用发生频率预测方法、系统、终端及可读存储介质，其获取药物、副作用相似性信息和已知的药物副作用发生频率信息，再生成药物相似性向量和副作用相似性向量；进而针对每种类型的药物相似性与副作用相似性生成一个交互图并通过神经网络捕获药物与副作用的交互信息；使用多层感知机分别对药物和副作用相似性向量进行编码产生药物嵌入和副作用嵌入；最后将药物嵌入、副作用嵌入和药物

全部详细技术资料下载

【技术实现步骤摘要】
一种基于相似性的新药副作用发生频率预测方法、系统、终端及可读存储介质

[0001]本专利技术属于计算机生物信息学和机器学习
，具体涉及一种基于相似性的新药副作用发生频率预测方法、系统、终端及可读存储介质。

技术介绍

[0002]药物的副作用发生频率的估计在药物风险
‑
收益评估中至关重要。目前，药物的副作用频率是通过在随机对照试验中使用干预组和安慰剂组估计的。尽管它们是消除临床医学中选择偏倚的标准方法，但是这些试验受到样本量和时间复杂度的限制。另一方面，众所周知，许多药物的副作用不会在临床试验中观察到，它们在已经进入市场之后才会被人们识别。由于这个原因，药物的副作用仍然是医疗保健中发病率和死亡率的主要原因，每年造成数十亿美元的损失。例如，一种名为Fen
‑
Phen的食欲抑制剂在许多服用该抑制剂的患者死亡后退出市场。因此，利用生物信息学手段对药物的副作用进行分析和预测具有重要的现实意义。
[0003]近年来，已经开发了许多计算模型来预测基于药物相关数据库的药物副作用。然而，大多数方法只探讨一种药物是否有一种或多种副作用，而不能确定副作用的发生频率。副作用的发生频率是药物风险收益评估的核心问题。准确估计药物副作用的发生频率不仅对临床实践中的患者护理至关重要，而且对制药公司也很重要，因为它降低了从市场撤出药物的风险。尽管已经提出了两个方法来预测药物副作用的发生频率，但它们都严重依赖于已知的药物副作用关联或频率，不能对新药的副作用发生频率进行预测。例如，基于已知的药物副作用频率...

【技术保护点】

【技术特征摘要】
1.一种基于相似性的新药副作用发生频率预测方法，其特征在于：包括以下步骤：步骤1：基于已知药物
‑
副作用频率信息构建训练数据集；步骤2：获取药物相似性信息以及副作用相似性信息；步骤3：基于所述药物相似性信息和所述副作用相似信息构建每个药物的相似性向量和每个副作用的相似性向量，并映射到同一维度的特征映射空间中得到药物、副作用的特征向量；步骤4：基于药物的特征向量和副作用的特征向量构建药物
‑
副作用对交互图；步骤5：搭建药物副作用发生频率预测模型的网络架构，并利用所述训练数据集及其药物、副作用数据进行网络训练得到训练好的药物副作用发生频率预测模型；其中，所述训练数据集中已知药物
‑
副作用频率信息为标签，步骤5中的所述药物、副作用数据至少包含药物
‑
副作用对交互图；步骤6：针对待预测新药物，获取新药物的药物相似性信息，并按照步骤3以及步骤4的方式处理药物数据，再输入至训练好的药物副作用发生频率预测模型得到新药物副作用发生频率预测结果。2.根据权利要求1所述的方法，其特征在于：若步骤1中已知药物
‑
副作用频率信息包括以药物与副作用的频率得分是否已知进行编码的数据，则步骤5中所述药物副作用发生频率预测模型用于预测新药物与副作用是否存在关联关系；所述药物副作用发生频率预测模型的训练过程如下：步骤5.1：搭建基于深度卷积神经网络和多层感知机的药物副作用发生频率预测模型的网络架构；其中，利用深度卷积神经网络对药物
‑
副作用对交互图进行特征提取得到药物
‑
副作用交互嵌入数据，利用多层感知机分别对药物特征向量和副作用特征向量分别进行特征提取得到药物嵌入数据以及副作用嵌入数据；再将所述药物
‑
副作用交互嵌入数据、药物嵌入数据以及副作用嵌入数据进行拼接，输入至多层感知机得到药物
‑
副作用关联对的预测得分；当药物
‑
副作用关联对的预测得分小于预设判断阈值，视所述药物不具有对应副作用；当药物
‑
副作用关联对的预测得分大于或等于预设判断阈值，视所述药物具有对应副作用；步骤5.2：以药物特征向量、副作用特征向量、药物
‑
副作用对交互图作为网络输入，训练数据集中已知药物
‑
副作用频率信息为标签进行网络训练。3.根据权利要求1所述的方法，其特征在于：若步骤1中已知药物
‑
副作用频率信息包括以药物与副作用的频率得分数值进行编码的数据，则步骤5中所述药物副作用发生频率预测模型用于预测基于编码规则的新药物与副作用的频率数据；所述药物副作用发生频率预测模型的训练过程如下：步骤5
‑
1：搭建药物副作用发生频率预测模型的网络架构；其中，利用深度卷积神经网络对药物
‑
副作用对交互图进行特征提取得到药物
‑
副作用交互嵌入数据，利用多层感知机分别对药物特征向量和副作用特征向量分别进行特征提取得到药物嵌入数据以及副作用嵌入数据；再将所述药物
‑
副作用交互嵌入数据、药物嵌入数据以及副作用嵌入数据进行拼接，拼接后向量输入多层感知机得到基于编码规则的药物
‑
副作用关联对的频率数据；步骤5
‑
2：以药物特征向量、副作用特征向量、药物
‑
副作用对交互图作为网络输入，训
练数据集中基于编码规则的新药物与副作用的频率数据为标签进行网络训练。4.根据权利要求1所述的方法，其特征在于：若步骤1中已知药物
‑
副作用频率信息包括以药物与副作用的频率得分是否已知进行编码的邻接矩阵DMA和以药物与副作用的频率得分数值进行编码的邻接矩阵DMF；则步骤5中所述药物副作用发生频率预测模型用于预测新药物与副作用是否存在关联关系，以及针对存在关联关系的新药物与副作用进一步预测基于编码规则的新药物与副作用的频率数据；所述药物副作用发生频率预测模型的训练过程如下：S5
‑
1：搭建基于深度卷积神经网络和多层感知机的药物副作用发生频率预测模型的网络架构；其中，利用深度卷积神经网络对药物
‑
副作用对交互图进行特征提取得到药物
‑
副作用交互嵌入数据，利用多层感知机分别对药物特征向量和副作用特征向量分别进行特征提取得到药物嵌入数据以及副作用嵌入数据；再将所述药物
‑
副作用交互嵌入数据、药物嵌入数据以及副作用嵌入数据进行拼接，输入至多层感知机得到药物
‑
副作用关联对的预测得分；当药物
‑
副作用关联对的预测得分小于预设判断阈值，视所述药物不具有对应副作用；...

【专利技术属性】
技术研发人员：王建新，赵皓晨，郑凯，赵其昌，
申请(专利权)人：中南大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人