新药候选物质导出方法及装置制造方法及图纸

技术编号:28850446 阅读:19 留言:0更新日期:2021-06-11 23:56
可以公开一种借助于计算装置而执行的新药候选物质导出方法。新药候选物质导出方法可以包括:生成由分别代表生物学实体的节点利用代表所述节点之间相互关联度的连接线进行连接的精确知识网络的步骤;分析精确知识网络中存在的药物‑疾病节点对,决定导出新药候选物质所需的基础药物的步骤;及使用基于人工神经网络的结构预测模型,获得具有与基础药物类似化学结构的类似物质的步骤;生物学实体可以包括基因、蛋白质、新陈代谢体、症状、疾病、化合物及药物中至少一种,在结构预测模型中,可以输入基础药物的基于SMILES(Simplified Molecular‑Inputline‑Entry System:简化分子线性输入规范)的字符串。

【技术实现步骤摘要】
【国外来华专利技术】新药候选物质导出方法及装置
本专利技术涉及新药开发方法及装置,更具体而言,涉及一种用于导出药物重定位(DrugRepositioning)所需候选物质、预测候选物质的物性的方法及装置。
技术介绍
据悉,为了开发一种新药,平均需要共15年时间,发生2~3万亿韩元费用。其中,为了发掘前临床(preclinicaltrial)之前的新药候选物质,需要约6年时间。一般而言,作为开发新药所需途径的第一步,为了发掘新药候选物质,需经过由多位专业研究人员逐一搜索海量信息,由此推导出主要生物学实体(entity)间相关性的过程。另一方面,据最近日本出台的生命智能联盟(LifeIntelligenceConsortium,2017)预测,将人工智能技术应用于新药开发时,为了开发新药所需的时间可以缩短约40%左右,费用可以节省约50%左右。
技术实现思路
技术问题可以提供一种用于基于多组学(Multi-Omics)数据的网络分析和人工智能技术,预测药物重定位所需候选物质的化学结构和物性的方法及装置。本实施例要解决的技术课题不限于如上所述的技术课题,可以从以下实施例类推出其他技术课题。技术效果可以基于反映了人体复杂性的多组学上的相互作用路径,准确选定可药物重定位的候选药物。另外,通过预测可药物重定位的候选药物的化学结构和物性,从而能够导出与可药物重定位的候选药物类似的新型新药候选物质,可以提高新药开发的成功可能性。附图说明图1是根据一个实施例用于发掘新药候选物质的数据处理装置的框图。图2根据一个实施例显示出数据处理装置用于发掘新药候选物质的数据处理方法的流程图。图3根据一个实施例显示出所输入的既定搜索词。图4是根据一个实施例在步骤S110及步骤S120中提取的生物学实体及显示他们间相互关联度的矩阵的一部分。图5是根据一个实施例用于提取图4矩阵的相互关联度的范畴的一个示例的一部分。图6是一个实施例的第一知识网络。图7根据一个实施例显示按参与指数(PC:Participationcoefficient)来区分中枢种类。图8是根据一个实施例从搜索词“epilepsysyndrome(癫痫综合征)”生成的第二知识网络。图9根据一个实施例显示出用于导出新药候选物质的计算装置的框图。图10根据一个实施例显示出计算装置用于导出新药候选物质的方法的流程图。图11根据一个实施例显示出计算装置决定导出新药候选物质所需基础药物的方法的流程图。图12根据一个实施例显示出从精确知识网络提取的药物-疾病节点对的接近度的标准分数。图13根据一个实施例显示出接近度小于基准值的药物-疾病节点对和存在于其路径上的中间节点。图14根据一个实施例显示出用于输出具有与基础药物类似化学结构的物质的结构预测模型。图15根据一个实施例显示出输入于预测模型的基础药物变换成基准大小的矢量。图16根据一个实施例显示出利用物性预测模型来对新药候选物质进行预测的物性。最优实施方式借助于计算装置来执行的新药候选物质导出方法可以包括:生成由分别代表生物学实体的节点利用代表所述节点之间相互关联度的连接线进行连接的精确知识网络的步骤;分析所述精确知识网络中存在的药物-疾病节点对,决定导出新药候选物质所需的基础药物的步骤;及使用基于人工神经网络的结构预测模型,获得具有与所述基础药物类似化学结构的类似物质的步骤;所述生物学实体可以包括基因、蛋白质、新陈代谢体、症状、疾病、化合物及药物中至少一种;所述相互关联度的范畴可以包括相互作用(interact)、参与(participate)、共变(covariate)、调节(regulate)、关联(associate)、结合(bind)、上调(upregulate)、原因(cause)、类似(resemble)、治疗(treat)、下调(downregulates)、缓解(palliate)、发现(present)、位置(localize)、包含(include)及表达(express)中至少一种;在所述结构预测模型中,可以输入所述基础药物的基于SMILES(SimplifiedMolecular-Inputline-EntrySystem:简化分子线性输入规范)的字符串。所述生成精确知识网络的步骤可以包括:接收搜索词的步骤;从生物学实体种类DB提取与所述搜索词相关的至少一个生物学实体的步骤;从生物学实体间相互关联度相关DB提取所述搜索词与所述生物学实体之间的相互关联度的步骤;以各个所述搜索词和所述生物学实体为节点,根据所述搜索词与所述生物学实体之间的相互关联度或生物学实体间相互关联度,生成利用连接线连接多个节点的第一知识网络的步骤;计算所述第一知识网络的图论指标的步骤;及利用所述多个节点中通过所述图论指标而提取的一部分节点,将第二知识网络生成为所述精确知识网络的步骤;所述搜索词可以包括基因名、蛋白质名、新陈代谢体名、症状名、疾病名、化合物名及药物名中至少一者;可以按所述相互关联度的范畴赋予识别号码,设置加权值,所述图论指标反映按所述相互关联度的范畴设置的加权值而计算;所述图论指标可以包括构成所述第一知识网络的多个节点的节点间最短路径、各节点聚类系数、各节点中心性系数及各节点的中枢性质中至少一者;所述生成第二知识网络的步骤可以包括:利用所述多个节点中构成所述第一知识网络的多个节点的所述节点间最短路径、所述各节点聚类系数及所述各节点中心性系数中至少一者来计算各节点标准分数,删除所述标准分数不足临界值的节点,删除与已删除节点关联的连接的步骤。所述标准分数可以是将构成第一知识网络的各节点的既定图论指标的指标值与构成第一知识网络的多个节点的既定图论指标的平均指标值之差除以标准偏差而得到的值,所述临界值可以为95%的显著性。所述决定导出新药候选物质所需基础药物的步骤可以包括:计算所述精确知识网络中存在的所述药物-疾病节点对的接近度的标准分数的步骤;选择所述接近度的所述标准分数小于基准值的至少一个药物-疾病节点对的步骤;及如果在所述选择的至少一个药物-疾病节点对的路径上有代表疾病的节点,则将所述药物-疾病节点对的所述药物决定为所述基础药物的步骤。所述接近度的所述标准分数可以是将构成所述精确知识网络的特定药物-疾病节点对的最短路径与构成所述精确知识网络的节点的最短路径的平均差除以标准偏差而得到的值。所述获得具有与基础药物类似化学结构的类似物质的步骤可以包括:将构成所述基础药物的基于SMILES的字符串的各字符置换为与所述字符对应的索引,从而变换成基准大小的矢量的步骤;及将所述矢量输入所述结构预测模型而获得的输出决定为所述类似物质的步骤。将所述矢量输入所述结构预测模型而获得的输出决定为所述类似物质的步骤可以包括:通过对所述矢量进行编码而提取所述矢量的特征的步骤;及通过对所述特征进行解码而输出复原矢量的步骤。所述人工神经网络可以包括输入层本文档来自技高网...

【技术保护点】
1.一种新药候选物质导出方法,所述新药候选物质导出方法借助于计算装置来执行,包括:/n生成由分别代表生物学实体的节点利用代表所述节点之间相互关联度的连接线进行连接的精确知识网络的步骤;/n分析所述精确知识网络中存在的药物-疾病节点对,决定导出新药候选物质所需的基础药物的步骤;及/n使用基于人工神经网络的结构预测模型,获得具有与所述基础药物类似化学结构的类似物质的步骤;/n所述生物学实体包括基因、蛋白质、新陈代谢体、症状、疾病、化合物及药物中至少一种,/n所述相互关联度的范畴包括相互作用、参与、共变、调节、关联、结合、上调、原因、类似、治疗、下调、缓解、发现、位置、包含及表达中至少一种,/n在所述结构预测模型中,输入所述基础药物的基于简化分子线性输入规范的字符串。/n

【技术特征摘要】
【国外来华专利技术】20191011 KR 10-2019-01264891.一种新药候选物质导出方法,所述新药候选物质导出方法借助于计算装置来执行,包括:
生成由分别代表生物学实体的节点利用代表所述节点之间相互关联度的连接线进行连接的精确知识网络的步骤;
分析所述精确知识网络中存在的药物-疾病节点对,决定导出新药候选物质所需的基础药物的步骤;及
使用基于人工神经网络的结构预测模型,获得具有与所述基础药物类似化学结构的类似物质的步骤;
所述生物学实体包括基因、蛋白质、新陈代谢体、症状、疾病、化合物及药物中至少一种,
所述相互关联度的范畴包括相互作用、参与、共变、调节、关联、结合、上调、原因、类似、治疗、下调、缓解、发现、位置、包含及表达中至少一种,
在所述结构预测模型中,输入所述基础药物的基于简化分子线性输入规范的字符串。


2.根据权利要求1所述的新药候选物质导出方法,其中,
所述生成精确知识网络的步骤包括:
接收搜索词的步骤;
从生物学实体种类DB提取与所述搜索词相关的至少一个生物学实体的步骤;
从生物学实体间相互关联度相关DB提取所述搜索词与所述生物学实体之间的相互关联度的步骤;
以各个所述搜索词和所述生物学实体为节点,根据所述搜索词与所述生物学实体之间的相互关联度或生物学实体间相互关联度,生成利用连接线连接多个节点的第一知识网络的步骤;
计算所述第一知识网络的图论指标的步骤;及
利用所述多个节点中通过所述图论指标而提取的一部分节点,将第二知识网络生成为所述精确知识网络的步骤;
所述搜索词包括基因名、蛋白质名、新陈代谢体名、症状名、疾病名、化合物名及药物名中至少一者,
按所述相互关联度的范畴赋予识别号码,设置加权值,所述图论指标反映按所述相互关联度的范畴设置的加权值而计算,
所述图论指标包括构成所述第一知识网络的多个节点的节点间最短路径、各节点聚类系数、各节点中心性系数及各节点的中枢性质中至少一者,
所述生成第二知识网络的步骤包括:
利用所述多个节点中构成所述第一知识网络的多个节点的所述节点间最短路径、所述各节点聚类系数及所述各节点中心性系数中至少一者来计算各节点标准分数,删除所述标准分数不足临界值的节点,删除与已删除节点关联的连接的步骤。


3.根据权利要求2所述的新药候选物质导出方法,其中,
所述标准分数是将构成第一知识网络的各节点的既定图论指标的指标值与构成第一知识网络的多个节点的既定图论指标的平均指标值之差除以标准偏差而得到的值,所述临界值为95%的显著性。


4.根据权利要求1所述的新药候选物质导出方法,其中,
所述决定导出新药候选物质所需基础药物的步骤包括:
计算所述精确知识网络中存在的药物-疾病节点对的接近度的标准分数的步骤;
选择所述接近度的所述标准分数小于基准值的至少一个药物-疾病节点对的步骤;及
如果在所述选择的至少一个药物-疾病节点对的路径上有代表疾病的节点,则将所述药物-疾病节点对的所述药物决定为所述基础药物的步骤。


5.根据权利要求4所述的新药候选物质导出方法,其中,
所述接近度的所述标准分数是将构成所述精确知识网络的特定药物-疾病节点对的最短路径与构成所述精确知识网络的节点的最短路径的平均差除以标准偏差而得到的值。


6.根据权利要求1所述的新药候选物质导出方法,其中,
所述获得具有与基础药物类似化学结构的类似物质的步骤包括:
将构成所述基础药物的基于简化分子线性输入规范的字符串的各字符置换为与所述字符对应的索引,从而变换成基准大小的矢量的步骤;及
将所述矢量输入所述结构预测模型而获得的输出决定为所述类似物质的步骤。


7...

【专利技术属性】
技术研发人员:裵荣佑秦承炫
申请(专利权)人:迈立塔股份有限公司
类型:发明
国别省市:韩国;KR

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1