抗癌候选药物的ADMET性质预测方法及系统技术方案

技术编号:33536365 阅读:19 留言:0更新日期:2022-05-19 02:18
本发明专利技术属于抗癌候选药物抗癌分子ADMET性质数据处理技术领域,提供了一种抗癌候选药物的ADMET性质预测方法及系统。其中,该方法包括获取抗癌候选药物化合物分子描述符信息;对抗癌候选药物化合物分子描述符信息进行多特征提取,筛选出决定ADMET化合物性质的关键特征;对筛选出的关键特征进行ADMET性质分类预测,得到抗癌候选药物的ADMET性质预测结果。得到抗癌候选药物的ADMET性质预测结果。得到抗癌候选药物的ADMET性质预测结果。

【技术实现步骤摘要】
抗癌候选药物的ADMET性质预测方法及系统


[0001]本专利技术属于抗癌候选药物抗癌分子ADMET性质数据处理
,尤其涉及一种抗癌候选药物的ADMET性质预测方法及系统。

技术介绍

[0002]本部分的陈述仅仅是提供了与本专利技术相关的
技术介绍
信息,不必然构成在先技术。
[0003]在抗癌药物研发中,通过建立有效的抑制癌靶标蛋白生物活性表达模型来筛选潜在药物化合物,预测具有更好抑制靶标生物活性的新化合物分子。同时,除了关注候选药物抗癌分子抑制靶标的生物活性外,在进一步药物研发过程中更需要考虑到组成抗癌药物的化合物ADMET性质对人体健康的影响。所述ADMET性质,主要是指人体内需具备良好的药代动力学性质和安全性。其中,A代表吸收(Absorption)、D代表分布(Distribution)、M代表代谢(Metabolism)、E代表排泄(Excretion)、T代表毒性(Toxicity)。ADME主要指化合物的药代动力学性质,描述了化合物在生物体内的浓度随时间变化的规律,T主要指化合物可能在人体内产生的毒副作用。
[0004]因此,一个成功的治疗药物不仅仅需要依靠其化合物抗癌分子拮抗癌症靶标蛋白生物活性的表达,还需要满足药物的药代动力学性质以及生物毒性等性质,如药物化合物在小肠上皮细胞的渗透性、化合物被代谢的程度、化合物的口服生物利用度、以及化合物是否具有心脏毒性、遗传毒性等。但是由于化合物及其分子描述符的数据维度高、数据量有限和化合物结构的相似等难点,导致建立精准的抗癌候选药物ADMET性质预测模型具有很大的挑战。
[0005]专利技术人发现,在抗癌候选药物性质预测方面,由于传统的抗癌候选药物特征表示具有高维性和稀疏性,特征表达能力较弱,且传统的算法在特征工程中需要耗费大量的人力物力,才能找到一个行之有效的方法预测药物化合物的ADMET性质,因此,药物化合物性质预测是一个复杂而漫长的过程。并且,针对抗癌药物而言,由于其领域性强、数据量大且内容庞杂等特点,采用现有的特征提取方法,精度不高。

技术实现思路

[0006]为了解决上述
技术介绍
中存在的技术问题,本专利技术提供一种抗癌候选药物的ADMET性质预测方法及系统,其对物质的描述符与其理化性质之间的相关性建模,进而揭示物质化合物分子某种特征对性质的影响,进而提高抗癌候选药物的ADMET性质预测结果准确性。
[0007]为了实现上述目的,本专利技术采用如下技术方案:
[0008]本专利技术的第一个方面提供一种抗癌候选药物的ADMET性质预测方法,其包括:
[0009]获取抗癌候选药物化合物分子描述符信息;
[0010]对抗癌候选药物化合物分子描述符信息进行多特征提取,筛选出决定ADMET化合
物性质的关键特征;
[0011]对筛选出的关键特征进行ADMET性质分类预测,得到抗癌候选药物的ADMET性质预测结果。
[0012]本专利技术的第二个方面提供一种抗癌候选药物的ADMET性质预测系统,其包括:
[0013]数据获取模块,其用于获取抗癌候选药物化合物分子描述符信息;
[0014]变量筛选模块,其用于对抗癌候选药物化合物分子描述符信息进行多特征提取,筛选出决定ADMET化合物性质的关键特征;
[0015]性质预测模块,其用于对筛选出的关键特征进行ADMET性质分类预测,得到抗癌候选药物的ADMET性质预测结果。
[0016]本专利技术的第三个方面提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上述所述的抗癌候选药物的ADMET性质预测方法中的步骤。
[0017]本专利技术的第四个方面提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述所述的抗癌候选药物的ADMET性质预测方法中的步骤。
[0018]与现有技术相比,本专利技术的有益效果是:
[0019]本专利技术提供了一种抗癌候选药物的ADMET性质预测方法及系统,其通过对抗癌候选药物化合物分子描述符信息进行多特征提取,筛选出决定ADMET化合物性质的关键特征,进而对筛选出的关键特征进行ADMET性质分类预测,对ADMET性质进行高效可靠的降维处理,结合特征和敏感性参数分析,嵌入到机器学习模型中,进而提高预测模型的准确度,提高了抗癌候选药物的ADMET性质预测结果的准确性;
[0020]本专利技术针对抑制癌候选药物化合物的ADMET性质的分类预测,在传统机器学习的方法的基础之上建立有效的模型,对抗癌候选药物相关化合物及分子描述符信息以及ADMET性质数据进行挖掘分析,研究其分子机制,使用该模型预测抗癌候选药物的ADMET性质,从而研发具有更好药物性质的新化合物分子,或者指导已有活性化合物的结构优化,加快癌候选药物的研发过程,为癌临床治疗研究提供理论参考。
[0021]本专利技术附加方面的优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本专利技术的实践了解到。
附图说明
[0022]构成本专利技术的一部分的说明书附图用来提供对本专利技术的进一步理解,本专利技术的示意性实施例及其说明用于解释本专利技术,并不构成对本专利技术的不当限定。
[0023]图1是本专利技术实施例的抗癌候选药物的ADMET性质预测方法流程图;
[0024]图2(a)是本专利技术实施例中五类药物化合物性质中Caco

2性质与相关系数可视化图;
[0025]图2(b)是本专利技术实施例中五类药物化合物性质中CYP3A4性质与相关系数可视化图;
[0026]图3是本专利技术实施例中支持向量机SVM的ADMET性质预测模型混淆矩阵图;
[0027]图4为本专利技术实施例中随机森林模型中n_estimators评估示意图;
[0028]图5为本专利技术实施例的抗癌候选药物的ADMET性质预测系统结构示意图。
具体实施方式
[0029]下面结合附图与实施例对本专利技术作进一步说明。
[0030]应该指出,以下详细说明都是例示性的,旨在对本专利技术提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本专利技术所属
的普通技术人员通常理解的相同含义。
[0031]需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本专利技术的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。
[0032]实施例一
[0033]成功治疗癌症药物的化合物生物活性是极其重要的,即如果一个组成药物的化合物分子生物活性很弱,则其对应的药物治疗疾病效果会很差,达不到预防或者治疗疾病的目标。但在抗癌药物预测过程中仅仅考虑其抑制靶标生物活性的强弱是远远不够的,还要考虑预测药物分子的化学性质,不同的化合物性质又受到不同关键分子本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种抗癌候选药物的ADMET性质预测方法,其特征在于,包括:获取抗癌候选药物化合物分子描述符信息;对抗癌候选药物化合物分子描述符信息进行多特征提取,筛选出决定ADMET化合物性质的关键特征;对筛选出的关键特征进行ADMET性质分类预测,得到抗癌候选药物的ADMET性质预测结果。2.如权利要求1所述的抗癌候选药物的ADMET性质预测方法,其特征在于,基于随机森林集成模型对抗癌候选药物化合物分子描述符信息进行多特征提取。3.如权利要求1所述的抗癌候选药物的ADMET性质预测方法,其特征在于,基于抗癌候选药物化合物各个分子描述符与提取的各个特征的之间的相关性,来确定出ADMET化合物性质的关键特征。4.如权利要求3所述的抗癌候选药物的ADMET性质预测方法,其特征在于,筛选出决定ADMET化合物性质的关键特征的过程为:基于设定特征重要性公式来计算每个特征的重要性,并按降序排序;依据特征重要性剔除预设剔除比例的特征,得到一个新的特征集;对新的特征集重复上述重要性排序及特征剔除过程,直到剩下预设数量的特征;根据得到的各个特征集和特征集对应的袋外误差率,选择袋外误差率最低的特征集,以作为决定ADMET化合物性质的关键特征。5.如权利要求1所述的抗癌候选药物的ADMET性质预测方法,其特征在于,采用性质预测模型对筛选出的关键特征进行ADMET性质分类预测;其中,所述性质预测模型为支持向量机。6.如权利要求1所述的抗癌候选药物的ADMET性质预测方法,其特征在于,所述ADMET化合物性质包括Caco

2、CYP3A4、hERG、HOB和MN的性质;其中,Caco
...

【专利技术属性】
技术研发人员:王红郑子希
申请(专利权)人:山东师范大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1