基于RegNet_1d模型和积分梯度法的ERα拮抗剂的生物活性预测方法技术

技术编号：32519089 阅读：16 留言：0更新日期：2022-03-02 11:19

本发明专利技术公开了一种基于RegNet_1d模型和积分梯度法的ERα拮抗剂的生物活性预测方法，是先搭建RegNet_1d深度学习模型，再使用ERα拮抗剂的m个分子描述符信息来预测其对ERα的生物活性，并以积分梯度法为理论基础进行数据结构优化，将预测结果归因到输入特征中，得到m个变量对生物活性影响的相关性分布，以此筛选合适的分子描述符变量，用于重新构建数据结构来训练预测模型。本发明专利技术使用深度学习网络自动学习表征模型，提高了预测效率，同时优化后的模型预测准确率略有下降但所需测量的数据量大大减少，节约了药物研发的时间和成本。节约了药物研发的时间和成本。节约了药物研发的时间和成本。

全部详细技术资料下载

【技术实现步骤摘要】
基于RegNet_1d模型和积分梯度法的ER
α
拮抗剂的生物活性预测方法

[0001]本专利技术涉及ERα拮抗剂活性预测及其虚拟筛选领域，特别是一种基于RegNet_1d模型和积分梯度法的ERα拮抗剂的生物活性预测及其优化方法。

技术介绍

[0002]目前，在药物研发中，为了节约时间和成本，通常采用建立化合物活性预测模型的方法来筛选潜在活性化合物。具体做法是：针对某个靶标收集一系列作用于该靶标的化合物及其生物活性数据，然后以一系列分子结构描述符作为自变量，化合物的生物活性值作为因变量，构建化合物的定量结构
‑
活性关系(Quantitative Structure
‑
Activity Relationship,QSAR)模型，然后使用该模型预测具有更好生物活性的新化合物分子，或者指导已有活性化合物的结构优化。现有技术更多的是采用传统建模方法预测，准确率不高；且建模方法大都基于实验范式，依赖人工设计，而全部采用实验测试则成本较高周期太长，不利于药物研发迭代。

技术实现思路

[0003]本专利技术为克服现有技术存在的不足之处，提出了一种基于RegNet_1d模型和积分梯度法的ERα拮抗剂的生物活性预测方法，以期能减少测量的数据量的同时提高预测效率，从而节约药物研发的时间和成本。
[0004]为了达到上述专利技术目的，本专利技术采用如下技术方案：
[0005]本专利技术一种基于RegNet_1d模型和积分梯度法的ERα拮抗剂的生物活性预测方...

【技术保护点】

【技术特征摘要】
1.一种基于RegNet_1d模型和积分梯度法的ERα拮抗剂的生物活性预测方法，其特征在于，包括以下步骤：S1：收集一系列作用于靶标ERα的拮抗剂化合物的生物活性数据以及m个分子结构描述符；以靶标ERα的拮抗剂化合物的m个分子描述符作为m个自变量，对m个自变量分别进行数据标准化操作后，得到特征数据记为：X＝[x1,x2,
…
,x
i
,
…
,x
m
]，x
i
表示第i个分子描述符的值；以拮抗剂化合物对靶标ERα的生物活性值数据的负对数pIC
50
为因变量，记为Y；将特征数据X和因变量Y组合为数据集并划分为训练集D
train
和验证集D
val
；S2：搭建由输入模块、核心模块和输出模块构成的RegNet_1d预测模型：S2.1：所述输入模块依次包括一个卷积层Conv1d、一个池化层Pool1d和批归一化层BatchNorm1d；设置输入数据的通道数为m；S2.2：所述核心模块是以RegNet网络架构为基础，并由a个第一模块block1、b个第二模块block2、c个第三模块block3叠加构成，其中，第一模块block1包含一维卷积层Conv1d、一维批量归一化层BatchNorm1d；第二模块block2包含一维卷积层Conv1d、一维批量归一化层BatchNorm1d、激活函数层ReLU；第三模块block3包括Conv1d、BatchNorm1d、ReLU、瓶颈层Bottleneck；S2.3：所述输出模块包括自适应池化层AdaptiveAvgPool1d和全连接层；S3：训练和选择模型：S3.1：初始化学习率为lr、当前迭代次数为epoch、最优决定系数为R2
max
、学习率调整迭代值t＝0，设置调整周期阈值为t
max
；S3.2：在第epoch次迭代中将训练集D
train
按照每批次的大小为bs输入到所述RegNet_1d神经网络模型中进行训练，并计算MSE损失L后求解m个通道的梯度，再利用基于学习率lr的Adam优化器优化梯度中的权重参数，从而得到第epoch次训练的模型；S3.3...

【专利技术属性】
技术研发人员：王玉成，冯志宏，赵娜娜，汪鸣明，叶晓东，
申请(专利权)人：中国科学院合肥物质科学研究院，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人