【技术实现步骤摘要】
基于RegNet_1d模型和积分梯度法的ER
α
拮抗剂的生物活性预测方法
[0001]本专利技术涉及ERα拮抗剂活性预测及其虚拟筛选领域,特别是一种基于RegNet_1d模型和积分梯度法的ERα拮抗剂的生物活性预测及其优化方法。
技术介绍
[0002]目前,在药物研发中,为了节约时间和成本,通常采用建立化合物活性预测模型的方法来筛选潜在活性化合物。具体做法是:针对某个靶标收集一系列作用于该靶标的化合物及其生物活性数据,然后以一系列分子结构描述符作为自变量,化合物的生物活性值作为因变量,构建化合物的定量结构
‑
活性关系(Quantitative Structure
‑
Activity Relationship,QSAR)模型,然后使用该模型预测具有更好生物活性的新化合物分子,或者指导已有活性化合物的结构优化。现有技术更多的是采用传统建模方法预测,准确率不高;且建模方法大都基于实验范式,依赖人工设计,而全部采用实验测试则成本较高周期太长,不利于药物研发迭代。
技术实现思路
[0003]本专利技术为克服现有技术存在的不足之处,提出了一种基于RegNet_1d模型和积分梯度法的ERα拮抗剂的生物活性预测方法,以期能减少测量的数据量的同时提高预测效率,从而节约药物研发的时间和成本。
[0004]为了达到上述专利技术目的,本专利技术采用如下技术方案:
[0005]本专利技术一种基于RegNet_1d模型和积分梯度法的ERα拮抗剂的生物活性预测方 ...
【技术保护点】
【技术特征摘要】
1.一种基于RegNet_1d模型和积分梯度法的ERα拮抗剂的生物活性预测方法,其特征在于,包括以下步骤:S1:收集一系列作用于靶标ERα的拮抗剂化合物的生物活性数据以及m个分子结构描述符;以靶标ERα的拮抗剂化合物的m个分子描述符作为m个自变量,对m个自变量分别进行数据标准化操作后,得到特征数据记为:X=[x1,x2,
…
,x
i
,
…
,x
m
],x
i
表示第i个分子描述符的值;以拮抗剂化合物对靶标ERα的生物活性值数据的负对数pIC
50
为因变量,记为Y;将特征数据X和因变量Y组合为数据集并划分为训练集D
train
和验证集D
val
;S2:搭建由输入模块、核心模块和输出模块构成的RegNet_1d预测模型:S2.1:所述输入模块依次包括一个卷积层Conv1d、一个池化层Pool1d和批归一化层BatchNorm1d;设置输入数据的通道数为m;S2.2:所述核心模块是以RegNet网络架构为基础,并由a个第一模块block1、b个第二模块block2、c个第三模块block3叠加构成,其中,第一模块block1包含一维卷积层Conv1d、一维批量归一化层BatchNorm1d;第二模块block2包含一维卷积层Conv1d、一维批量归一化层BatchNorm1d、激活函数层ReLU;第三模块block3包括Conv1d、BatchNorm1d、ReLU、瓶颈层Bottleneck;S2.3:所述输出模块包括自适应池化层AdaptiveAvgPool1d和全连接层;S3:训练和选择模型:S3.1:初始化学习率为lr、当前迭代次数为epoch、最优决定系数为R2
max
、学习率调整迭代值t=0,设置调整周期阈值为t
max
;S3.2:在第epoch次迭代中将训练集D
train
按照每批次的大小为bs输入到所述RegNet_1d神经网络模型中进行训练,并计算MSE损失L后求解m个通道的梯度,再利用基于学习率lr的Adam优化器优化梯度中的权重参数,从而得到第epoch次训练的模型;S3.3...
【专利技术属性】
技术研发人员:王玉成,冯志宏,赵娜娜,汪鸣明,叶晓东,
申请(专利权)人:中国科学院合肥物质科学研究院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。