System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种小胶质细胞毒性的预测方法及相关设备技术_技高网
当前位置: 首页 > 专利查询>东北大学专利>正文

一种小胶质细胞毒性的预测方法及相关设备技术

技术编号:41769440 阅读:2 留言:0更新日期:2024-06-21 21:46
本发明专利技术提供了一种小胶质细胞毒性的预测方法及相关设备,应用于数据处理技术领域。本申请获取训练样本集和目标数据集;对训练样本集进行预处理,生成带有标识信息的训练样本集;基于预设处理规则对训练样本集进行处理,生成训练集和测试集;基于预设特征处理规则对训练集和测试集进行处理,生成化合物向量特征;基于递归特征选择规则对化合物向量特征进行处理,生成特征选择后的分子指纹;基于预设处理规则构建小胶质细胞毒性预测模型;基于特征选择后的分子指纹对小胶质细胞毒性预测模型进行训练,生成目标细胞毒性预测模型;基于目标细胞毒性预测模型对目标数据集进行处理,生成预测结果。

【技术实现步骤摘要】

本专利技术涉及数据处理,特别涉及一种小胶质细胞毒性的预测方法及相关设备


技术介绍

1、神经退行性疾病(如阿尔茨海默病、肌萎缩性脊髓侧索硬化症、帕金森病和亨廷顿病)对全世界数百万人生活产生不利影响,其治疗药物开发一直是医学研究领域的主要热点之一。小胶质细胞诱导的神经炎症在许多神经退行性疾病中起着重要作用,改善这种炎症反应的策略受到了广泛关注。随着研究的进展,许多植物及其衍生的化合物,如山奈酚和五味子苷,已被发现具有抑制神经炎症的潜力,从而改善各种神经退行性疾病。然而,目前在临床上推进这些化合物可能存在一些困难,主要因为在研发过程中忽略了细胞毒性的重要性。因此,为了降低药物研发失败率,细胞毒性测定是先导化合物筛选和优化过程中的一个重要且具有挑战性的步骤。

2、传统的细胞毒性筛选实验面临成本高、周期长的问题。随着人工智能技术的不断发展,基于机器学习的方法构建小胶质细胞毒性预测模型因其实用性和便利性逐渐成为大规模生物检测的替代方法。合适的分子表征方法结合先进的人工智能算法为毒性预测开辟了新的途径。因此如何利用人工智能算法构建较准确的小胶质细胞毒性预测模型以有效替代传统细胞毒性筛选实验是一个亟需的问题。

3、需要说明的是,在上述
技术介绍
部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。


技术实现思路

1、本申请的目的在于提供一种小胶质细胞毒性的预测方法及相关设备,至少在一定程度上克服现有技术存在的问题,基于分子图骨架的数据集划分方式以提高小胶质细胞毒性预测模型的泛化能力,将特征选择方法引入到本专利技术中构建小胶质细胞毒性预测模型以提高预测模型的准确度。利用shap模型可解释性算法对预测结果进行合理性解释,并识别小胶质细胞毒性预警结构,对所述化合物的预警结构进行无毒性化处理,生成无细胞毒性的化合物,具有较高的实用价值。

2、本申请的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本专利技术的实践而习得。

3、根据本申请的一个方面,提供一种小胶质细胞毒性的预测方法,包括:获取训练样本集和目标数据集,其中,所述训练样本集包括若干单体化合物;对所述训练样本集进行预处理,生成带有标识信息的训练样本集,其中,所述标识信息用于表征单体化合物的细胞存活率;基于预设处理规则对所述训练样本集进行处理,生成训练集和测试集;基于预设特征处理规则对所述训练集和所述测试集进行处理,生成化合物向量特征;基于递归特征选择规则对所述化合物向量特征进行处理,生成特征选择后的分子指纹;基于预设处理规则构建小胶质细胞毒性预测模型;基于所述特征选择后的分子指纹对所述小胶质细胞毒性预测模型进行训练,生成目标细胞毒性预测模型;基于所述目标细胞毒性预测模型对所述目标数据集进行处理,生成预测结果。

4、在本申请的一个实施例中,所述基于所述特征选择后的分子指纹对所述小胶质细胞毒性预测模型进行训练,生成目标细胞毒性预测模型之后,还包括:基于算法决策模型对所述目标细胞毒性预测模型进行处理,生成化合物图骨架相似值;所述算法决策模型包括用于生成化合物图骨架相似值的计算公式,所述公式为:其中,和分别代表目标数据集和训练样本集中所有图骨架类别的ecfp4分子指纹;基于预设阈值对所述化合物图骨架相似值进行处理,生成所述目标细胞毒性预测模型的适用域。

5、在本申请的一个实施例中,所述基于所述特征选择后的分子指纹对所述小胶质细胞毒性预测模型进行训练,生成目标细胞毒性预测模型之后,还包括:基于机器学习模型对目标细胞预测模型进行处理,生成化合物子结构的shap值;基于预设特征处理规则对所述shap值进行处理,生成预警结构,其中,所述预警结构为毒性预警结构;基于预设频率计算公式对训练样本集进行处理,生成预警结构在具有细胞毒性的化合物的出现频率;所述公式为:其中,ntotal和nsas_total分别代表在训练样本集中化合物的总数和包含预警结构的化合物数量;ncytotoxicity和nsas_cytotoxicity分别代表具有细胞毒性的化合物数量和包含预警结构的毒性化合物数量;fresas值越高,表明存在该预警结构导致细胞毒性的概率越大;若所述预警结构在具有细胞毒性的化合物中出现的频率大于预设阈值,则将所述预警结构作为小胶质毒性预警结构。

6、在本申请的一个实施例中,所述将所述预警结构作为小胶质毒性预警结构之后,还包括:对具有细胞毒性的化合物进行处理,获取该化合物的预警结构;对所述化合物的预警结构进行无毒性化处理,生成无细胞毒性的化合物。

7、在本申请的一个实施例中,所述基于预设处理规则对所述训练样本集进行处理,生成训练集和测试集,包括:对所述训练样本集进行分子图骨架特征提取,将具有相同图骨架的化合物划分到一个类别,确定分子图骨架类别库;设置训练集和测试集样本比例;根据所述分子图骨架类别库进行划分训练集和测试集,从图骨架类别中包含分子数量大于等于2的类别中随机抽取分子作为测试集直到训练集和测试集达到预定比例,生成训练集和测试集。

8、在本申请的一个实施例中,所述基于预设处理规则对所述训练样本集进行处理,生成训练集和测试集,还包括:基于标识信息对所述训练集进行划分,生成若干数量的数类样本;获取所述训练集中任一数量较少的数类样本;基于所述任一数量较少的数类样本与同类别的其他数量较少的数类样本之间的距离,生成相邻样本,其中,所述相邻样本包括所述任一数量较少的数类样本的预设数量;对所述相邻样本进行采样,生成预设数量的采样样本;基于所述任一少数类样本与每个采样样本,生成多组数据组,其中,每组数据组均包含预设数量的数据样本。

9、在本申请的一个实施例中,所述对所述相邻样本进行采样,生成预设数量的采样样本,包括:基于所述训练集中各数类样本的数量,确定采样比例;基于所述采样比例,确定采样比率;基于所述采样比率对所述相邻样本进行采样,生成预设数量的采样样本。

10、在本申请的一个实施例中,所述基于递归特征选择规则对所述化合物向量特征进行处理,生成特征选择后的分子指纹,包括:基于分子指纹特征构建初始特征集合;基于所述初始特征集合对svm分类器进行训练处理,获得每个特征的权重值和特征排序,其中,所述特征排序为基于特征重要性所生成;获取模型性能评价指标;基于所述模型性能评价指标对每个特征的权重值和特征排序进行处理,生成目标子集;将所述目标子集作为特征选择后的分子指纹。

11、本申请的另一个方面,一种小胶质细胞毒性的预测装置,其特征在于,包括:获取模块,用于获取训练样本集和目标数据集,其中,所述训练样本集包括若干单体化合物;处理模块,用于对所述训练样本集进行预处理,生成带有标识信息的训练样本集,其中,所述标识信息用于表征单体化合物的细胞存活率;基于预设处理规则对所述训练样本集进行处理,生成训练集和测试集;基于预设特征处理规则对所述训练集和所述测试集进行处理,生成化合物向量特征;基于递归特征选择规则对所述化合物向量特征进行处本文档来自技高网...

【技术保护点】

1.一种小胶质细胞毒性的预测方法,其特征在于,包括:

2.如权利要求1所述的方法,其特征在于,所述基于所述特征选择后的分子指纹对所述小胶质细胞毒性预测模型进行训练,生成目标细胞毒性预测模型之后,还包括:

3.如权利要求1所述的方法,其特征在于,所述基于所述特征选择后的分子指纹对所述小胶质细胞毒性预测模型进行训练,生成目标细胞毒性预测模型之后,还包括:

4.如权利要求3所述的方法,其特征在于,所述将所述预警结构作为小胶质毒性预警结构之后,还包括:

5.如权利要求1所述的方法,其特征在于,所述基于预设处理规则对所述训练样本集进行处理,生成训练集和测试集,包括:

6.如权利要求1或5所述的方法,所述基于预设处理规则对所述训练样本集进行处理,生成训练集和测试集,还包括:

7.如权利要求6所述的方法,所述对所述相邻样本进行采样,生成预设数量的采样样本,包括:

8.如权利要求1所述的方法,其特征在于,所述基于递归特征选择规则对所述化合物向量特征进行处理,生成特征选择后的分子指纹,包括:

9.一种小胶质细胞毒性的预测装置,其特征在于,所述装置包括:

10.一种电子设备,其特征在于,包括:

...

【技术特征摘要】

1.一种小胶质细胞毒性的预测方法,其特征在于,包括:

2.如权利要求1所述的方法,其特征在于,所述基于所述特征选择后的分子指纹对所述小胶质细胞毒性预测模型进行训练,生成目标细胞毒性预测模型之后,还包括:

3.如权利要求1所述的方法,其特征在于,所述基于所述特征选择后的分子指纹对所述小胶质细胞毒性预测模型进行训练,生成目标细胞毒性预测模型之后,还包括:

4.如权利要求3所述的方法,其特征在于,所述将所述预警结构作为小胶质毒性预警结构之后,还包括:

5.如权利要求1所述的方法,其特征在于,所述基于预...

【专利技术属性】
技术研发人员:何大阔刘晴侯悦范萌萌崔泽宇
申请(专利权)人:东北大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1