System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术属于材料性能研究的,具体涉及一种基于多模态数据的纳米生物效应跨材料预测方法及装置。
技术介绍
1、目前,大量研究已经表明纳米生物效应与纳米材料的粒径、表面电荷以及亲疏水性等理化性质密切相关。然而,由于纳米核材料的复杂性和多样性以及其与生物体的相互作用机制的复杂性,因此对其在纳米生物效应中的关键作用的理解仍然存在挑战,并且对于纳米核材料如何实现跨材料预测生物效应也鲜有报道。
2、机器学习作为一种强大的数据分析和模式识别工具,已经在许多领域取得了显著的成果。通过将机器学习方法应用于纳米材料的研究中,我们可以进行毒性预测分析,可以更好地厘清核材料在纳米生物效应中的关键作用。另外,元素性质描述符是用于描述材料性质的重要工具,通过结合机器学习和元素性质描述符,我们可以对核材料的性质和行为进行深入剖析,并实现跨材料纳米生物效应预测。
3、此外,仅靠传统实验方法难以从众多参数中解析出关键影响因素。传统的实验方法虽然可以进行纳米材料与生物体的相互作用的研究,但在研究过程中受客观环境、实验仪器等各种因素的影响,有些实验无法达到预期的效果。当研究对象结构复杂且不易操作时会耗费大量的人力、物力,但仍难以确保实验顺利进行,且对于实验条件的控制严格、难度大、成本高、时间长等缺点限制了其应用范围。因此,采用机器学习方法来预测纳米材料的生物效应具有重要的意义。
技术实现思路
1、本专利技术的主要目的在于克服现有技术的缺点与不足,提供一种基于多模态数据的纳米生物效应跨材料预测方法
2、为了达到上述目的,本专利技术采用以下技术方案:
3、第一方面,本专利技术提供了一种基于多模态数据的纳米生物效应跨材料预测方法,包括下述步骤:
4、构建金属氧化物纳米颗粒影响细胞毒性的数据集;所述数据集包括实验描述符和元素性质描述符;所述实验描述符包括实验条件,所述元素性质描述符用于表征物理特性、化学特性、结构特征、表面性质以及元素结构推导的数值指标;
5、构建跨材料预测模型,并利用数据集训练跨材料预测模型,预测纳米核材料对生物效应的影响;
6、针对预测结果计算模型指标,评估模型在测试集上的整体性能,经过微调和优化后获取训练好的跨材料预测模型;
7、利用训练好的跨材料预测模型进行跨材料预测,将跨材料预测结果和数据集进行重要性分析,获取最优的金属氧化物纳米颗粒参数;所述重要性分析包括随机森林特征重要性分析、ebm模型分析和shap局部分析。
8、作为优选的技术方案,所述数据集构建时需要预处理,包括:对数据进行缺失值处理、异常值清洗、数据标准化处理和将分类数据进行编码转换成数字型数据。
9、作为优选的技术方案,所述元素结构推导的数值指标包括元素的电负性和分子量,用于描述核材料的性质和行为。
10、作为优选的技术方案,所述预测纳米核材料对生物效应的影响,具体为:将数据集输入跨材料预测模型中,模拟与生物相互作用,预测不同金属氧化物纳米颗粒在特定环境或条件下的行为,利用实验环境下的数据以及元素结构推导的数值指标观察其对生物效应的影响。
11、作为优选的技术方案,所述跨材料预测模型包括机器学习模型,用于分析纳米核材料与其生物效应的定量关系;所述机器学习模型包括随机森林、xgboost和支持向量机。
12、作为优选的技术方案,所述针对预测结果计算模型指标,评估模型在测试集上的整体性能,具体为:
13、模型指标包括拟合程度和均方根误差,所述拟合程度用于评估跨材料预测模型的整体性能,所述均方根误差用于评估跨材料预测模型的预测误差;
14、拟合程度计算公式如下:
15、
16、其中,y_pred表示模型的预测值,y_true表示模型的真实值,y_mean表示真实值的平均值。
17、均方根误差计算公式如下:
18、
19、其中,n表示样本数量,y_pred表示模型的预测值,y_true表示模型的真实值。
20、作为优选的技术方案,所述微调和优化,包括:
21、基于实验描述符构成的细胞毒性数据集,利用金属氧化物元素性质描述符对跨材料预测模型进一步优化;采用交叉验证的方法,将数据集进一步划分为多个子集,然后依次将每个子集作为测试集,其余子集作为训练集,训练跨材料预测模型并在测试集上评估性能;迭代训练,得到模型性能评估的平均值作为最终评估结果;根据最终评估结果进行超参数调优,确定调优参数范围,利用交叉验证评估不同参数组合的性能,并选择性能最佳的参数组合。
22、作为优选的技术方案,所述随机森林特征重要性分析,具体为:使用随机森林模型训练数据集计算每个特征在模型中的重要性得分,并将特征重要性得分可视化,识别对预测结果影响最大的特征;所述ebm模型分析,具体为:对跨材料预测模型中每个特征的影响程度和贡献进行分析,对可视化特征的贡献度和影响程度作可视化,以便理解模型的预测过程;所述shap局部分析,具体为:分析单个样本的预测结果,获取每个特征对该样本预测结果的影响,并通过shap值可视化,判断由单个特征对预测结果对模型的影响;所述预测结果对模型的影响包括正向贡献或是负向贡献。
23、第二方面,本专利技术还提供了一种基于多模态数据的纳米生物效应跨材料预测系统,应用于所述的基于多模态数据的纳米生物效应跨材料预测方法,包括预处理模块、模型训练模块、评估与优化模块以及预测模块;
24、预处理模块,用于构建金属氧化物纳米颗粒影响细胞毒性的数据集;所述数据集包括实验描述符和元素性质描述符;所述实验描述符包括实验条件,所述元素性质描述符用于表征物理特性、化学特性、结构特征、表面性质以及元素结构推导的数值指标;
25、模型训练模块,用于构建跨材料预测模型,并利用数据集训练跨材料预测模型,预测纳米核材料对生物效应的影响;
26、评估与优化模块,用于针对预测结果计算模型指标,评估模型在测试集上的整体性能,经过微调和优化后获取训练好的跨材料预测模型;
27、预测模块,用于利用训练好的跨材料预测模型进行跨材料预测,将跨材料预测结果和数据集进行重要性分析,获取最优的金属氧化物纳米颗粒参数;所述重要性分析包括随机森林特征重要性分析、ebm分析和shap局部分析。
28、第三方面,本专利技术提供了一种电子设备,所述电子设备包括:
29、至少一个处理器;以及,
30、与所述至少一个处理器通信连接的存储器;其中,
31、所述存储器存储有可被所述至少一个处理器执行的计算机程序指令,所述计算机程序指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行所述的基于多模态数据的纳米生物本文档来自技高网...
【技术保护点】
1.基于多模态数据的纳米生物效应跨材料预测方法,其特征在于,包括下述步骤:
2.根据权利要求1所述基于多模态数据的纳米生物效应跨材料预测方法,其特征在于,所述数据集构建时需要预处理,包括:对数据进行缺失值处理、异常值清洗、数据标准化处理和将分类数据进行编码转换成数字型数据。
3.根据权利要求1所述基于多模态数据的纳米生物效应跨材料预测方法,其特征在于,所述元素结构推导的数值指标包括元素的电负性和分子量,用于描述核材料的性质和行为。
4.根据权利要求3所述基于多模态数据的纳米生物效应跨材料预测方法,其特征在于,所述预测纳米核材料对生物效应的影响,具体为:将数据集输入跨材料预测模型中,模拟与生物相互作用,预测不同金属氧化物纳米颗粒在特定环境或条件下的行为,利用实验环境下的数据以及元素结构推导的数值指标观察其对生物效应的影响。
5.根据权利要求1所述基于多模态数据的纳米生物效应跨材料预测方法,其特征在于,所述跨材料预测模型包括机器学习模型,用于分析纳米核材料与其生物效应的定量关系;所述机器学习模型包括随机森林、Xgboost和支持向量机。
6.根据权利要求1所述基于多模态数据的纳米生物效应跨材料预测方法,其特征在于,所述针对预测结果计算模型指标,评估模型在测试集上的整体性能,具体为:
7.根据权利要求1所述基于多模态数据的纳米生物效应跨材料预测方法,其特征在于,所述微调和优化,包括:
8.根据权利要求1所述基于多模态数据的纳米生物效应跨材料预测方法,其特征在于,所述随机森林特征重要性分析,具体为:使用随机森林模型训练数据集计算每个特征在模型中的重要性得分,并将特征重要性得分可视化,识别对预测结果影响最大的特征;所述EBM模型分析,具体为:对跨材料预测模型中每个特征的影响程度和贡献进行分析,对可视化特征的贡献度和影响程度作可视化,以便理解模型的预测过程;所述SHAP局部分析,具体为:分析单个样本的预测结果,获取每个特征对该样本预测结果的影响,并通过SHAP值可视化,判断由单个特征对预测结果对模型的影响;所述预测结果对模型的影响包括正向贡献或是负向贡献。
9.基于多模态数据的纳米生物效应跨材料预测系统,其特征在于,应用于权利要求1-8中任一项所述的基于多模态数据的纳米生物效应跨材料预测方法,包括预处理模块、模型训练模块、评估与优化模块以及预测模块;
10.一种电子设备,其特征在于,所述电子设备包括:
...【技术特征摘要】
1.基于多模态数据的纳米生物效应跨材料预测方法,其特征在于,包括下述步骤:
2.根据权利要求1所述基于多模态数据的纳米生物效应跨材料预测方法,其特征在于,所述数据集构建时需要预处理,包括:对数据进行缺失值处理、异常值清洗、数据标准化处理和将分类数据进行编码转换成数字型数据。
3.根据权利要求1所述基于多模态数据的纳米生物效应跨材料预测方法,其特征在于,所述元素结构推导的数值指标包括元素的电负性和分子量,用于描述核材料的性质和行为。
4.根据权利要求3所述基于多模态数据的纳米生物效应跨材料预测方法,其特征在于,所述预测纳米核材料对生物效应的影响,具体为:将数据集输入跨材料预测模型中,模拟与生物相互作用,预测不同金属氧化物纳米颗粒在特定环境或条件下的行为,利用实验环境下的数据以及元素结构推导的数值指标观察其对生物效应的影响。
5.根据权利要求1所述基于多模态数据的纳米生物效应跨材料预测方法,其特征在于,所述跨材料预测模型包括机器学习模型,用于分析纳米核材料与其生物效应的定量关系;所述机器学习模型包括随机森林、xgboost和支持向量机。
6.根据权利要求1所述基于多模态数据的纳米生物效应跨材料预...
【专利技术属性】
技术研发人员:闫希亮,张菁,刘国红,王燕,吴银宝,贾琛,闫兵,
申请(专利权)人:华南农业大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。