System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 基于集成学习大规模直接带隙双钙钛矿设计方法、系统、介质技术方案_技高网

基于集成学习大规模直接带隙双钙钛矿设计方法、系统、介质技术方案

技术编号:43560699 阅读:8 留言:0更新日期:2024-12-06 17:33
本发明专利技术涉及一种基于集成学习大规模直接带隙双钙钛矿设计方法、系统、介质。其中设计方法包括如下步骤:S1,建立初始数据库;S2,对初始数据进行清洗与预处理;S3,特征工程与模型训练;S4,设计新型直接带隙双钙钛矿材料,完成整个方法流程。与现有技术相比,本发明专利技术能提供各组分特征对双钙钛矿直接带隙的影响趋势的同时还可以加快给出能够达到期望的直接带隙双钙钛矿,以减少实验的试错成本。

【技术实现步骤摘要】

本专利技术涉及钙钛矿电池,尤其是涉及一种基于集成学习大规模直接带隙双钙钛矿设计方法、系统、介质


技术介绍

1、作为新一代光伏材料,abx3通式的卤化物钙钛矿已被广泛研究,然而,稳定性差、可调性弱以及铅污染等问题限制了它们的商业应用,双钙钛矿具有环境友好、稳定性好、光电性能可调等优良特性,因此作为钙钛矿太阳能电池的替代材料具有广阔的应用前景,无铅无机双钙钛矿被认为是单包晶石的潜在替代品。

2、要制造高效率的双钙钛矿太阳能电池,必须使用具有合适带隙类型的双钙钛矿材料。然而由于潜在的元素空间庞大,不管是通过传统的试错法还是通过dft计算来寻找合适的直接带隙双钙钛矿都会消耗大量的时间与资源,这可能阻碍双钙钛矿太阳能电池的商业化进程。

3、机器学习技术的迅速发展为钙钛矿器件优化提供了新的契机。机器学习侧重于从大量数据中提取隐藏的、有效的和可理解的知识,通过使用各种算法来学习和预测某些材料特性,为我们提供了很好的启发。集成学习是机器学习中的一个重要技术和方法,其核心思想是通过构建并结合多个学习器(通常称为基学习器或弱学习器)来提高模型的性能和泛化能力。目前还没有从集成学习的角度尝试对无机双钙钛矿进行直接或间接带隙分类的方法。


技术实现思路

1、针对该需求,本专利技术使用了集成学习方法提供了一种智能化、快速准确搜寻和设计直接带隙双钙钛矿的方法,以减少实验的试错成本以及加速双钙钛矿电池的商业化进程。

2、本专利技术的目的可以通过以下技术方案来实现:

>3、本专利技术第一方面提供一种基于集成学习的直接带隙双钙钛矿设计方法,包括如下步骤:

4、s1,获取关注的双钙钛矿材料体系信息,获取已知的双钙钛矿材料数据,所述双钙钛矿材料数据包括双钙钛矿各个位点的组分信息和其带隙种类信息,建立初始数据库;

5、s2,基于集成学习,对初始数据库中的数据进行清洗与预处理,得到用于集成学习的建模数据集,所述建模数据集包括双钙钛矿各个位点的组分信息和带隙类型信息,将各个位点的组分信息作为变量,将带隙类型信息作为目标变量,将问题划归为分类问题;

6、s3,对建模数据集的特征进行筛选,得到最佳特征子集,对最佳特征子集进行模型训练与评估,并使用集成学习算法提升模型预测能力,获得机器学习预测模型,并使用shap方法,对机器学习预测模型进行可解释性分析;

7、s4,通过限定各个位点元素,创建理论双钙钛矿数据集,使用电中性筛选、容忍因子筛选法过滤不合理数据后,将过滤得到理论双钙钛矿数据集作为s3中获得的机器学习预测模型的输入,得到模型预测为直接带隙的双钙钛矿。

8、进一步地:s1中,建立初始数据库的过程包括如下子步骤:

9、s1.1,获取关注的双钙钛矿材料体系信息,自文献以及公开的材料数据库中收集已知的双钙钛矿材料的各个位点组分信息以及带隙类型信息;

10、s1.2,组分信息包括双钙钛矿材料(化学通式为a2bb′x6)各个位点的原子半径、原子序数、原子半径、范德瓦耳斯半径、鲍林电负性、价电子数量、电离能、偶极极化率以及氧化价态和离子半径,四个位点一共40个特征,其中一个元素会有多种氧化价态,这里取最常见的一种。

11、s1.3,将各个位点的组分信息和带隙类型进行整合,建立初始双钙钛矿材料的数据集。

12、s2中,根据关注内容,集成学习的目标变量为用于分类任务的类别标签,以1为直接带隙,以0为间接带隙。

13、进一步地:s2中,具体包括如下子步骤:

14、s2.1,基于机器学习,对初始数据集的特征进行异常值处理,再使用数据归一化操作,本专利技术中使用到的特征为组分特征,几乎没有缺失值,不需要额外进行缺失值处理,得到用于集成学习建模数据集,建模数据集包括双钙钛矿各个位点的组分特征和带隙类别;

15、s2.2,基于机器学习,对于类别不平衡问题需要进行采样增加数据使得类别平衡,对于特定数据集若类别标签比值超过1:10,则需要进行数据采样处理。

16、进一步地:s2.1中,异常值的上界为q3+1.5×(q3-q1),异常值的下界为q1-1.5×(q3-q1),其中q1为第一四分位数,q3为第三四分位数;数据归一化使用标准化操作,x^'=(x-μ)/σ,其中x是原始数据,μ是数据平均值,σ是数据的标准差,x'是归一化后的数据。

17、进一步地,s3中,具体包括如下子步骤:

18、s3.1,对s2中得到的数据集的特征进行皮尔斯相关性计算,过滤相关性高的特征,获得低共线性的特征子集;

19、s3.2,对低共线性特征子集使用多种集成学习模型算法分别进行模型训练,所述集成学习模型算法为分类算法和/或回归算法,以f1-score分数作为指标,对每个模型使用十折交叉验证,将每折交叉验证的平均分数作为模型性能指标,对模型性能进行评估,并作为基准线;

20、s3.3,基于机器学习,使用rfe方法对低共线性特征集合进行特征筛选,提高模型可解释性并优化模型;

21、s3.4,对优化的多种集成学习模型使用网格搜索进行模型超参数优化,其中,将提升十折交叉分数作为目标,搜索各个模型的超参数空间,得出最优模型;

22、s3.5,引用shap方法对集成学习预测模型的特征进行可解释性分析。

23、进一步地,s3.2中,将所述低共线性特征子集使用四种分类算法即gradientboosting classifie、random forest、lgbm、catboost分别训练模型。

24、进一步地,s4中,包括如下子步骤:

25、s4.1,将双钙钛矿各个位点可能的元素进行组合,创建理论双钙钛矿数据库;

26、s4.2,使用电中性筛选,将理论双钙钛矿数据库中非电中性的双钙钛矿删除;

27、s4.3,使用容忍因子筛选法,计算理论双钙钛矿数据库中双钙钛矿的容忍因子,将容忍因子小于4.18的删除;

28、s4.4,将通过电中性和容忍因子筛选的双钙钛矿数据作为s3中得出的最优模型的输入,获得模型预测的带隙类别,筛选出预测为直接带隙的部分,完成直接带隙双钙钛矿的设计流程。

29、进一步地,s4.3中,所述容忍因子筛选法公式具体为:其中r代表离子半径,下标代表该离子半径属于的位点,n代表元素的氧化态,rb的数值使用双钙钛矿a2bb′x6中rb与rb′作为替代。

30、本专利技术第二方面提供一种集成学习大规模直接带隙双钙钛矿电池设计的系统,包括:

31、初始数据库建立模块,获取关注的双钙钛矿材料体系信息,获取已知的双钙钛矿材料数据,所述双钙钛矿材料数据包括双钙钛矿各个位点的组分信息和其带隙种类信息,建立初始数据库;

32、数据预处理模块,基于集成学习,对初始数据库中的数据进行清洗与预处理,得到用于集成学习的建模数据集,所述建模数据集包括双钙钛矿各个位点的组分信本文档来自技高网...

【技术保护点】

1.一种基于集成学习的直接带隙双钙钛矿设计方法,其特征在于,包括如下步骤:

2.根据权利要求1所述的基于集成学习的直接带隙双钙钛矿设计方法,其特征在于:

3.根据权利要求1所述的基于集成学习的直接带隙双钙钛矿设计方法,其特征在于:

4.根据权利要求3所述的基于集成学习的直接带隙双钙钛矿设计方法,其特征在于:

5.根据权利要求1所述的基于集成学习的直接带隙双钙钛矿设计方法,其特征在于:

6.根据权利要求5所述的基于集成学习的直接带隙双钙钛矿设计方法,其特征在于:S3.2中,将所述低共线性特征子集使用四种分类算法即Gradient boosting classifie、Random Forest、LGBM、Catboost分别训练模型。

7.根据权利要求1所述的基于集成学习的直接带隙双钙钛矿设计方法,其特征在于:

8.根据权利要求7所述的基于集成学习的直接带隙双钙钛矿设计方法,其特征在于:

9.一种集成学习大规模直接带隙双钙钛矿电池设计的系统,其特征在于,包括:

10.一种包含计算机可执行指令的存储介质,其特征在于,所述计算机可执行指令的存储介质在由计算机处理器执行时,用于执行如权利要求1至8中任一项所述的基于集成学习的直接带隙双钙钛矿设计方法。

...

【技术特征摘要】

1.一种基于集成学习的直接带隙双钙钛矿设计方法,其特征在于,包括如下步骤:

2.根据权利要求1所述的基于集成学习的直接带隙双钙钛矿设计方法,其特征在于:

3.根据权利要求1所述的基于集成学习的直接带隙双钙钛矿设计方法,其特征在于:

4.根据权利要求3所述的基于集成学习的直接带隙双钙钛矿设计方法,其特征在于:

5.根据权利要求1所述的基于集成学习的直接带隙双钙钛矿设计方法,其特征在于:

6.根据权利要求5所述的基于集成学习的直接带隙双钙钛矿设计方法,其特征在于:s3.2中,将所述低共线性特征子集使用四种分类算法即grad...

【专利技术属性】
技术研发人员:林佳陈宇智刘晓霖陈正鑫
申请(专利权)人:上海电力大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1