当前位置: 首页 > 专利查询>上海大学专利>正文

基于随机森林快速分类用于有机-无机杂化钙钛矿后处理胺的预测方法及其系统技术方案

技术编号:31571756 阅读:23 留言:0更新日期:2021-12-25 11:11
本发明专利技术公开了一种基于随机森林快速分类有机

【技术实现步骤摘要】
基于随机森林快速分类用于有机

无机杂化钙钛矿后处理胺的预测方法及其系统


[0001]本专利技术涉及一种用于有机

无机杂化钙钛矿后处理胺的分类的方法和系统,是一种基于随机森林对后处理胺快速分类的方法,该方法应用于提高有机

无机杂化钙钛矿太阳能电池的稳定性。

技术介绍

[0002]钙钛矿是指一类陶瓷氧化物,其分子通式为ABO3,A位离子通常是稀土或者碱土具有较大离子半径的金属元素,B位一般为离子半径较小的元素,一般为过渡金属元素,如Mn、Co、Fe等。钙钛矿由于具有特定的稳定晶体结构,使其在光电领域具有巨大的发展前景,因此钙钛矿太阳能电池成为了近年来的研究热点。钙钛矿材料用于太阳能电池方面,不仅可以达到同其它太阳能电池相比较高的光电转换效率,且制作工艺也相对简单,价格低廉,稳定性较好。
[0003]有机

无机杂化钙钛矿(HOIPs)材料是由有机分子和无机分子组成的一类新型的复合晶体材料。无机组分可以为杂化结构提供热稳定性,硬度以及磁性和介电性能;有机配体可以提供结构多样性,高效的电学、光学性质。近几年,有机

无机杂化钙钛矿在太阳能电池领域得到了很好的发展和应用。
[0004]传统太阳能电池是由活动层中的硅制成,经过几十年的改进,这些设备的效率才达到了20%以上。而钙钛矿太阳能电池仅用了10年时间就达到了同样的水平。但钙钛矿太阳能电池有一个非常明显的问题,它的稳定性较差,各种研究发现钙钛矿在潮湿、氧气、紫外线等条件下的稳定性较差。因此,对钙钛矿进行后处理以提高其稳定性对太阳能电池的未来发展具有非常重要的研究意义。
[0005]随机森林(Random Forest,简称RF)是非常具有代表性的装袋(Bagging)集成算法,采用随机样本和随机特征构建单个基评估器,它的所有基评估器都是决策树,并根据决策树的不同可以同时适应分类和回归任务。随机森林算法的优点有:(1)可以产生高准确度的分类器;(2)它可以处理大量的数据集;(3)在建模过程中采用了无偏估计;(4)能够处理具有高维特征的输入样本,而且不需要降维;(5)能够评估各个特征在分类问题上的重要性等。
[0006]最大相关最小冗余(mRMR)是一种常见的用于自变量筛选的方法。该方法是一种滤波式的特征筛选算法,基于所选择的特征之间的冗余度应最小,与目标变量之间的相关性最大的理论来筛选自变量。但如何将基于随机森林算法应用于快速预测有机

无机杂化钙钛矿后处理的胺进行快速还需要进一步地探索和研究。

技术实现思路

[0007]为了解决现有技术的问题,本专利技术的目的在于克服已有技术存在的不足,提供一种基于随机森林快速分类用于有机

无机杂化钙钛矿后处理胺的预测方法及其系统,能对
用于有机

无机杂化钙钛矿后处理的胺进行快速准确分类,从而改善钙钛矿太阳能电池的稳定性差的问题。该方法通过计算胺的描述符,利用最大相关最小冗余筛选变量,通过随机森林算法建模,预测胺的类别。该方法能在几分钟内得到分类结果,方便快捷,无需实验和繁杂的计算。
[0008]为达到上述专利技术创造目的,本专利技术采用如下技术方案:
[0009]一种基于随机森林快速分类用于有机

无机杂化钙钛矿后处理胺的预测方法,包括如下步骤:
[0010](1)建立数据集样本:利用计算机系统,从文献中查找用于有机

无机杂化钙钛矿后处理的胺的结构,作为数据集样本;
[0011](2)生成描述符:用Chemdraw画出收集到的胺的结构,再用Dragon软件生成描述符;
[0012](3)以钙钛矿薄膜与后处理胺是否发生反应为目标变量,利用Dragon生成的描述符为自变量,以变量自相关性为0.95初步筛选特征变量;
[0013](4)利用最大相关最小冗余方法进一步筛选变量,选出建模的最优变量子集;
[0014](5)随机划分训练集和测试集,测试集的比例占整个数据集的20%;
[0015](6)采用随机森林分类算法建立后处理胺的分类模型;
[0016](7)根据建立的模型,快速预报独立测试集的至少10个胺的结构式。
[0017]优选地,在所述的步骤(4)中,利用最大相关最小冗余方法进一步筛选特征变量的方法如下:
[0018]利用HyperMiner数据挖掘软件,将经过初筛的数据集导入,选择最大相关最小冗余的方法,确定好目标变量及自变量后点击“计算”,得到特征变量的相对重要性排序,在此基础上选择用于建模的特征变量。
[0019]一种实施用于有机

无机杂化钙钛矿后处理胺的预测的系统,执行本专利技术基于随机森林快速分类用于有机

无机杂化钙钛矿后处理胺的预测方法,包括:
[0020]输入模块:从公开发表的文献中查找用于有机

无机杂化钙钛矿后处理的胺的结构数据,并作为输入数据;
[0021]数据分析模块:利用输入模块获得的数据,执行基于基于随机森林快速分类用于有机

无机杂化钙钛矿后处理胺的预测方法,快速预测有机

无机杂化钙钛矿后处理的胺;
[0022]输出模块:将有机

无机杂化钙钛矿后处理的胺数据输出。
[0023]本专利技术与现有技术相比较,具有如下显而易见的突出实质性特点和显著优点:
[0024]1.本专利技术的随机森林快速分类方法避免了重复试验,克服了传统实验“试错法”的不足,利用Dragon软件对画好的胺结构生成描述符,经过变量筛选与建模,将数据导入模型,可以在数秒内完成分类,能给实验人员提供指导与参考,从而缩短研发时间,降低研发成本;
[0025]2.本专利技术是在Dragon软件生成自变量并进行一定的特征筛选,再以随机森林建模,操作过程简单,成本低,节约人力及资源;
[0026]3.本专利技术整个过程不涉及实验及化学品,不产生环境污染,符合绿色环保理念。
附图说明
[0027]图1为本专利技术的程序框图。
[0028]图2为本专利技术的随机森林快速分类胺的分类模型建模结果混淆矩阵图。
[0029]图3为本专利技术的随机森林快速分类胺的分类模型留一法交叉验证结果混淆矩阵图。
具体实施方式
[0030]以下结合具体的实施例子对上述方案做进一步说明,本专利技术的优选实施例详述如下:
[0031]实施例一:
[0032]在本实施例中,参见图1,,一种基于随机森林快速分类用于有机

无机杂化钙钛矿后处理胺的预测方法,包括如下步骤:
[0033](1)建立数据集样本:利用计算机系统,从文献中查找用于有机

无机杂化钙钛矿后处理的胺的结构,作为数据集样本;
[0034](2)生成描述符:用Chemdraw画出收集到本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于随机森林快速分类用于有机

无机杂化钙钛矿后处理胺的预测方法,其特征在于,包括如下步骤:(1)建立数据集样本:利用计算机系统,从文献中查找用于有机

无机杂化钙钛矿后处理的胺的结构,作为数据集样本;(2)生成描述符:用Chemdraw画出收集到的胺的结构,再用Dragon软件生成描述符;(3)以钙钛矿薄膜与后处理胺是否发生反应为目标变量,利用Dragon生成的描述符为自变量,以变量自相关性为0.95初步筛选特征变量;(4)利用最大相关最小冗余方法进一步筛选变量,选出建模的最优变量子集;(5)随机划分训练集和测试集,测试集的比例占整个数据集的20%;(6)采用随机森林分类算法建立后处理胺的分类模型;(7)根据建立的模型,快速预报独立测试集的至少10个胺的结构式。2.根据权利要求1所述基于随机森林快速分类用于有机

无机杂化钙钛矿后处理胺的预测方法,其特征在于:在所述的步骤(4)中,利用最大相关最小冗余方...

【专利技术属性】
技术研发人员:郑靖陆文聪麦嘉琪申玉姝王君亚
申请(专利权)人:上海大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1