基于NLP处理的钙钛矿太阳能电池HTL材料预测方法技术

技术编号:37669047 阅读:23 留言:0更新日期:2023-05-26 04:29
本发明专利技术公开了基于NLP处理的钙钛矿太阳能电池HTL材料预测方法。本发明专利技术采用NLP9(自然语言)处理方法来探索钙钛矿太阳能电池材料,自动提取科学信息和预测使用新的数据类型的候选材料。采用word2vec的自然语言处理技术详细分析了原型金属卤化物钙钛矿、ETL和HTL材料以及添加剂材料;基于NLP的结果对钙钛矿太阳能电池的材料成分进行了预测。由NLP模型预测的HTL候选四氧化三铁,在现有数据库中尚未实现为合适的HTL材料。然后通过第一性原理计算对候选材料进行了结构和电子表征,并构建了先进的Fe3O4/CH3NH3PbI3异质结构,以揭示其光电性能。本发明专利技术将自然语言处理的方法应用到材料科学的研究中,应用自然语言处理方法对钙钛矿太阳能电池材料的分析和预测提供了一个平台。阳能电池材料的分析和预测提供了一个平台。阳能电池材料的分析和预测提供了一个平台。

【技术实现步骤摘要】
基于NLP处理的钙钛矿太阳能电池HTL材料预测方法


[0001]本专利技术属于机器学习预测材料领域,具体涉及基于NLP处理的钙钛矿太阳能电池HTL材料预测方法。

技术介绍

[0002]钙钛矿是一种分子通式为ABX3的晶体材料,呈八面体形状,结构特性优异。钙钛矿晶体的制备工艺简单,光电转换效率高,在光伏、LED等领域应用广泛。但由于高品质钙钛矿薄膜重复制备难度大、光输出耦合效率低、铅污染等问题仍待解决,目前距离商业化应用尚有一定的距离。使用计算机自动从文献中提取潜在的科学知识是计算机人工智能时代未来材料和化学研究的高度期望,然而大量钙钛矿相关科学文献没有得到有效利用。

技术实现思路

[0003]本专利技术的目的在于:
[0004]通过采用NLP(自然语言)处理方法来改善钙钛矿太阳能电池领域自动提取科学信息和预测可能有应用价值的HTL候选材料。
[0005]为实现上述目的,本专利技术提供如下技术方案:基于NLP处理的钙钛矿太阳能电池HTL材料预测方法,包括以下步骤:
[0006]S1、构建关键字为钙钛矿的文献数据库;
[0007]S2、提取文献数据库中材料名称及其对应的化学式;
[0008]S3、以材料名称及其化学式为输入,空穴传输层材料关联的候选材料为输出,构建并训练空穴传输层材料预测模型;
[0009]S4、将材料名称及其对应的化学式输入至步骤S3获得的空穴传输层材料预测模型,对获得的空穴传输层材料关联的候选材料进行DFT计算,验证空穴传输层材料预测模型输出候选材料的原子结构和光电性能。
[0010]进一步地前述的步骤S1中,利用API从springlink中爬取以钙钛矿为关键词的文献摘要构建文献数据库。
[0011]进一步地前述的步骤S2包括以下子步骤:
[0012]S201、使用了NLTK工具包方法,删除文献中与材料名称无关的语句以及标点符号;
[0013]S202、使用chemdataextractor以及正则表达式的结合进行材料名称及其对应的化学式识别提取。
[0014]进一步地前述的步骤S3中包括如下子步骤:
[0015]S301、将材料名称及其化学式将数据库里的每个材料名称及其化学式输入Word2vec,采用跳格法,提取词向量,调整最优参数进行无监督训练;
[0016]S302、对各个词向量与应用钙钛矿太阳能电池的余弦相似度进行相似度排序,获得空穴传输层材料关联的候选材料。
[0017]进一步地前述的步骤S4包括以下子步骤:
[0018]S401、通利第一性原理进行自旋极化计算,对候选材料进行结构和电子表征;
[0019]S402、通过构建CH3NH3PbX3与候选材料异质结构,验证候选材料的光学性能。
[0020]进一步地前述的步骤S401中,第一性原理计算采用CASTEP,截止能量为430eV,密度泛函为珀杜

伯克

恩泽霍夫。
[0021]相较于现有技术,本专利技术的有益效果如下:
[0022]通过自然语言处理方法成功地模拟了钙钛矿太阳能电池材料。通过采用NLP(自然语言)处理方法来改善钙钛矿太阳能电池领域自动提取科学信息和预测可能有应用价值的HTL候选材料。从而实现提高钙钛矿太阳能电池目前存在的重复制备难度大、光电转换效率较低等问题。并且逐步完善人工智能在钙钛矿材料领域的应用,建立相关数据库进一步推动人工智能与材料交叉学科的发展与进步。实现材料领域当中实验数据、第一性原理计算数据、自然语言处理数据的多模态融合。并使用自然语言处理方法对钙钛矿太阳能电池材料的分析和预测提供了一个平台。
[0023]通过NLP模型,获得元素周期表和钙钛矿/ETL/HTL材料的自动分类等各种化学信息。该模型表明,与Cs

、Cl

和Br

基的CH3NH3PbI3相比,碘基CH3NH3PbI3作为钙钛矿太阳能电池的主要金属卤化物钙钛矿材料。此外,该模型还表明,氧化锡、CuSCN和LiCO3是与钙钛矿太阳能电池高度相关的ETL、HTL和添加剂材料。
附图说明
[0024]图1是本专利技术的流程图。
[0025]图2是word2vec模型中钙钛矿、HTL、ETL的分析图;图中,(a)为钙钛矿、ETL和HTL材料的分布图,(b)为材料关系提取图。
[0026]图3是三种Fe3O4/CH3NH3PbI3钙钛矿/HTL界面的PDOS光谱和紫外可见光谱图;图中(a)为MAI

O的PDOS光谱图,(b)为PbI2

O的PDOS光谱图,(c)为PbI2

Fe的PDOS光谱图,(d)为MAI

O、PbI2

O和PbI2

Fe的紫外

可见光谱图。
[0027]图4是利用本专利技术训练模型输出的空穴传输层材料预测结果图。
具体实施方式
[0028]为了更了解本专利技术的
技术实现思路
,特举具体实施例并配合所附图式说明如下。
[0029]在本专利技术中参照附图来描述本专利技术的各方面,附图中示出了许多说明性实施例。本专利技术的实施例不局限于附图所述。应当理解,本专利技术通过上面介绍的多种构思和实施例,以及下面详细描述的构思和实施方式中的任意一种来实现,这是因为本专利技术所公开的构思和实施例并不限于任何实施方式。另外,本专利技术公开的一些方面可以单独使用,或者与本专利技术公开的其他方面的任何适当组合来使用。
[0030]如图1所示,本专利技术的流程图,本专利技术基于自然语言处理的钙钛矿太阳能电池空穴传输层材料预测方法,包括如下步骤:
[0031]S1、构建关键字为钙钛矿的文献数据库;
[0032]S2、提取文献数据库中材料名称及其对应的化学式;
[0033]S3、以材料名称及其化学式为输入,空穴传输层材料关联的候选材料为输出,构建并训练空穴传输层材料预测模型;
[0034]S4、将材料名称及其对应的化学式输入至步骤S3获得的空穴传输层材料预测模型,对获得的空穴传输层材料关联的候选材料进行DFT计算,验证空穴传输层材料预测模型输出候选材料的原子结构和光电性能。
[0035]其中,步骤S1,利用爬虫程序或网页爬虫插件和数据库API(或者数据库本身的搜索引擎)爬取收集SpringerLink中1997年至2021年中以钙钛矿为关键词的文献摘要。
[0036](不设时间限制,20,000篇以上),以获取初始训练语料库。
[0037]步骤S2包括以下子步骤:
[0038]S201、使用了NLTK工具包方法,删除文献中与材料名称无关的删除无意义的连词、括号、标点符号以及参考意义不大的新闻类、致谢类、会议类和书评类文献摘要等等并将

[]’
,

()

,...

【技术保护点】

【技术特征摘要】
1.基于NLP处理的钙钛矿太阳能电池HTL材料预测方法,其特征在于,包括以下步骤:S1、构建关键字为钙钛矿的文献数据库;S2、提取文献数据库中材料名称及其对应的化学式;S3、以材料名称及其化学式为输入,空穴传输层材料关联的候选材料为输出,构建并训练空穴传输层材料预测模型;S4、将材料名称及其对应的化学式输入至步骤S3获得的空穴传输层材料预测模型,对获得的空穴传输层材料关联的候选材料进行DFT计算,验证空穴传输层材料预测模型输出候选材料的原子结构和光电性能。2.根据权利要求1所述的基于NLP处理的钙钛矿太阳能电池HTL材料预测方法,其特征在于,步骤S1中,利用API从springlink中爬取以钙钛矿为关键词的文献摘要构建文献数据库。3.根据权利要求1所述的基于NLP处理的钙钛矿太阳能电池HTL材料预测方法,其特征在于,步骤S2包括以下子步骤:S201、使用了NLTK工具包方法,删除文献中与材料名称无关的语句以及标点符号;S202、使用chemdataextractor以及正则表达式的结合进行材料名...

【专利技术属性】
技术研发人员:张磊李深越
申请(专利权)人:南京信息工程大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1