材料基因工程高通量集成计算与数据管理的方法及系统技术方案

技术编号:14526652 阅读:170 留言:0更新日期:2017-02-02 06:18
本发明专利技术涉及一种材料基因工程高通量集成计算与数据管理的方法及系统,该方法包括:获取大量初始结构;选择第一性原理计算任务;对初始结构进行高通量筛选,得到有效结构;根据有效结构和第一性原理计算任务推荐计算参数;设置计算资源,生成计算资源配置文件,并保存计算资源配置文件;将有效结构、计算参数和计算资源配置文件提交到计算集群,进行计算和监控,并自动纠错;计算完成后,对计算结果文件进行提取或处理,得到计算结果和描述符数据,并将计算结果和描述符数据保存到第一性原理计算数据库中,实现了高通量自动流程第一性原理计算,及数据的自动提取、加工和存取,使用户可以便捷地开展自动流程高通量第一性原理计算。

【技术实现步骤摘要】

本专利技术涉及新材料研发领域,尤其涉及一种材料基因工程高通量集成计算与数据管理的方法及系统
技术介绍
目前,利用计算机模拟的方法来研究材料的性质已经成为探索新材料的一种强有力的方式,其中,第一性原理计算已经能够成功且准确地对材料结构和性质进行预测。国际上已经有一些高通量材料计算软件或第一性原理计算数据库,例如AutomaticFLOW软件和MaterialsProject数据库,但其开源程度以及数据的开放程度不高,影响国内用户的使用,并且需要用户自己搭建计算环境。因此,使用起来会有很大的局限性。而且,单一的第一性原理计算无法满足大规模作业平行运行和数据集中管理的要求。尽管可以通过写一段脚本程序的方式初步实现批量作业的自动流程,但是需要用户自己编写代码,购买或租用计算集群,搭建计算环境,数据可视化和格式转换、数据抽取和存储,数据的可靠性评价等依然不易实现,尤其是不能实现计算数据的复用和共享。因此,实现高通量第一性原理计算,数据及计算资源的一体化集成式管理,降低用户开展第一性原理计算的门槛,显得尤为迫切。
技术实现思路
本专利技术所要解决的技术问题是针对用户开展第一性原理计算的不便捷,及无法满足大规模作业平行运行和数据集中管理的要求,提供一种材料基因工程高通量集成计算与数据管理的方法及系统。本专利技术解决上述技术问题的一种技术方案如下:一种材料基因工程高通量集成计算与数据管理的方法,包括以下步骤:步骤1,获取大量初始结构,所述初始结构可以由系统根据内置的计算模块进行高通量建模产生,也可以由用户直接提供,所述初始结构包括:晶体结构、相结构;步骤2,选择第一性原理计算任务,包括:结构优化、静态计算、磁学性质计算、弹性常数计算(包括应力—应变法、应变—能量法两种方法)、电子态密度、能带结构、跟频率有关的介电函数以及结构预测和筛选,所选择的第一性原理计算任务可以是以上的一个,也可以是多个;步骤3,对所述初始结构进行高通量筛选,得到有效结构;步骤4,根据所述有效结构和所述第一性原理计算任务推荐计算参数,包括:结构优化参数、平面波截断能、计算方法参数、K点密度以及交换关联泛函参数信息,然后用户对所述计算参数进行修改和确认,或用户也可以选择直接上传计算参数,并保存所述计算参数;步骤5,设置计算资源,包括选择计算集群、设置计算时长以及所需CPU核数,生成计算资源配置文件,并保存所述计算资源配置文件;步骤6,将所述有效结构、所述计算参数和所述计算资源配置文件提交到计算集群,进行计算和监控,并自动纠错;步骤7,计算完成后,得到计算结果文件,并对所述计算结果文件进行提取或处理,得到计算结果和描述符数据,并将所述计算结果和所述描述符数据保存到第一性原理计算数据库中,所述计算结果包括计算资源和计算参数数据,所述描述符数据包括结构和性质数据。本专利技术的有益效果是:通过筛选大量初始结构,选择第一性原理计算任务,推荐计算参数,提交计算任务并监控,得到计算结果并存储,使用户可以便捷地开展自动流程高通量第一性原理计算。在上述技术方案的基础上,本专利技术还可以做如下改进:进一步地,所述系统内置的计算模块包括:支持单个结构建模和性质计算的原胞模块即UnitCell模块、单个结构连续掺杂情况的结构筛选和性质计算的掺杂模块即Doping模块、固溶体合金建模以及性质计算的特殊准随机结构模块即SQS模块、批量结构开展能量计算的多结构模块即Batchcalculations模块、用于结构表面吸附的表面吸附模块即SurfaceAdsorption模块、用于支持内部溶解扩散计算的扩散模块即Diffusion模块、以及支持过渡态搜索的过渡态搜索模块即TransitionStateSearch模块。采用上述进一步方案的有益效果是:通过系统内置的计算模块,可以根据不同的研究需求提供更多的高通量建模和自动流程计算,帮助用户便捷实现材料理论设计和相关研究。进一步地,步骤3具体为:步骤3.1,去除所述初始结构中的等价结构;步骤3.2,去除所述初始结构中的不合理结构,例如不稳定结构;步骤3.3,得到有效结构。进一步地,步骤6具体为:检测所述计算是否有误,如果有误,则自动进行纠错,纠错的方式为调整所述计算参数,并重新将修改过的计算参数和所述有效结构、所述计算资源配置文件提交至计算集群进行计算。进一步地,步骤6中,自动纠错的纠错方式具体为:检测是否有报错信息,如果有报错信息,根据报错信息的关键字从纠错规则库中确定纠错方案;检测计算结果文件是否完整,如果计算结果文件不完整,检查计算结果文件的中断信息,从纠错规则库中确定纠错方案;判断计算结果是否收敛,如果计算结果不收敛,调整计算收敛精度或调整计算步长,进行纠错,其中,纠错规则库包括计算错误的分类信息和针对错误的纠错方案。进一步地,步骤6中,检测模块针对出错文件的自动纠错最大次数为5次,超过5次自动放弃纠错,并返回自动纠错未成功信息给用户。进一步地,步骤7具体为:步骤7.1,计算完成后得到初始计算结果,将所述初始计算结果保存为计算结果文件;步骤7.2,对所述计算结果文件进行选择后下载,并保存;步骤7.3,解析所述计算结果文件,生成计算结果报告;步骤7.4,提取所述计算结果文件中的计算结果和描述符数据,并将所述计算结果和所述描述符数据存储在第一性原理计算数据库中。进一步地,步骤7中,还可以对所述描述符数据进行一次加工或二次加工,并将一次加工或二次加工后的描述符数据存储在第一性原理计算数据库中。进一步地,本专利技术所述的方法还包括:步骤8,将所述有效结构和所述描述符数据进行可视化展示。进一步地,第一性原理计算数据库中存储的数据默认为共享模式,所有平台用户都可以查看数据,数据作者也可以修改为暂不共享,其他用户无法看到数据。采用上述进一步方案的有益效果是:通过对第一性原理计算数据库设置共享模式,提高数据的安全性。本专利技术解决上述技术问题的另一种技术方案如下:一种材料基因工程高通量集成计算与数据管理的系统,包括:依次连接的获取系统、高通量作业生成系统、文件系统、作业提交与监控系统、纠错系统、数据提取系统和第一性原理计算数据库,其中,所述获取模块用于获取大量初始结构,所述初始结构可以由系统根据内置的计算模块进行高通量建模产生,也可以由用户直接提供,所述初始结构包括:晶体结构、相结构,所述获取模块还用于选择第一性原理计算任务;所述高通量作业生成系统用于对所述初始结构进行高通量筛选,得到有效结构,还用于根据所述有效结构和所述第一性原理计算任务推荐计算参数,供用户对所述计算参数进行修改和确认,或接收用户直接上传的计算参数;所述文件系统用于保存所述计算参数、计算资源配置文件和计算结果文件;所述作业提交与监控系统用于设置计算资源,并生成计算资源配置文件,还用于将所述有效结构、所述计算参数和所述计算资源配置文件提交到计算集群,进行计算和监控;所述纠错系统用于自动纠错;所述数据提取系统用于对计算完成后得到的计算结果文件进行提取或处理,得到计算结果和描述符数据;所述第一性原理计算数据库用于存储所述计算结果和所述描述符数据。在上述技术方案的基础上,本专利技术还可以做如下改进。进一步地,系统内置的计算模块具体包括:支持单个结构建模和性质计算的原胞模块即UnitCell模块、单本文档来自技高网...

【技术保护点】
一种材料基因工程高通量集成计算与数据管理的方法,其特征在于,包括以下步骤:步骤1,获取大量初始结构,所述初始结构由高通量建模产生,或由用户直接提供,所述初始结构包括:晶体结构、相结构;步骤2,选择第一性原理计算任务;步骤3,对所述初始结构进行高通量筛选,得到有效结构;步骤4,根据所述有效结构和所述第一性原理计算任务推荐计算参数,用户对所述计算参数进行修改和确认,或用户直接上传计算参数,并保存所述计算参数;步骤5,设置计算资源,生成计算资源配置文件,并保存所述计算资源配置文件;步骤6,将所述有效结构、所述计算参数和所述计算资源配置文件提交到计算集群,进行计算和监控,并自动纠错;步骤7,计算完成后,得到计算结果文件,并对所述计算结果文件进行提取或处理,得到计算结果和描述符数据,并将所述计算结果和所述描述符数据保存到第一性原理计算数据库中,所述计算结果包括计算资源和计算参数数据,所述描述符数据包括结构和性质数据。

【技术特征摘要】
1.一种材料基因工程高通量集成计算与数据管理的方法,其特征在于,包括以下步骤:步骤1,获取大量初始结构,所述初始结构由高通量建模产生,或由用户直接提供,所述初始结构包括:晶体结构、相结构;步骤2,选择第一性原理计算任务;步骤3,对所述初始结构进行高通量筛选,得到有效结构;步骤4,根据所述有效结构和所述第一性原理计算任务推荐计算参数,用户对所述计算参数进行修改和确认,或用户直接上传计算参数,并保存所述计算参数;步骤5,设置计算资源,生成计算资源配置文件,并保存所述计算资源配置文件;步骤6,将所述有效结构、所述计算参数和所述计算资源配置文件提交到计算集群,进行计算和监控,并自动纠错;步骤7,计算完成后,得到计算结果文件,并对所述计算结果文件进行提取或处理,得到计算结果和描述符数据,并将所述计算结果和所述描述符数据保存到第一性原理计算数据库中,所述计算结果包括计算资源和计算参数数据,所述描述符数据包括结构和性质数据。2.根据权利要求1所述的方法,其特征在于,步骤3具体为:步骤3.1,去除所述初始结构中的等价结构;步骤3.2,去除所述初始结构中的不合理结构;步骤3.3,得到有效结构。3.根据权利要求1所述的方法,其特征在于,步骤6具体为:检测所述计算是否有误,如果有误,则自动进行纠错,纠错的方式为调整所述计算参数,并重新将修改过的计算参数和所述有效结构、所述计算资源配置文件提交至计算集群进行计算。4.根据权利要求3所述的方法,其特征在于,步骤7具体为:步骤7.1,计算完成后得到初始计算结果,将所述初始计算结果保存为计算结果文件;步骤7.2,对所述计算结果文件进行选择后下载,并保存;步骤7.3,解析所述计算结果文件,生成计算结果报告;步骤7.4,提取所述计算结果文件中的计算结果和描述符数据,并将所述计算结果和所述描述符数据存储在第一性原理计算数据库中。5.根据权利要求4所述的方法,其特征在于,对所述计算的检测内容包括:检测是否有报错信息、查看所述计算结果文件是否完整、判断所述计算结果是否收敛。6.根据权利要求1-5中任一项所述的方法,其特征在于,在步骤7之后,还包括:步骤8,将所述有效结构和所述描述符数据进行可视化展示。7.一种材料基因工程高通量集成计算与数据管理的系统,其特征在于,包括:依次连接的获取系统、高通量作业生成系统、文件系统、作业提交与监控系统、纠错系统、数据提取系统和第一性原理计算数据库,其中,所述获取模块用于...

【专利技术属性】
技术研发人员:杨小渝
申请(专利权)人:中国科学院计算机网络信息中心
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1