杏彩平台客户端:评论材料项目——材料基因组加速创新的方法

2024-07-16 11:17:16来源:杏彩体育官网app 作者:杏彩体育平台登录

新闻摘要:  材料基因组计划是在2011年由美国发起的,目的是将实验学家、理论学家和计算机科学家之间的大规模合作部署验证过的计算方法,以实现对材料的预测、筛选和优化,规模和速度都是无与伦比的。  这个雄心勃勃的

  材料基因组计划是在2011年由美国发起的,目的是将实验学家、理论学家和计算机科学家之间的大规模合作部署验证过的计算方法,以实现对材料的预测、筛选和优化,规模和速度都是无与伦比的。

  这个雄心勃勃的方法已经成熟,现在已经很好地确定了许多重要材料特性可以通过求解基于使用密度泛函等量子化学近似的物理基本定律的理论(DFT)来预测。

  例如,在太阳能水分离、太阳能光伏、拓扑绝缘体、闪烁体、CO2捕获材料、压电和热电等领域,每项研究都提出了几个有前途的新化合物,可用于后续实验。在催化、储氢和锂离子电池等领域,高通量计算的实验“成功”也已经得到报道。

  近年来,一个令人振奋的趋势开始出现,即将计算材料科学与信息技术(如基于网络的传播、数据库和数据挖掘)相结合,超越任何单个研究小组的范围。这一发展扩展了对计算材料。

  数据集的访问权限,促进了新的协作方式来推动材料发现。下一步是利用开源开发和基于网络的交互式技术,使用户能够通过报告回馈社区问题,编码新类型的分析和应用程序,并提出下一组突破计算材料的方法。所有这些工作都准备好改变材料设计的方式。

  本文介绍的材料项目,是一个利用高通量计算和信息时代最佳实践的材料基因组项目,目的是创建开放、协作和数据丰富的生态系统,以加速材料设计。

  图1提供了材料项目的概览。材料项目是通过创建一个开放的协作系统来加速材料设计,涵盖了计算材料设计过程的每个步骤,包括数据创建、验证、传播、分析和设计。

  材料项目的一个主要目标是计算化合物的性质,然而实验数据可能不完整或缺失,这给实现这一目标带来了科学上的障碍。尽管第一行原理代码的稳健性和用户友好性有了显著改进,但自动化和存储大量计算仍然不容易。

  第一性原理计算是计算上昂贵的,为了获取基本属性,一个材料可能需要数百个CPU小时,通常需要串行操作,例如首先计算晶体结构的优化,然后进行性能计算,并且通常需要人为干预以获得一致可靠的结果。

  为了解决这些问题,材料项目开发了自己的工作流软件(烟花),用于自动化和管理大型超级计算中心中的所有计算步骤,并使用作业管理软件(保管人)执行所有计算所需的任务。

  例如,在执行能量优化运行时,它会通过应用基于规则的修复方法来自动修复失败的运行,更新集群和收敛参数。该系统还可以自动防止重复作业,并在检测到金属时应用不同类型的工作流程与绝缘体。

  利用这个基础设施,材料项目已经建立了一个相当大的材料数据库,其中包含计算的结构、电子和能量数据。

  到目前为止,大多数材料项目的数据是针对无机晶体中的化合物的结构数据库(ICSD)。展望未来,一个重大挑战是生成新的成分和化合物进行计算。

  这个问题是计算材料科学中最重要的挑战之一,已经有多种算法方法来解决它。基于优化的方法(例如遗传算法和模拟退火)已经得到广泛研究,数据驱动方法也开始出现,但没有一种技术是理想的。

  然而,基于Web的协作增长表明另一种生成新化合物的方法:结合众包建议和按需计算。在这种方法中,由用户社区设计的晶体结构将自动输入到计算基础设施中,并将结果报告给社区。

  在生成大型数据集时,最后一个问题是验证计算数据的准确性。材料项目面临的一个主要挑战是如何向广泛的研究人员呈现计算数据,包括那些可能对第一性原理方法的局限性不熟悉的人。

  解决计算不准确性的一种方法是制定提高一致性的策略,并与实验结果进行比较。例如,在使用单一近似(如DFT)计算固体和气体之间的反应时,有时会得到不准确的反应能量,在某些元素与其二元化合物之间,或金属与包含相关d或f电子的绝缘体之间。

  材料项目报告了更准确的结果,通过针对不同材料类别采用单独的方法(包括使用已报告的实验数据)并使用一组参考反应来连接广泛的化学空间中不同方法的结果。此外,材料项目还提供原始数据,以供希望应用自己的校正技术或进行数据挖掘的用户使用(图3)。

  总之,材料项目的目标之一是通过自动化和协作加快材料设计,并通过提供可靠的计算数据和相应的解释来支持研究人员。

  他们的工作流软件和作业管理软件在管理大规模计算中起着关键作用,并且他们的数据库已经包含了大量的材料数据,为材料科学研究提供了宝贵的资源。

  尽管计算方法不断改进,但高通量计算的现实情况是,某些数据可能是不正确的。为了验证数据的完整性,我们目前正在使用自动化和众包的方式。

  在自动化分析方面,我们验证计算的氧化态、细胞体积和键长与实验数据的对比,并在网站上明确报告这些值超出正常范围的化合物,通过视觉警告的方式提醒用户。

  例如,许多层状化合物的结构在没有准确建模范德瓦尔斯相互作用的情况下通过标准的DFT函数进行计算,这些材料在网站上显示视觉警告,表明实验和计算结构不一致。

  与自动验证同样重要的是,每种材料在网页上都有一个报告问题按钮,用户可以点击该按钮来报告数据问题。例如,用户使用这个按钮报告了几个条目的磁性结构问题,这些问题很难通过自动检测来发现。

  材料项目的目标是以灵活和创新的方式提供对数据的访问,并为用户提供多种渠道来访问其庞大而丰富的材料数据集。

  大多数用户主要通过Web应用程序来访问材料项目的数据。这些应用程序提供了图形用户界面,用户可以通过查询不同形式的原材料和加工材料数据来进行搜索。

  例如,材料浏览器允许用户基于成分或性质搜索材料,并探索其性质(图4)。锂电池浏览器添加了特定于锂离子电池电极材料的搜索条件,如电压和容量。

  此外,还有其他的Web应用程序,允许用户以交互方式分析数据集,相图应用程序可以构建低温下任何化学系统的相图,支持封闭系统和开放系统(图5)。反应计算器可以平衡反应并计算反应能量,还可以自动报告与实验反应的能量比较。

  未来,材料项目计划进一步扩展其Web应用程序,以提供更复杂的数据分析功能。例如,他们正在开发根据Persson等人的方法计算普贝图(水溶性)的应用程序。

  此外,材料项目还计划利用大型材料研究社区的力量,通过材料数据创建新颖的应用程序,并提供托管用户提交的应用程序的机会。

  尽管Web应用程序提供了一种探索性数据分析的方法,但它们并不是获取大量材料数据的高效手段。因此,材料项目推出了材料应用程序编程接口(API),以满足用户对大型数据集的需求。

  通过该API,用户可以直接访问数据并进行类似于其他基于Web的信息门户(如谷歌地图)的操作。这个API基于使用超文本传输协议(HTTP)访问数据的表述状态传输(REST)原则。

  每个材料对象都有一个唯一的URL,并可以使用HTTP动词进行操作。操作返回结构化数据,通常以广泛使用的JSON格式表示。该API已内置于开源Python材料基因组(pymatgen)分析库中,提供了一种强大的编程方式来查询和分析大量的材料信息。

  目前,材料项目的API只支持单向信息传输,即从材料项目向用户。未来版本的API将提供一个通道,使用户能够向材料项目传输信息。

  例如,用户将能够提交化合物进行自动计算(按需计算),并且还可以提交关于材料的补充信息,如众包实验数据或带有出版物参考的标记化合物。这种双向互动将进一步扩大合作科学的范围。

  例如,通过基于能量的电子结构计算,可以构建相图,这对于大多数材料设计和合成问题非常有用。从计算得到的带结构可以推导出带隙、光学跃迁性质(间接/直接)以及载流子的有效质量,这对于功能性电子材料的设计(如热电或透明导电氧化物)非常重要。

  拥有像材料项目这样庞大而丰富的材料数据集,还有潜力将统计学习技术应用于广泛的化学领域中的数据挖掘趋势。

  (如图6所示)其中绘制了氧化物中4倍或6倍配位的Cr位点百分比作为氧化态的函数。数据支持已知的化学原则:较小的Cr6+离子倾向于4倍(四面体)配位,而较大的Cr3+离子倾向于6倍(八面体)配位。

  材料项目认为,开发稳健而具有洞察力的分析的最佳方法是利用整个材料研究界的专业知识。为此,材料项目采用了开源软件开发的最佳实践,构建了一个协作的材料数据分析平台。

  计算信息和分析在新材料设计中的作用最终将达到巅峰。(图7)展示了这一过程的示例:通过组合多个材料项目工具,可以在计算机上执行材料设计的许多方面。

  科学家可以想象,他们正在寻找具有特定能带结构特征和热力学稳定性标准的材料。通过在材料浏览器中进行搜索,用户找到了一种非常合适的含钌氧化物化合。


杏彩平台客户端


【责任编辑:(Top) 返回页面顶端
Copyright © 2008 - 2020 m.hzdongrun.com All Right Reserved.杏彩平台客户端(中国)体育官网app登录 | 备案许可证: .