神经网络有助于优化新材料的搜索
当搜索特定应用的可能新材料的理论列表时,例如电池或其他与能源相关的设备,通常有数百万种潜在材料需要考虑,以及需要同时满足和优化的多个标准。现在,麻省理工学院的研究人员找到了一种使用机器学习系统来显著简化发现过程的方法。
作为示范,该团队在近300万名候选人中,得出了一套8种最有希望的材料,一种叫做移动电池的储能系统。他们说这需要50年的常规分析,但他们在5周内就完成了。
麻省理工学院化学工程教授希瑟库利克和琼保罗珍妮特博士的论文《ACS中央科学》报道了这一发现。19岁,陈如研究生。
这项研究研究了一组被称为过渡金属配合物的材料。库利克说,这些物质可以以许多不同的形式存在。它们"真的很有吸引力,功能材料不同于许多其他材料阶段。理解它们为什么以自己的方式工作的唯一方法是使用量子力学来研究它们。"
为了预测这些材料中的任何一种的性质,它需要耗时和资源密集型的光谱学和其他实验室工作,或者它需要对每一种可能的候选材料或材料组合进行耗时和高度复杂的基于物理的计算机建模。每项这样的研究可能需要数小时到数天的工作。
相反,Kulik和她的团队使用了少量不同的可能材料,并利用它们来教授一种先进的机器学习神经网络,以了解材料的化学成分与其物理性质之间的关系。然后,应用这些知识为下一代建议可能的材料,以便在神经网络的下一次训练中使用。通过这个过程的四次连续迭代,神经网络每次都得到了明显的改善,直到达到一个明显的点,也就是进一步的迭代不会产生任何进一步的改善。
这个迭代优化系统大大简化了寻找满足两个冲突标准的潜在解决方案的过程。当改善一个因素时,找到最佳解决方案的过程通常会使另一个因素恶化,这个过程被称为帕累托前沿,它代表一个点的图形,因此一个因素的任何进一步改善都会使另一个因素恶化。换句话说,根据分配给每个因素的相对重要性,图表代表了最佳折衷方案。
训练一个典型的神经网络需要非常大的数据集,从几千到几百万个例子,但是Kulik和她的团队可以使用这个迭代过程,基于Pareto前沿模型,只使用几百个样本来简化过程并提供可靠的结果。
在筛选移动电池材料的情况下,所需的性能是相互冲突的,通常如下:最佳材料将具有高溶解度和高能量密度(在给定重量下储存能量的能力)。然而,溶解度的增加往往会降低能量密度,反之亦然。
神经网络不仅可以快速找到有前途的候选,还可以通过每次迭代为不同的预测分配置信度,有助于改进每一步的样本选择。Culic说:"我们开发了班里最好的不确定性量化技术,以真正了解这些模型何时会失败。"
他们为概念验证测试选择的挑战是氧化还原液流电池的材料,这种电池有望用于大规模电网电池,并能在实现清洁和可再生能源方面发挥重要作用。Kulik说,过渡金属络合物是这种电池的首选材料类别,但用传统方法评估的可能性太多了。他们首先列出了300万个这样的复合体,然后最终将它们减少到8个好的候选者,以及一套设计规则,这应该能让实验者探索这些候选者的潜力和它们的变化。
她说:"通过这个过程,神经网络在(设计)空间方面变得更聪明、更悲观。任何超出我们描述的东西都可以进一步改进我们已经知道的东西。"
她说,除了建议系统进一步研究的特定过渡金属配合物外,该方法本身也可以广泛应用。"我们真的认为这是一个可以应用于任何材料设计挑战的框架,你真的试图同时解决多个目标。你知道,所有最有趣的材料设计挑战是你有一件事要改进,但改进会让另一件事变得更糟。对我们来说,氧化还原液流电池的氧化还原对就是一个很好的证明。我们认为我们可以从这台机器中学到什么,并加速物质发现。"
例如,优化各种化学和工业过程的催化剂是另一个如此复杂的材料搜索,Kulik说。目前使用的催化剂往往涉及稀有和昂贵的元素,因此在丰富和廉价的材料基础上找到类似的有效化合物可能是一个显著的优势。
她说:"我认为这篇论文代表了多维定向改进在化学科学中的首次应用。"但是这项工作的长期意义在于方法论本身,因为它可能在其他方面是不可能的。"你开始意识到,即使进行了并行计算,我们也不会在这些情况下以任何其他方式提出设计原则。我们工作产生的这些线索,不一定是文献中已经知道的想法,也不一定是专家给你指出来的。"
西北大学化学、化学和生物工程教授乔治沙茨说:"这是统计学、应用数学和物理科学中非常有用的概念组合。"他说,这项研究涉及"当有多个目标时,如何进行机器学习。Culic的方法使用前沿方法来训练人工神经网络,以预测哪种过渡金属离子和有机配体的组合最适合氧化还原流
动电池电解质。"沙茨说:"这种方法可以在许多不同的环境中使用,因此它有可能改变机器学习,这是世界各地的一项主要活动。"