Nature重磅:终于,科学家打开“AI黑盒”,发现了化学新知识

作者:网络 来源:欧博 2024-09-05   阅读:

撰文 | 马雪薇 前言 今年 3 月,世界气象组织发布了《2023年全球气候状况》报告。随后,古特雷斯称,地球正处于崩溃的边缘,化石燃料的污染让气候混乱达到了“

Nature重磅:终于,科学家打开“AI黑盒”,发现了化学新知识图片

Nature重磅:终于,科学家打开“AI黑盒”,发现了化学新知识图片

撰文 | 马雪薇

前言

今年 3 月,世界气象组织发布了《2023 年全球气候状况》报告。随后,古特雷斯称,地球正处于崩溃的边缘,化石燃料的污染让气候混乱达到了 " 爆表 " 的水平。

面对全球自然环境恶化的挑战,发展可再生清洁能源已成为最重要的解决方案之一。

作为新一代的光伏技术,有机太阳能电池(Organic solar cells,OSCs)凭借质轻、透明、柔性、成本低等优点受到了广泛关注,在光伏建筑一体化、可穿戴柔性电子器件和物联网设备等领域具有十分广阔的应用前景。

然而,自 1980 年代以来,提高有机太阳能电池的光稳定性一直是一个难题,这也是阻碍其商业化的重要原因之一。

人工智能(AI)技术有望被用来提高有机太阳能电池的光稳定性。然而,由于 AI 是一个黑盒,其是如何做出决策的,一直无法解释。

而且,在分子科学前沿,利用 AI 产生对化学知识的基本理解,与 AI 引导的优化策略得出实际结果,两者同等重要。

为此,来自伊利诺伊大学厄巴纳 - 香槟分校和多伦多大学的研究团队打开了 AI 黑盒,为提高光伏电池的稳定性做出了进一步的贡献。

他们将闭环实验与基于物理的特征选择和监督学习相结合,提出了一种名为 " 闭环迁移 "(closed-loop transfer,CLT)的新方法,旨在从闭环优化过程中提取和验证物理洞察,并指导化学发现。

据介绍,CLT 可以帮助研究人员快速识别影响目标函数的关键物理特征,从而更好地理解化学现象背后的原理。并且,CLT 可以指导实验设计,避免不必要的实验尝试,从而提高实验效率。此外,CLT 还帮助研究人员发现新的化学知识,并为材料设计和药物发现等领域提供新的思路。

相关研究论文以 "Closed-loop transfer enables artificial intelligence to yield chemical knowledge" 为题,已发表在权威期刊 Nature 上。

论文通讯作者之一 Jackson 教授表示:"AI 工具具有惊人的力量。但是如果你试图打开引擎盖了解它们在做什么,通常你得不到任何有用的信息。AI 可以帮助我们优化一个分子,但它不能告诉我们为什么那是最佳选择——哪些是重要的性质、结构和功能。"

研究结果表明,产生的新型光捕获分子比原来稳定四倍,同时还提供了关于它们为何稳定的至关重要的新见解——这是一个阻碍材料开发的化学问题。通过这一过程,他们确定了是什么赋予了这些分子更大的光稳定性。他们将 AI 黑箱变成了一个透明的玻璃球。

Burke 教授表示:" 模块化化学方法与闭环实验完美互补。AI 算法请求具有最大化学习潜力的新数据,自动化分子合成平台可以非常快速地生成新的所需化合物。然后对这些化合物进行测试,数据返回到模型中,模型变得更加智能——一次又一次。到目前为止,我们主要关注结构。我们的自动化模块化合成现在已升级到探索功能的领域。"

打开 AI 黑盒

AI 黑盒指的是内部工作原理对用户不可见的 AI 系统。你可以向它们提供输入并获得输出,但是你不能检查产生输出的系统代码或逻辑。

在许多情况下,我们需要警惕黑箱机器学习算法和模型。假设一个 ML 模型对你的健康状况做出了诊断,我们应该知道模型是如何做出决定的。

而在本研究的领域,了解有哪些决定性因素影响了光稳定性也是非常重要的。科研人员理解分子光稳定性的关注点主要集中在最低激发三重态(T1)的能量学及其与键离解能的关系上,而最近的研究表明,对于有限的化学类别,存在更高的能量三重态(Tn,n>1),但仍然缺乏一般性的设计原则。

研究团队提出的 CLT 方法有望打开 AI 黑盒,超越传统分析光稳定性的方法,取得突破。为了实现这一愿景,在 AI 能够产生可解释的假设并增强科研人员对光稳定性和分子功能的基本理解之前,需要从闭环策略中提取知识的新方法。CLT 可以在广谱的化学空间中优化分子功能,并给出化学知识。

CLT 由三个阶段组成:(1)机器学习驱动的假设生成;(2)实验测试;(3)物理驱动的发现。这三个阶段相互迭代,成为闭环,进而发生循环。这种迭代循环对于有效探索化学空间、识别影响分子特征的关键决定因素至关重要。

Nature重磅:终于,科学家打开“AI黑盒”,发现了化学新知识图片

图|CLT 范式。第一阶段(机器学习驱动的假设生成,绿色轨道)描述了基于 BO 的合成和表征回合,并同步使用基于物理特征的可解释机器学习。通过机器学习出现基于物理的假设后,第二阶段(假设测试,橙色轨道)实验性地测试该假设,如果得到验证,将产生新知识,这些知识在第三阶段(物理驱动的发现,红色轨道)中被用于分子优化。

在这项研究中,团队通过 CLT 的整个过程,打开了 AI 黑盒。AI 在闭环优化和知识提取方面发挥了关键作用。

例如,AI 通过 GRYFFIN 算法进行贝叶斯优化,指导合成和表征过程,以寻找具有更高光稳定性的分子。BO 算法平衡了探索和利用,确保了化学空间的多样性和高效搜索。

其次,AI 训练可解释的 ML 模型,利用基于物理的分子特征来预测光稳定性。这些模型不仅识别了高光稳定性的化合物,还阐明了分子光稳定性的设计规则。

此外,AI 还通过物理建模和特征选择,发现了高能三重态态密度 ( TDOS ) 与分子光稳定性之间的强相关性,这为后续的假设验证提供了基础。

AI 驱动科学新发现

总之,闭环实验,通过使用基于物理特征的可解释的 ML 模型进行了增强,阐明了有关分子光稳定性的基本化学知识,同时针对高功能分子目标进行了优化。人机交互、AI 引导的活动产生了本文的假设(30 个分子),其显著效率得益于 AI 引导的探索和利用的平衡与可解释的基于物理的建模的结合。

此外,研究团队也在进一步证明 CLT 广泛适用于其他前沿应用和研究领域,特别是难以先验预测的低数据状态和多维分子特性。有理由相信,CLT 将成为在假设驱动的发现研究中利用 BO 优势的手册,并通过基于物理的见解得到加强。

分享给小伙伴们:
本文关键词:
如果本文侵犯了您的权利, 请联系本网立即做出处理,谢谢。
相关文章