AI对于化学意味着什么？

发布时间：23年06月28日

编译高斯寒

让机器为我们进行思考会不会改变我们对化学的理解？科普作家菲利普 · 鲍尔审视了这个问题。

好几年前，我和一位杰出的天体物理学家同坐一辆计程车，我们在路上聊起AI的未来。他说，工作岗位将逐渐变得可以牺牲。AI会取代计程车司机、医生、教师、诗人……随着近期ChatGPT的出现，如今有一些人认为AI最终会取代作家。

“那么天体物理学家呢？”我问道。“哦，不，天体物理学家不会被取代。”他回答。他们做的工作无法被自动化。

我不怀疑，他的话有点讽刺的成分，但许多科学家的本能想法是人类的直觉对于他们的工作方式至关重要，AI在可预见的未来中无法淘汰直觉。实际上，现今的AI很大程度上基于能够挖掘庞大数据集，寻找模式和相关性的机器学习算法，被视作科研人员的助手，而非科研人员的替代。它能完成许多事，尤其是当它与机器人系统连接时：不仅分析数据，还能筹划和执行实验，进行迭代改进，甚至用公式表述和检验特定的假设。这些尚未成为实验室里的常规做法，但正在变得越来越常见。

AI可以如何转变化学家提出的问题？

在某些方面，化学接受AI殖民（AI colonisation）的时机已经成熟。大量的化学合成利用经过试验检验的方法和合成路线，甚至那些实施者都觉得它们是无聊乏味的重复性操作。微流体技术使得许多湿化学操作能够自动化完成。即使设计逆合成策略也可以是公式化的，因此适合于算法。早已有研究人员尝试制造出自动化合成系统，那些系统允许使用者输入他选择的任何一种分子。许多分析技术也正在被自动化改造。

但是，将这些发展塑造为“人类化学家的退场”就属于过分简单化了。至少以近期来说，更可能发生的情况是化学家扮演的角色和拥有的技能组合会转变。消除重复性任务的负担，这一点都不会让我们遗憾，因为它可能解放化学家，让他们能进行创造性思考，而不是例行公事地埋头苦干。

也许，更加有启发性的问题是AI是否可能从概念上改变化学？历史上，方法论的改变伴随着学科知识框架的变化。18世纪分析化学的进步使得学者能聚焦于组成的问题：化学的元素物质是什么？它们如何组成不同的化合物？从19世纪中期起，学者的关注点转移到分子结构，促成这一转变的部分原因是分离和提纯紧密相关化合物的能力的改进。量子理论和光谱学之类技术的出现在20世纪初期促成对化学键的新认识。在20世纪渐近尾声时，分子束和超快激光使得研究者可以研究反应必威在线网站首页网址学的细节。随着AI越来越变成化学家工具箱中的一个工具，它可以如何转变化学家提出的问题？

怎样的工具

随着AI在实验室里发挥的作用日益扩张，一个被常常问起的问题是，化学家以后是否需要传统上教授的实践技能？假如合成变成了使用微流体和其他方法来完成的自动化合成，那么你还需要知道如何使用移液器或如何滴定吗？

扎卡里 · 鲍姆（Zachary Baum）认为你需要。他是美国化学学会信息部门的一位科学内容工程师。他说：“多步微流体操控在改进中，包括在每个自动化步骤中提纯样本的方法，所以流动化学对于研究人员而言，可能会变得更加像例行程序。”但是，将这些方法放大规模到中试的运作，就需要以人工方式完成，至少在目前是这样。“在我看来，赋予合成化学魅力的实践技能的重要性没有一丝一毫的降低，”他说，“我们会继续让研究生在硅胶柱上辛苦忙活，努力让蒸馏器运作。”

多伦多大学的阿纳托尔 · 冯 · 利林菲尔德（Anatole von Lilienfeld）是一位利用机器学习来预测化学行为的专家，他同意“机器学习不会取代未来的化学家，而是会协助他们”。他认为机器学习是“继实验、理论和计算之后科学的第四支柱”。如他所说，它是一个为更好地理解和控制化学过程和性质的工具。

但是，新的工具不只是扩展研究化学过程的方式，它们可能改变我们对于化学过程的思考方式。“工具箱中的每个新工具都已经导致化学家关注点的转变。”多伦多大学的费利克斯 · 施特里特 - 卡尔特霍夫（Felix Strieth-Kalthoff）说道，他是一位跟随计算科学家阿兰 · 阿斯普鲁 - 古齐克（Alán Aspuru-Guzik）工作的博士后。

元素在某些化合物中的“可替换性”能够计算出来

“以核磁共振（NMR）波谱法的发展为例，”他说，“它演变为一种强大的常规技术，能够表征越来越复杂的分子，这使得研究者能够把注意力转向复杂分子和它们的反应。”一旦聚合酶链式反应使得扩增DNA序列进行分析变得容易，生物学家和生物化学家就能聚焦于更高级别的任务，譬如弄明白DNA序列意味着什么。经由这些转变后，曾经对于化学实践而言属于核心的技术——譬如滴定——可能被降格为一种教育用途的技术，因为它们被现代自动化技术取代了。“我相信AI工具能让类似的范式转变成为可能，让化学家拥有更多时间和能力集中于复杂的、更高等级的设计任务。”施特里特-卡尔特霍夫说道。

他仍然坚信：“鉴于化学整体上多么广袤和多样，我们迄今为止已经探索过的领域多么的小，化学家仍将站在概念化、抽象化和指导研究问题的最前沿。”

瑞士伯尔尼大学的化学信息学专家让-路易 · 雷蒙（Jean-Louis Reymond）赞同这种观点：“我的观点是，AI从长期来看应该确实会比得上或者超越化学家的学识，但还有漫漫长路要走。当那天来临时，AI仍将是化学家的工具，而不是替代品，因为决定应用AI解决哪个问题，何时以及如何实施人工智能解决方案，都需要人类专家。”

然而，随着AI和自动化扩大探索合成策略的可能性，化学家可能在评估和优化策略时变得更加有系统性。譬如，2022年普林斯顿大学的阿比盖尔 · 多伊尔（Abigail Doyle）领导的一支团队表明，在优化有机分子之间钯催化交叉偶联反应（著名的铃木反应的一个变体）的反应条件方面，AI算法在表现上胜过人类的判断。算法使用一种名叫贝叶斯优化的方法，在这种优化中，对于最佳解的期望被新数据不断更新——在此例中，新数据由一个探索反应条件的自动化高通量系统提供。AI系统也能确定与之前普遍使用的反应条件有本质不同的最佳反应条件。

AI将会如何切分自然？

这些技术可能会产生什么样的启发式理解？化学一直都依赖于把复杂的、有时令人困惑的数据提炼成概念，再为化学推理提供直觉性的经验法则：诸如化学键类型和键级、原子半径、电负性标度和氧化态等概念。但假如化学学科变得更加依赖于原始数据的大量数字运算，那么这些概念会不会继续有用？利林菲尔德认为答案是肯定的。他说，这些启发式概念是把高维度数据缩减为低维度的参数的方式——比如，在计算一个代表电负性的数字时，通常有好几个要素介入。利林菲尔德感觉，AI技术应该能再生这些参数，量化它们的限度。

但这些方法也可能识别出新的参数与度量：也就是发现减少数据的新方法。利林菲尔德援引佩蒂弗数概念为例，佩蒂弗数由理论化学家大卫 · 佩蒂弗（David Pettifor）在1984年提出，旨在根据元素在二元化合物ABn中形成的结构，描绘出元素周期表中的每个元素的特征。粗略地说，具有相同佩蒂弗数的元素应该能够在二元相中替代彼此。这个从574种化合物的数据集中用手算推断出的分类计划可以被视为如今由机器学习产生的分类项目的前身。但AI的方法是完善佩蒂弗数的概念，把它作为一种将元素分类的方法，并借此拓宽化学家掌握的有用的启发式方法。

另一个例子是含有主族元素的钾冰晶石（化学计量数为ABC₂D₆）晶体结构的分类。利林菲尔德和同事使用机器学习来寻找这些结构的成键和形成能的趋势，使得他们识别出一些不同寻常的例子，譬如铝元素在钾冰晶石中被赋予负氧化态的情况。利林菲尔德觉得，AI以这种方式可能帮助化学家探究化学领域传统的启发式方法是否真正地“将自然在关节处切分”，还是需要完善和修改，以便更好地与数据显示的一致。

吉耶尔莫 · 雷斯特雷波（Guillermo Restrepo）在位于德国莱比锡的马克斯? · 普朗克自然科学数学研究所工作。他说：“或许未来的AI方法通过打开连接输入和输出的黑盒，将会增进对化学现象的理解。但他也指出，迄今为止，AI技术尚未揭示任何一类遭到忽视的反应类或官能团。也许我们已经确定了我们对于化学所需的大部分有用的“粗砺”描述，或者这只是表明我们倾向于被已经熟悉的领域吸引。

用AI从原始数据中取得的分类也可能帮助我们判断，那些化学家目前使用的方法是不是“自然的”（在实体世界中客观反映出的东西），还是更多是历史上和文化上的偶发事件。“AI能够确定一些化学概念是否反映出世界中的自然类别。”来自雅典大学的化学哲学家瓦妮莎 · 塞弗特（Vanessa Seifert）说道。她提出，酸性也许是一个好例子：酸性只是临时的“日常概念的持久性”，还是作为化学行为的一个基本方面有更深层次的有效性？

迈向人工智能辅助鉴赏

假如我们要获得新的洞察，我们也许需要发展“有解释能力”的AI算法：这些算法不仅给出数字，也能为它们的结论提供一些定性理由。那越来越成为AI领域更加普遍追求的一个目标。因为它往往是客户需要的东西。比方说，一位医生不仅想要从AI诊断系统知道它认为病人罹患什么病症，也想知道它是如何得到那个结论的。AI假如要得到信任，也许必须要能够解释自身。

“有解释能力的AI和基于AI的假设生成理念直到最近才进入化学领域。”施特里特-卡尔特霍夫说。譬如，阿斯普鲁-古齐克与合作者已经研发出一种机器学习算法，能够从化学和物理学的大型数据集中提取出可以向人类解释的见解。算法除了重新获得一些已知的控制有机分子溶解度和能级方面的——譬如杂环和吸电子基团对于能级的作用——经验法则，也提供一些新的结论。

施特里特-卡尔特霍夫说：“这样的手段尚未在化学中被广泛采用。我坚信这样的一天会到来，但这会需要一些时间。”鲍姆说：“一旦我们拥有能够在熟悉的化学语境下解释数据的AI，很可能就可以识别新的模式，依靠它们建立抽象概念。”

根据其他领域（如音乐和棋类游戏）使用AI的经验来判断，AI甚至可能拓宽我们对于化学的鉴识——譬如识别出人类从未发现过的全新的逆合成策略。雷蒙说，他对于AI用于逆合成的研究发现了一些之前从未被怀疑过的可能性——但在实验室中检验它们很可能是一个十分费力的过程，新的合成策略的研究总是这样。

鲍姆指出，这样的灵感源自奠基性的弈棋算法AlphaZero，这个算法能在国际象棋、围棋上击败其他的一流程序。国际象棋世界冠军芒努斯 · 卡尔森（Magnus Carlsen）曾经证实，他的下棋风格受到AlphaZero一些招数的影响。

施特里特-卡尔特霍夫说：“我觉得国际象棋或围棋的类比十分恰当。假如AI发现更多成功的策略或概念，我们不仅能从中学习，而且也能逐渐从美学角度赏识它们。长期来看，我认为这会补充当前化学家的技能组合，使得我们更好地理解化学。”

总有一天，机器可能生成一些假设并向人类做出解释。

资料来源 Chemistry World

——————

本文作者菲利普·鲍尔（Philip Ball）是英国著名科学作家，他的《预知社会：群体行为的内在法则》《好奇心》《图案密码》《明亮的泥土：颜色发明史》《如何制造一个人》《量子力学，怪也不怪》《我们为什么听音乐》《水：中国文化的地理密码》等著作都有中译本