李正风
清华大学社会学系教授
清华大学科技与社会研究中心主任
2023年拉斯克基础医学研究奖授予谷歌DeepMind公司的哈萨比斯(Demis Hassabis)博士和江珀(John Jumper)博士,以表彰他们发明了AlphaFold这种能够预测蛋白质三维结构的革命性技术。AlphaFold本质上是一种人工智能(AI)系统,它将蛋白质结构预测的准确性和速度提升到了前所未有的水平。本期专稿《人工智能是蛋白质科学的终结者吗?》一文详细介绍了这项突破性技术发展的来龙去脉以及背后的关键人物。
除了AlphaFold这种标志性案例,人工智能在科学研究中的应用开始渗透到几乎所有STEM领域,特别是在医学、材料科学、机器人学、农业、遗传学和计算机科学等领域。从科学研究范式变革的角度,人们把这种新变化称为继“经验驱动”“理论驱动”“计算驱动”和“数据驱动”之后的第五范式,即“人工智能驱动的科学研究”(AI for Science)。尽管目前对于 AI for Science 的定义和内容仍有诸多讨论,但越来越多的科学家认为它是一场正在发生的重大科技革命。
从人类认知行为的历史演进,可以更充分地认识这一科技革命的性质与意义。从古代哲学思辨式的知识生产、工匠经验试错式的知识积累,到近代建立实验试错式的科学知识生产体系,人类认知行为演变的一个显著特征是“技术性替代”不断加强。从大的历史跨度看,这种“技术性替代”经历了两次重大变革。第一次重大变革是近代实验试错式科学知识生产方式的社会化和建制化,把数学和实验的方法系统引入到人类科学研究,形成了专业化、职业化、技术化的科学技术体制,不仅提升了知识的可靠性、精确性,推动了精密科学的发展,而且大幅度增强了知识生产的能力和效率。
目前正在涌现的AI for Science是又一次重大变革,意味着人类认知行为的“技术性替代”进入新时代。这个新时代具有三方面特点。
第一,人工智能对人类认知行为的技术性替代从肢体、感官上升到大脑。在以往科学知识生产过程中,技术手段的利用更多体现为人类肢体和感官的延伸,技术工具帮助科学家获得更广泛、更精确的事实,发现自然原理的工作则依赖科学家的创造性思维活动。AI for Science使这种技术性替代上升到人类的大脑,通过人工智能、机器学习、模拟推理等方法处理和分析大量数据,高效发现数据之间的关联,不仅帮助科学家克服“维数灾难”,而且帮助人类发现数据中隐藏的规律,助力科学家提出新假设。
第二,AI for Science有可能创造性地融合以往科学发现的多种范式。AI for Science不仅运用机器学习和大语言模型,而且要结合特定领域科学理论设计和开发AI模型与算法;不仅能够跨时空地利用不同学科领域长期积累的大量经验和实验数据,而且需要有足够的算力进行模拟和计算。这种创造性的融合让更多科研人员能够基于AI在更复杂的场景中进行探索,结合数据反推复杂场景下更为准确的物理规律,也使人工智能成为全新的知识生产工具。
第三,AI for Science是开放的、不断进化的社会技术系统。AI技术的发展不断打破学科、技术领域的边界,实现跨时空、跨模态的数据融合,不断利用新的知识、技术和数据进行迭代升级。同时,AI for Science也需要一系列数字技术和基础设置的支撑。因此AI for Science成为变革更彻底、影响更深远的“技术性替代”,而且这种“技术性替代”带来更高的技术壁垒,会形成科研能力更大、更难以超越的“代际差异”。
尽管AI for Science仍处于起步阶段,但其巨大潜力和深远影响不容忽视。我国建设当代科技强国,必须尽快抓住这次变革的历史性机遇,积极有效应对可能出现的各种挑战。