科学学(Science of Science)试图以科学的方法来理解科学,但不论是从对象的角度看,还是从方法的角度看,科学都处在不断的变化之中,因此研究科学学的新趋向、新使命,必须立足于当代科学的新变化。本文将从对象和方法两个方面概要探讨当代科学的新变化,进而在此基础上分析新时代对科学学研究提出的新需求,以及科学学发展的新趋向。
当代科学的新变化
贝尔纳(Bernal)曾经把科学学理解为“一个具有反身性质的研究”,普赖斯(Price)认为科学学是“二次科学”。这意味着我们所理解的科学学,首先是以科学为“对象”,当然对科学“对象”的理解可以是狭义的,也可以是广义的:狭义的对象主要指自然界,广义的对象则包括人类社会。其次是以科学为“方法”,科学研究依赖的一些方法与以前哲学式的探讨以及工匠在获得经验知识方面的方法明显有所区别。从科学学的性质出发,我们理解当代科学的新变化,也可以主要聚焦在两个方面:其一,当代科学在研究对象上的新变化;其二,当代科学在方法上的新变化。
当代科学在对象上的新变化可以概括为三个方面。第一,数字化与大数据使得科学的研究对象发生了巨大变化。若干年前,我们并没有注意到数据会成为今天大数据时代面对的非常重要的一个对象,大数据时代的来临与数字化技术不断发展是联系在一起的。数字化技术不断发展使得科学研究的对象发生了巨大变化。无论是传统科学研究的物理对象、化学对象,还是人类社会行为学的研究对象,甚至历史上已经形成的文本,以及我们在现实生活中拍摄的图像都可以通过数字化的技术成为数据,进而成为当代科学展开研究的对象。第二,随着智能技术的发展,人类对自身各方面的认识和理解变得更加系统和深入,人类自身越发成为科学研究的重要对象。过去,我们科学研究对象更多是物理对象、化学对象,人是认识的主体,人在认识对象之外对认识对象进行观察和实验;今天,无论是生命科学,还是人工智能(AI),人本身变成了科学研究非常重要的对象。上述这两个方面的变化,带来第三个方面的变化:跨边界和跨模态的科学学研究。科学学以科学作为核心研究对象,但是今天的科学与技术、科技与创新活动之间的界限越来越模糊,自然科学和社会科学之间的关系变得越来越复杂。在研究尺度上,大尺度和小尺度之间由于数字科学的不断发展也趋向融合。因此,当代科学的研究对象也呈现出跨边界、跨领域和跨模态的新特征。
在科学对象变化的基础之上,我们再来看当代科学在方法上的新变化。人类获得知识的方法,从历史发展的角度来看,已经从以前哲学尤其是自然哲学思辨式的方法、工匠在试错中获得知识经验的方法,发展到广泛依靠实验、数学的方法,从而获得更加精确、更加系统的知识。这个演变的过程有一个很重要的特点就是对人类认知行为的技术性替代在不断加强。
对人类认知的技术性替代演变到今天,有两个非常重要的发展阶段。第一个阶段从16、17世纪开始,近代科学建制化使得我们用技术的手段来进行更加精密的科学研究,科学研究进入到社会化、组织化的新时期,这是一个非常重要的转变。第二个阶段是与数字化、智能化联系在一起的,人工智能对于人类认知行为的技术性替代开始从肢体上升到头脑,使得科学研究范式从以前经验试错范式发展到理论范式,再进一步发展到今天的计算范式、大数据驱动范式,也有人说我们会进入“智能的时代”。我们可以看到,方法上的变化使AI技术用于学习、模拟、预测、优化自然和社会现象,以促进科学的发现与创新。
今天,服务于科学的人工智能(AI for Science,AI4S)是非常值得关注的话题,在我看来它意味着人类认知行为技术性替代进入到新的阶段。2022年剑桥大学、图宾根大学、纽约大学和威斯康星大学一起召开了关于“科学研究中的机器学习和AI4S”的讨论,研究我们怎么样把AI技术用于科学发现、科学研究,有哪些重要领域和方法上的拓展。2023年美国医学拉斯克奖授给了哈萨比斯(Demis Hassabis)和江珀(John Jumper),他们的重要贡献是发明了能够预测蛋白质三维结构的AI技术——AlphaFold。和以前人们对于蛋白质三维结构的研究相比,AlphaFold2开源仅一周时间里,有98.5%的人类蛋白质结构被其预测。在此之前,全球顶尖科学家耗时数十年的努力也只解码了覆盖人类蛋白质序列中17%的氨基酸残基,这充分展现出AI在数字化和智能化时代很可能对科学发展带来巨大影响。这个影响不仅是对科学的影响,也会延伸到对社会生活的影响以及对技术的创新。
科学学的新趋向
当代科学的新变化会对科学学有什么样的推动作用?科学学会表现出什么新趋向?贝尔纳主要研究科学及其社会功能,在研究时他非常希望用科学方法进行研究,并认为科学学应该成为真正的、具有某种特点的科学,强调充分运用观察、估算、实验以及运筹学等手段。普赖斯对科学学的理解是“科学、医学、技术等的历史、哲学、社会学、心理学、经济学、政治学、运筹学等”。
20世纪60年代之后,科学学有两个重要的发展潮流。第一个潮流是对象导向的,以科学、技术和医学作为研究对象,但使用的方法可能是社会学、经济学的。在60年代,“科学技术与社会(STS)”成为人们关注的对象,但当人们要研究科学技术与社会的关系时,人们发现对科学、技术等对象的理解本身首先成了问题,必须要深化对科学、技术的系统认识,于是衍生出来科学技术学研究(Science and Technology Studies,S&TS),其实就是从社会学、经济学、政治学、历史学等多个人文社会科学的角度来对科学和技术这种社会现象进行比较深入的研究,这是对象导向的。
另外一个潮流是方法导向的,即尝试用定量方法来对科学对象进行研究,这就是科学计量学。从科学计量学角度来讲,它的发展非常值得我们关注。首先它要发现科学世界的量化特征,并且积累量化数据;然后开发各种类型的量化工具并进行量化分析,这个过程中量化数据也不断丰富。量化数据多元化和量化能力的提升推进了科学计量学的发展,形成了三个主要的阶段:首先是普赖斯的工作,即基于数理统计的计量科学学;然后是加菲尔德(Garfield)建立起引文数据库之后,围绕引文关系建立起来的基于引文网络分析的计量科学学;之后是把知识图谱、计算机方法应用于基于知识图谱的计量科学学。
计量科学学的发展为数字化和智能化时代的科学学发展新趋向奠定了基础,但它们之间有本质的变化和区别。在数字化和智能化时代,科学学走向新形态:计算科学学。这个发展过程中有两件事值得我们关注:一是在2009年,十余位来自哈佛大学、麻省理工学院等世界知名高校和研究机构的学者在《科学》(Science)上发表题为“计算社会科学”(Computational Social Science)的文章,认为随着收集和分析大规模数据能力的提高,一个数据驱动的新研究领域——计算社会科学——正在出现;二是在2018年,来自社会科学、计算机科学、物理学等不同领域的十多位学者在《科学》杂志发表了题为“科学学”(Science of Science)的综述文章,后面的引文比较少提到普赖斯、加菲尔德,更没有提贝尔纳,他们所说的科学学与贝尔纳那个时候的科学学之间已经有了很大的区别。
2018年的“科学学”文章提出了一种新的“科学观”:科学可以被描述为一个复杂的、自组织的、不断进化的网络,它由学者、论文和思想组成。当然,这个科学观是新颖的,从更广义的角度来讲这个科学观实际并不全面,但是也有它的好处,它为其他学科,特别是计算机等学科进入科学学领域提供了可能。该文认为科学学提供了对于不同空间和时间尺度的科学单元之间相互作用的定量理解,它让我们了解“创造力”背后的条件和科学发现的过程,其最终目标是发展一系列能加速科学研究的政策和工具。这篇文章最后也谈到,科学学未来研究的关键是将机器学习和人工智能整合,让客观的机器和人类一起去工作。我们注意到生成式人工智能出现后,用生成式人工智能工具来写科学学相关研究的论文这两年也迅速发展起来。
可以看出,当代科学学发展的第一个趋势是从计量科学学走向计算科学学。计量科学学所利用的结构化数据是对科学世界的某些量化表征,计算科学学面向的是逐渐数字化的科学世界,这是两者之间本质上的差别。当然,计算科学学的发展得益于数字化和智能化技术的不断发展,使得数据越来越丰富,而且也能够获得并且以比较低的成本存储下来。与此同时,也得益于自然科学家、社会科学家和计算机领域学者在新的科学观基础之上的合作。以数字化、智能化技术为基础,科学世界的数字化为我们实现科学学理想提供了一定的可能,即用计算的方法、量化的工具来对一个可以数字化的科学世界进行更加精密的分析。
当然计算科学学也有它的局限性,主要是三个方面:其一,科学世界不可能完全数字化,越是深层次的思想和观念越难以被数字化;其二,科学学使用的广泛数据和方法的一致性会导致研究结论片面性;其三,计算科学学面临更多数据伦理和人工智能伦理的问题。
当代科学学的第二个发展趋势是科学学的多样化和场景化。普赖斯曾经说“分析研究科学自身的各门学科都是逐个产生出来的,但是到1960年代,它们已经表现出连接为一个统一整体的许多迹象。这个统一整体将会比它的各部分的总和还要更大”。我们要问的是“统一的”科学学是否可能?计算科学学是否能够提供这种可能?面对日益复杂化、社会化的科学系统,科学学如何展开其研究?实际上,不同领域、不同场景之下的科学研究既有共性,也有特殊性。尤其在今天,计算科学学不断发展,我们确实需要避免普遍主义和特殊主义两个极端。这意味着科学学研究将会因场景而异。尽管科学学渴望适用于各个科学领域的长期普遍的规律和机制,但是首先需要面对的是不同领域和国家之间文化习惯和偏好难以避免的差异。这种变化使得一些跨领域的见解难以被理解,相关的科学政策也难以实施。科研问题、数据之间的差异,一般是与领域相关联的,这也暗示在将来科学学的研究会因“领域特色”而产生相应的变化。
未来科学学可能会同时面向“普遍科学”和“特殊科学”。普遍科学实际上是体现我们科学知识生产的共性特征和共同问题;特殊科学体现科学知识生产对象、领域和国家特殊性的实践和问题上,往往与学科对象、领域和国家特殊的场景密切相关。因此,科学学应该鼓励促进科学发展的多样化探索和实验。在这个过程中,我们应该合作、共享、开放、包容,而不应该只有一种普遍主义的科学学模式,要求大家必须按照这种模式去发展,或者是把某一个地方性科学学的一种发展框架理解为全球必须要共同遵守的框架。
当代科学学的第三个发展趋势是要走向“负责任的”科学学。在早期科学学发展过程中,人们曾经有一个理想。比如爱丁堡学派有一位非常著名的学者大卫?·?艾杰(David Edger)曾经说过,科学学的目标是为科学与技术投资决策提供客观的、价值中立的基础。我们今天的科学学研究也是希望能够发展出一系列加速科学研究的政策和工具。
那么科学学是不是“价值中立”的?科学学是不是需要充分考量科学和技术发展的方向以及是否有利于社会经济健康发展?前文提到当代科学在研究对象上有非常重要的变化,即从人类之外的对象进一步扩展到人类自身。伴随着这个变化,生命科学、人工智能领域衍生出来诸多新的社会伦理问题。如基因编辑、合成生物学这些生命增强技术有可能打破人类的“类同一性”。以前无论来自什么国家、什么民族,我们作为人类在生物学这个意义上具有“类的同一性”,现在有可能因为生命科学的发展而打破这种“类同一性”。此外,大数据、人工智能、脑机接口等技术重新定义“人类”,重新建构“人- 机”之间的关系,而这种关系与以前我们在科学研究中使用质谱仪或者显微镜所建立起来的人- 机关系有了本质的区别。在这种情况下,当代科技发展正在挑战人类共有共享的良知和人性,带来大量社会伦理问题。当我们需要研究科学及科学如何发展的时候不得不去面对这些社会伦理问题。
与此同时,计算科学学的发展本身在方法上、对象上蕴含着许多在当代科学发展过程中衍生出来的社会伦理问题,比如计算科学学高度依赖数据、算法和人工智能技术,无法回避新科技革命所面临的数据伦理、算法伦理和人工智能伦理的问题。2021年11月,联合国教科文组织发布《人工智能伦理问题建议书》。《建议书》中提到:“人工智能系统实际上涉及人工智能技术开发各个环节,以及与这些环节相关联的各类机构和各类人群。”《建议书》把使用人工智能的这部分人群也纳入到人工智能体系中,这样几乎当代社会所有个体都不能游离在这个系统之外。当然也由此使得人工智能带来的伦理问题将涉及社会生活的方方面面,尤其是人工智能算法可能复制和加深现有的偏见,从而加剧已有的各种形式的歧视,并产生新的伦理问题。
从这个角度来看,这些伦理问题对科学学研究提出了新的挑战。2021年10月,美国国家科学基金会(NSF)设立了新资助项目,并用了“科学学”这个标题,即“科学学:发现、传播与影响”项目。该项目旨在增强科学活动公共价值方面的理论和知识,以及相关政策制定过程中所需要的一些智力支持。
由此,我们可以看到,怎样使社会受益,使科学发展能够给公共价值向善带来更多的可能性,其实变成我们今天再去考量“科学应该向什么方向发展、科学应该如何发展”的非常重要的价值准则。因此,我们需要一个“负责任的”科学学。
“负责任的研究和创新”这个理念在最近一二十年已得到广泛认同。从这个理念出发,当我们以科学为对象,并且用科学方法来研究科学在当代发展的特点、规律以及它可能的趋向时,也需要体现负责任的研究和创新。“负责任的研究与创新”需要“负责任的”科学学。“负责任的”科学学意味着我们要不断反思以往科学学研究背后所包含的价值预设,需要“价值反思”和“价值对齐”。“价值对齐”是在人工智能发展过程中碰到的一个比较突出的问题,比如Open AI关于创新理念和路线之争,是“有效加速”还是“超级对齐”?这也是当代科学学发展要面对的一个共同话题。
由此来看,科学学的核心任务之一不仅是要加速科学的发展,促进科学和技术之间的关联以及促进创新,还要引导和保障科学与技术健康地发展!
————————
本文作者李正风是清华大学社会科学学院教授,科学与社会研究中心主任,教育部“高校科技伦理教育专项工作”秘书长;长期从事科技发展战略与政策、科技哲学、科学技术与社会、科技伦理与科技文化等领域的研究,多次参与国家科技发展规划、相关科技政策的研究和制定工作;《科学学研究》副主编,《科学文化》副主编。