尽管自由意志和生活环境变幻莫测,人类行为总体上还是要比我们想象的可预测得多。

科学与社会1

在艾萨克·阿西莫夫的《基地》(Foundation,1951)系列小说中,数学家哈里·谢顿(Hari Seldon)运用心理史学预言了银河帝国的崩溃。小说中的所谓心理史学,就是一种对人类大众回应社会及经济事件模式的计算。谢顿起初因叛国罪受审,理由是他的预言助长了所谓的帝国崩溃,后来他获准在一颗与世隔绝的行星上组建了一个研究小组。在那里,谢顿研究了如何将帝国崩溃造成的破坏最小化,并将后续出现的无政府状态从3万年之久缩短到仅仅1 000年。

阿西莫夫知道,实际上我们不可能预测上千年尺度的大规模政治事件。然而,当我们阅读这本小说时,这种怀疑并没有萦绕在心头。简·奥斯汀的读者也不会因为知道伊丽莎白·班内特和达西先生并不存在而感到难过不安。阿西莫夫是个聪明人,他知道不论这类预测有多准确,都会受到意料之外的大型扰动的严重影响,更别提那些涉及原则的变动了。他也明白,那些愉快接受心理史学这个设定的读者也一定会意识到这点。在《基地》系列的第二卷中,就有这样一个“黑天鹅”事件彻底打乱了谢顿的计划。不过,谢顿还准备了一个应急计划,这个计划为后续小说内容带来了诸多惊喜。

阿西莫夫的《基地》系列最为人称道之处在于把重点放在了关键人物集团的政治阴谋上,而不是一页又一页地重复描写全副武装的庞大太空舰队的战斗。主角们会定期收到此类战斗的消息,但对这类消息的描绘与好莱坞的处理手法大相径庭。正如阿西莫夫自己所说,《基地》系列的故事情节是根据爱德华·吉本的作品《罗马帝国衰亡史》(1776—1789)改编的。《基地》系列作品是针对不确定性进行史诗级规划的大师之作。每一位高级部长以及公务员都应该好好看看这部小说。

为了取得戏剧性的效果,小说中提到的预测人类未来的方法,也即心理史学,把假设的数学技巧运用到了极致。然而,我们其实每天都会在不那么宏伟的任务中用到这种基本思想,例如当超市经理估算要摆多少袋面粉到货架上时,又例如当建筑师在设计建筑时估算会议室可能的大小。谢顿这个角色在某种程度上是受到了阿道夫·凯特莱(Adolphe Quételet )的启发。凯特莱1796年出生于低地国家根特,也就是现在的比利时,他是第一批将数学应用到人类行为上的人之一。如今我们对“大数据”和人工智能前景和危险的痴迷都是凯特莱智慧成果的直系后代。当然,凯特莱并不把由此衍生出的这门学科叫作心理史学,他称其为社会物理学。

统计的基本工具和技巧诞生于物理学科(尤其是天文学)之中。它们起源于一种系统方法。这类方法的主要目的是从不可避免地会出现误差的观测结果中提取信息。随着人们对概率论的认识不断加深,一部分先行者把这种方法拓展到了其原始边界之外。自此之后,统计学方法就成了生物学、医学、政治学、人类学乃至艺术中不可或缺的一种研究手段。因此,当你知道这门学科的奠基人本来是位纯粹的数学家,后来改攻天文,最后又臣服于社会科学的塞壬之歌时,估计也不会太过惊讶,甚至会觉得恰如其分。

凯特莱把自己的这个思想认识馈赠给了后代,那就是:尽管自由意志和生活环境变幻莫测,人类行为总体上还是要比我们想象的可预测得多。无论怎么说,这种认识都还不够完美,但正如他们常说的,“对政府工作来说,已经足够好了”。凯特莱还给我们留下了两条具体思路:一是“平均人”的概念;二是正态分布的普遍性,也就是如今众所周知的钟形曲线。这两个概念都是非常有用的工具,提供了全新的思考方式,但同时,如果太过刻板或是太过宽泛地应用它们,也会出现非常严重的缺陷。

凯特莱的第一个博士学位是当时刚成立不久的根特大学颁发的。他的博士论文是关于圆锥截面的。这个问题也是古希腊几何学家们的钟爱,他们用平面切割圆锥构建出了这些重要曲线——椭圆、抛物线、双曲线。凯特莱在大学里教了一段时间数学,直到1820年被选入布鲁塞尔皇家学院。这也开启了他长达50年的比利时科学界核心人物的学术生涯。

大约就在那个时候,凯特莱加入了一场建立新天文台的运动。当时,他对天文学还所知不多,但他天生就是一位实干家并且对政府里的那些弯弯绕一清二楚。凯特莱的第一个动作就是确保政府能够为这个项目提供资金支持。接着,他又采取措施弥补了他本人对天文台研究项目知之甚少的弱点。1823年,在政府资助下,凯特莱前往巴黎从当时顶尖的天文学家、气象学家和数学家那儿取经问道。弗朗索瓦·阿拉戈和亚历克西斯·布瓦尔教他天文,约瑟夫·傅里叶则教他概率论。

当时,天文学家是应用概率论的先行者,他们利用这种方法改善必定会出现误差的行星轨道观测结果。从专家那儿学习这些技巧的经历培养了凯特莱对把概率论应用于统计数据的终生痴迷。到了1826年的时候,凯特莱已经是低地国家统计局的一名区域通讯员了。

对于国家来说,有一个基本数字对现在及未来发生的事件施加了巨大影响,那就是:人口。如果你不知道自己国内究竟有多少人,那就很难做出相应规划。当然也可以进行猜测,但这么做到头来很有可能在不必要的基础设施上浪费很多钱,或者由于低估了国民的需求而引发危机。直到今天,这也是许多国家仍致力于解决的问题。

查明国家人口的最自然的方式就是把他们一个一个数出来。然而,人口普查并不像看上去的那样简单。国民会四处流动,有些还会因犯罪或逃税而藏匿起来。1829年,比利时政府酝酿了一场新的人口普查行动,当时一直在历史人口数据方向上工作的凯特莱也加入了这个项目。

“我们当前掌握的数据只能说是临时的,必须进行修正。”他写道。全面人口普查代价高昂,因此,估算历次普查结果之间的人口变化情况就变得有意义了。然而,这种估算方法并非长久之计,如今通行的做法是每十年进行一次大普查。当时,凯特莱也督促政府赶紧开展新的人口普查活动,这样才能获取估算未来的准确基准。不过,当他从巴黎学成归来时,产生了一个有趣的想法。这个想法来自伟大的法国数学家拉普拉斯。如果它能奏效的话,就可以省下一笔大笔钱。

拉普拉斯把两个数字相乘,计算出了当时法国的人口。第一个数字是过去一年的婴儿出生数,可以在出生登记记录中找到,准确性很高。第二个数字是总人口与每年出生人数之比——也就是人口出生率的倒数。把这两个数字乘起来,就得到了当年总人口的变化情况。不过,这个方法要奏效,似乎首先得知道全国总人口,毕竟这样才能知道出生率。对此,拉普拉斯给出的解决方案是采样:通过完善的采样方法就能得到一个合理的估计值。具体方法是,挑选几个具有典型性的人口配置合理地区,在那里开展全面的普查工作,然后再把结果与这些地区每年的出生人数相比较。拉普拉斯还做了相关计算,认为大约30个这样的区域就足以推算整个法国的人口。

然而,比利时政府并没有使用采样的方法,而是直接开展了全面的人口普查工作。现在看来,凯特莱之所以没有坚持使用完善的采样方法,是因为当时的一位国家顾问凯弗伯格男爵(Baron de Keverberg)提出了一项睿智、成熟但也具有误导性的方法论角度上的批评意见。调查不同区域内的出生率必然涉及各种令人困惑的因素,因此,这位男爵总结,根本不可能取得这样一种具有代表性的采样样本。各种因素造成的误差会累积,导致采样结果毫无用处。然而,他犯了两个错误。第一个错误是,寻找具有代表性的样本,并不是找到一个随机样本就完事了。第二个错误是,他只想到了可能出现的最坏情况(各种误差不断累积),却没想到最有可能出现的情况(大多数误差会通过随机变化而相互抵消)。值得一提的是,拉普拉斯之前就已经提出,对全国人口的最佳采样方案是预先挑选那些至少在某些方面能够代表总体的区域。这意味着这些区域要与总体有大致相似的贫富人口比例、受教育人口和非受教育人口比例、男女比例等等。如今,要想从小样本中得到优秀的采样结果,我们也会如此设计相关的民意调查。不过,统计学家最终发现,足够大的随机样本,效果就和精挑细选的代表性样本一样好,而且前者的获取难度还低得多。不过,这些道理都是我们现在发现的了,无论如何,当时的比利时政府决定挨个统计每个国民。

凯弗伯格男爵对凯特莱计划的批评最终促成了比利时政府于1829年开展全面人口普查工作,但这也产生了一个有益影响:凯特莱在这项庞大的工作中收集了大量数据,正是这些数据让他研究、分析了一辈子。很快,凯特莱的工作重点就从“数人头”发展成了测量人口。在整整8年的时间里,他收集了大量国民数据,其中包括出生率、死亡率、结婚率、预计妊娠期、身高、体重、健康状况、成年人口率、饮酒率、发疯率、自杀率、犯罪率,等等。凯特莱还研究了这些数据随年龄、性别、职业、地点、季节、入狱、住院等方面的变化。他一次只比较两项因素,从而绘制出展示这两者关系的图表。最后,凯特莱总结并出版了自己的研究结论,形成了他的代表作《论人类及其能力之发展——社会物理学论》(1835)。1842年,这本著作译成了英文,英文书名为《论人及其能力的发展》(1842)。

凯特莱每次提到这本书的时候,都会用副标题“社会物理学”。于是,当他于1869年修订本书的新版本时,直接交换了原书的主标题和副标题,也就是直接用“社会物理学”作为主标题。凯特莱完全了解自己创造了一门怎样的学科,那就是用数学分析方法诠释人类,至少是诠释那些可以量化的人类特征。

这本书中提到的一个概念激发了公众的想象力,并且令人们心醉神迷,那就是平均人的概念。凯特莱提出的这个概念在很多领域都有重要意义,他也因此清晰地认识到,还有必要更具体地考虑平均女性、平均孩童等各类人群的平均值。凯特莱很早就注意到,有关身高、体重这类特征的数据(充分限制在同一性别的同一年龄组中)往往会集中于单个值附近。如果我们把这类数据画成柱状图,就会发现最高的那根柱子出现在正中央,两侧柱子的高度逐渐减小,形成斜坡。这其实就是钟形曲线的特征形状,并且正如凯特莱自己承认的那样,数学家早已知晓了这种分布曲线。钟形曲线的整个形状大致对称,因此,中央峰值——代表最常见的取值——也就是平均值。许多类型的数据分布都会呈现这种模式,而凯特莱第一个意识到了这种分布模式在社会科学中的重要意义。

图、表当然都是非常好的工具,但凯特莱想要的是一种更简洁明了的总结方式,一种用活泼且便于记忆的形式传递数据主要信息的方式。因此,相较“钟形曲线显示,某些阶级20岁以上男性的平均身高是1.74米”这种说法,凯特莱更欣赏“(某些群体)男性的平均身高为1.74米”。接着,他就会对不同群体中的“平均男性”进行比较。全比利时范围内的“平均步兵”和法国“平均农民”相比如何?这个“平均步兵”是更高还是更矮?是更轻还是更重?又或者“他俩”几乎一样?“他”与德国“平均军官”相比又如何?布鲁塞尔的“平均男性”和伦敦的“平均男性”相比如何?“平均女性”呢?“平均孩童”呢?哪个国家的“平均男性”杀人或犯罪的可能性更高?哪个国家的“平均男性”成为救死扶伤的医生概率更高,而不是更倾向于自己了结自己的性命?对于每一种讨论的特征,我们都需要各种平均男性(平均女性、平均孩童)的数据。正如斯蒂芬·施蒂格勒在《统计学历史》(1986)一书中指出的那样,凯特莱认为“‘平均人’的概念是一种抹平社会随机变量,展示其‘社会物理学’定律的方法”。

1880年之后,社会科学开始广泛使用统计学,特别是钟形曲线。弗朗西斯·高尔顿是将数据分析应用于天气预报的先驱,并且发现了反气旋的存在。高尔顿绘制了人类第一幅气象图,并于1875年发表在《泰晤士报》上。他对真实世界的数字数据以及背后潜藏的数学规律心驰神往。查尔斯·达尔文出版《物种起源》(1859)后,高尔顿随即开展了一项人类遗传学研究。孩子们的身高与其父母之间有什么关系呢?体重、智商又怎么样呢?高尔顿采用了凯特莱的钟形曲线,把它应用在各种人群上。如果数据形成的钟形曲线出现了两个峰值,而不是一个,高尔顿就认为,数据样本涉及的人群一定包含两个区别明显的亚群,每个亚群各自遵守自己的钟形曲线。

随着研究的深入,高尔顿越发相信有许多美好人类特征都是遗传的,这应该是进化论的一个推论,但达尔文却予以否认。对高尔顿来说,凯特莱的平均人是一种社会必需,也是一种需要回避的情况。他的作品《遗传天才》(1869)运用统计学研究天赋和伟大特质的遗传,以及今日出现的一种平等主义目标(即“每个年轻人都应该有机会展示自己的能力,而如果他天赋极高的话,就应该接受一流教育并就此开启职业生涯”)的怪异混合体,还有“种族骄傲”的鼓励效应。在他的作品《人类能力及其发展探究》(1883)中,高尔顿创造了一个叫作“优生学”的术语,倡导政府提供财政支持鼓励那些高层级或高智商家庭联姻、生育。他想通过这种方式培养出拥有超能力的孩子。优生学在20世纪二三十年代大行其道,但由于过分滥用、强迫精神病患者绝育、纳粹的优等种族论等现象而迅速失去人心。如今,优生学与种族主义联系在一起。它违反了《联合国预防和惩治种族灭绝罪公约》和《欧盟基本权利宪章》。然而,这种思想从没有彻底离开我们的视线。

无论我们对高尔顿的性格看法如何,他对统计学的贡献是不容置疑的。1877年,他发明了回归分析,这种方法可以计算不同量之间最可能的相互关系,还催生了统计学中的另一个核心概念:相关性,用以评估不同数据集间的关联程度——例如,吸烟频率和肺癌发病率之间的关系。高尔顿在1888年讨论了一些例子,比如前臂长度和身高间的关系。随后,英国数学家和生物统计学家卡尔·皮尔森将这个想法转变成了一个数学公式,也就是相关系数公式。正如我们经常指出的那样,相关性并不是因果性,但它常常是潜在因果性的一个有用指标。

1824年,《宾夕法尼亚人报》开展了一场民意调查,内容为安德鲁·杰克逊还是约翰·昆西·亚当斯会成为美国总统。调查结果为,335票投了杰克逊,169票投了亚当斯。事实情况也是杰克逊赢得了最后的普选。自此之后,选举这个领域就吸引了民意调查专家的目光。出于实际操作方面的原因,民意调查只会涉及一小部分选民。于是就出现了一个明显的数学问题:多大的样本才能给出准确的结果?这个问题在人口普查、新药测试以及许多其他领域内都很重要。

直到最近,民意调查主要用的都还是随机样本。雅各布·伯努利于1684年左右发现了大数定律,并发表在了他的作品《猜度术》(1713)上。这个定律告诉我们,如果样本足够大的话,那么这个样本的平均值就“几乎肯定”会无比接近于我们想要的真实值。然而,这个定律并没有告诉我们所谓的“足够大”究竟是多大。中值极限定理,这个更复杂的定理就运用钟形曲线把样本均值与实际均值联系了起来,并可以据此计算所得结果能够奏效的最小样本容量。

如今,社交媒体的出现改变了许多选举的开展方式。精心设计的互联网民意调查又回到了拉普拉斯的方法。它们以精挑细选的个人组成的代表性小组作为统计样本。然而,很多此类民调都只是让那些想要投票的人参与进来——既不随机也不具有完全的代表性。这类民调的设计很糟糕,因为那些拥有强烈政治观点的人更有可能参与投票,而很多人甚至都不知道这个民调的存在,还有一些人都没法上网。同理,电话民意调查也很有可能存在倾向性,因为很多人都不太想回应电话那头冰冷的声音,甚至会在被问及看法时拒绝做出回答。在这个诈骗横行的时代,我们甚至没法确定这通电话是否真的是为民调而打来的。有一些人没有电话,有一些人不会对电话那头的民意调查员说真话——例如,他们很可能不太愿意向陌生人透露自己想要把票投给一个极端党派。在电话民调中,同一个问题的不同表述都会影响人们的回答。

民意调查机构为了尽可能地减小这些误差来源的影响,运用了各种各样的方法。其中许多都是数学方向上的,但心理学和其他方面的因素现在也已纳入考量。我们中的大部分人都听说过这样的故事:民意调查中出现了明显错误的结果。而且这样的故事似乎发生得越来越频繁了。有时可以用一些特殊因素来“解释”其中的原因,比如民众的意向突然发生了转变,或者选民在民调时故意撒谎,目的是为了让对手误以为自己胜券在握而放松大意。尽管如此,只要能执行得当,民意调查总体上还是能够相当好地胜任追踪记录的工作。它为削减不确定性提供了一件非常有用的工具。出口民调,也就是人们在投出选票后不久就被询问选了谁的民意调查,通常准确率相当高,往往能在官方公布结果前很久就给出正确的选举结果,且这类民调本身并不会影响选举结果。

如今,“社会物理学”这个术语背后的隐喻意义已经少了许多。信息技术的飞速发展引发了“大数据”革命。就这样,我们掌握了获取并处理海量信息的能力。人类的行为模式可以从信用卡消费记录、电话记录和电子邮件记录中提取出来。社交媒体上的消息突然变多了起来,例如2016年美国总统大选期间的“煽动事件”就可能成为热议政治问题的线索。

目前面临的数学挑战是:找到从大量非结构化信息中提取出有意义模式的有效方法。另外,我们已经尝试了许多新方法——其中某些源于物理学自身。例如,有关气体分子如何互相反弹的理论已经改编成了预测大型建筑或复杂建筑群(比如奥林匹克公园)中人群移动方式的方法。而社会及政治方面面临的挑战则是确保上述这类方法不会被滥用。在越来越多强大新方法的帮助下,社会物理学已经从当初凯特莱寻求无须挨个数人头就能查明全比利时人口方法的时代,往前走了很长一段路。

资料来源aeon.co

__________________

本文作者伊恩·斯图尔特(Ian Stewart)是美国华威大学数学系荣誉教授,最新作品《骰子是否戏弄了上帝?》(Do Dice Play God?)即将出版