灾难模拟：基于主体的模型

发布时间：18年07月11日

编译蔡立英

极为复杂的模型可以模拟数百万模拟人的灾难情景

从这张基于主体的模型快照中可以看到，一颗原子弹在美国白宫附近爆炸，几小时后，一股放射性尘埃横穿华盛顿特区向东蔓延。柱状图显示某个地点的人数和该处人们的健康状况

假如一颗原子弹落在华盛顿

　　5月的一个星期一上午11:15，一辆看似普通的货车驶入美国华盛顿市中心西北第16大街和K大街的交叉路口，就在白宫北边相隔几个街区远的地方。货车中，自杀式炸弹袭击者接通了开关。

　　这颗原子弹以恐怖分子几个星期前劫持的5公斤高浓缩铀为动力，爆炸后形成的火球是日本广岛原子弹的2/3，整个城市街区瞬间化为乌有，至少1公里范围的房屋向四面八方炸裂，数十万人在废墟中死去或挣扎。电磁脉冲烧毁了方圆5公里以内的手机，城市的大部分电网跳闸。原子弹爆炸产生的蘑菇云被风刮成放射性尘埃，向东蔓延到马里兰州郊区。道路很快被混乱的人群堵塞，一些人试图逃离，但是更多的人在寻找失散的家庭成员或寻求医疗救助。

灾难模拟的NPS1模型

　　当然，这些都是虚构的，但是有着非常严肃的目的。这个被称为“国家计划情景1”（NPS1）的核攻击故事情节起源于20世纪50年代。作为一种战争游戏，在必须面对的真灾难发生之前，美国国家安全官员和应急管理者用于测试其应对方案的安全方法。

　　60年后的今天，官员依然用常规的NPS1演习来估算核灾难的后果。只是现在，他们并非遵循固定的故事情节和提前集成的预测，而是使用计算机进行整个人工社会（artificial society）的假设分析：称之为“基于主体的模型的先进计算机模拟。

　　NPS1模型的现代版本包括了受原子弹影响地区的每一栋建筑的数字模拟，道路、电线、医院甚至手机信号塔也涵盖其中；模型也包括用以模拟放射性尘埃的天气数据。这个场景布满了大约73万个主体，这是合成人口（syntheticpopulations），从统计上等同于受影响地区的真实人口，考虑年龄、性别和职业等因素。每个主体是一个自发的子程序，能够在多种行为模式之间切换（比如恐慌、逃离和努力寻找家庭成员），从而以合理的人类方式响应其他主体和不断演变的灾难。

　　这种模型的目的是避免用固定的方程自上而下的描述人类事件，像经济学和流行病学等领域的传统做法那样。事实上，诸如金融崩溃或疾病传播这样的事件，其后果是从底层开始显现的，通过很多个体的相互作用，导致了现实世界丰富和自发的事件，而这是很难模拟的。

　　这样的细节正是应急管理者需要的，计算机科学家克里斯托弗·巴雷特（ChristopherBarrett）说，他是布莱克斯堡（Blacksburg）的弗吉尼亚理工学院暨州立大学（弗吉尼亚理工）的生物复杂性研究所所长。该研究所为美国政府研发了NPS1模型。NPS1模型可以提醒管理者，X点的电力故障可能导致Y点出现意外的交通拥堵。如果他们决定在危机发生后几个小时内部署移动手机信号塔来恢复通信，NPS1会告诉他们是否会有更多或更少市民涌到路上。巴雷特说：“基于主体的模型就是你如何把所有这些碎片化的信息梳理出来，并审视其相互作用。”

　　缺点是：像NPS1这样的模型往往十分庞大，每个模型的初始运行就让具有500个微处理器的计算集群忙碌1天半，迫使参与主体相对简单。乔纳森·普福茨（JonathanPfautz）说：“在每个主体的复杂性和模拟的规模之间存在基本的权衡。”普福茨是美国国防部高级研究计划局（DefenseAdvanced Research Projects Agency）的项目经理，资助了社会行为的基于主体模型。

基于主体模型的发展简史

　　但是，随着计算机越来越强大、用来模拟人口和校准模型的数据集变得越来越庞大，在经济、交通、公共卫生和城市规划等诸多领域，越来越多的决策者开始认真对待基于主体的模型。艾拉·隆吉尼（Ira Longini）说：“这种模型是现有的模型中最灵活最详细的模型，在理解和指导政策方面最有效。”隆吉尼在佛罗里达大学做传染病建模。

　　基于主体模型的起源至少可以追溯到20世纪40年代，当时像艾伦·图灵（AlanTuring）这样的计算机先驱，尝试用本地交互软件为物理学和生物学的复杂行为建模。但是，当前的发展浪潮是20世纪90年代中期发展起来的。

　　一个早期的成功案例是乔治梅森大学的经济学家罗伯特·阿克斯特尔（Robert Axtell）和纽约大学的约书亚·爱泼斯坦（JoshuaEpstein）共同开发的“糖域”（Sugarscape）模型。他们的目标是在普通的台式计算机上模拟社会现象，于是他们把基于主体的建模简化：在网格中四处游走寻找“糖”的一群简单主体，糖为类似食物的资源，在某些地方很丰富，而在另一些地方很稀缺。这个模型尽管很简单，却产生了令人惊讶的复杂群体行为，比如迁徙、战斗和邻里隔离。

　　20世纪90年代的另一个里程碑是交通分析和模拟系统（Transims），这是一个基于主体的交通模型，由巴雷特和新墨西哥州洛斯阿拉莫斯国家实验室的其他研究者共同开发。不像传统的交通模型用方程把移动的车辆整体描述为一种流体，Transims为每辆车和司机建模，将其视为在城市道路网上移动的主体。这个模拟包括了轿车、卡车、公交车的实际混合，并对司机的年龄、驾驶能力和目的地进行实际混合。应用到实际城市的道路网时，Transims在预测交通拥堵和地方污染水平方面比传统模型做得更好。之所以受到Transims启发的基于主体的模型如今成为交通规划中的标准工具，这也是其中一个原因。

流行病学家的制胜法宝

　　流行病学家也在经历类似转变。在20世纪的很长一段时间里，流行病学家用一组相对简单的方程来评估疾病暴发，这些方程把人们划分为几类：比如易感人群、传染人群和免疫人群，并且假设不同的人群进行完美混合，这意味着受影响地区的每个人都与其他所有人保持联系。这些基于方程的模型起初是在纸上运算，后来在计算机上运算，至今仍然被广泛使用。但是，流行病学家日益转向使用基于主体的模型来囊括方程忽视的因素，比如地理、交通网络、家庭结构和行为变化，所有这些因素都能强烈影响疾病的传播。

　　例如，2014年埃博拉（Ebola）疫情在西非暴发期间，弗吉尼亚理工学院团队运用基于主体的模型，帮助美国军方确定了战地医院的地点。规划者需要知道：当流动医疗队最终抵达时，哪里将是感染率最高的地方；病人在该地区著名的恶劣路段上能移动多远和多快；还有传统模型的方程中没有捕捉到的一系列其他问题。

　　在另一个例子中，纽约大学的爱泼斯坦实验室正在与纽约市公共卫生部门合作，为可能暴发的寨卡（Zika）疫情建模。寨卡病毒是一种通过蚊子传播的病毒，可能会导致灾难性的新生儿感染。该团队设计了一个模型，包括了代表所有850万纽约人的主体，加上一群规模小一点的代表了所有蚊子个体的主体。该模型还整合了如下的数据：人们通常如何在家、上班地点、学校和购物场所之间移动、性行为（寨卡病毒可以通过无防护措施的性行为传播）、影响蚊子种群数量的因素（比如季节性气温波动、降雨）、繁殖场所（比如旧轮胎堆放地）等。结果是，模型不仅能预测寨卡疫情暴发的严重程度（流行病学家根据方程也能确定），而且还提示了疫情最严重的热点地方。

经济学家的强大工具

　　世界银行经济学家斯特凡·哈勒加特（Stéphane·Hallegatte）指出：在经济学上，基于主体的模型可能是理解全球贫困的强大工具。如果你看的都是标准指标，比如国内生产总值（GDP）和总收入，那么，在大多数国家你看到的只是富人，穷人钱太少了，他们几乎没有登记相关数据。

　　为了得出更好的结论，哈勒加特及其同事正在研究单个家庭。他的研究团队搭建了一个模型，用主体代表全球140万个家庭，大约每个国家1万个家庭，并研究气候变化和灾难会如何影响健康、食品安全和劳动生产率。该模型估计了风暴和干旱如何影响农民的庄稼收成和市场价格，估计了地震如何通过摧毁汽车、道路乃至工厂而削减工人的收入。

　　模型表明了一些显而易见的事情：穷人在相当大的程度上比富人更容易受灾难和气候变化的影响。但是，哈勒加特的团队发现了一个显著的变量：比如，如果一个特定国家的穷人大多数是农民，当全球的食品价格因为气候变化而上涨时，他们实际上可能从气候变化中受益。但是，如果这个国家的穷人大多数都涌入城市中，则食品价格上涨反而可能会严重损害穷人的利益。

　　这种模型具有的个体化分析功能使得世界银行更容易根据每个国家的需求给出有针对性的建议，而且更容易用人们听得懂的语言而非晦涩的经济学术语来解释模型的结果。他说：“与其告诉一个国家说，气候变化将会令其GDP下降X%;你可以说，1000万人将陷入贫困，这个数据更容易理解。”

如何科学看待模拟结果

　　巴雷特指出：考虑到这些模拟的风险有多大，用户总是想知道为什么他们应该相信模拟结果，他们如何能确定模型的输出结果与现实世界有关？尤其诸如核灾难这样的情况，没有任何经验数据可循。

　　巴雷特指出这个问题有若干答案：其一，用户不应该期待模型给出具体预测，比如，预测下周二的股市崩盘。大多数建模者通过如下方法来调节不可避免的不确定性：在每个情景的多次运行之间取平均，展现可能的结果范围。这很像飓风的登陆预测。这仍然允许规划者使用模型作为试验台，来模拟采取行动A、B或C的结果。其二，巴雷特指出：建模者不应该只是把模型拼凑起来看最终结果是否说得通，而是应该在建模时验证它，分析每一个模块，与现实世界的数据（来自运输机构、普查或其他来源）进行对比。他说：“每一步，都有你用于校准的数据。”

　　建模者还应该利用人类心理学的研究来校准主体的行为。这样做可能比较棘手，人类是很复杂的；但是在危机情形下，行为建模变得更容易，因为人类的行为往往是原始的。例如，NPS1模型设置了一些内在的规则，致使主体仅仅在少数几种行为之间变换，比如“寻求医疗救助”、“寻找避难所”和“撤离”。

　　朱莉·达格代尔（Julie Dugdale）提出：即便如此，实地研究指出了关键的细微差别。达格代尔是法国格勒诺布尔大学的人工智能研究者，研究压力下的人类行为。她说：“在地震中我们发现，比起害怕危机本身，人们会更害怕身边没有家人或朋友。”人们会首先寻找他们爱的人，而且在寻找过程中自己甘冒危险。在火灾中同样如此，工程师往往假设当火灾警报响起时，人们会迅速有秩序地涌向出口。但是，当你所在的大楼进行消防演习时，你观察一下就会发现，她说：“人们总是首先跟其他人交谈，才会疏散。”而且如有必要，会集合朋友和家人一起撤离。

　　证据还表明，盲目的不假思索的恐慌很罕见。2011年，特拉华大学社会学家本·阿奎尔（BenAguirre）及其同事发表了基于主体的模型，试图再现2003年发生在罗德岛的夜总会火灾。人群紧紧地拥堵在一起，以致无人能够移动，最后导致100人在火灾中丧生。从警方、当地报纸和幸存者的叙述中，阿奎尔的团队得到了关于遇难者的详细数据，包括其行为、与他人的关系等。当研究人员把这些关系整合到模型中时，他说，模型运行下来，结果与几乎没有恐慌的真实火灾最一致。阿奎尔说：“我们发现，人们总是努力想与朋友、同事和爱的人一起逃生，他们并不想互相伤害，那只是偶然事件。”

　　NPS1模型试图整合这样的洞见，让其主体进入“家庭重建”模式（寻找朋友和家人）而非“恐慌”模式（没有一致目标的到处乱窜），而结果有时候可能是反直觉的。例如，模型建议，在灾难发生后，应急管理者应该马上预期看见一些人冲向1层，努力在人群中寻找放学的孩子或是失散的配偶，导致道路拥堵。模型还提出减小混乱的好方法：迅速恢复部分手机通信服务，这样人们能证实他们爱的人是安全的。

建模者的优先级：让模拟更容易、更方便

　　如果基于主体的模型的建模者要选择最高的优先级，那就是让模拟更容易构建、运行和使用，尤其是因为这样做能让现实世界的决策者更容易理解模型。例如，爱泼斯坦设想了一个国家中心，在那里决策者可以访问他所称的千万亿字节的“剧本”（petabyteplaybook）：这是一个图书馆，包括了每个大城市的数字档案，对每个可能的危险都有预先计算好的模型。他说：“然后，如果真的发生了什么事情，比如毒烟弥漫，我们可以挑选出匹配度最高的模型，进行近乎实时的计算，得出有用的结果，比如就地避难和疏散的最优组合。”

　　在弗吉尼亚理工学院，计算机科学家马达夫·马拉泰（MadhavMarathe）也在思考同样的问题。他说，当一场五级飓风铺天盖地袭来时，某人，比如波多黎各首府圣胡安（San Juan）的女市长不会坐以待毙，耐心等待专家用长达一周的时间分析这场风暴可能对波多黎电网造成的影响。他说，市长需要的是可操作的信息，“这意味着模型要界面简便，在云端运行，在非常短的时间内给出非常全面的分析。”

　　马拉泰称其为“基于主体的建模服务”。他的实验室在过去4年里一直在开发和测试一种基于互联网的工具，能让公共卫生官员建立传染病模拟，并且无需雇佣程序员，自己就能进行假设分析。只需点击几下鼠标，用户就可以指定关键变量，比如，感兴趣的地区和疾病的类型，前者可小到一个城市也可大到全美国，后者如流感、麻疹、埃博拉或某种新疾病等。然后，使用工具内置的地图和图表，用户可以观看模拟过程，并看到他们提出的治疗方案的效果。

　　尽管这个工具专门用于传染病的模拟，马拉泰说，作为工具基础的地理模型和统计合成人口是通用的，可以用于其他类型的灾难模拟，比如化学品泄漏、飓风和电网的连锁故障等。最终，他说：“我们的希望是建立这样的模型，为你、你的家庭或你的城市提供个性化服务。”或者，用巴雷特的话说：“如果我今天送吉米上学，模型会告诉我，他感染寨卡病毒的可能性有多大？”

　　所以，这些模拟系统的用户不仅仅是政府官员，巴雷特补充道，用户将会是你，“这些模型会变得像谷歌地图一样常用。”

资料来源 Science

责任编辑岳峰

__________________
本文作者米切尔·沃尔德罗普（M . Mitchell Waldrop）是《科学》杂志驻华盛顿特区的记者。