计算社会科学可以帮助防止或赢得战争吗?五角大楼寄希望这是可以的。其花费上千万美元由军方资助研制的用于预测恐怖动乱的计算机软件模型,预测结果或已接近对军方领导人产生影响的目的,部分模型也已得到实战的验证。

4-梁??2

模型预测伊拉克恐怖分子炸弹(深色)袭击与藏匿位置(浅色)

  由乔治·克鲁尼(George Clooney)主演的电影,或是取得成功,或是深度方面欠缺火候,就像他2008年主演的喜剧《爱情达阵》一样?

数据:并非解决问题唯一方案

  这个问题在一定程度上给肯·科默(Ken Comer)提供了思路。科默是美国国防部联合简易爆炸装置对抗组织(JIEDDO)副主任,也是美国军队对付路边炸弹战争的中心人物。最近他看了美国能源部科学家所作的一个简报,这些科学家正在和一个电影制片厂合作,意在用公式化的建模技能来打造一部大片。
  从这些科学家的描述中,可以看出他们重在分析好莱坞是如何吸引观众的数据,并试图从中得出结论,但每次得到的同一个结论就是:谁也说不清楚。科默回忆说:“你可以把克鲁尼包装得很好,抑或打扮得很差,甚至可以给他粘个胡子什么的。但是,没有一个可靠的方法可以预测一部由他主演的电影是否会取得巨大成功。”
  科默认为,这很好地说明了为什么五角大楼正在重新考虑用于对付路边炸弹问题的数据挖掘方法,更不用说反恐和战争等方面了。鉴于科默的部门在伊拉克和阿富汗近十年的战争中汇总的大量信息数据,他说:“对于我这样一个三年来在数据中“游泳”的人来讲,数据不是我们解决这个问题的方案。”
  相反,科默和其他官员正在把赌注押在新一代的计算机模型上,尝试预测群体行为以及这种行为是如何改变的。这一研究在不同领域有各自的称呼,包括“人类行为动力学”和“计算社会科学”,表明了一种从社会网络分析到政治预测和复杂性科学研究领域融合的趋势。
  尽管这一工作所获得的经费资助总额难以统计。但美国国防部长办公室2011年在这个项目上投入2 800万美元,而且几乎都用于非保密的学术和工业研究上。另外,单列的计算社会科学项目也得到了美国国防高级研究计划局(DARPA),以及陆、海、空军方研究机构的资助。
  鉴于五角大楼对这一工作倾注了很大的热情,以致于一些科学家因担心这些初始模型未完善之前就投入使用而呼吁稍微放缓一下。包括美国人类学协会成员、华盛顿特区美国大学(DC)的人类学家罗伯特·奥尔布罗(Robert Albro)认为,以目前的研发状态,这些模型大多是在浪费时间。“我不是说计算社会科学是巫术科学,而是说计算社会科学的工作过于频繁了。”

建模:锁定特定族群的言与行

  在建模工作中,一个经常被提及的灵感是发生在2003年的一个小插曲,当时联军正在伊拉克四处搜捕被推翻的独裁者萨达姆。由于传统方法无果,一组美军情报分析员决定用链接图解法来追踪萨达姆的社会网络关系,想以此收集可用的信息。当他们考虑采用关键变量如“信任”等的时候,情报分析家们开始意识到,那些印在美军“个性识别扑克牌”上被通缉的伊拉克官员不一定是萨达姆最信任的,他们不可能知道他的藏身地点。相反,分析师们将注意力集中在那些信任级别稍低的官员中,包括一个重要的保镖身上。最终,图表信息引导追踪者发现萨达姆藏在提克里特附近一个农场的地下隐匿处。
  如今的模型在概念上与链接图解法相似,但区别在于,陆军分析师的图表是静态的并由人工绘制和分析的。现在的目标算法是,通过计算机整合大量不同来源的数据,包括最新数据生成后随时保持结果更新。
  创建这种模型系统的一个主要例子是机构风险分析仪(ORA),其必威在线网站首页网址 网络分析程序由匹兹堡卡内基梅隆大学的计算机科学家凯瑟琳·卡利(Kathleen Carley)设计,她是五角大楼资助的计算社会科学中的领军人物之一。在论及科幻小说作家艾萨克·阿西莫夫(Isaac Asimov)发明的群体行为的“科学”时,卡利开玩笑地说:“我们建立了心理历史模型,我们是奠基者。”
  为了在政治不稳定地区创建一个机构风险分析(ORA)模型,卡利曾在苏丹启用了自动映射功能(Auto Map)程序――该程序如拖网捕鱼似地可以筛选公开发表的新闻报道,并自动提取用户名和其他重要数据。通过这些数据信息,ORA运用社会网络分析词典识别其“中间状态”(betweenness)节点,“中间状态”意味着很多与网络中的其他人的直接连接。卡利说:“这些人或节点经常被认为是有影响力的,因为他们联系着不同群体的信息。”
  同一类型的模型也可以用来预测恐怖主义意识形态是怎样在当地民众中生根的,并像病毒一样在人群中传播开来。卡利的系统可以通过特定族群中普遍盛行的观点或态度等记录以此作为文化变量因素。她说,目标是通过外交谈判或军事行动来锁定识别出的关键个人和团体,从而产生一种有效的阻止激进的扩散或破坏恐怖网络的战略。
  另一个例子是马里兰大学帕克分校的计算文化动力学实验室联合主任文卡塔马南·苏布拉马尼恩(Venkatramanan Subrahmanian)开发的空间文化溯因推理引擎(SCARE)。通过运用开源数据与距离和文化的组合分析,苏布拉马尼恩认为,SCARE可以预测恐怖分子在半公里范围内隐藏的位置,并将程序复制给军队,后者很明显正在进行试验(开发SCARE是基于恐怖分子因害怕被抓而不想携带爆炸品到很远的地方,而且他们在伊拉克跟踪到的大部分攻击都来自于和伊朗有关的什叶派,因此这些武装分子不太可能在逊尼派聚集的附近地区)。

预测:错误几乎和正确一样多

  一个模型可以预测一场战争吗?在DARPA资助下,一些大学的研究人员正在与洛克希德·马丁公司合作开发综合危机早期预警系统(ICEWS)。在某种程度上,ICEWS最开始源于上世纪70年代DARPA的原始预测项目,目前着重于预测政治事件如叛乱、内战、政变或入侵等。该系统主要根据来自路透社的在线新闻,并将其结合种族或政治团体的先前行为、经济因素(如一个国家的国内生产总值及和邻国的地缘政治关系等)进行整合。ICEWS可能会预测出如“X国家有60%内战的可能性”这样的结果。

  DARPA项目经理肖恩·奥布莱恩(Sean O'Brien)说,自从2010年3月以来,ICEWS每个月都在进行预测,尽管他认为这样的模型虽不完美,但其预测结果已接近对军事领导人产生影响的目的。奥布莱恩同时参与国防部防御研究办公室资助的人力、社会、文化和行为建模项目,据说其中的一些模拟或模型已经被美国特种作战司令部和美国非洲司令部使用。
  尽管其中一些模型研究人员获得了五角大楼资助,但仍有人对这种过早的热情存有担忧。例如,目前看来不管是计算机模型还是人工分析都不能精确预测2011年中东地区出现的动乱。
  苏布拉马尼恩认为,那些研究天气预报的家伙要远远排在我们前面。他指出,气象学家经常被指责,因为他们的错误几乎和正确一样多。“也许你能从中了解到‘预测科学发展的实际进度’。”
  对于自动数据收集中存在的缺陷,卡利说:“其中一个问题就是你需要知道网络中经常被讨论的一些人在现实生活中是否真实存在。”比如,在针对苏丹的机构风险分析模型中,其网络中的一个关键人物穆罕默德(伊斯兰预言家)在公元前632年就去世了。
  在查阅了美国国家研究委员会(NRC)的一些社会科学计算模型后,奥尔布罗发现其中很多工作是由计算机科学家完成的,他们只是简单地输入数据,却很少留意其真正含义的来源。他指出,一些模型只是通过跟踪在线网络讨论“爆炸”等短语作为寻找极端分子的踪迹,最终语言“爆炸”导致了真正的暴力,这是疯狂的、不科学的。
  对此,弗吉尼亚州乔治梅森大学Krasnow高级研究所的计算社会科学家罗伯特·阿克斯特尔(Robert Axtell)争辩说,基于主体的建模方法先驱,并没有足够准确的数据来填充这些模型。他说:“我个人的感觉是,在未来的20年甚至100年,在构建人类行为和相互作用的高精确度模型方面有大量的研究项目需要去做。”

萨马拉:基于数据的成功模型

  类似的提醒在国防部可以听到。北卡罗莱纳三角研究园陆军研究办公室的复杂系统建模项目负责人约翰·拉威利(John Lavery)将计算社会科学的现状与19世纪早期物理学进行比较之后说,“我们才刚刚起步”。
  位于纽约西点军校网络科学中心的行为学家布赖恩·里德(Brian Reed)认同这一点并认为:“如果你可以利用它,它就是很了不起的工具。”在引导抓捕萨达姆过程中,他是网络分析的关键构建者。他提醒说:“你能获得很多的信息,但必须有人提供一个重点。”里德引用了2008年至2009年他被部署在伊拉克迪亚拉省的一个例子。为了停止路边炸弹袭击,他要求他的情报组织对当地的叛乱者进行网络分析。里德说,尽管他们提供了超量数据,但我们这边没有一个人能够真正理解。
  奥尔布罗担心太多的研究人员没有意识到他们工作的实际限制。比如,他见到的很多模型重在验证,即确保模拟内部是一致的,但在有效性和确保与现实世界的关联方面却未受到足够的重视。他认为,这些模型也许提供了一种解释性工具,允许决策者或军队领导人批判性的思考一个问题,但这项技术的局限性有时被忽略了。“它不能回答我们的问题,也不能解决我们需要作出什么样的决策的困境。”
  事实上,目前我们还远远不清楚这代模型能否告诉人们该领域的专家所不知道的信息。卡利回忆在一个会议上,她报告了她的ORA在苏丹识别出的一些关键人物。参加会议的该地区专家说:“是的,我们知道这里边的大部分人物。”。
  然而,所有的告诫都是在帮助士兵带着迫切感返回JIEDDO总部。科默引用JIEDDO资助的基于伊拉克萨迈拉城主体的模型说:“我们有一些基于数据的成功例子,诀窍就是把这些模型应用到它们能预测的那个点上。
  萨马拉模型可以与美军增加或减少路边炸弹袭击的军事部署相匹配,但这个模型仅适用于萨马拉。科默说,研究人员“做出了一个了不起的模型,而且真的管用。现在必须为阿富汗也‘写一个’。”
  科默坦承,世界上装备最高科技的军队正在花费上千万美元研制复杂计算机软件来预测叛乱行为,而这些成为问题的粗糙炸弹其原料成分或许与肥料差不多以及一些基本电子元件,这很具有讽刺意味。“恐怖分子目前还在与我们周旋,尽管他们不仅没有数据,也没有计算能力、互联网和数据库,更没有高科技。”

资料来源Nature

责任编辑 则 鸣

――――――――

本文作者:莎伦·温伯格(Sharon Weinberger),华盛顿特区艾丽西亚帕特森基金会研究员,专栏作家。此文发表于20114月。