万亿次计算机的竞争

发布时间：93年01月25日

P. J. Skerreff 编译蓝彧祥

较快计算机永无终止的探索即将到达另一个里程碑。为了攻克困扰当今计算机的复杂问题，工程师们正把几百，甚至几千台低成本微型处理机并行地连结起来，以便创造超巨型计算机。

在帕萨迪纳市加州工学院一间塞满许多计算机的寒冷房间里，英特尔公司的塔奇斯通δ机立即引起了参观者的注意。这种巨型计算机（每秒能完成几十亿次计算）高5呎，宽3呎，长16呎。当这部原型计算机运行程序时，无论其几百台处理机是发送还是接收数据，黄绿色信号灯的定向信号都在计算机的前面交叉闪动。

塔奇斯通δ机是为并行超级计算共同体建造的同类计算机中的一部，该共同体由13家研究机构组成，包括加州工学院、桑迪亚国家实验室和喷气推进实验室。目前，强烈吸引生物学家、物理学家、飞机设计师、石油地质学家和其他人员的创举是怎样迅速地把诸如8机之类的计算机发展成超巨型计算机。到90年代中期，这些新型计算机将能迅速地解决一些现在需要几个计算日才能解决的问题，或能迅速地解决那些目前还难于解决的复杂问题。

但具有革命能力的未来计算机并非科学家所独有。在今后10年内，某些投入超巨型计算机的先进微型处理机芯片也将出现在台式个人计算机中，当它们的巨大伙伴用成箱的这种芯片取得不可思议的速度时，单处理器的个人计算机PC——定价和现在的原型差不多——将提供与某些大型计算机甚至巨型计算机不相上下的性能。

未来计算机终将隐形，而以独特的形式进入家庭、办公室和其他场所的墙壁和设备。这样的计算形式——广泛分布并由电线、无线电和其他信号相连结的芯片——将使照明和仪表控制产生新的复杂性，不过这种计算形式也将提供更广泛的选择余地，例如通过收费亭记入你借方的银行账中，或像从搁架上取食品那样为你自动安排食物。

当前，通向未来超巨型计算机的前进步伐极为狂热。去年春塔奇斯通δ机公诸于众之后不久，它就执行了每秒86亿次标准基准程序的运算，简而言之，这种计算机正在成为世界上最快的计算机。但是计划在1993年交付的以δ机为基础的550亿美元商用巨型计算机，预计每秒可达3，000亿次运算的最高速度。

英特尔公司是大约12家暗中参与树立计算机能力第二个里程碑、万亿次计算机竞争的公司之一。在一眨眼的时间内，这种计算机能完成万亿次浮点运算，这种计算机至少比目前最强大的计算机快100倍，它以每秒兆（100万）或千兆（10亿）次浮点运算的速度运行。

为什么建造万亿次计算机？担任芝加哥郊外阿贡国家实验室数学与计算机科学主任和高性能计算处长的里克 · 史蒂文斯（Bick Stevens）说：“因为我们还不能建造多倍的万亿次计算机。”诺贝尔奖获得者肯尼思 · 威尔逊（Kenneth Wilson）称之为“重大挑战”的一大批研究问题根本不能用目前仅千兆次能力的“慢速”巨型计算机加以解决。这些复杂、计算量大的问题涉及全球气候模型、绘制人类基因组图和制服核聚变等。

国防部很可能为收集情报资料、跟踪最新式近音速不可见秘密潜水艇，或诸如“沙漠风暴”之类计划的作战后勤使用万亿次水平的计算机。

国家宇航局计划副主任迈克尔 · 威克斯（Michael Weeks）说，在过去5年里， · 为国家航天飞机继续作的工程师们一直在利用美国1/4左右的超计算总时间。他们需要比以往更快的计算机，以便模拟能在传统跑道上起降、以17，500哩的时速穿过大气层进入空间的豪华喷气式飞机（“X-30：当今超音速冲压式喷气发动机的非凡世界”，1991年11月）。因为没有8马赫风洞，所以研究上述飞机的飞行性能的唯一途径在计算机中，而且是万亿次的计算机。

美国大力推进发展的被称为高性能计算与通讯计划的超速计算机与网络已得到布什总统和国会的支持（参阅建设中的光纤高速通道）。康涅狄格州斯坦福德市加特纳集团的乔治 · 林达穆德（George Lindmood）说，在下一个5年中，报偿可能是巨大的。他在为能源部制定的研究中，评价了90年代期间每年能使航天、化学、电子学、石油和医药工业增长5%生产能力以及大致可使国民生产总值提高至5，000亿美元以上的较新、较快计算机和网络。

专家们认为，由于联邦政府创始、巨额研究经费和需要万亿能力的科学家这些因素的刺激，正在为新计算机工作的公司之一，可能在1995年或更早带着实际运行的万亿次机跨过终点线。在这些公司中，有些是熟知的计算机巨人，例如克雷公司和英特尔公司，特雷微型计算机公司以及肯德尔 · 斯夸里公司，有些是几乎不知名的公司。这些公司都指望一种称为大规模并行处理的较新结构，以便提供所需的速度。

一直是防御尖端研究计划局研究90年代中期万亿次计算机和每秒能传送几十亿位网络的竞争先锋斯蒂芬 · 斯夸尔斯（Stephen Squires）说：“并行处理是提高万亿次计算机速度的唯一方法。”他说，为什么要并行？因为人们能利用比较廉价的现售元件，而且能用多种方法加以连结和利用。

个人计算机和大多数主机都使单处理机来处理一个接一个的指令，并以串行方式处理数据。这些计算机无法同巨型计算机竞争，后者使用16台非常快、非常协调和非常昂贵的处理机。因为空前密集的元件使指令或数据位传送必经的距离缩短，所以也就缩短了计算机时间。

传统巨型计算机也能同时在几个矢量或有序数组上进行相似的运算，而不是一次仅一位数。尽管像克雷Y-MP16型矢量巨型计算机破除了10亿次计算机的障碍因素，但斯夸尔斯说：“诸如光速和热扩散这样的物理限制，将使成千倍地提高速度非常困难。”

为了达到数字处理的新高度，巨型并行计算机的缔造者们走过了极其艰难的道路。他们把几百甚至几千台处理机连结起来，以便同时攻克一个问题的不同部分，在某种程度上，这就是亨利 · 福德（Henry Ford）更快地制造汽车的想法的电子翻版一把大工作以小件形式分发给许多工人。

这种技术大部分已在执行中。特雷计算机公司总经理詹姆斯 · 罗特索尔克（James Rottsolk）说：“虽然现在我们能建立万亿次的计算机，但其成本可能高得惊人。”这家以西雅图为基地开办的小公司计划于1995年建立这种计算机。他估计仅仅存储器，比如说万亿字节存储器的价格大约就是7，500万美元。然而，由于处理机速度和存储密度大致每隔货个月增加一倍，所以到1995年时万亿次计算机的成本可能在4，000万美元之内。

英特尔公司的塔奇所通δ机已从较快的处理机获利。打开δ机前面的黑色有机玻璃门，里面露出几排处理机板、一套输入-输出与网络连结板。这种计算机的电脑相当于528台英特尔i860百万门处理机，每个电脑的存储器有16兆字节，这些处理机用平面网络连结，因此每台处理机能通过高带宽网络同四个邻居交换数据。

以δ机设计为基础的称为Paragon XP/S的英特尔商用巨型计算机，使用了配有250万个晶体管的较新处理机芯片，这些芯片速度的增加，使英特尔公司能以200万美元左右出售一部装有66台处理机的5千兆次的巨型计算机。

在塔奇斯通δ机以每秒86亿次工作之后的周末，马萨诸塞州坎布里奇市思想机器公司的科学家们通过巧妙处理他们的竞争伙伴互连机，以90.3亿次的速度通过同一程序，因而收回了最快计算机的所有权。一个月之后，落后的塔奇斯通δ机则以119亿次领先。而在去年11月，英特尔公司的塔奇斯通δ机按程序运转达到了139亿次的最亮记录。

竞争绝非开玩笑。在开始出售巨型计算机时，拥有自夸为世界最快系统的权利是一种便利。加利福尼亚州萨里维尔市马斯帕公司总经理杰夫 · 卡尔布（Jeff Kalb）解释说：“在此刻，这些就是有胆量的拍击。”他说，最后的问题是怎样迅速地使这些计算机对真正的科学或商业问题发生作用，在这一点上它通常远远落后于人工标准检查程序的速度。

在马萨诸塞工学院附近查尔斯河拐弯处对面的一家老墨水厂里，思想机器公司的计算机科学家们正在为他们的万亿次计算机项目工作，这是互连机的一种改进款式。他们似乎很喜欢这种万亿次计算机的竞争，公司共创者兼首席科学家的丹奈 · 希利斯（Danny Hi-Ills）坐在塞满救火车模型的办公室里笑着说：“我喜欢有人宣布在某些事上的一项竞争。我对未来充满激情，我知道我会成功。”

自从1985年希利斯首次建立太空时代箱之一以来，互连机已经普遍。最新一代的佼佼者，CM-5型互连机，由4个塞满处理机的高大黑色柜子构成。在每个柜子的一端，剧烈闪动的红光像是从机内深处发射出来，显示出机器正在工作。互连机的早期形式用了许多单个处理机——每部多达64，000个——和较小的存储器来实现快速的复杂运算。去年秋展出的最新式样采用缩减指令集微处理器来提高能力，每台微处理器的能力是每秒1.280亿次。售价140万美元的最小的CM-5型机将由32台处理器组成，峰值速度大约40亿次。

公司人员看中理论上限为16，000个缩减指令集处理器的2万亿次计算机。然而，目前这种计算机值数亿美元。

大型并行系统的妙处是其可扩性，需要更强的能力吗？再加一些处理机即可。例如，如果使4，096台处理机的互连机尺寸增加到4倍，那么其运行速度大约是原型机的4倍，而且人们无需变更软件或程序。由于微处理器速度的提高和成本的下降，可扩系统将为提供更强的能力给出一条在成本效益上可行的道路。

另一家万亿次计算机的竞争者柏西特克公司管理副主任莱因哈德 · 林恩（Reinhard Rinn）说：“这好像是在用莱戈积木建造计算机。”他说：“首要的是制造简单的基本砌块，然后你就能把它们组合在一起。”一家德国公帕西特充公司与其在伊利诺斯州西芝加哥的美国总部，希望争取与一个物理研究机构的国际财团签订建造欧洲万亿次计算机的合同，试图建造万亿次计算机来解决一些占用巨型计算机数月之久的亚原子问题。

虽然建筑砌块的设计几乎和计划建造万亿次计算机的公司一样多，但大多数可以分成两种基本类型：单指令多数据流计算机的并行设计。在每一时刻，所有处理机都按照局部存储器的数据执行同一指令集。在多指令多数据流中——如塔奇斯通δ机和帕西特克GC机——每台处理机都对其专有局部数据执行独特的指令集。

这种方法的想法是：单指令多数据计算机好像罗马军规那样运转。每个苦工都按照命令不断划桨，而船则不断向前滑动。多指令多数据计算机更像多桅纵帆船。各水兵组按照军官队的命令立刻执行不同的任务，船则向前航行。

另一个重大变革涉及计算机存储器。提议中的某些万亿次计算机具有所谓的分布存储器——每台处理机均与成千字节或成兆字节的随机存取存储装置连结以存贮指令和数据。然后，复杂的信息通过程序指示处理机怎样、何时和何地交换数据、其他的计算机，如特雷计算机将使用全局共享存储器。在这里，每台处理机都接进一个巨大的指令和数据中心存储器。这种技术因速度太慢而受到批评，因为信息进出中心存储器时，处理机必须等待。可是特雷公司首席科学家伯顿 · 史密斯（Burton Smith）打算把“存储等待时间”用于工作。

在史密斯设计的具有206台处理机的万亿次计算机中，任何一台等待数据的处理机在延误期间都要执行被授予的其他任务，他解释说：“这就像你每天在书桌上工作一样。你打电话给某人，但电话线很忙。你不得不放下电话，阅读一下报告，喝点咖啡，大致等到线路空时再试一试。”特雷公司的工程师们正在研究能让每台处理机充当128台虚拟处理机的软件和硬件，这一任需要各方面的巨大配合。史密斯说，现在他们正在制作矢量巨型计算机大规模并行设计的模型，但计划到1993年才能制造出16台处理机原型，1994年制造出较大的计算机。

另一家正在设计具共同存储器的万亿次计算机的公司是明尼阿波利斯附近的克雷硏究公司，几年来，被公认为矢量巨型计算机领导者的克雷研究公司一直在设计并行系统。其最新的头等式样Y-MPC90有16台处理机和160亿次的最佳性能。目前，这家公司正朝着1993年制造出可扩至1，000台64位缩减指令集处理机的大规模并行处理的目标迈进，按照特雷研究公司的时间表，到1997年该公司将拥有实际应用的持续万亿次计算机的能力。

其他万亿次计算机的竞争者也有不同的设计。以俄勒冈州比弗顿市为基地的N. 丘布公司总经理迈克尔 · 迈里尔（Michael Meirer）说：“我们怀有一个与超立方体建筑艺术并驾齐驱的坚定因标立方体扩大了想象力：把4台处理机连成一个正方形，再把它们与同样的正方形连结，于是就形成了一个有8台处理机的立方体——技术上称为三阶超立方体——每台处理机与3台邻机连结。在13阶超立方体中，8，192台处理机的每一台都用导线连结到另外13台处理机上。迈里尔说，这就形成了处理机间相互传递不超过13次的密集网络。而在网状网络中处理机也许必须使数据通过几百个中介物。

有些公司，如马萨诸塞州沃尔瑟姆市的开创者肯德尔 · 斯夸尔公司，或纽约州阿蒙克市巨大的国际商用机器公司还不愿谈论其万亿次巨型计算机的计划。威斯康星州欧克莱尔市克雷分公司巨型计算机系统发言人解释说，该公司具有极端的安全意识。

迄今为止，科学家们似乎都愿同就要取得超速进展的任何组织一道工作。加州工学院的约翰 · 萨蒙（John Salmon）和伊利诺斯州钱普恩市国家超计算应用中心的迈克尔 · 诺曼（Michael Norman）两人都想解决全宇宙星球和卫星原料被“大碰撞”毁灭之后星系怎样发展的问题。萨蒙把他的计划倾注在塔奇斯通δ机上，诺曼则把他的计划倾注在互连机上。开始，他二人基本上都把假想星系切成各区均含一些随机分布粒子的3度坐标网。因为引力吸引附近彼此接近的大快物质，所以就可计算出各粒子对其他所有粒子的影响，并重新标绘它们的位置。重复同一过程，比如说10，000次，因为每一步骤相当于100万年的演变。诺曼说：“那就是说超过万亿次。”

这些模拟试验在巨型计算机上要花几天甚至几周时间。他接着说：“如果你必须长久等待答案，那就会削弱试验结果与设想之间的交互影响。”为了强调他的观点，诺曼将花4天的计算来顺利通过论证。首先，屏幕是一块模糊的微粒，就像物理定律走过其时间那样缓慢移动。有些微粒缓慢地形成小块，小块又结成团块，该过程差不多和物理学家相信我们的宇宙发展成遍布空间各处的结块星系的道路完全一样。他说：“就万亿次计算机而言，这好像是一件容易完成的工作，如果我发现不正确的问题，或想为我提供一种新概念，那我就可以作一些改变。”

这就是提供直接视觉反馈的动力，这种动力极大地激励了科学家和工程师们。用巨大的并行系统创作全球气候模型的阿贡国家实验室计算机科学家威廉 · 格罗普（William Gropp）说：“直接反馈可以建立直觉，而直觉又有助于人们解决一些科学和工程问题。”他和其他人正在创立最新科学分支——计算科学——把计算机用于实验室，以便他们能进行世界上从未做过的实验：例如，改变大气展二氧化碳的数量，或使两个黑洞互相碰撞。这些计算实验工作大部分形成了如此多的数据，以致理解它们的唯一途径是用高级的图形程序来显示它们。实际上，就某些问题而言也许只需要万亿次计算机计算能力的一半就能显示数据。

能力饥饿

尽管人们无限地使用最快的计算机，但克林特 · 波特（Clint Potter）仍是另一位渴求更强能力的研究者，这位国家超计算应用中心生物医学成像主任说：“无论在哪里我都为我的计算能力不足而努力工作。”

他坐在中心的巨型计算机实验室之一的工作站前面叙述什么能满足他的需要（至少满足一会儿）时说：“如果我有一部万亿次计算机，那我就能模拟活脑周围移动分子的个体分子。”要是能使计算机闯过每秒万亿次计算，那就能用强磁共振扫描器处理数据流的流动，操作它跟踪从神经细胞到神经细胞的分子，这给彼特观察活脑怎样工作、怎样传送信息，甚至怎样思考提供了可能性。

气象学家罗伯特 · 威尔森（Hebert Wilhelmson）就在大楼下面模拟正好位于中心外的伊利诺斯大草原沙洲上空突然出现的强风暴。从60年代以来，他一直在进行这项硏究工作，而且总是使用最大的通用计算机。现在，他可以在巨型计算机上用2-4小时时间模拟宽达80公里的大风暴。威尔森说：“虽然模拟试验会把风暴的主要特性告诉你，但细节不多。模拟试验遗漏了像旋风那样的重大问题，其宽度要小很多，大约只有500米。”他用万亿次计算机就能计算出大风暴及其密度中心怎样相互作用，最后更准确地预报它们。

并行问题

据电子计算机研究所的希利斯说，正在设计的容错的万亿次系统提出了困难的挑战，就无数处理而言，总有一些处理机会出现故障，希利斯说：“能治愈周围故障处理机而又不使整体显示停止。”的系统将是实现万亿次有效能力的决定性步骤。而不具先进性能的输入-输出系统、存储装置和高速网络将会出现重大故障。

最大的障碍也许是建立这些计算机软件和程序编制的工具，目前，矢量巨型计算机的每一个连续程序在用于并行机之前必须进行改写。据英特尔公司超计算技术处主任、英特尔的同事贾斯廷 · 拉特纳（Justin Rattner）说，这未必是坏事。他说，有时改写程序有助于科学家以新的方式看问题。打算使用这些计算机的人们最后仍须同时学会思考和编制程序。

一旦技术细节被解决，新一代快速处理机就会出现，存储器价格就会下跌，第一部万亿次计算机就会离开装配线，这又会怎么样呢？田纳西大学计算机科学家杰克 · 唐加拉（Jack Dongara）说：“我们会满足于万亿次计算机吗？毫不满足。”未来万亿次计算机可能揭示今天需要每秒1，000⁶次运算的计算机才能解决的新问题。

电子计算机公司销售主任吉姆 · 贝利（Jim Bailey）有先见之明。“我不是发现万亿次有多大，而是发现一次有多小，这是多么小的测量单位。也许今后20年万亿次将是基本单位，而且人们将追求具有万万次能力的计算机。”

[Popular Science，1992年3月]