一个称为随机倍增原理的新理论可以解释什么是随机,以及为什么大多数被称之为随机的现象却最终并非随机。

珀西 · 达安柯尼斯(Persi Diaconis),从斯坦福大学来的统计学家,今年在哈佛大学工作,他在过去的几年里花了许多时间思考随机问题。这问题被认为既难以捉摸又非常重要。他说,他的研究导致这样的结论:“你对随机思考得越多:则随机的事情就越少。但有时,你可利用随机性的缺乏。”

特别是,达安柯尼斯和他的同事布拉德利 · 埃弗隆(Bradley Efron)及爱杜埃多 · 爱哥尔(Edluardo Engle)正在发展一个他们称之为随机倍增(randomness multiplier)的方法,达安柯尼斯解释说,“只要改变微小的不确定性的量,随之决定论式地产生高度随机的结果。”作为这次研究的直接成果,他们首次获得了混沌的定量定义。

不仅仅统计学家对随机性怀有兴趣,它涉及生活所有领域,可以具有政治上和社会学的重要性。例如,1970年的一次彩票开奖,组织者为使抽签尽可能公平,决定让每人从金属壶里取生日号码,365个日期数码放在密封套里,金属壶摇晃几小时之后,让每人依次选择密封套。但达安柯尼斯说,“结果是引人注目的;取出的日期并非是随机的。”12,月的生日号码倾向于被首先抽出,后面依次为11月,10月…其道理在于:密封套依固定的方式放入壶里。一月份的生日码首先放入,落入壶底,2月份其次,3月份再次,…最后放入的是12月份数码。尽管壶是摇了几小时,可事实上“要使这些数字密封套混合打乱所需花的时间比人们想象的要长得多。”

误用随机性的另一例子:由计算机生成随机数。这些计算机生成的随机数“是现代科学计算的重要基础”,达安柯尼斯说,“每个科学领域的科学寒们每天要用到上亿的随机数Z例如,用于蒙特 - 卡罗方法和高维函数数值积分。但事实上它们并不是随机的。计算机是按固定的方法生成这些数字的,尽管它们通过确定的随机试验(如,在大的数后紧跟一个较小的数或反之)但本质上缺乏随机,使许多研究者深感棘手。

几年前,华盛顿大学的乔治 · 马沙里亚(George Marsaglia)发现了一个简单随机试验的特例:由所有标准随机数生成程序产生随机数遭到失败。目前已有几种产生随机数的新方法通过了马沙里亚的试验。但所有类似的其他简单随机试验有待构想出来,以便研制新的随机数生成器,这又将意味着什么?达安柯尼斯说/科学家们定要担忧了。如果他们对这些计算机生成的数字的随机性仍处于无知的状态,必将会以错误的结果而告终。”

这里谈到的反映随机性无所不至的最后一例是概率模型的运用。“我对人们运用概率模型的方式感到担忧。”达安柯尼斯说,“在我看来,存在大量机械地、不动脑筋地滥用概率论,人们写出概率模型并常常是假设随机性的标准必要条件。但他们的假设往往不切实际,所以其结论就会毫无意义。”

据加州大学帕克利分析的戴维 · 弗里德曼(David Friedman)所说,这类概率模型的应用常出现在宏观经济模型中。这些模型用来进行各种类型的预测,从通货膨胀率到国家能源消耗率,而且其本身已成为一种行业。弗里德曼和其他人争论时说道:“它们基本上不可靠,其部分原因是概率论模型的误用。”达安柯尼斯说:“这倒给我以启发,我想这种概率论的应用完全失去了控制而变得无效。”

事实上是埃弗隆启发达安柯尼斯开始思考“随机”实质上的含义究竟如何。埃弗隆给达安柯尼斯举了这样一例子:如果一堵墙上涂上各为10英尺宽黑白相间的色带,假如你向墙投飞镖,你能事先决定它是落在黑色带上还是白色带上,此时不存在随机性。现在假定黑白带宽度分别缩至十分之一英寸,这时你会说投在黑色或白色带上就是不确定的了,即是随机的。“埃弗隆举例后问:‘你能对此搞出一个理论吗?’达安柯尼斯回答:‘这是一个极为重要的想象,同时也是一个棘手的问题’。”

达安柯尼斯着手研究这一问题时首先从随机现象最清楚和最简单的例子入手,并探求其中随机的含义。达安柯尼斯这样说:“这例子便是抛掷硬币,这是基本上大家都能想象的随机现象,”然对这一现象首先要讲的是:“它不是随机现象而是物理现象。硬币的上抛速度、旋转速度和牛顿定律决定了硬币将落在何处。”近来,有三个独立的研究小组,包括斯坦福大学的达安柯尼斯和约瑟夫 · 凯勒(Joesph Keller),分析了抛硬币的物理问题。(其他两小组是:马里兰大学的夫拉迪密尔 · 佛洛维克(Vladimir Vulovic)和理查德 · 普兰其(Richard Prange);北京大学的岳正元和张斌(译音))。

首先,达安柯尼斯和凯勒画了一张平面坐标图,x轴表示上抛速度,y轴作为旋转速度,图上的点则表示了抛硬币的初始条件。这图表明了什么样的初始条件导致最终结果是正还是反面。这样把平面图划分为两个区域。当初始条件与起初的离得愈来愈远时,两个区域便愈来愈紧密地在一起,也就是说,初始条件的微小变化便可使正面和反面不同。实验表明,抛落在这区域时,初始条件的微小变化造成完全不同的结果。那样的话,硬币的抛掷结果几乎是随机的,或许你能抛上百万次硬币来确定此误差偏向。这两位研究者能够从理论上证明上述结论,而不仅仅是从实验的图上得到结论。

在某些情形,达安柯尼斯和凯勒找到了失稳值,即在此值之后,原先全部不是随机的突然变为随机的。例如,如果将扑克牌洗了五次或更少,他们并不能随机的混杂了,而在洗了七、八次后,它们才突然混杂得很好。

达安柯尼斯正创立了一个理论,使他能够与这些例子相符合。为此,他研究了科学家两种相互争论的有关随机概念的观点。第一个是被称之为频率论的观点。若你问一个持频率论的人,抛硬币是随机的究竟是什么意思,他将如此回答你:“只要你抛一个硬币的次数足够多,它终究会发生一半次数是正,一半次数是反的结果。”但这种定义并不完全令人满意,达安柯尼斯指出:“有些事情的随机性往往是无法不断重写的,举例来讲,我们可以讲到可能昨天发生的中东战争,但那是无法重复的事情。”另一较为普遍的随机概念是主观论者的观点。达安柯尼斯说,按此观点,硬币本身不具有或然性,而是人有或然性概念,概率是人们对结果的相信程度的度量——“于我、它是随机的。”

—些统计学家已发展了一些原理来解释为什么在对待可重复性现象上频率论者和主观论者达到一致的结论。其基本观点是:随着不断增长的数据积累(如硬币不断地抛掷),起先两种具有不同假定的人必然达到同一结论。或者如统计学家所言,数据将原先的信念吞没了。

达安柯尼斯的随机倍增理论解释了为什么主观论者与频率论者的一致,甚至在不可重复的事件中。他认为,这理论已探取了像转盘、转壶和抛币之类的客观偶然性装置的本质特点。

达安柯尼斯指出,这种理论基于一个几乎被人遗忘的统计学家的工作,他叫埃伯汉特 · 霍普夫(Eberhand Hopf),1930年开始此项研究。他的著作没有得到更多的重视。当然达安柯尼斯相信,霍普夫的工作没有为人们赏识的部分原因系霍普夫自己和其他一些统计学家此后马上将研究重点移向完全没有联系的量子力学课题了。达安柯尼斯说,“我所做的大部分工作是重新阐述霍普夫的工作,并使它当代化。”

达安柯尼斯的理论由三部分构成。(1)初始条件空间(如硬币的速度和转速),(2)结果空间(抛硬币时正面和反面),(3)概率分布族(所有对硬币特殊的速度和转速的可能意见)。

为搞清随机倍增的概念,达安柯尼斯解释了一族概率分布的深度的含义。他注释道:“你和我对硬币翻转的快慢如何可能抱有不同的看法,我可能相信翻十五次,而你可能猜更像是五至二十次。”概率分布的深度所要反映的是:相应于一族概率分布,不同猜测的最大差别可能怎样。

达安柯尼斯的随机倍增是概率分布的映射,这映射将对初始条件的猜测的描述在正或反的结果空间里加以反映。达安柯尼斯说,“如果降低深度,系统便是随机倍增的。”在抛硬币的例子中,两个人对初始条件的意见可相去甚远,但最后不得不同意:“硬币出现正面和反面的机会各为50%。极为不同的意见消失了。”达安柯尼斯继续说,用这一随机垣论,他还能定量地验明典型或然现象的随机性程度。而且,他也能给混沌下定量定义。

在混沌运动中,初始条件微小的不确定性会被迅速而巨量的扩张,由于初始条件的描述总不能细致到便于说出系统的最终结果,这样,系统是不可预测的。达安柯尼斯观察到,这是一个随机增值的典型例子。混沌的研究者已分析了几百个这样的系统。而达安柯尼斯所要问的是:在初始条件里有多少不确定性?产生混沌的数学步骤进行了多少回?以及经过这许多次迭代后离随机状态的距离是多少?

然后可以给出混沌的客观定义:一个系统是特殊程度混沌的,即意味着经过特殊的迭代次数后离随机的距离。

[Science 1986年3月7日]