人工智能科学家在建立思维的模型时,一直在追求两个显著的目标:人类思维过程的精确描述,和应用智能的工具。这两个目标经常交织在一起:思维模型影响了工具的设计,而工具又常常自命为思维的模型。大多数工具的设计都基于这样的假设:智能由问题求解组成。
目前对于最大众化地被称为“智能工具”的专家系统软件已经做出了许多偏激的论断。这些论断认为专家系统可以在许多复杂的、甚至生命关天的情况中取得成功,如飞机飞行控制、医疗诊断、发电厂操作、生产以及武器系统,而其它程序则不行。我同越来越多的观察家们一样,深切地关心着对于这些程序的过分的信任,要知道它们在未经检验的情况中的能力和行为是未知的。
这种关心重新激起了人们对人工智能哲学基础的兴趣,探索智能系统能力的限度并更好地理解计算机如何为人服务的问题。作为科学家,我们遵循着逻辑经验主义的传统,我们认为世界是客观可知的,关于世界的推理是可以检验的。这个传统对我们的影响是如此地深以至于其它的非经验的研究领域,如伦理学或形而上学(这些领域中的推理也同样是严格的),对我们来说没什么价值,因为它们的结论是不可检验的。哲学研究的目的在于对生命存在的洞察,由此我们可以找出人与机器的区别。从这种研究中我们知道了逻辑经验主义强加于我们的广泛的盲目性,这种盲目性使得我们不能看到比我们目前所知的东西更可靠的可能的设计。
这种盲目性是怎样引进的呢?诺伯特 · 维纳(Norbert Wiener)在他1948年的著作《控制论》—书中假设人是一台由大脑和感觉运动系统组成的复杂的机器。人作为机器是在寻求目标的:它能检查错误,改变过程并且调节自己的行为以更有效地获取目标。自维纳的时代起,关于构造控制论机器就有了两个方向的研究。
第一个方向所基于的假设是控制论机器基本上是面向符号的,它的操作可以根据精确的规则安全地描述为对符号的操纵,而不必管符号的各种解释。根据这种观点,智能行为来自组织成模式的符号,而在写规则时,这些模式是不知道的。专家系统就是这个研究方向的产品。
第二个研究方向所基于的假设是控制论机器是由许多简单的(非线性的)单元经互连而构成的。这种“神经网络”以其内部状态存贮知识,并且改变状态以响应其环境。根据这种观点,智能行为来自许多神经元的集体性交互作用。
关于符号处理假设还有许多争论。目前流行的论断认为人的大脑是由服从物理和化学定律的部件组成的系统,那么大脑的状态最终都可以描述成为神经元输入和输出的(非线性)可计算函数的数学方程的解,只要有充分的信息就可以计算出一个人下一步的动作。只有两件事情使我们不能设计出可以模拟大脑的计算机程序,第一,我们对神经元功能和互连的理解还很有限,第二,目前的计算能力不充足。但随着时间流逝,比方说一百年以后,我们总可以理解它们并得到所需要的计算能力。
相反的论断认为人是在一个解释的框架内处理每件事情的。每个人说话都有一个上下文,所说的与所听的都是在这个上下文中得到解释的。另外,人还会对他们的动作进行约定并设想承担责任。相反,规则系统处理符号时却不管它们的意义;任何表示背景的企图对于我们说来都是不可见的——它是我们的“潜意识”。此外,设计者不可能预想出规则所适用的无限多的情况,因而系统肯定会有明显的盲点。
如果倡导把人看作符号处理的神经网络的那些人把这种观点当作假设而不是事实的话,那么引发出许多关于专家系统的过头的论断的力量就会衰落,而涉及设计智能系统的更加合理的问题的讨论会随之而起。让我们回到智能工具的问题上。逻辑经验主义认为,智能可以由问题求解过程建立模型,它由三部分组成:给出问题及其上下文的精确陈述,枚举可能的解答,最后选择出一个具有充分的好处并且代价较小的解。专家系统非常适合于这种目的。
但是问题求解是智能的充分的描述吗?道格拉斯 · 霍夫斯塔特(Douglas Hofstadter)认为不是。他认为思维的一个基本特点是模式识别的能力,这包括一个人自己的行为的模式。我们有能力认识到我们常在墨守成规,但同时也有能力做其它事情。确实,创造性的举动恰恰发生在我们识别了一种模式并且有意识地从事一种新的行为时。创造性的内涵是发明出一种新的上下文——一个超出问题求解过程的动作。
特里 · 威诺格拉德(Terry Win grad)和费尔南德 · 弗洛里斯(Fernand Flores)在《理解计算机和认知》—书中描述了哲学家马丁 · 海德格尔(Martin Heidegger)的工作,对这个问题投下了希望之光。海德格尔把动作域与描述域区分开来。在动作域中,人们在对事件做出反应时,不用有意识的思维就可以把知识结合于动作之中。人没有机会对事件进行思考,直到一个“中断”发生时,此时一个事件中断了人趋向于目标的动作流程。描述是观察者看到的动作的陈述,在把动作翻译为动作发生的描述时,已经丢掉了某些东西。描述域对于动作域是不完全的。
构成一个专家系统的程序的规则是由动作的观察者所写出的描述。这并不是说专家系统不能足够快地采取动作,而是说设计一个系统的过程肯定带来某种盲目性,这种盲目性对于设计者隐藏了动作域的某些部分。结果,专家系统就会在某些重要的情况中失败,在没有预计到的情况中采取了不适当的动作,在新的上下文中表现得不恰当。这就是为什么在这个领域中经常称专家系统容易损害的原因。威诺格拉德评论说专家系统在稳固性、迟钝性以及不能适应变化着的环境方面可以同官僚政治相比。
经常有人坚持认为这种类型的盲目性可以在现成的成功的专家系统中进行插入而得到克服,例如,把所有规则放进一个数据库中,在此数据库中,它们可以以一种新的、没预见到的方式组合。这个论断受到了霍夫斯塔特的挑战,他分析了唐纳德 · 努茨(Donald Knuth)关于所有印刷活字都可以通过对参数适当组合,而由几个基本活字产生的断言。问题求解过程引入的盲目性不能通过组合已知的解答而克服。
强调这样一件事实是很重要的,即许多传递给设计的盲目性起源于人的盲点,这是不可避免的。据说现象可以依据与人的关系分为三类:已知的,已知的未知,未知的未知。已知的未知是由人们不知道知识,但知道获取它的方法的东西组成的,它是部分盲点。未知的未知则是由那些人们不知道,并且也不知道他不知道这一事实的那些东西组成的,它是完全盲点,人们甚至不具备讨论它的语言。因为一个程序是以语言形式写出的表达式,所以对于设计者来说不可能指明在他自己的未知的情况中的处理过程。一个在免疫系统的实质尚未彻底理解时所写的医学诊断专家系统可以说明这一点。这样一个专家系统对于所有与免疫有关的现象,包括相关的疾病都有一个盲点,医学研究人员能够认识到这样的盲点,从而导致对新现象的解释,但计算机却不能。
有些人坚信发现盲点并且扩充规则集合取消盲点的过程是可以建立模型的,最终我们总会有一个能够修改自己的规则并且没有盲点的专家系统。但是这个论断假设了创造性的人的活动最终可以由规则所描述——这恰是成问题的假设。
盲目性的另一个例子涉及到一个设计师,他被要求建造一台能打出本垒打的打棒球的机器人。从问题求解的观点来看,这位设计师将从这样一个假设开始/即“问题”是计算出与抛出的球的观察到的抛物线相交的对于一个球拍来说又是可实现的抛物线。最终的设计将包括检测抛出的球的抛物线的传感器,挥动球拍的快速伺服机制和一台强有力的计算抛物线的计算机。这个设计师将寻找规则来决定随着球的不同的抛物线而不同的挥拍动作。现在假设我们来问一个职业的棒球运动员在他打出一个本垒打时的那一瞬间发生了什么。回答与设计师的假设全然不同。这些回答可能是这样的:“球恰在空中停着,‘或’球在投手手中的一刹那,它已经说明了一切。”这样的回答是发生在动作域的。写出一个描述的过程而引起的盲目性使得它们看起来似乎全然无用,而作为描述,也确实如此,这样的回答提出了一种不同的设计方法:建造一台机器人,向投出的球挥拍时,要密切注视自己的动作,并且构成一个能够导致经常击出本垒打的经验库。
同样,研究人员设计了能够对呈现的编码语音模式进行识别,并且学会对相似的模式进行识别的系统,由此对于连续语音识别的困难问题取得了进展。这些新的设计是在动作域中构思的,在这里学习伴随着经验。过去的不成功的设计是在描述域中构思的,它们寻找能够把语音信号映射成相关的正文的规则。
弗洛里斯还强调了第三个域,承诺域,它是动作的根源。承诺提供了处理故障的动机,故障就是未知的介入,它的处理仅能通过重构一个问题的上下文进行,以使得新的合适的动作成为可能。理解承诺域使我们可以更深刻地认识到专家系统脆弱性的根源,专家系统是在一个固定的上下文中运行的(它们就是为此而设计的),并且不能对之进行重构。威诺格拉德和弗洛里斯认为一个好的设计是一个预知故障的被承诺的企图。
电子办公室通讯对于这些区别提供了一个好的范例。一个观察两个人对话的观察者可以看到一串消息,每个消息由一些信息组成,后面跟随一个表示收到的应答信息。绝大多数电子邮件系统的设计都是基于这种通讯模型的。从承诺域来看,一次典型的办公室对话包括通话人趋向于完成状态的意向,所谓完成状态就是没人希望再进一步通讯的状态,因而,对话由请求、回答、反问、约定和报告完成几部分组成。一个从这个角度设计的计吴机系统知道这几个组成部分,并且在通话人趋向于完成时,对他们提供支持。从动作域来看,就不可能以这种方式组织办公室通讯,因为设计者不能看到通话人对于对话的内部状态。问题求解作为智能的基础的传统观点是如此地牢固,以致新的区别,如描述域、动作域和承诺域,看起来新奇而又难以把握。然而认真地解决这些问题会使得设计者克服专家系统的盲目性,从而有可能带来人工智能的新的成功。
[American Scientist,1988年3~4月号]