认知科学十年

发布时间：90年01月25日

章士嵘

认知科学自1979年正式宣告诞生到现在已经10年了。在这10年中，认知科学取得了哪些进展，这是一个人们所关注的问题。本文拟就笔者所接触到的材料，作扼要的介绍。

一、并行分布处理和认知结构的微观探索

《并行分布处理》—书是由瑞麦哈特（Rumelhart）和麦克莱伦（McClelland）及PDP研究小组于1986年编集出版的一本探索认知的微观结构的书。在人工智能和自然智能哪个优越的争论中，人们常常以自然心智能对信息进行并行处理加工而引以为荣，而认知科学要取得突破性的进展就必定要对这种并行处理的微观结构进行研究和探索。《并行分布处理》—书就是这方面研究所得的初步成果。安德森（Anderson）认为该书所取得的成就是非常杰出的，是认知科学领域的一个里程碑，书中提出的一些模型能令人信服地以一贯和自然的方式来说明大量现象。塞登贝格（Seidbnberg）也认为该书在理解大脑和行为方面取得了真正的进展，其中作者所提出的方法是一个重要的事件，在未来的若干年内，该方法必定会得到进一步的讨论和发展。

毋庸置疑，《并行分布处理》—书代表了认知科学研究中的一个新方向和新方法。这种新方向和新方法的主要之点就是提出了一种更逼近人脑实际的认知工作模型。毫无疑问，这种逼近要以神经科学和心理学的成就作为基础。这再次说明，要充分理解认知的工作原理，就必须打破学科的限制，以便在多种学科交叉的层面上，生长出认知科学的花朵来。

并行分布处理的一个基本的理论假设就是认为如果我们从若干分钟或小时的时间跨度来看人类的思维和解题活动，可以看出其串行处理的特点，然而这种串行处理的每一步，都是大量的相互影响的简单的计算要素（或认知加工单元）同时活动的结果。书中依据这一基本理论假设，在知觉、记忆、语言和思维方面提出了一些并行分布处理的认知工作模型，使人们对于认知的微观结构有了一些可作为出发点的有益内容。

并行分布处理在认知科学中的理论突破主要表现在从串行处理的概念转为并行处理的概念；A计算机隐喻转为大脑隐喻；从功能主义转为新联结主义。

长期以来，在认知科学中流行的是串行处理的概念。这种概念以大脑皮层的短时记忆是串行加工和人类有意识控制自己的行为是串行系列为基础，认为在认知的高级层次上如有意识的思维和推理，尤其是符号的加工处理的特点必然是串行的。虽然他们也承认人类在知觉、直觉、理解等方面表现为并行的特点，但是，他们认为由于认知的高层次活动是符号处理，因而通过分时的方法计算机也可以模拟人的平行加工过程。这样，通过这种还原，按串行加工原理设计的计算机既能模拟人的并行加工过程，也能模拟串行加工过程，而且，在速度上能对并行结构的不足作出补偿。然而，人们不禁要问，人脑具有10⁹ ~10¹²个神经元，而有的神经元具有数千到数万个突触，构成了10¹⁵个树叉状的联结网络，因而人们有理由相信大脑的信息加工是由这种多层次、多模块、多回路的神经元网络来完成的。人们会问：如果大脑里进行的主要是串行加工的话，那么，除了对信息进行加工的神经元以外，剩下的神经元起什么作用呢？脑科学中长期存在的定位论与整体论的争论，不能不说是与串行与并行的概念相联系着的。如果我们过分强调大脑皮层水平的记忆、思维、注意等过程多是串行加工的，那么我们就不能解释为什么人能在模糊、充满噪音的环境中准确地识别事物和从记忆的大量信息中迅速找到所需要的信息等问题。麦克莱伦等人强调指出，“软件”即高层次的计算机语言和强有力的算法并不是问题答案的全部，问题在于人脑具有一种更适合于各种自然信息处理的基本的计算结构，这就是并行处理的概念。他们强调人类的各种行为都是一种多元约束的结果，语言的识别、理解和加工必然也是句法、语义和其他各种知识相互作用的结果。因而有必要从串行处理的概念转到并行处理的概念上来。当然他们也不否定串行处理的概念。在他们看来串行处理只是一种总体的、宏观的描述，需要用大量加工单元的内在结构的微观描述来补充。因为串行的行为并不一定是串行的结果，宏观描述只是对微观结构的突现属性的一种逼近。

自从计算机出现以后，人们都认为心智的计算机模型是人们研究心智的工作原理的重要的物质手段，因而计算机隐喻的思想占了统治地位。人们习惯于作这样的类比，把大脑比作计算机，把思维比作计算机软件。并行分布处理的模型的出现则突破了这种框框，它要求更多地考虑到认知系统的神经基础，希望能在更逼近大脑的神经结构的基础上来构建认知的理论和计算的模型。这就是人们所说的从计算机隐喻到大脑隐喻的转变。在计算机隐喻中，人们用心智的计算机模型来解释和说明人类的智能活动，而在大脑隐喻中人们则是努力用计算机的各种技术如并行计算、分布式网络、广泛并行等来模拟和逼近大脑的神经结构和工作原理。因而并行分布处理模型的研究者们特别强调该模型与神经科学的关系。他们认为他们的工作还仅仅是一个开端，但是并行分布处理的语言是适合于作为具体的神经模型的媒介的。他们寄希望于未来，尤其是大脑神经生理学和解剖学的发展，以便为信息为什么是以这样的方式被处理加工的作出解释。

具体地介绍并行分布处理模型的各种理论和算法并非本文的任务。为了说明上述认知科学中的范式转变，下面拟介绍一个简单的并行分布处理模型。

并行分布处理模型一般为八个方面的要素组成：（1）一组加工单元；（2）—种激活态；（3）每一单元有一输出函数；（4）单元之间的联结有一模式；（5）在联结网络中激活的传播模式有一传播规则；（6）将单元的当前态与输入相结合以产生该单元新的激活水平有一激活规则；（7）联结的模式由经验来修正从而有一学习规则；（8）系统在一定的环境中操作运行。通过上述八个方面要素我们可以看到，新联结主义是从认知加工单元的联结模式出发来解释认知现象中最重要的现象即记忆、知识和学习的。

下面具体介绍一个字词知觉的并行分布处理的模型。从并行分布处理模型的基本假设出发，语言字词的知觉和理解包含多层次的同时的信息加工处理过程，而且各个层次之间的处理加工还存在大量的相互作用、相互激活或抑制。这些处理加工的层次可分为字母、字词的视觉特征、句法和语义等，而且在同一层次又有若干由联结模式所代表的可供选择的假设存在，相互竞争。下图显示了这种多层次、多单元的信息的并行分布处理的情景该图是一个字词知觉相互作用的激活模型的要图。图中分为三个层次，在最上面的层次是字词层次上对Time这个词的处理加工，中间的层次是对T、I、M、E四个字母层次的处理加工，最下面的层次接受输入刺激，是在字母视觉特征层次上的处理加工。其中每一长方形中的许多圆圈代表关于输入模式的互不相容的而又可供选择的假设。其中的双箭头联线代表各层次的认知单元之间的双向相互激活的联结。

普遍认为认知的并行分布处理模型的提出在认知科学的理论原理上是一个突破性的进展，具有很好的前景。然而，并行分布处理模型也存在若干弱点，并行分布处理模型虽然对于表达和说明知觉、运动控制以及认知的范畴化方面具有优越性，但对于一些时序发展的推理和解题活动目前尚没有很好的说明模型。人们有理由认为大脑除了认知机制之外还有监督控制机制和评价机制，这些机制同样能用并行分布处理模型来解释吗？是否在并行分布处理加工之外还有别的处理加工形式呢？对认知现象的研究，人们很早就察觉到认知功能的二重性，即解释世界很快，而要提出新观念却很慢，以及有意识的控制系统的存在。这些都能用认知单元的联结和激活状态来解释吗？甚至有的人还会向并行分布处理模型提出这样的问题，即怎样区分被处理加工的信息和加工结构的问题以及区分学习系统本身的变化和记忆表达系统的变化的问题。正因为存在这些难题，该书的作者认为并行分布处理未来的研究要集中在：研究如何将并行分布处理应用于高层次的认知加工过程和串行的符号加工；进一步发展学习机制的研究和对网络结构作相应的分析；在并行分布处理模型和神经科学之间建立更加紧密的关系。

二，人类推理的基础和非单调逻辑

人类推理的基础是什么？是逻辑规则还是经验，或者，两者都是推理的基础，如果是这样，两者又是怎样结合的。这是一个人类长期思索的问题，也是认知科学的迫切课题。下面列举几位人工智能科学家对人类思维的看法也许是有益的。

明斯基（Minsky）是一位著名的人工智能科学家，但许多人认为，他更像一位具有哲学头脑的心理学家，他对思维的理解可以称为“思想社会论”。在他看来，人的思想是由许多较小的思想组合而成的，而较小的思想又由更小的思想组成。这些思想及它们之间的联系构成了人们的自我的社会，他的许多人工智能方面的科学成就就是从这样的思想出发的。如他关于知识表达的框架理论就是以思想社会论为前提的。从这样的前提出发，人类的思维、推理不过是各种知识的合理调用和存取。认知心理学家诺旻（Norman）认为“人类更多是通过范例来进行推理，我们很少根据逻辑的准则来进行思维或作出决定。人类似乎更倾向于通过类推和经验推理。看来，开药方的内科医生在通过其他手段找到治疗方法之前即已放弃逻辑分析法。他会先回想一下最近的几位病人中，哪些人跟现在这些病人有相同症状，然后再想想先前那些病人服的药疗效怎样。”也就是说人类在解题的思维活动中，主要是靠启发式搜索，而不是证明。西蒙（Simon）最近在日本的第5代机的会议上指出：“人类的推理过程并不是只有几个推理过程，而是有许多推理过程，同时也不是都是逻辑规则，而是一般而言总是配合有重要的特定领域知识。”人工智能科学家Winograd也有这样的看法，他认为专家系统所取得的成就向我们表明，今后发展的方向就是“要去发现更好的方法来将人工智能系统所能做的演绎的工作与人们以经验为背景所做的推理结合起来。”

以上这些意见说明人工智能科学家已越来越明确地认识到传统逻辑（指数理逻辑）的方法不能满足人工智能系统刻划人类思维和物化智能发展的需要。

我们知道，建立在谓词逻辑基础上的传统系统具有“单调”的性质，就是说已知为真的命题数目会随时间而严格增加，而且这种加入和被证明决不会导致前面已知为真或已被证明的命题变为无效。这样的单调系统具有下列的优点：当加入一新命题时，不必检查新命题与原有知识的不相容性，而且，对每一已被证明了的命题，不必保留一个命题表，不存在命题被取消的危险。然而，这种单调的系统并不能很好地处理现实问题领域中常常出现的三类情况，即不完全的信息、不断变化的情况和在解复杂问题过程中假设的生成等等。10多年来，不少科学家致力于这方面的研究，在非单调逻辑和似然推理方面取得一定的成果。这些成果不K有助于认知科学对人类推理机制的了解，而且也推动了人工智能，尤其是专家系统的发展。

专家系统的发展表明，物化智能的艰巨的任务是如何把大量的知识组织起来，使得人或电子计算机能随意检索，即能灵活地把各种知识加以混合、匹配，并使其建立永久性的联系，从而只要检索出其中的一个即可带出另一个。换言之，也就是如何使机器具有像人那样的常识性知识和进行常识推理的问题。

下面简要介绍雷特（Reiter）的默认逻辑（Default Logic）和麦卡锡（McCarthy）的约束逻辑（Circumscription）。这两种非单调逻辑都是企图在信息不完全的条件下，使推理能继续工作下去的途径。在一定程度上更逼近人类的实际思维方式。

（1）雷特的默认逻辑是基于相容性思想而提出的一个比较成功的非单调逻辑系统，其意思是说，当缺乏信息时，只要不出现相反的证据，就可以作一些有益的猜想。因为当我们关于某一具体世界的知识是不完全而又需要进行推理，这时我们就有必要去作一些我们已有信念暂时默认的假设。当然这样的假设并不是僵硬的，它可以为尔后的观察所修正或拒斥。所以，默认逻辑是一种合情推理，特别是可在知识不完全而又要作出结论时使用。

在雷特看来，我们关于世界的知识往往是知道其一般情况下或大多数情况下是什么样的，同时我们又知道一些例外。如我们知遂大多数鸟是会飞的，但企鹅、鸵鸟却是例外。因而这种默认推理规则就可形式地表示为：

BIRD(x) : MFLY(x) / FLY(x)

这一规则可解释为：如果X是一只鸟而且能相容地假定X是会飞的，（即在缺乏相反的信息的情况下可默认鸟是会飞的），其中M可读作“假定……是相容的。”这种通过默认推理规则导出的认可只是反映一种信念的状况，以后若出现反例就应修改。如假定“会陵吱叫的动物是会飞的”是从默认推理规则导出的，以后发现会吱吱叫的企鹅又不会飞则要修改以前的结论。因而这里所说的相容性是指用一阶逻辑表示的事实应和默认推理规则导出的事实（信念）相容。所以，在默认推理的形式化的工作中需要有一种能在新信念出现时修正信念的机制。

为此，雷特提出闭域假设的概念，在他看来人工智能中的演绎问答系统在回答问题时经常是隐含地诉诸某种特殊的默认推理形式。

这样，利用闭域假设对某个论域进行推理，就可大大简化领域知识的表示，即数据库中只表示肯定的信息，否定的信息通过默认来表示。由于否定信息一般说来都大大超过肯定信息，因而闭域假设在计算和知识表达上具有极大的优点。

雷特十分强调这种默认推理的作用是在知识不完全的条件下，即客观论域和我们自身知识之间存在裂缝的情况下去推演，去填平这条裂缝，完成不完全的一阶逻辑所表现的知识。因而，默认理论是指一个二元对（D，W），D是默认集即默认知识，W是闭式集即关于客观世界的知识，从而在这二元对延伸的交积上形成一个信念集即关于客观世界较完全的知识。

雷特同时也指出默认逻辑存在的二个主要问题：一是在证明理论和修改信念时，对普遍存在的可满足性进行验证的计算问题并不存在算法，因而各种启发式的知识是需要的；二是在多个延伸集存在时如何选择延伸的技术问题，同样需要有启发式的知识来将相互冲突的默认合理地排列起来，以便选定优选度最高的默认来获得完式的证明。

尽管如此，默认逻辑在数据库系统设计、知识工程、专家系统和其他人工智能系统中仍有广泛应用价值。

（2）麦卡锡的约束逻辑是他于1980年依据极小化模型提出的。1986年他对这种逻辑进行了扩充和推广，使之成为当前最完善的非单调逻辑系统。

在麦卡锡看来无论是人还是智能的计算机程序常常需要进行猜测，约束逻辑就是对这种猜测性的推理的形式化，因而约束逻辑是一种猜测的规则，人们或程序应用这种规则就能得出某种结论。因此，约束逻辑是对人类的非形式推理的某些过程的形式化。如在数理逻辑中，很容易得出这样的一句话：“船是可以渡河的”这在现实生活中也许是正确的，但常识告诉我们船也可能漏水或没有船桨，如有这些情况发生，船就不能渡河。因而，在逻辑中必须把这些情况考虑在内，这样就要在原话后面加上“船必须不漏，必须有桨才能渡河”。当然意想不到的情况还会有的。那么在推理中怎样解决这类问题呢？麦卡锡认为解决的办法是说这样的语句：“除非受阻碍，船可以用作渡水的工具”。在普通的数理逻辑中，这样说是不够的，因为必须逐一列出每一种例外。麦卡锡的约束逻辑提供了在这种信息不完全的条件下，继续工作下去的途径。如单纯从外延的角度来考虑，“除非受到阻碍，船可以用作渡河的工具”并没有传递任何具体的信息，然而在麦卡锡看来，它却能帮助人们去形成一个如何使用船的规则。

麦卡锡强调指出，约束逻辑并不是要给已有的数理逻辑的一般推理规则增加什么内容，而是要将一些可以与一阶逻辑的推理规则同时使用的猜测规则加以形式化。在麦卡锡看来智能行为需要非单调推理，而启发式的程序能以不同的方式来应用约束逻辑。麦卡锡将约束逻辑定义为如下的语句图式：

在A（p）中P的约束逻辑为

约束推理在人工智能的启发式推理中有大量的应用。程序有时能将约束推理应用于某一谓词，有时也可用阻碍操作进行的谓词作为一种约束而在语句A中进行考察。尤其是当程序要在某种特定的领域进行操作时，就要依据该领域的启发式规则决定作什么样的约束，或何时将这种约束取消。因此，约束推理在知识表达和将某一组事实公理化方面均是一种十分有用的工具。

三、意义和计算结构

1986年由Ablex出版社出版的《意义和计算结构》—书是Western Ontario大学认知科学中心召开的会议的论文集，在这本文集中许多著名的认知科学家如心理学家、计算机科学家纽厄尔（Newell）、语言学家、计算机科学家伍兹（Woods）、哲学家、心理学家福多（Fodor）和哲学家普特内姆（Putnam）等都就“知识”、“意义”和“符号结构”等认知科学所回避不了的理论范畴进行了探讨和争论。所以该书反映了认知科学近10年来的理论关注和这方面所取得的进展。

在认知科学和哲学中人们常常用“意义”、“意向”、“心理状态的语义内容”和“内在表达的语义学”等来解释人们的行为。然而正是这些概念人们有极大的争论。因而，这次会议将问题集中在这样一点上，即一特殊的符号是如何、为何具有意义（或语义内容）这样的问题上。显然，这个问题是很基本的，也是认知科学在形成自己的基本理论时所必需解决的。这些理论问题无疑会涉及到认知表达的结构和认知加工器的结构以及一系列古老的哲学问题的认识论、心智哲学和语言哲学中的一些有争议的问题。下面拟扼要介绍这本论文集的主要内容。

（1）心智的模块性（Modularity）

在认知科学正式宣告诞生之时，多数人都接受智能系统是一物理符号系统的假设，认为通过统一的通用的符号加工处理就能解释各种智能现象和行为。同财也有人提出怀疑，认为智能系统是由许多系统组成的，也就是说人的心智是由功能和组构不同的模块组成的。

通过这10年认知科学的发展，心智的模块性的观念越来越得到人们的重视。福多为会议提供的论文就是《心智的模块性》。福多认为心智的模块性的思想可以追溯到上一世纪的F. J. 高尔（F. J，Gall）的思想，即不是把各种不同的心理事件都还原成同一的功能如联想等，而是承认心智本身就是一束专门化的计算模块。模块因计算领域而异，有语言加工模块、视觉模块、识别模块、规划模块等，甚至记忆也有不同的记忆模块福多认为模块系统一般具有下列六个特征：①模块系统的操作是强制性的；②它们操作的速度是相对地快的；③它们只是一种浅层的计算，为你提供输入的初步的特征化；④它们是与固定的神经组构相联系的认知系统；⑥由于固定的神经组构的特有功能，它们表现出各种特征的分类模式；⑥它们极大地依赖于智能过程的发展而表现为一种特征的发生学的系列。

人们对这种模块性的观念提出的问题主要是：是否存在一个高度平行的中央记忆系统的问题。这种中央记忆系统为各种模块之间的信息交流提供了通道，这种模型可称之为中央数据库模型。有的人更倾向于这样的模型。

（2）符号层次和知识层次

认知科学家们对心智的工作模型的分析，往往采取层次分析法。下面列举几种主要的层次分析。

显然，这种层次分析的方法对于理解智能系统的工作原理是十分有用的，但是也存在着相当大的理论困难。困难在于高层次的内容、功能和属性不能归结为低层次的内容、功能和属性，而高层次的内容、功能和属性又必须通过低层次的内容、功能和属性来说明。再有，各个层次之间是怎样相互联系和相互作用的，这些都需要认知科学家以物理的、生物的组构为基础去说明高级层次的属性和功能的出现。

纽厄尔在他的论文《符号层次和知识层次》中试图从他的一贯立场即物理符号系统的基本假设出发，对符号层次和知识层次的相互关系作出必要的理论说明。该文在会上引起了热烈的过论。这些讨论反映了认知科学界对这些基本理论问题的基本动向。

纽厄尔的论证是十分简单的，其基本的出发点就是认为人总是使用符号的，符号活动是心智操作的本质。他与西蒙提出的物理符号系统假设强调每一符号系统都是物理上可实现的系统，是某种媒介，而符号不过是这种媒介中的模式。我们常说的表达式与符号结构是一回事。他强调，我们如用符号来指谓X，就是说我们在该系统的物理结构中看到了一种存取关系，即符号作为输入会引起一个过程，这样符号的指谓就是通过一定的存取路径去获得另一信息。在他看来，符号层次的操作是很好理解的，这就是程序员所给出的机器语言，而知识层次上的操作需要进一步加以分析。纽厄尔从计算机科学的成就出发，强调知识是在我们设计任一结构来实现它之前就在记忆中存在的东西，一个系统具备知识就是说它能利用这些知识来实现它的目标，因而他认为存在着一个区别于符号层次的自主的知识层次。在这个层次其媒介是知识，其组成要素是目标和行动等。因而这个层次的系统就是由一组目标加一组行动和一知识实体组成。

纽厄尔认为关键在于说明符号是怎样实现这些合理的行为的。纽厄尔强调任何表达都是存取关系加知识。正是表达将符号层次和知识层次联系在一起。

那么，为什么符号系统的加工和操作会导致以知识为基础的合理的行为呢？纽厄尔强调这样二个新观点：第一，符号应被看作是一种存取一定知识的一种设计装置。在他看来，符号就是一种存取知识以便符号能在其上下文上起作用的一种装置。我们如果问一符号的意义是什么，这可能不是一种正确提出问题的方式；第二，符号系统的内部记忆结构（地址）人们可以利用这种指谓使其能对外部世界进行工作。

（3）符号与意义

在伍兹的《程序语义学》和普特内姆的《计算心理学和解释理论》的论文中热点问题是符号怎样获得其意义的。具体地说，就是计算机的抽象的程序是如何成为意义的载体的。在伍兹看来，自然语义学应由两部分组成：一是将外部语言翻译成内部语言的规则；二是内部标记的语义学。伍兹认为内部语言在许多方面是不同于外部语言的：而且正是在内部语言的基础上人们发展关于外部世知的模型对自己的行为进行规划。这种内部语义学对任何关于自然语言的语义学的说明来说都是重要的成分。伍兹通过计算机程序语言的类比，试图提出一种程序语义学以便对符号和意义的关系在某种内在语言表达式的基础上得到具体的解释和说明。伍兹认为他的论文中所说的还仅仅是一些十分初步的设想。

通过大家的争论，人们普遍认为关于符号、语言的科学解释理论对于说明心理的层次和意义与计算的关系是绝对必需的。认知科学要在理论原理上有所突破就要在意义与计算结构这样的关系上进行突破，说明非语义属性如何决定语义属性。

10年对一门科学是短促的一瞬间，认知科学的研究者们都决心花费毕生的精力去研究智能的本质和来源。在各交叉学科的共同哺育下；必定会结出更丰富的硕果来。