[译者按]鲁道夫·卡尔纳普是西方著名的哲学家,一生有很多建树,尤其是在归纳逻辑研究方面,他的工作令人瞩目。本译文选自他的代表作《概率的逻辑基础》,翻译时略有删节。可以作为研究哲学、逻辑学的同志的参考资料。

(一)归纳逻辑在科学中的理论效用

在科学中,运用归纳逻辑的可能性和局限性——这些局限性有些是根本性的,有些只是技术上的——通过同演绎逻辑的类比可以得到最好的阐明。在大多数情况下,特别在还不涉及数学变换的地方,科学家以一种直觉的、本能的方式进行他们的演绎推理,也即没有使用明确提出的逻辑规则;他们这样做通常都很成功。所以,我们不能指望,演绎逻辑的发展及其系统化会带来立即增加科学家推理程序正确性或有效性这种效果。在科学家的工作中,他必须处理的许多情况是如此的简单,以致没有必要使用明确的逻辑规则。而在其它场合,他工作的那些前提又是如此的复杂,以致他不能够或者不愿意去费心明确地、详尽无遗地表述它们;有时候这不会妨碍他认识到——多少清楚地和确实地——一个给定结论从这些前提导出;但是,它避免了运用明确规则。另一方面,存在着某些场合,演绎逻辑证明对科学家说来是十分有用的,特别是由于最近一百年来演绎逻辑取得了非常广泛的发展;我们可以期望,这些场合的数目会随着进一步的发展而增加。例如,较为精确的现代形式的公理方法只有在现代逻辑的基础上才变得可能;而这种方法在数学及其应用中变得越来越主要,在物理学和科学其它领域中,同样如此。另外,我想,我们可以假定,如果现代逻辑的方法以前就已提供,那么那时科学在演绎程序中的某些错误本来就能避免。欧几里得的平行公理据称是从其它公理演绎而来,就是突出的例子;如果现代逻辑最富于成果的一个领域即关系逻辑,在那时就为人所知的话,那么那些错误本来就会避免,因为关系逻辑使得以一种精确的、形式的方式表示从公理到一个结论的推导,从而避免早先的非形式方法的陷阱,特别在直觉基础上错误地运用一个附加的、未表述出来的前提。

归纳逻辑的情况也是如此。首先,在它对逻辑因素、对排斥方法论的因素上,存在着根本性的局限。这种局限性决不使归纳逻辑成为无用,因为,如果它提供给科学家包含所有逻辑因素的确证度的一个数值,那么它也并不因此阻止他在作决定时无视像他想得那么多的非逻辑因素。相反,它使这个任务变得便易。然而,科学中存在许多场合,它们的复杂性使得应用归纳逻辑实际上成为不可能。举例来说,我们不能指望把归纳逻辑应用于爱因斯坦的广义相对论,不能指望在这个理论刚提出财物理学家所知道的全部观察材料的基础上来为这个理论的确证度找到一个数值,或者为由于1919年日蚀观察而提高了的确证度提供一个数值。归纳逻辑同样不能运用于现代物理学、特别是同量子论相联系的现代物理学的革命性转变的其它步骤。在所有这些情况中,有关的观察材料浩如烟海;它们绝不限于我们通常将之和新理论兴起相连在一起的那些判决性实验。另外,这些场合中,新物理理论的结构每每都是如此的错综复杂,以致在发展中的任何阶段上都没有一个物理学家会给出它的完全和精确的表述,更不用说观察证据的完全和精确的表述了。因此,在这些场合,应用归纳逻辑是不可能的。

另一方面,也存在一些情形,有充分的理由期望,对科学家说来,在其中运用归纳逻辑将是有用的,或者说、在其中有用的应用在今天已成为可能。对于那些用统计方法来描述某些性质分布的科学领域,事情尤其是这样。就如我们在后面将会看到的那样,统计推理形式的归纳推理特别重要,即在假说或证据或这两者由例如陈述相对频率来给出统计信息的地方特别重要。假定一个科学家知道一个给定群体(人、细菌、原子或任何别的东西的群体)中某些性质的统计分布,并且在此基础上想求出关于这些性质在一个尚未观察到的样本(直接推理)中的分布的某个假设的概率,或者反过来说,一个样本中的分布是已知的,并且已给出了一个关于整个群体(回溯推理)或者另一个样本(预测推理)中的分布的假说;对于这些推理和统计推理的类似情况,归纳逻辑也许会有直接帮助。

许多数理统计方法本质上是归纳的方法,特别是那些最近几十年里发展起来、已经非常富于成果地运用于农业、医学、工业生产、保险和许多其它领域的方法,包括估计法、曲线求律法、显著性检定法等等。像当今大多数数理统计学家运用的那样,这些方法通常并不是建立于归纳逻辑系统上面,而是独立地发展的。同样,演绎的数学(算术、分析、函数论、微积分等等)起先也是独立于逻辑地发展了二千多年之久,最后,弗雷格、罗素和怀特海等人成功地把数学的概念和原理建基在演绎逻辑的概念和原理之上,从而使数学成为逻辑本身的一部分。尽管这种成就几乎没有改变任何数学内容,但它仍是十分重要的,因为它首先把数学建立于牢固的基础之上,并且在很大程度上促成了数学基本概念的清晰性和精确性。显然,只有通过利用符号逻辑,这成就才成为可能。依我的看法,归纳统计的情形非常类似。如果可能把定量的归纳逻辑构造到本节开头指出的那种程度(当然,又得借助符号逻辑),那么,就有可能把统计学建立在归纳逻辑上,从而使它成为归纳逻辑的一部分。可以期望,数理统计学由此将首次获得坚实的基础、它的各种方法的系统地统一以及它的基本概念清晰而又精确。尽管现代数理统计学在方法和成果上极为丰硕,尤其是它在实际应用中硕果累累,但很显然,它比弗雷格以前的演绎数学更迫切需要刚才提到的理论优点。

将在本书中发展的归纳逻辑系统远未达到上面提到的那种程度。但即使在这个有限的范围里,仍将可能引入一个一般的估计概念,借助它能够找出关于相对频率的预测和回溯估计的一些新的简单而又重要的结果。在这有限的范围里,把统治方法建基于归纳逻辑在某些情况中甚至将导致修正一些一般定理,因而还使数值结果也得到修正。

杰弗里斯第一个迄今为止也是唯一一个企图解决这样的难题:在一个包含到足以应用于物理学定量语言的归纳逻辑系统的基础上,建立数理统治学。对这个问题,他不是从逻辑出发,而是从经验科学出发。他从自己在常用统计方法的科学领域中的工作,首先是在地球物理学这个特殊领域中的工作获知,必需充分发展概率;理论以用作运用统计方法的逻辑基础。在他的工作中,他自始至终强调一个要求,即一个归纳逻辑系统必须适用于科学家的实际工作,并且,他本人为他的方法之应用于地球物理学和物理学其它分科中的特殊问题给出了大量例子。在我看来,杰弗里斯的例子为经验科学的实际工作中归纳逻辑的有用性甚至必不可少性提供了充分例证。不管我们是否赞同他的方法的全部细节,但毫无疑问的是,他在填补归纳逻辑和处理定量物理量的统计方法领域间的鸿沟上,做了有价值的先驱工作。

在我看来,还存在着另外一个方向,演绎逻辑和归纳逻辑两者都可沿之发展而变得对于一般科学思维来说是重要的。演绎逻辑的发展不仅使得应用于大量具体场合成为可能,而且还对某些更为一般性的基本问题提供启发。今天,我们对演绎推理的基础、对推理有效_理由和对陈述纯逻辑联系的语句的性质有了更好的了解,从历史和心理学的角度看,这是现代演绎逻辑发展的一个副产品,虽然从哲学的角度看,这可以认为是一个极为重要的成就。由于这样,在清楚阐明数学的性质、特别是数学和经验科学间的关系上,也已取得了令人瞩目的进步。我相信,同样,归纳逻辑的发展也将超越应用于具体的情况,产生一些更为一般的、可以说是哲学性的结果:澄清归纳(在我们使用这个词的最广意义上)基础、归纳前提(它们几乎从来没有明确过)以及归纳有效性的意义和条件。这包括过去那个争议颇多且至今仍有争议的问题,也即归纳或特殊种类(例如前面提到的归纳推理)的合理性问题。本书目的不仅是构造一个归纳逻辑系统,而且还要阐明这些更为一般的问题。在这两个方面,本书都只能开一个头。我相信,将来的发展将很快不仅改进归纳逻辑的技术方法和大大扩充它们的范围,而且同时还加深我们对归纳推理的性质和有效性的洞见,而今天我们的目光还布满了荫翳。

(二)归纳逻辑的实际效用:概率作为生活指导

从概率演算发展肇始以来,从事这项工作的数学家和哲学家们强调它对实际问题的适用性。起初,应用主要在赌博领域,这种演算据认为提供了方法,一个赌徒借助它们能够计算一次赌博中的机会,从而决定在哪些条件下接受一份赌注是明智的,判定这次赌博的规则是否公平,就是说,不偏袒任何一方,不久人们就认识到,在比较严肃的事务中作的决定、私人生活中的个人决定或者社会生活中的政治决定在原则上都和赌博中作的决定没有什么不同。这里的情形比较复杂,不能容易地分析其中的决定性因素、相关因素往往也多得多。但是,这种复杂性的差异似乎仅仅是程度上的。所以,人们希望,一旦科学提供一种对自然和社会的规律的更为透彻的分析,概率演算就将成为人类心灵最有效工具之一,就能帮助人们在任何给定情境中找出最合理的决定,就是说,提供最有希望成功的决定。启蒙运动时期的著作家在这个问题上最为乐观。现代著作家在原则上一致期望应用概率将获得好处,但通常比较适度。另一方面,在某些有限的领域内,现代著作家不仅纸上谈兵,而且做出了成绩。他们可以指出概率考虑和基于概率的统计方法有许多富于成果的应用,这些应用涉及各种领域,诸如保险、公共卫生、遗传学、理论物理学、天文学、农业试验设计、工业大生产中的质量控制、经济趋势和人事因素的分析以及种种其它领域。这些应用不仅导致理论成果,而且还导致就保险率、公共卫生措施、特殊小麦种的选择、大生产和检验方法的改变等作出实际决定。

使归纳逻辑对获得合理决策有用甚至必不可少的基本事实是,不可能确定地知道将来。

自从我们发现了性质上根本不同的两种概率概念以来,在作出实际决定中它们各起什么作用的问题就产生了。那些想把概率论仅限于概率2即频率概念的人相信,只有这个概念才在实际生活中有用。他们持这种信念的主要论据是,事实上只有关于概率2的陈述才对自然的事实有所说明,而关于概率1的陈述是纯逻辑的,没有事实内容。对这两个概念的表征当然是正确的,但是,关于从概率,的逻辑概念得出的结论是否适用于实际目的的问题仍有待于研究。

根据我们前面的讨论,一个性质M的概率2陈述和一个关于M的单称假说的概率1陈述之间的区别,可以看作下面两类陈述间一般区别的一个特例:(1))关于一个给定情形中的一个物理量的实际值的陈述,这值是观察者所不知道的或至少是不精确地知道的,和(2)—个关于相对给定证据的这个值的估计的陈述。让我们来考虑一个熟悉的关于这种区别的例子;这可能有助于我们阐明有关两种概念的情形。让我们假定,观察者X得到的证据e包含这样的信息:某根杆的长度已度量了三次,结果为80.0、80.1和80.5。让我们假定,度量是在同样的条件下作出的。因此,没有理由认为三个结果中的任何一个比任何其它二个更可靠。所以,X将把这三个值的算术平均值即80.2作为这根杆的长度的估计。他不可能确凿地断定,实际长度就是80.2(即使这个数字被理解为80.15 ~ 80.25区间的简略表达,也不可能)。80.2这个值只是一种估计;这意味着,它是一种猜测;不是一种武断的猜测,而是一种合理的猜测。只要没有进一步的度量结果可供这观察者利用,它实际上就是他在这种情形下所能作的最佳猜测。现在,让我们比较出现在这个例子中的下面二个句子;第一句不属于我们的语言系统而属于更广包的、定量的物理学语言:

(1)“杆的实际长度是80.2。”

(2)“相对给定的证据e作出的杆的长度的估计是80.2。”

句子(1)是一个经验句子;它有事实内容。(我们不必详细讨论用观察对它作的精确解释这个问题;例如,它可以被解释为:随着n增加,前几次度量的结果的算术平均值收敛于80.2。)另一方面,第二个句子是分析的。它建基于估计概念的定义之上。让我们假定,这个定义是以这样一种方式构造的,即它意味着:对于像所讨论的那样简单情形,这个估计是观察值的平均值。句子(2)既不可能由任何进一步观察来确证,也不能由它们否证。即使进一步度量的结果趋于一个十分不同于80.2的值,仍然还成立的是:80.2是关于包含前面讲到的三个值的论证e的估计。

让我们假定,X不得不就这根杆的应用作出一个实际决定,而这决定取决于这根杆的长度。于是,他的行动在某些方面可能像是他知道长度为80.2似的。现在让我们来分析这行为的理论基础。这并非意味着一个关于X作出其决定的实际过程的心理学问题,而倒是一个这过程的理性重建问题。X怎样利用句子(1)和句子(2)呢?我们或许情不自禁地说,他必定利用(1)而不是(2),因为只有句子(1)才能告诉他实际长度是多少。假如X知道句子(1)的话,他当然要利用它。然而,在我们例子所假定的情形里,X并不知道实际长度,而只知道三次度量的结果。此时,对X来说,句子(1)既不是确实的,甚至也不是可能的,就是说,它并不从由e表达的观察结果得出的,甚至也没有由e高度确证。对于句子(1),X除了等着看进一步观察的动向之外,一筹莫展;它们可能高度确证它,从而提示人可接受它,或者高度地否证它,从而提示人否弃它。所以,X不可能在句子(1)中为他决定找到一个理论基础。但他在句子(2))中找到了,因为这个句子是分析的因此既是真的,又是他所知道的;除了他的包含三次度量结果的证据e之外,它还表达了确定他的决定的估计值80.2。

一般说来,这种情况可以描绘如下。一个人的实际决定常常依赖于他周围环境中事物的某些量的值。如果他不知道精确值,则他必须把他的决定建立在一种估计之上。这种估计以下述形式的陈述给出:“所考虑的量的相对如此这般观察结果的估计是如此这般的。”这个陈述是纯分析的。然而,它可以用作为决定的基础。当然,它光凭自身做不到这一点,因为它没有事实内容;但它可以和它所涉及的观察结果结合起来做到这一点。

现在,让我们回到概率1概念的问题上来。这里的情况在某种程度上和刚才讨论的例子类似。假定X从芝加哥的人口中取出80个人作为一个样本,并且发现其中60个人具有性质M。这构成了他现在的证据e。设h是一个单称假说,即预言从人口的未观察部分随意取出的人b将发现具有性质M。对于现在的讨论,h关于e的概率:的精确值是无关紧要的。看来,这个值可能和被观察样本中M的等于3/4的相对频率就是有不同的话,也相差不多。为了使这个例子更具体一点,让我们随意假定h关于的概率1是0.73。现在让我们比较一下下面几个关于本例的句子;我们将看到,它们和以前关于一根杆的实际长度和对其长度的估计的句子相类似。

(3)“芝加哥人口中M的实际相对频率是0.73。”

(4)“关于被观察样本的证据e的单称假说的概率1是0.73。”

根据我们前面的讨论,芝加哥整个人口中M的相对频率关于证据e的估计(在概率:平均值的意义上)等于h关于e的概率1,因此也是0.73。所以,(4)在逻辑上和下面的(5)等值:

(5)“整个人口中M的相对频率关于证据e的估计是0.73。”

假定X不得不作出一个实际决定,或许是行政管理或立法性质的决定,这个决定取决于他对芝加哥人口中M的相对频率的知识。他将如何做是显而易见的;他的行动在某些方面将仿佛是他知道相对频率为0.73似的。但是,他的决定的理论基础是什么,——换句话说,哪一种理性程序导致他的行动,或许不是一目了然的。他会不会把(3)或者(5)当作他作决定的基础呢?概率的频率概念的支持者或许会说,只有(3)才能作为一个基础,因为这是一个关于整体中的相对频率的陈述,因而是一个他们意义上的概率陈述。从下述意义上说,他们是正确的:如果X知道(3),则他会把它作为一个基础。然而,只要X的知识局限于关于80个被观察个人的证据e,(3)就是他所不知道的;(3)甚至也不是在证据e的基础上得到高度确证的。倒不如说,另一个陈述可能作为这种决定的基础。这个陈述是X知道的,因为它在等值的表述(4)或(5)之下都是分析的;(4)是从预先假定的概率的定义得出的,(5)是从一个函项的估计的定义得出的。陈述(5)酷似前面有关一根杆的长度的估计的陈述(2)。这里,关于这估计的陈述还是既不能被任何进一步的观察确证,也不能否证。即使芝加哥人口的一次全面统计表明,实际的相对频率迥异于0.73,也绝不会否弃关于证据e的估计是0.73这个陈述。这里,像前面情形一样,决定可以建基于给定的观察证据e和给出关于这证据e的估计的分析陈述之上。正是这估计的值或者说概率1的值证明了决定的合理性。

这些考虑表明了如下情况。就某种意义上而言,说关于物理量的值的经验陈述对于确定我们的实际决定是重要的,是正确的。对于M在长期过程中的相对频率也即M的概率2,尤其如此,因为根据有关M的单称预言对未来全部赌注的最终平衡是由M的概率2决定的。可见,经验陈述特别是关于概率2的陈述确实可用作一种生活指导。然而,只有在这些陈述已知的情况下,才能做到这一点;如果一个量的值被定义为观察值的无穷序列的极限,那么,精确值就绝不可能知道。这个事实并不使这类概念没有意义或者不适合于实际有用的应用。但是,它带来了一个结果,即为了利用这些概念,需要归纳逻辑。某个量的实际值处于某个小区间内这个假说尽管并不确实,但可能是高度可几的;就是说,它不可以从可资利用的观察知识e得出,但它关于e的概率可能很高。即使如上面讨论的例子那样,对任何小区间来说,情况却并非这样,我们也还是可计算这关于e的量的值的估计。在这些情况里,这些量实际上仍是重要的;但是,它们只能通过高度的概率1或者一个估计被加以利用,只能借助概率1加以定义;不利用这些归纳逻辑的概念,这些量就成为无用的了。于是,我们看到,经验科学(它包括概率2)或者归纳逻辑(它建立在概率1之上)单独都不能作为生活指导。

而只有两者合作才行。科学作出观察并构造理论。为了判断有关理论或根据给定观察结果作出的理论或单称预言的可信性,归纳逻辑是必不可少的。而这些关于期望事件的判断则成为我们实际决定的基础。类似于康德的一句著名格言,我们可以说,离开观察的归纳逻辑是空洞的;离开归纳逻辑的观察是盲目的。

[R. Carnap:The Nature and Application of Inductive Logic,1951年]