|
科学发现的逻辑 作者: K.R.波珀 第十章 验证或理论如何经受住检验 理论是不能证实的,但是它们可被“验证”。 常常尝试把理论描述为既非真的又非假的,而是或多或少可几的。尤其是归纳逻辑已发展为一种不仅把“真”和“假”两个值,而且把不同程度的概率赋于不同的陈述;这类逻辑在这里将称为“概率逻辑”。按照那些相信概率逻辑的人看来,归纳应该确定一个陈述的概率程度。并且归纳原理应该,或者使归纳出来的陈述是“可能正确的”这一点成为确实可靠的,或者使这一点成为可几的——因为归纳原理本身只是“可能正确的”。然而我认为整个假说概率问题是被误解了的。我们不应去讨论一个假说的“概率”,而是应该努力去评价它通过经受住检验在多大程度上能够证明它适宜生存。简言之,我们应该努力评价它在多大程度上得到“验证”。 79.关于假说的所谓证实 理论是不能证实的这一事实常常被忽视。人们常常谈到一个理论时说,当从它推导出的某些预测被证实时它就被证实了。他们也许会承认从逻辑观点看,证实是不完全没有缺点的,或者承认通过确定某一陈述的某些推断决不能最终确定这个陈述。但是他们易于把这些异议看作是由于某种不必要的顾虑所致。他们说,我们不能确定地知道太阳明天是否会升起,这是很对的,并且甚至是平凡浅显的,但是这种不确定性可以不予考虑:理论不仅可改进,而且能被新的实验证伪这个事实给科学家提供了一个在任何时候都可成为现实的重大可能性;但是从来还没有认为一个理论由于一个得到充分确证的定律突然垮台而必须被证伪。决不会发生老的实验有一天产生新的结果这种事。发生的只是新的实验判定反对旧的理论。旧的理论,即使当它被取代时,也常常保持它的正确性作为新理论的一种极限情况;它仍然至少以高度的近似应用于那些以前它在其中富有成效的情况。简而言之,可用实验直接检验的规律性没有改变。大家承认,它们会改变这是可以设想的,或者在逻辑上是可能的;但是这种可能性为经验科学所忽视,并且不影响它的方法。相反,科学方法以“自然过程不变性”或“自然界均一性原理”为前提。 对于上述论证有一些话要说,但它不影响我的论点。它表示对我们世界存在规律性的形而上学信念(我也有这种信念,并且没有这种信念实践行动是不可设想的)。然而,在我们面前的问题——则是在完全不同的侧面上。与我对其他形而上学问题的态度相一致,我避免去支持或反对对我们世界存在规律性的信念。但是我将努力证明理论的不可证实性在方法论上是重要的。正是在这个侧面我反对刚才提出的论据。 所以我将认为只是这个论据中一个论点是有关的——提到所谓“自然界均一性原理”。我认为这个原理以十分浅显的方式表达了一个重要的方法论规则,这个规则正是从理论的不可证实性的考虑中有效地推导出来的。 让我们设太阳明天将不升起(并且虽然如此我们将继续生活着,并从事着我们感兴趣的科学工作)。如果发生这样的事情,科学就不得不努力解释它,即认定律中把它推导出来。大概要求对现存的理论作重大修改。但是修改的理论不仅应解释新事态,我们旧有的经验也应可以从修改的理论中推导出来。从方法论观点看,人们看到自然界均一性原理在这里被既要考虑到空间又要考虑到时间的自然界不变性的公设取代了。所以,我认为断言自然规律性不变是错误的。(这是一种既不能反对又不能赞成的陈述。)更确切地说,如果我们假设它们不随空间和时间而变化,并且假设它们没有例外,这种陈述是我们自然律定义的一部分。因此从方法论观点看,证伪一个得到验证的定律无论如何不是没有意义的。它帮助我们发现,我们对自然律的要求和期望什么。并且“自然界均一性原理”也可被认为是对某个方法论规则——如与它十分接近的“因果律”的一种形而上学解释。 人们尝试用方法原理代替这种形而上学陈述,这导致“归纳原理”,这个归纳原理被认为是支配归纳方法的,从而支配证实理论的方法。但是这个尝试失败了,因为归纳原理本身在性质上是形而上学的。正如我在第1节已指出的,归纳原理是经验的这一假定导致无穷的后退。因此只能作为原始命题(或公设,或公理)引入。如果归纳原理并非在任何情况下都得被看作不可证伪的的陈述,这也许没有什么关系。因为如果这个原理——它应证明理论的推论正确——本身是可证伪的,那么它就会随第一个被证伪的理论而证伪,因为这个理论在那时是一个借助归纳原理推导出的结论;而这个原理作为一个前提,只要从这前提推导出的一个理论被证伪,当然就将被否定后件的推理(modus tollens)所证伪。但是这意味着一个可证伪的归纳原理将随着科学的进展而一再被证伪。所以就必须引入一个假定不可证伪的归纳原理。但是这等于是对一个先验地正确的综合陈述,即关于实在的一个不可反驳的陈述理解错误的观念。 因此如果我们试图把我们对自然界均一性和理论可证实性的形而上学信念转变为基于归纳逻辑的知识理论,留给我们的只是在无穷后退和先验论之间进行选择。 80.假说的概率和事件的概率:概率逻辑批判 即使承认理论决不能最后被证实,我们是否能够确保它们在或大或小的程度上是可靠的——更可几的或不那么可几?毕竟也许有可能把一个假说的概率问题还原为比方说事件的概率问题,因而使之容易接受数学和逻辑的处理。 像一般的归纳逻辑一样,假说概率理论似乎是由于把心理学问题和逻辑问题混为一谈而产生的。大家承认,我们对确信的主观感觉具有不同的强度,并且我们等待某一预测的实现和某个假说的进一步确认的信心程度,很可能取决于(除了其他以外)这个假说迄今业已经受住检验的方式——取决于它过去的验证。但是这些心理学问题并不属于认识论或方法论这一点甚至得到概率逻辑信仰者的充分承认。然而他们争辩说,根据归纳主义者的决定,把概率程度归于假说本身是可能的;并且进一步争辩说把这个概念还原为事件概率概念是可能的。 一个假说的概率主要被认为只是关于陈述概率的一般问题的特例;而后者本身又被认为不过是用特定术语表达的一个事件的概率问题。因此例如我们在Reichenbach那里读到:“不管我们把概率归于陈述还是归于事件只是一个术语问题。迄今我们认为分配给一粒骰子某一面朝上的概率为1/6是事件概率的一种情况。但是我完全可以说正是‘点1将朝上’这个陈述被分配到1/6的概率。” 如果我们想起第23节所说过的,就可以更好地理解事件概率和陈述概率的这种等同。在那里“事件”概念被定义为一类单称陈述。所以说用陈述概率代替事件概率也必定是可允许的。因此我们能够认为这仅是一个术语的改变:参考序列被解释为陈述序列。如果我们想到陈述所代表的一种“二择一”,或更确切地说它的元素,那么我们就能用“k是正面”这个陈述来描述正面朝上,并且用这个陈述的否定来描述它不朝上。这样我们就获得一个这种形式的陈述序列Pi,Pk,PI,Pm,Pn,……,其中Pi有时表征为真,有时(上面加一划)为“假”。因此能够把在一个二择一内的概率解释为陈述序列内陈述的相对“真频率”(而不是某种性质的相对频率)。 如果我们愿意,我们可以称经过如此改造的概率概念为“陈述概率”或“命题概率”。并且我们能够证明在这个概念和“真理”概念之间有十分密切的联系。因为如果陈述序列变得越来越短,最后只包含一个元素,即只有一个单个的陈述,那么根据这单个陈述是真还是假,序列的概率或真频率只可能有1和0两个值中一个值。因此可把一个陈述的真或假看作是概率的特例;反之,就概率把真理概念作为一个极限情况包括在内而言,可把概率看作为真理概念的一般化。最后有可能以这种方式定义真频率运算,即经典逻辑常用的真值运算是真频率运算的极限情况。这些运算的计算可称为“概率逻辑”。 但是我们实际上能否把假说概率与以这种方式定义的陈述概率,因而间接地与事件概率等同起来呢?我认为这种等同是混淆的结果。这个思想是,某一假说的频率,由于它显然是一种陈述概率,必须在刚才定义的意义上的“陈述概率”的名目下。但是这个结论证明是没有根据的;并且因此这个术语是很不合适的。也许终究最好不要用“陈述概率”这个词,如果我们心里指的是事件概率的话。 不管这可能怎样,我断言假说概率概念引起的问题甚至未被基于概率逻辑的考虑触及。我断言如果人们谈到一个假说时说,它不是真的,但是“可几的”,那么这个陈述无论如何不能译为关于事件概率的陈述。 因为如果人们试图把假说概率观念还原为使用陈述序列概念的真频率观念,那么他马上面临这个问题:根据哪些陈述序列,能够把一个频率值赋予一个假说?Reichenbach把一个“自然科学的断言”——他用它指一个科学假说——本身与一个陈述参考序列等同起来。他说,“……自然科学的断言决不是单称陈述,事实上是陈述序列,严格地说我们必须把一个较小的概率值,而不是概率度1赋予这些陈述。所以惟有概率逻辑才提供能够严格代表适合于自然科学知识概念的逻辑形式。”现在让我们把假说本身是陈述序列的意见追根究底。解释它的一个方法是取可能与假说矛盾或一致的种种单称陈述作为这样一个序列的元素。于是这个假说的概率决定于与它一致的那些陈述的真值频率。但是如果平均起来该假说被这个序列的每隔一个的单称陈述所反驳,那么这个假说的概率为1/2!为了避免这个毁灭性的结论,我们再试试两个权宜之计。一个是根据对它通过的所有检验与尚未尝试的所有检验的比值的估计把一定的概率——也许不很精确——赋予这个假说。但是这种办法也没有什么结果。因为这种估计碰巧能够精确计算,并且结果总是概率等于零。最后,我们可以努力使我们的估计立足于导致有利结果的那些检验与导致中性结果——即不产生清楚决定的结果——的那些检验的比值上(用这种方法人们确实可以获得某种类似主观信心感的量度,实验者就是用这种信心看他的结果的)。即使我们不顾这个事实:我们由于这种估计已经离开真值频率概念和事件概率概念很远了,这最后一种权宜之计也不行(这些概念基于真陈述与假陈述的比值,并且我们当然必须把中性陈述同客观上假的陈述等同起来)。为什么这最后的尝试也不行的理由是所建议的定义使一个假说的概念成为不可救药地主观:一个假说的概率不是依靠客观上可复制的和可检验的结果,而是依靠实验者的训练和技能。 但是我认为接受可把某个假说看作是陈述序列这种意见是完全不可能的。如果全称陈述有这样的形式:“对一切k值,在k处某某事发生,这是真的”,这是可能的。如果全称陈述有这种形式,那么我们就可把基础陈述(与全称陈述矛盾或一致的陈述)看作陈述序列——被视为全称陈述的序列——的元素。但是我们已经看到(参阅第15和28节),全称陈述并不具这种形式。基础陈述决不是仅仅从全称陈述中推导出来的。所以全称陈述不能被认为是基础陈述序列。然而,如果我们试图考虑是从全称陈述推导出来的基础陈述的否定的序列,那么对每一个自相一致的假说的估计将导致相同的概率,即1。因为我们必须考虑能被推导出的未被证伪的否定的基础陈述(或其他可推导陈述)与已被证伪的那些陈述的比值。这就是说,我们不考虑真频率,而应考虑假频率的补值。这个值无论如何等于1。因为可推导的陈述类,甚至可推导的基础陈述否定类,都是无限的;另一方面,已接受的起征伪作用的基础陈述数目是有限的,不可能比它更多。因此即使我们不顾全称陈述决不是陈述序列这个事实,并且即使我们试图把它们解释为这类东西,把它们与完全可判定的单称陈述序列相关起来,即使如此我们也达不到一个可接受的结果。 然而我们得考察用陈述序列解释假说概率的另一个十分不同的可能性。也许还记得我们已称某一单称事件是“可几的”(在“形式上单称概率陈述”的意义上),如果它是以一定概率发生的事件序列的一个元素的话。但是这个尝试也失败了——完全不是确定参考序列的困难(它可用许多方法选定;参阅第71节)。因为我们不能说假说序列内的真频率,只是因为我们决不能知道一个假说是否是真的。如果我们能够知道这一点,那么我们就根本不需要假说概率概念。现在我们如上述那样,试图取假说序列内假频率的补数作为我们的出发点。但是如果比方说我们借助未证伪与已证伪的假说序列的比值来定义一个假说的频率,那么如前所说,每一个无穷参考序列内每一个假说的概率等于0。并且即使选定一个有穷的参考系列,我们也未处于更好的地位。因为让我们假定我们能把与这种程序相应的在0与1之间的概率程度——比方说值3/4——赋予某个(有穷的)假说序列的诸元素。(如果我们获得信息,说某个假说属于已被证伪的序列,就能作到这一点。)就这些已被证伪的假说是序列元素而言,我们正由于这个信息就得把3/4而不是零值赋予这些元素。一般来说,一个假说的概率由于知道了它是假的,就要降低1/n,n是参考序列中的假说数。所有这一切显然同用“假说概率”表达我们必须根据支持性或破坏性证据赋予某一假说可靠性程度的纲领是矛盾的。 我认为这已详尽地研究了使假说概率概念立足于真陈述频率(或假陈述频率)概念,从而立足于事件概率频率理论的可能性。 我想我们不得不认为把假说概率与事件概念等同起来的尝试完全失败了。这个结论完全不依赖于我们是否接受(Reichenbach的)这个主张:物理学的所有假说“实际上”是,或者“仔细检查时”不过是概率陈述(关于观察结果序列内某些平均频率陈述,观察结果总是表明与某个均值有离差),或者不依赖于我们是否倾向于在两类不同的自然律之间——一方面“决定论的”或“精确的”定律与另一方面“概率定律”或“频率假说”之间作出区分。因为这两类都是假说性假定,这些假定决不能成为“可几的”:它们只能在这样的意义上得到验证,即它们能够在烈火中——检验的烈火中“证明它们的品质”。 我们该如何解释概率逻辑的信仰者已经达到某种对立的观点这一事实呢?Jean写道——首先在我可以完全同意的意义上——“……我们对任何东西也不能……确定无疑地知道”,但是他接着说:“我们至多只能涉及频率。(并且)新量子论的预测(与观察结果)是如此完全一致,以致有利于与实在相符合的这个图式的机会是极大的。确实,我们可以说这个图式几乎肯定是定量正确的……”,当他这样写时,他的错误在哪里? 无疑最常见的错误在于认为频率的假说性估计,也就是关于概率的假说,本身只能是可几的;或换言之,在于赋予概率假说以某种程度的所谓假说概率。如果我们记得,就其逻辑形式而言(无需参照我们的可证伪性的方法论要求),关于概率的假说既不能证实也不能证伪,那么我们也许能够提出一个令人信服的论据来支持这个错误结论(参阅第65至68节)。它们不是可证实的,因为它们是全称陈述,它们不是可严格证伪的,因为它们决不能在逻辑上与任何基础陈述发生矛盾。因此它们是(如Reichenbach认为的那样)完全不可判定的。现在正如我们已证明的那样,它们能够更好地或不太好地得到“确证”,那就是说,它们可或多或少地与已接受的基础陈述一致。看来正是在这一点概率逻辑起了作用。经典归纳主义逻辑所承认的可证实性与可证伪性之间的对称提示了这样一个信念:把某种可靠性程度的标尺,某种其可达到的上限和下限是真和假的“连续概率程度”(引自Reichenbach),同这些“不可判定的”概率陈述相关起来必定是可能的。然而,根据我的观点,概率陈述正因为它们是完全不可判定的,它们是形而上学的,除非我们使它们因接受某一方法论规则而变得可证伪。因此它们不可证伪的简单结果,并不是它们能更好地或不那么好地得到确认,而是它们根本不能在经验上得到验证。因为否则——假如它们什么也不排除,因而与一切基础陈述相容——就可以说它们被(任何组成程度的)一切任意选取的基础陈述所“验证”,假如它描述某种有关事例的出现的话。 我认为物理学使用概率陈述仅在我在有关概率论已充分讨论的这一方面;更具体地说,它把概率假定,正如其他假说一样,用作可证伪的陈述。但是我应该拒绝参加关于物理学家“实际上”如何工作的这一争论,因为这必定主要是一个解释问题。 我在这里对我的观点与我在第10节中称之为“自然主义”的观点之间的对比作了很好的说明。能够证明的首先是我的观点具有内在的逻辑一致性;其次,摆脱了困扰其他观点的那些困难。大家承认证明我的观点是正确的,这是不可能的,并且与另一种科学逻辑学的支持者进行争论也许毫无裨益。能证明的一切是我对这个特定问题的观点是我一直为之论证的科学概念的一个结果。 81.归纳逻辑和概率逻辑 假说的概率不能还原为事件的概率。这是从前节进行的考虑中引出的结论。但是一种不同的看法可否导致假说概率概念令人满意的定义? 我不认为有可能建立一种假说概率概念,可被解释为表达假说的“可靠性程度”,与“真”和“假”的概念类似(而且它与“客观概率”概念,即与相对频率有如此密切的关系,因而证明使用“概率”一词是正确的)。虽然如此,我现在为了论证起见,要假设这样一种概念事实上已成功地建立,以便提出这样的问题:这会如何影响归纳问题? 让我们假设,某一假说——比方说Schrodinger理论——在某个确定的意义上被承认是“可几的”;或“可几到某一数值程度”,或仅仅是“可几的”,没有具体规定程度。把Schrodinger的理论描述为“可几的”这种陈述我们可称为对理论的评价。 一个评价当然必定是一个综合陈述——关于“实在”的断言——,正如陈述“Schrodinger的理论是真的”或“Schrodinger的理论是假的”一样。所有这些陈述显然说的是关于这个理论的适宜性,因此当然不是重言的。他们说一个理论是适宜的或不适宜的,或者在某种程度上是适宜的。其次,对Schrodinger理论的评价必须是一个不可证实的综合陈述,正如理论本身一样。因为一个理论的“概率”——即理论仍然可接受的概率——看来不可能决定性地从基础陈述中演绎出来。所以我们不得不问:评价如何能得到证明?它如何能受到检验?(因而又发生了归纳问题;参看第1节。) 至于评价本身,也可断言这个评价是“真的”,或者也可说它是“可几的”。如果认为它是“真的”,那么它必定是一个经验上尚未证实的真的综合陈述——先验地真的综合陈述。如果认为它是“可几的”,那么我们需要一个新的评价:可以说是评价的评价,所以是更高水平上的评价。但是这意味着我们陷入了无穷后退。诉诸假说概率不能改善归纳逻辑这种靠不住的逻辑境况。 相信概率逻辑的大多数人坚持这样的观点:借助赋予归纳出来的假说以概率的“归纳原理”可达到这种评价。但是如果他们把概率赋予这个归纳原理本身,那么这个无穷后退仍继续着。如果另一方面他们把“真理”赋予它,那么他们就不得不在无穷后退和“先验论”之间进行抉择。Heymans说,“概率论永远不可能说明归纳论证;因为正是同一个问题隐藏在一方,也隐藏在另一方(概率论的经验应用)。在两种情况下,结论都超出了前提中所给予的”。因此,用“可几的”一词代替“真的”一词,用“不可几的”一词代替“假的”一词毫无收获。仅当考虑到证实和证伪之间的不对称性——那种不对称性产生于理论和基础陈述之间的逻辑关系——时才有可能避免归纳问题的覆辙。 信仰概率逻辑的人也许试图用这种方法来对付我的批评:他们断言概率逻辑产生于人的心智,而人的心智“与经典逻辑的框架紧紧束缚在一起”,所以不能遵循概念逻辑使用的推理方法。我坦白地承认我不能遵循这些推理方法。 82.积极的验证理论:假说如何可“证明它的品质” 我刚刚提出的反对归纳概率理论的异议是否可能转变为反对我自己的观点?似乎它们是可能的;因为这些异议基于“评价”概念。并且显然我也不得不使用这个观念。我谈到一个理论的“验证”;而验证只能被表达为一种评价(在这方面,验证与概率之间没有区别)。此外我也认为不可能断言假说是“真的”陈述,只能断言它们是“暂时的推测”(或这类东西);并且这个观点也只能用评价这些假说的方法来表达。 这个异议的第二个部分容易回答。我确实不得不使用的。描述为“暂时的推测”(或这类东西)的假说的评价具有重言式的地位。因此它不发生归纳逻辑发生的那类困难,因为这种描述仅仅是解说或解释严格全称陈述,即理论不能以单称陈述中推导出来这个断言(按照定义,这种描述与这个断言是等价的)。 至于异议的第一部分,有关陈述理论得到确认的评价,情况也类似。确认的评价不是一种假说,但是如果给定理论和公认的基础陈述就可以推导出来的。它断言这些基础陈述与理论并不矛盾这一事实,并且在它断言这个事实时考虑到这个理论的可检验性程度,以及直至陈述时间为止理论已经受的检验的严格性。 我们说只要一个理论经受住了这些检验,它就得到“验证”。断言验证的评价(验证评价)确定某些基本的关系,即相容性和不相容性。但是单单相容性不允许我们把某种正的验证度赋予理论:单凭一个理论尚未被证伪的事实显然不能被认为是充分的。因为没有比建立任何数目的、与公认的基础陈述的任何系统相容的理论系统更容易的了。(这个评价也适用于所有“形而上学”系统。) 也许可以提出,如果一个理论与公认的基础陈述系统一致,并且如果再加上这个系统的一部分可从这理论中推导出来,就应该给予某种正的验证度。或者,考虑到基础陈述不是可以从纯理论系统中推导出来的(虽然基础陈述的否定可如此推导出来),人们会提出,应该采取下列的规则:如果一个理论与公认的基础陈述相容,并且如果再加上这些基础陈述的非空子类可以从这个理论与其他公认的基础陈述的合取中推导出来,就应给予它一个正的验证度。 我对这最后的表述并无严重的异议,除了我认为这对一个理论正验证度的适宜表征是不充分的。因为我们想说理论得到更好地或不那么好地确认。但是一个理论的验证度肯定不能只靠计算验证事例的数目,即可用已表明的方法推导出来的公认的基础陈述的数目来确定。因为会有这样的事发生:一个理论得到的验证似乎比另一个差得多,即使我们已借助它推导出非常多的基础陈述,而借助后一个理论推导出的基础陈述却很少。作为一个例子我们可以比较假说“一切乌鸦皆黑”同假说(第37节提到的)“电子电荷有Millikcan测定的值”。虽然在前一类假说的情况下,我们大概遇到许多更为验证的基础陈述,然而我们将判断Millikcan的假说是二者之一得到更好验证的假说。 这表明决定验证度的与其说是验证实例的数目,不如说是所说的那个假说能够并且已经经受的种种检验的严格程度。但是检验的严格程度本身取决于可检验性程度,并且因此取决于假说的简单性:高度可证伪的假说,或更简单的假说,也是高度可验证的假说。当然实际达到的验证度不仅依赖于可证伪度:一个陈述也许是高度可证伪的,然而它也许只得到一点儿验证,或它事实上也许被证伪了。并且它也许虽未被证伪,却被它可从中推导出——或是它的极为密切的接近——的一个可更好检验的理论所代替。(在这种情况下,它的验证度也是低的。) 两个陈述的验证度也许同可证伪度一样并不是在所有情况下都是可以比较的:我们不可能规定一个数值上可计算的验证度,但是只能用正的验证度、负的验证度等等粗略地说。然而我们可制定种种规则;例如这一条规则:我们不应继续把一个正的验证度给予一个已经被主体间可检验的实验证伪的理论,而这些实验基于起证伪作用的假说(参阅第8和22节)(然而,我们在某些条件下可把一个正的验证度给予另一个理论,即使它遵循一条类似的思路。一个例子是Einstein的光子理论,它与Newton的光的微粒说有密切联系)。一般说来,我们认为一个主体间可检验的证伪是最后的(假如它受到充分的检验):正是通过这种方式使人们感觉到理论的证实和证伪之间的不对称。这些方法论要点每一点都以它自己独特的方式推进作为一步步逼近过程的科学的历史发展。在后来作出的验证评价——即在把新的基础陈述加于那些已经得到承认的基础陈述上面作出的评价——可以用一个负的验证度代替正的,但是反之则不然。并且虽然我认为在科学史上总是理论而不是实验,总是思想而不是观察,开辟通向新知识的道路,我也认为总是实验把我们从死胡同中挽救出来:帮助我们跳出老框框,激起我们去发现新的道路。 因此一个理论的可证伪性或简单性程度进入了理论验证的评价。并且这个评价可被认为是理论和公认的基础陈述之间的一种逻辑关系:考虑到理论已经经受的检验严格程度的一种评价。 83.可验证性、可检验性和逻辑概率 在评价一个理论的验证度时我们考虑到它的可证伪度。一个理论越能更好地得到验证,它就越可检验。然而,可检验性与逻辑概率的概念是相反的,因此我们也能说一个验证评价考虑到了该陈述的逻辑概率。而逻辑概率本身,如我们在第72节已表明的那样,与客观概率——事件概率——的概念有关。因此,通过考虑到逻辑概率,把验证概念与事件概率概念连结起来,即使也许只是间接地和松散地。我们认为这里也许同上面批评的假说概率学说有某种联系。 当试图评价一个理论的验证度时,我们可推理如下:它的验证度将随它验证实例的数目而增长。这里我常常给予第一个验证实例比后面几个大得多的重要性:一旦一个理论得到充分验证,进一步的实例只能提高它的验证度很少一点儿。然而如果这些新的实例迥然不同于早先的实例,即如果这些实例在一个新的应用领域验证这个理论,这条规则就不适用。在这种情况下,它们就可极大地增加验证度。普遍性程度更高的理论的验证度因此可比普遍性程度较低(所以可证伪度也较低)的理论的验证度更大。同样,精确度更高的理论比精确度较低的理论可得到更好的验证。为什么我们不把一个正的验证度给予手相者和占卜者的典型预言的一个理由是他们的预测是如此小心谨慎和不精确,以致这些预言是正确的逻辑概率极高。并且如果我们被告知说,一些更为精确、因而逻辑上不那么可几的这类预测曾经是成功的,那么一般说来,我们怀疑的往往不是它们的成功,而是它们所谓的不可几性:因为我们倾向于认为这些预言是不可验证的,在这些情况下我们也往往从它们低的验证度推论到它们低的可检验度。 如果我们把我的这些观点同蕴涵在(归纳)概率逻辑中的观点加以比较,我们就会得到一个真正值得注意的结果。根据我的观点,一个理论的可验证度——以及一个真实上已通过严格检验的理论的验证度,可以说均与它的逻辑概率处于反比关系中;因为它们都随它的可检验性和简单性程度而增加。但是概率逻辑蕴涵的观点正好是这种观点的对立面。这种观点的支持者使一个假说的概率的增加与它的逻辑概率成直接比例——虽然无疑他们想要他们的“假说概率”所要代表的与我试图用“验证度”所表明的完全是同一件事。 在那些以这种方法论证的人中间是Keynes用了“先验概率”一词来指我称之为“逻辑概率”的东西(参见第113页注)。他就一个“概括”g(即一个(假说)以及“条件”或前件或条件从句φ和“结论”或后件或结论句f作了下列完全确切的评论:“条件φ内容越丰富和结论f内容越贫乏,我们赋予概括g的先验“概率就越大。这个概率随着φ中的每一次增加而增加,它随着f中的每一次增加而减少。”正如我说的,这完全正确,即使Keynes并没有在他称之为“某一概括的概率”——与这里被称为“假说概率”的相一致——与它们的“先验概率”之间作出明确的区分。虽然如此,Keynes用他的“概率”所指的与我用“验证”所指的是一回事,这一点可从他的“概率”随验证实例数目以及(最为重要的)也随实例之间多样性的增加而增加中看出。(但是Keynes忽视了这一事实:其验证实例属于各种各样应用领域的理论常常相应地具有高度的普遍性。因而他的两个要求,即获得高的概率——最小可能的普遍性和验证实例最大可能的多样性——一般是不相容的。) 用我的术语来表达,Keynes的理论蕴涵着验证(或假说概率)随可检验性而降低。他对归纳逻辑的信仰引导他达到这个观点。因为使科学假说尽可能确定无疑,正是归纳逻辑的倾向。只有在种种假说能被经验证明为正确时才赋予它们以科学意义。只是因为理论和经验陈述之间密切的逻辑接近,一个理论才被认为科学上有价值。但是这不过意味着理论的内容必须尽可能少地超越经验上确定的。这个观点与否认预测的价值有密切的联系。Keynes写道:“预测的独特优点,……完全是想象性的。被考察的实例的数目和它们之间的类似是基本要点,碰巧在检查它们之前还是之后提出某一特定假说的问题是完全无关的。”Keynes在援引“先验地提出的”——即我们在对它们已有充分的支持以前根据归纳的理由提出的——假说时,写道:“……如果它不过是一种猜测,在它之前有一些事例或所有的事例都证实它,这一饶悻事实对它的价值丝毫不增添什么。”这种预测观点当然是前后一贯的。但是它使人们感到奇怪为什么我们总是要进行概括。有什么可能的理由要建立所有这些理论和假说?归纳逻辑的立场使这些活动成为完全不可理解的。如果我们评价最高的是可得到的最可靠的知识——并且如果预测本身对验证无所贡献——,那么为什么我们依然不满足于我们的基础陈述? 引起十分类似的问题的另一个观点是Kaila的观点。虽然我认为正是简单的理论,以及那些很少利用辅助假说(参阅第46节)的理论能得到很好的验证,正因为它们的逻辑不可几性,Kaila根据类似Keynes的理由正好以相反的方式解释这种情况。他也看到我们常常把一个高概率(用我们的话说,高的“假说概率”)赋予简单的理论,尤其是那些需要很少辅助假说的理论。但是他的理由是与我的对立的。他不像我所做的那样把一个高概率赋予这些理论,因为它们是可严格检验的,或逻辑上不可几的;那就是说因为它们可以说是先验地具有与基础陈述矛盾的许多机会。相反地,他把高概率赋予具有很少辅助假说的简单理论,是因为他认为由很少假说组成的系统先验地比由许多假说组成的系统与实在发生矛盾的机会更少。人们在这里又一次不明白为什么老是要费神去建立这些冒险的理论。如果我们怕与实在发生冲突,为什么通过作出断言把理论招来?我们最安全的方针是采取一个没有任何假说的系统。〔“言多必失,不说为佳”] 我自己的规则要求所用的辅助假说要尽可能地少(“利用假说的节约原理”)与Kaila的考虑毫无共同之处,我对仅仅减少我们陈述的数目不感兴趣:我感兴趣的是它们在高度可检验性意义上的简单性。正是这种兴趣一方面导致我的应尽可能少地利用辅助假说的规则,另一方面导致我的公理——最基本的假说——数目应尽量减少的要求。因为这后一点出于这一要求:应选取普遍性水平高的陈述,以及由许多公理组成的系统如有可能应从具有更少“公理”和普遍性水平更高的系统中演绎出来(因此用后一系统解释)。 84.论关于“真的”和“被验证的”概念的使用 在这里概述的科学逻辑学中,避免使用“真的”和“假的”概念是可能的。它们的地位可由关于可推导性关系的逻辑考虑来代替。因此我们不一定说:“假如理论t和基本陈述b是真的,预测p就是真的。”我们可以说,陈述p是从t和b(非矛盾的)合取中得出的结论。一个理论的证伪可用同样方法描述。我们不一定说这理论是“假的”,但我们可以说它被一组公认的基础陈述反驳。关于基础陈述我们也不一定说,它们是“真的”或“假的”,因为我们可以把它们的得到承认解释为协约决定的结果,而公认的陈述是这种决定的结果。 这当然不是说,我们禁止使用“真的”或“假的”概念,或它们的使用造成了任何特殊的困难。我们可以避免它们这一事实本身表明它们不可能引起任何新的基本问题。“真的”和“假的”概念的使用十分类似像“重言”、“矛盾”、“合取”、“蕴涵”和诸如此类这些概念的使用。这些是非经验概念、逻辑概念。它们描述或评价一个陈述,不考虑经验世界中的任何变化。虽然我们假定物理对象(Lewin意义上的“发生同一的[genidentical]对象”)随时间的推移而变化,我们仍然决定以这种方式使用这些逻辑谓词,因而陈述的逻辑性质成为无时间性的了:如果一个陈述是重言的,那么它永远是重言的。我们也把这同样的无时间性赋予“真的”和“假的”概念,这与日常的用法是一致的。说一个陈述昨天是完全真的,但今天变成假的,这不是日常的用法。如果昨天我们评价一个陈述是真的,今天评价它是假的,那么我们今天不言而喻地断言我们昨天错了;甚至昨天这个陈述也是假的——无时间性地假的——但我们错误地“把它当作真的”。 这里人们能十分清楚地看到真理和验证之间的不同。评价一个陈述得到验证或没有得到验证也是一个逻辑评价,因此也是没有时间性的;因为它断言在某一理论系统和某种公认的基础陈述系统之间有一定的逻辑关系。但我们谈到一个陈述时决不能简单地说它本身或自己“得到验证”(以我们说它是“真的”这种方式)。我们只能说它就某种基础陈述系统而言得到验证——直到某一特定时刻以前得到承认的系统。“一个理论直到昨天得到的验证”与“一个理论直到今天得到的验证”在逻辑上不是等同的。因此我们必须给每一个验证评价添上一个下标——表征验证与之有关的基础陈述系统的下标。(例如用它得到承认的日期)。 所以验证不是一个“真值”;即它不能与“真的”和“假的”概念(它们没有时间标志)处于同等的地位;因为对于同一陈述可以有任何数目的不同的验证值,这些值确实都可能同时是“正确的”或“真的”。因为它们是一些可从理论和在不同时期承认的不同组基础陈述中合乎逻辑地推导出来的值。 上述的评论也可帮助阐明我的观点和实用主义者的观点之间的对立,他们建议用一个理论的成功——因而用它的有用性,或它的确证或它的验证来定义“真理”。如果它们的意图只是要断言一个理论成功的逻辑评价不过是它的验证评价,那我可以同意。但是我认为把验证概念同真理概念等同起来远不是“有用的”。这在日常用法中也是要避免的。因为人们谈到一个理论时完全可以说,它迄今根本末被验证,或它仍未被验证。但我们一般不应说一个理论迄今不是真的,或它仍然是假的。 85.科学的道路 人们在物理学进化中可以辨认出某种总方向——从普遍性水平较低的理论到水平较高的理论的方向。这通常被称为“归纳”方向;也许会认为物理学沿这个“归纳”方向进展这个事实可被用作支持归纳方法的一个论据。 然而沿归纳方向进展不一定由归纳推理序列组成。实际上我们业已表明它可用完全不同的术语--用可检验性和可验证性程度——来解释。因为一个已得到充分验证的理论只能被一个普遍性水平更高的理论来代替;即被一个可更好检验的、并且此外包含旧的、得到充分验证的理论(或至少很接近于它)的理论来代替,所以把那种趋向——向普遍性水平越来越高的理论进展——描述为“拟归纳”趋向更好。 这种拟归纳过程应设想如下。提出具有某种普遍性水平的理论,并用演绎法检验;在这以后,又提出普遍性水平更高的理论、又借助具有以前水平的普遍性的理论检验,如此等等。检验方法是不变地根据从较高水平到较低水平的演绎推理;另一方面普遍性水平按时间次序通过从较低水平到较高水平而达到。 也许提出这个问题:“为什么不直接发明普遍性水平最高的理论!为什么等待这种拟归纳进化?也许这不就是因为毕竟有归纳要素包含在其中吗?”我不认为如此。具有一切可能的普遍性水平的意见——推测或理论——一次又一次被提出。那些普遍性水平太高的理论(即离开当时可检验的科学达到的水平太远)也许产生一种“形而上学系统”。在这种情况下,即使陈述应该可以从这个系统中演绎出来(或只是不完全地推导出来,例如在Spinoza系统的情况下),这些陈述属于流行的科学系统,在其中也不会有任何新的可检验陈述;这意味着没有任何判决性实验能被设计出来检验所说的系统。如果在另一方面,可以为它设计一个判决性实验,那么系统作为第一个近似将包含某个得到充分验证的理论。并且同时也包含某种新的东西——能够接受检验的东西。因此,该系统当然不是“形而上学的”。在这种情况下,可把所说的系统看作为科学拟归纳进化上的新进展。这说明为什么一般只是由那些提出来试图应付当时问题境况,即当时的困难、矛盾和证伪的理论来建立与当时科学的联系。在对这些困难提出一种解决办法时,这些理论可指出通向判决性实验的道路。 为了获得一个这种拟归纳科学进化的图景或模型,可把种种思想和假说看作为悬浮在液体中的粒子。可检验的科学是这些粒子在容器底下的沉淀物:它们是分(普遍性的)层沉淀的。沉积的厚度随这些层次数目而增长,每一个新的层次相当于比在它下面的那些理论更为普遍的理论。这个过程的结果是以前在较高的形而上学区漂浮的思想有时可因科学的增长而被触及,因而与它接触而沉淀。这些思想的例子是原子论;单一物理“本原”或最终元素(其他东西由此衍生出来)的思想;地动理论(被Bacon认为虚构而反对);古老的光微粒说;它的液体理论(作为金属传导的电气假说而复活)。所有这些形而上学概念和思想,即使在其最初的形式,也许已帮助把秩序引入人的世界图景中,并且在一些情况下也许甚至已导致富有成效的预测。然而这样的一个思想获得科学的地位,仅当它存在于可证伪的形式时;那就是说,仅当用经验在它与某个对立理论之间作出抉择成为可能时。 我的研究已探索了本书开头所采取的一些决定和约定——尤其是划界标准——的种种结果。我们在回顾时可以试图最后全面地看一看已经呈现的科学和科学发现的图景(我在这里想到的不是作为一种生物学现象,作为一种适应工具,或作为一种迂迴的生产方法的科学图景:我想的是它的认识论方面)。 科学不是一个确定的或既成的陈述的系统;它也不是一个朝着一个终极状态稳定前进的系统。我们的科学不是绝对的知识(episteme):它决不能自称已达到真理,甚或像概率一样的真理的替代物。 然而科学具有的价值不只是生物学的生存价值。它不仅是一个有用的工具。虽然它既不能达到真理,也不能达到概率,追求知识和探索真理仍然是科学发现最有力的动机。 我们不知道:我们只能猜测。并且我们的猜测受到对我们能够揭示——发现的定律、规律性的非科学的、形而上学的(尽管在生物学上可以说明的)信仰指导。像Bacon一样,我们可把我们自己的当代科学——“人们现在通常应用于自然界的推理方法”——描述为由“轻率的和过早的预感”组成的,描述为“偏见”。 但是,我们的这些不可思议的富有想象力的和大胆的推测或“预感”受系统的检验仔细而清醒的控制。我们的任何“预感”一旦提出,都不能被教条地坚持。我们的研究方法不是维护它们,为了证明我们是多么正确。相反,我们努力推翻它们。我们努力利用我们的逻辑的、数学的和技术的武库中的所有武器来证明我们的预感是错的——为了代替它们提出新的未被证明的和不可被证实的预感,Bacon嘲弄地称它们为新的“轻率的和过早的偏见”。 有可能更为乏味地解释科学的道路。人们会说,进步“……只有两种方法获得:通过收集新的知觉经验,以及通过把已经得到的那些经验更好地组织起来”。但是科学进步的这种描述,虽然实际上并不错,似乎没有抓住要害。它也是Bacon归纳法的残余:太使人想起他的勤奋收集“无数成熟的应时的葡萄,他期望科学之酒从中流出:想起他的始于观察和实验,然后进到理论的科学方法神话(顺便说一句,这种神话方法仍然激励一些试图实践它的新近出现的科学,原因是普遍认为它是实验物理学的方法)。 科学的进展并不是由于越来越多的知觉经验随时间而积累这一事实。它也不是由于我们正在越来越好地利用我们的感觉这个事实。科学不可能从未被解释的感觉经验中提炼出来,不管我们多么勤奋地收集和挑选它们。大胆的想法,未被证明的预感,以及思辨的思想是我们解释自然的惟一手段:我们把握自然的惟一的工具,我们惟一的仪器。并且我们为了获奖,就必须使它们冒风险。在我们之中不愿意使他们的思想去冒反驳的风险的人,不能参加科学游戏。 甚至用经验仔细地认真地检验我们的思想本身也受思想启发:实验是有计划行动,其中每一步受理论支配。我们并不是偶然地碰见我们的经验的,我们也让它们像溪流那样在我们身旁流过。宁可说,我们必须是主动的:我们必须“制造”我们的经验。正是我们总是向自然界提出问题;正是我们一而再、再而三试图提出这些问题,为了得到明确的“是”或“否”(因为自然界不给答案,除非逼着它)。最后,正是我们给出答案;正是我们自己在认真仔细研究之后决心回答我们向自然界提出的问题——在持久地和诚挚地试图从自然界那里得到一个毫不含糊的“否”之后。Weyl说,“我永远要记录我对实验家在他的斗争中工作的无限敬意,他在这种斗争中从毫不让步的造物主那里夺取可解释的事实,造物主清楚地知道如何用一个决定性的不——或用一个听不见的是来对付我们的理论”。我完全同意他。 关于episteme——绝对的确定的可证明的知识——的古老的科学理论已证明是一个偶像。科学客观性的要求使每一个科学陈述必定仍然永远是试探性的成为不可避免。它当然可被验证,但是每一次验证是相对于其他陈述而言的,这些陈述又是试探性的。只有在我们确信的主观经验中,在我们的主观信仰中,我们才可能是“绝对确定无疑的”。 蒙昧主义的防御工事随着确定性的偶像(包括不完全确定性或概率的偶像)而垮台了。蒙昧主义阻碍科学前进的道路,妨碍我们问题的大胆性,危害我们检验的严格性和完整性。这种错误的科学观表现于渴望成为正确;因为造就科学家的不是他之拥有知识、不可反驳的真理,而是他坚持不懈地以批判的态度探索真理。 那么我们的态度不得不是一种无可奈何的态度吗?我们是否不得不说,科学只能完成它的生物学任务;即至多它只能在可验证它的实际应用中证明它的品质吗?它的智力问题是不可解的吗?我不认为如此。科学决不追求使它的回答成为最后的甚至可几的这种幻想的目的。宁可说,它的前进是趋向永远发现新的、更深刻的和更一般的问题,以及使它的永远是试探性的回答去接受永远更新的和永远更严格的检验这一无限然而可达到的目的。 追记(1972) 我书的前一章(即最后一章)中,我试图阐明,我说的一个理论的验证度是指总结该理论如何经受住检验以及这些检验如何严格的简要报告。 我从未偏离过这个观点。这里我将补充以下几点: (1)逻辑的和方法论的归纳问题不是不可解决的,但是我的书提供了一个反面的解决:(a)我们决不能合乎理性地证明一个理论,这就是说,我们决不能合乎理性地证明对一个理论真理性的信念,或对它可能是真的信念。这种否定解决同下述包含在优先选择比其他理论得到更好验证的理论的规则中的肯定解决是相容的;(b)我们有时能够合乎理性地证明根据理论的验证,即根据竞争理论的批判讨论的现状(从评价它们接近真理性,即逼真性的观点对它们进行批判讨论和比较)优先选择某一理论。这种批判讨论的现状,原则上可以它们验证度的形式报告。然而,验证度不是逼真性的量度(逼真性的量度必须是没有时间性的),而只是关于我们到某一时刻为止能够确定什么的报告,关于根据对可得到的理由(这些理由已被提出来支待或反对理论的逼真性)所作的判断比较竞争理论主张的报告。 (2)逼真性观念提出的一个形而上学问题是:自然界中有没有真正的规律性?我的回答是:“有”。支持这个回答的论据(非科学的,但也许是“超验的”;参阅P.368)是:如果自然界中没有显而易见的规律性,那么观察和语言都不可能存在:描述性语言和论证性语言都不可能存在。 (3)这个回答的力量依赖某种常识实在论。 (4)实用的归纳问题也就自行解决了:在实践上优先选择根据理性讨论更接近于真理的理论是冒风险的,但是合乎理性 (5)我认为心理学问题(为什么我们相信如此选择的理论继续值得我们信任?)是没有什么意义的。 (6)这种方法并未解决所有可能的“归纳问题”(参阅我即将出版的书:Objectiue Knowledge:An Euolutionary Approach)。 ------------------ |