必读网 - 人生必读的书

TXT下载此书 | 书籍信息


(双击鼠标开启屏幕滚动,鼠标上下控制速度) 返回首页
选择背景色:
浏览字体:[ ]  
字体颜色: 双击鼠标滚屏: (1最慢,10最快)

数学:确定性的丧失[美]克莱因

_3 M·克莱因 (美)
除了代数,19 世纪早期的分析也处于逻辑困境中。拉格朗日为微积分打下的基础(见第六章)并未得到所有数学家的认同,一些人退回到了贝克莱的立场,其余人则认为错误是相互抵偿的。卡诺就是后者之一(他也是法国大革命时期的军队领袖),在他的著作《关于无穷分析的形而上学的思考》中,他的形而上学“解释”错误的确相互抵偿。经过对当时各种解决微积分问题的方法的仔细推敲,卡诺得出结论:尽管现在的各种方法,包括达兰贝尔的极限概念的运用,实际上和古希腊的穷竭法都是等价的,但是无穷小的方法更为迅捷。卡诺对于微积分概念的澄清作出了一定的,但不是最主要的贡献。另外,他将牛顿、莱布尼茨和达兰口尔的观点和希腊的穷竭法联系到一起时,作了错误的解释,因为在古希腊几何、代数学中找不出与导数有关的概念。
分析中的错误在19 世纪继续发展,这方面的例子不胜枚举,但举一两个就足够了。所有分析的基础就是连续函数和函数导数的概念。直观上,连续函数可用一条不间断画出的连续曲线来表示(见图7.1)。而函数导数的几何意义就是曲线上任意一点P 处切线的斜率。直观看来,一个连续函数应在任何一点都有导数存在,然而,一些19 世纪早期的数学家都超然于直观证明之外,而尽可能地用逻辑方法来说明。
图7.1图7.2
不幸的是,如图7.2 所示,一个在A、B、C 处有隅角的连续函数在这些点处没有导数存在。然而,1806 年安培(Andre-MarieAmpère)“证明”了任何函数在所有的连续点上都有导数。其他类似的“证明”可在拉克鲁瓦的三卷本名著《微积分学教程》和几乎所有19 世纪主要著作中找到。直到1875 年,贝尔特朗(JosephL.F.Bertrand)才在一篇论文中“证明”了可微性。然而,所有这些“证明”都是错误的。其中一些数学家情有可原,因为在很长一段时期内函数的概念没有很好地建立起来,但是大约到了1830 年,这方面的缺陷已得到了弥补。
连续性和可微性是分析的基本概念。从1650 年至今,分析一直是人们研究的主要对象。而数学家们对这些概念的认识竟然如此模糊不清,对此你就不能不感到震惊。一个严重的错误在今天对一个学数学的大学生来说都是不可原谅的,然而犯错误的人却是当时的伟人——傅立叶、柯西、伽罗瓦、勒让德、高斯,还有其他一些名声稍逊,但也成就斐然的数学家。19 世纪的教科书仍然随意使用可微、无穷小等意义不明,在既是零,又不是零这一点上前后定义不一致的术语,当时学生对微积分困惑不解,他们所能做的也只是遵循达兰贝尔的告诫:“坚持,你就会有信心。”罗素,1890—1894 年曾就读于剑桥三一学院,他在《我的哲学发展》中写道:“那些教我无穷小分析的老师找不出有说服力的论据来证明微积分的基本概念,就只好说服我充满信心地去接受那些公认的诡辩。”
17、18、19 世纪一直困挠数学家们的逻辑问题,在分析中表现得尤为严重,特别是在微积分和以微积分为基础的无穷级数、微分方程等领域。然而,在19 世纪早期,几何又一次成为人们热衷的研究目标。欧氏几何被扩展了,几何学的一个新分支——射影几何①首先被庞斯莱(Jean-VictorPoncelet)正确地预见到了它的前景。虽然庞斯莱和其他人提出了许多理论,但从其早期历史来看,这些理论的证明要比提出它们困难得多。当时,主要是借助于17 世纪笛卡尔和费马的工作成就,几何结论可用代数方法来证明,但是,19 世纪初期的几何学家对此不屑一顾,他们认为代数方法和几何方法格格不入,完全相异。
为了用纯粹几何学方法“建立”结果,庞斯莱提出了连续性原理,在他的《论图形的射影性质》中他是这样说的:“如果一个图形从另一个图形经过连续变化得出,并且后者与前者一样的一般,那么可以马上断定,第一个图形的任何性质第二个图形也有。”怎样判定这两个图形都是一般的呢?他没有解释。
图7.3
图7.4
图7.5
① 射影几何主要研究一个图形从一个位置投影到另一个位置时,其性质保持不变的问题。例如,一个二维实景通过照相机镜头投影到胶片上。——原注
为了“证明”此原理的正确性,他举出欧氏几何中图的相交弦的两段之积相等这条定理(如图7.3,ab=cd)并指出:当交点移到圆外时,会得到割线与其圆外段之积相等的定理(图7.4)。不需其他证据,连续性原理就可以保证这条定理的正确性。另外,当一条割线变成切线时,切线与其圆外段变得相等,它们的积仍等于另一条割线与其圆外段的积(ab=c2,见图7.5)。庞斯莱用来论证连续性原理的结论刚好是三个独立完美的定律,能够满足和说明他的原理。庞斯莱杜撰了“连续性原理”这个术语,并把此原理抬高成绝对的真理,在他的那本著作中大胆应用,“证明”了射影几何中的许多新定理。
这原理对庞斯莱来说其实不是新的。在广义的哲学意义下,可以追溯到莱布尼茨,他在解决与微积分有关的问题时就用到了这个原理(见第六章)。此后这个原理只是偶而提到,直到蒙日(Gas-Pard Monge)为了建立某些特殊类型的定理才复苏了它。他首先对一个图形的物理位置证明了一个一般的定理,然后声称这定理是普遍成立的,甚至该图形里的某些元素变成“虚”的时候也成立。例如,要证明关于直线与曲线的一个定理,他就在直线与曲线相交时证明,然后声称既使直线与曲线不相交,交点变成虚时,结论也成立。巴黎科学院的一些院士批评连续性原理,认为它只具有启发的意义,特别是柯西,他说:
这条定理严格说只是依靠将某一限定条件下成立的定理扩展到没有限定条件情况下时归纳出来的。用于二阶曲线时,它使人得到确切的结论,但是,其不具备普遍意义,因而不能随意用于几何学,甚至分析学中的各类问题,否则就会犯一些明显的错误。
但遗憾的是,柯西用来攻击这个原理的正确性的例子,却可以用别的方法证明完全为正确。批评者指出,庞斯莱等人对这原理的信心其实是来源于它有代数上的依据。事实上,庞斯莱在俄国狱中的笔记表明他的确曾用代数学来检验过原理的可靠性。庞斯莱也承认其证明是建立在代数学基础之上的,但他坚持认为这原理并不依赖于这样一个证明。然而可以相当肯定的是,庞斯莱依靠了代数的方法去弄清事情的究竟,然后又以这原理为依据来肯定几何的结果。
在19 世纪,尽管存在一些批评意见,连续性原理由于它直观易懂还是被人们接受并且作为一种证明方法得到广泛应用,尤其是几何学家,随心所欲地使用它。然而,从数学逻辑发展角度来看,连续性原理只不过是为了解决当时人们用纯推理方法不能解决的问题而提出的一个武断、偏颇的假定,提出这条原理是为了满足直观性和形象性的要求。
庞斯莱对连续性原理的主张和应用只是数学家们为了证明他们用正当手续不能证明的定理的一个例子,但是逻辑困境依然存在于几何学的每一处。我们知道(见第五章),主要是18 世纪末、19 世纪初非欧几何方面的研究工作,暴露了欧氏几何推理结构上的严重缺陷。然而,数学家们没有立即去弥补它,而是继续坚持它们的所谓绝对确定性。因为欧氏几何学定理的直观基础及实际应用提供了强有力的证据,甚至无人在意其缺陷。对非欧几何来说,情况就不同了。19 世纪早期,除了非欧几何的创始人——兰伯特、高斯、罗巴切夫斯基、鲍耶之外,另外一些人也接受了非欧几何,他们以为自己创造了一门新的学科,尽管其逻辑基础不如欧氏几何那样牢靠。然而,特别是当高斯和黎曼在这方面所从事的工作为人们熟知后,不仅刚才提到的四人而且几乎他们所有的继承者在没有证明的情况下,都相信非欧几何是相容的,也就是说,其定理是彼此不矛盾的。他们都同意萨切利自以为得出矛盾的证法是错误的。
但是,非欧几何中的矛盾总有可能暴露出来。一旦如此,双曲几何中的平行公理假设就不成立,如萨切利所认为的那样,欧氏几何中的平行公理也就是欧氏几何中其他公理的推论。没有任何证据能够证明这种新几何的相容性和实用性,否则它至少会成为一个令人信服的论据,数学家们只能出于一种信念来接受前辈们认为是荒谬的结论。在非欧几何相容性问题上的疑问后来又持续了50 年(见第八章)。
很明显,19 世纪任何一门数学在逻辑上都是得不到保证的。实数系、代数学、欧氏几何,新出现的非欧几何和射影几何,它们要么逻辑不完善,要么根本就没有。分析,也就是微积分及其扩展,不仅在缺乏实数和代数逻辑基础的情况下随意使用,而且在导数,积分,无穷级数中,一些概念也急需澄清。如果说数学没有一样东西是建立在牢固基础上的,此话一点也不为过。
从数学本身来讲,许多数学家对证明的态度真是令人难以置信。在18世纪,分析陷入了明显的困境,以致使一些数学家放弃了这个领域的严密性。因而洛尔认为微积分只是一些精巧的谬误的集合,其他人则像吃不着葡萄的狐狸,极力嘲弄希腊人的严密性。克莱洛在《几何原理》中说道:
欧几里得自找麻烦地去证明什么两个相交的圆的圆心是不同的啦,什么一个被围于另一个三角形内的三角形,其各边之和小于外围三角形的各边之和啦,这是不足为怪的。这位几何学家必须去说服那些冥顽不化的诡辩论者,而这些人是以拒绝最明显的真理而自豪的;因此,像逻辑那样,几何必须依赖形式推理去反驳他们。
克莱洛又说道:“但是一切都倒了个个,所有那些涉及到常识且早已熟知的事情的推理,只能掩盖真理,使读者厌倦,在今天人们对它已不屑一顾了。”
朗思基(J.Hoёne-Wronski),一位伟大的计算方法专家,但他不关心数学的严密性,表达了18 世纪和19 世纪初的这种观点。他的一篇论文被巴黎科学院的一个委员会认为缺乏严密性,而朗思基回答说,这是“迂腐,一种对达到目的的方法偏爱的迂腐”。
拉克鲁瓦在三卷本《微积分教程》第二版序言中说,“希腊人所烦恼的这种琐碎的东西,我们不再需要了。”当时典型的态度是,为什么要自找麻烦,用深奥的推理去证明那些人们根本没有怀疑过的东西呢?或者用不太明显的东西去证明较为显然的东西呢?
甚至到了19 世纪,雅可比(在他未完成的关于椭圆函数的著作中留有许多疑点)还说,“要达到像高斯那样的严密,我们没有时间。”一些人公然蔑视那种没必要的证明,大多数人并不关心问题的严密性。他们经常说的一句话是,传统阿基米得方法认为是严密的,而用现代方法则不是。这在希腊数学中所没有的微分学的工作中显得尤为突出。达兰贝尔1743年说“直到现在......人们总是热衷于扩大数学的范畴,却很少阐明其来源,注重向高层次发展,而很少考虑加固其基础。”这句话对整个18 世纪和19 世纪初的数学工作做了很好的注释。
到19 世纪中期,对证明的考虑更少了,以至于一些数学家甚至不愿意费脑筋去证明他们原本就可以充分证明的东西。杰出的代数几何学家、矩阵代数的发明者凯莱发表了关于矩阵的一个定理,现在称为凯莱—哈密尔顿定理(一个矩阵就是一些数字的矩形排列,在方阵中每行每列都有n 个数字)。他证明了他的定理对2×2 阶矩阵是正确的,并在1858 年的一篇论文中说:“我认为没有必要对一般n×n 阶矩阵去费力证明这个定理。”西尔维斯特(James Joseph Sylvester),杰出的英国代数学家,曾在1876 年至1884 年期间任英国霍普金斯大学教授。上课时他总是说,“我还没有证明这个结果,但我能像肯定任何必然事物一样肯定它。”然后他用这个结果证明新的定理,但是他经常又在下一次课结束前承认他上节课所肯定的结果是错误的。1889 年他证明了一个关于3×3 阶矩阵的定理,但仅仅指出了对n×n 阶矩阵证明此定理时必须考虑的几点。
考虑到欧几里得在处理几何和整数时的良好开端,数学这种不合逻辑的发展就提出了这样一个问题:为什么数学家们要如此徒劳无功地去使后来的发展——无理数、负数、复数、代数学、微积分及其扩展逻辑化?我们已经注意到(见第五章),就欧氏几何和整数而言,这些都是非常明显和直观易懂的,因此更容易发现基本原理或公理,从中又能得到其他性质,尽管欧氏几何的发展也存在一些缺陷。另一方面,无理数、负数、复数、字母运算和微积分概念却极其难以掌握。
还有更深一层的原因。数学大师们对数学的本质无意识地做了微小的改变,到1500 年左右,数学概念成了经验的直接理想化或抽象化。那时,负数和无理数已经出现并被印度人和阿拉伯人所接受。然而,尽管他们的贡献得到人们的承认,但就证明而言,他们只满足于直觉和经验证明。而且当时复数、使用字母的广义代数,微分和积分的概念纷纷进入数学,这门学科由于人们大脑深处的概念而处于统治地位。特别是导数或瞬间变化率的概念,尽管速度这个物理现象有直观基础,但还远不是理性的产物,它在本质上完全不同于数学三角形。同样对希腊人谨慎避开的无穷大量和巧妙地防止其出现的无穷小量,以及负数、复数在理解时所做出的努力也是勉为其难的。这是因为数学家们没有认识到这些概念不是来自于直接经验,而是心智的创作。
换句话说,数学家们是在贡献概念而不是从现实世界中抽象出思想,究其成因,他们是将感性知识转变为理性知识。由于这些概念被证明越来越实用,数学家们起初还忸怩作态,后来就变得肆无忌惮了,久而久之,人们也就认为这是无可指责且理所当然的了。从1700 年起,越来越多的从自然中提取和在人思想中产生的观念进入数学领域并几乎被毫不怀疑地接受,由此引起的不良后果终于促使数学家们不得不从现实世界之上去审视他们的这门学科。
因为他们没有认识到新概念特征的变化,他们也没有认识到他们所需要的是公理化发展的基础,而不是那些自明的真理。当然,新概念要比旧概念精致得多,而且就我们目前所了解的情况看,合适的公理基础并不容易建立。
那么,数学家们如何知道他们该往何处去呢?同时,考虑到他们的证明传统,他们怎么敢只用规则就能保证结论的可靠性呢?毫无疑问,解决物理问题就是他们的目标,一旦物理问题被数学公式化后,就可利用精湛的技巧,从而新的方法和结论就出现了。数学公式的物理意义引导着数学的步骤,也经常给数学步骤提供部分论据,这个过程在原理上同一个几何定理的论证没有什么差别。在证明几何定理时,对图形中一些显而易见的事实,尽管没有公理或定理支持它们,还是被利用了。
除了物理思维,在所有新的数学工作中,还有强烈的直觉作用,基本概念和方法总是在对结论合理的证明以前很久就被直觉捕捉到了。杰出的数学家,不管他们怎样恣意妄为,都有一种本能,即保护他们自己免遭灭顶之灾。伟大人物的直觉比凡人的推演论证更为可靠。
由于某些数学公式能抓住物理问题的本质,18 世纪的数学家们特别热衷于公式。显然,对他们来讲公式是如此的富有吸引力,以至于他们认为仅通过用像微分和积分这样的形式化运算,从一个公式到另一个公式的推导就足以证明它的正确性了。符号的魔力泛滥,耗尽了他们的理性。18 世纪被称为数学史上的英雄时代,因为这个时期的数学家们在几乎没有逻辑支持的前提下,勇于开拓并征服了众多的科学领域。
但是我们仍然心存疑问,尽管数学家们,特别是在18 世纪知道微积分的概念不清而且证明不充分,他们却那么自信他们的结果是正确的。部分答案是由于有许多结果被经验和观测所证实,其中最突出的是天文学的一些预言(见第二章)。但是另一个有关的因素导致17 和18 世纪的人们相信他们的工作,那就是他们确信上帝已经数学化地设计了世界,而数学家们正在发现和揭示这种设计(见第二章)。尽管17 世纪和18 世纪的人们的发现是不完全的,但他们认为它是基本真理的一部分。他们正在展示上帝的杰作并将最终达到永恒真理的彼岸。这样一种信仰支撑着他们的精神和勇气,而丰硕的科学成果则是养育他们的心智和使他们能够不懈追求的精神食粮。
数学家们所发现的只是寻觅中的宝物的一部分,但却富含着更多宝物将被发现的启示。如果应用起来如此精确的数学规律却缺乏精确的数学证明的话,那么还需不需要诡辩了呢?由科学论据支持的宗教信仰代替了虚弱的或者根本不存在的逻辑力量,他们渴望维护上帝的真理,致使他们不断地建造没有牢固基础的空中楼阁。他们用成功来安抚良心,的确,成功是如此地令人陶醉,以致于人们在大多数时间里忘记了理论和严密性。偶尔向哲学和神秘教义的求助掩盖了一些困难,以便它们不再显现。从逻辑上讲,17 世纪,18 世纪及19 世纪早期的工作肯定是粗糙不堪的,但也不乏独创性。为了贬抑这些工作的成就,其中的错误和不准确处被19 世纪后期和20 世纪的人们不公平地强调了。
17、18 世纪的数学就像一个经营大宗业务、却由于管理不善而招致破产的大公司。当然,顾客——购买并利用数学商品的科学家们和债权人——那些毫不犹豫地向数学股票投资的大众,并不知道真正的财政状况。所以,我们发现了极其荒谬的事情,在今天高度发展的数学的逻辑,当时却处于一种十分可怜的窘境。但数学在描述和预测自然方法上的成功给人的印象太深刻了,所以不仅仅是希腊人,所有18 世纪的知识分子都公然支持宇宙是按数学设计的,且把数学作为人类理性的壮丽庄严的成果而极力颂扬。正如约瑟夫?艾迪生在《赞美诗》中对天体的赞美一样(见第三章),人们都沉浸在收获颇丰的喜悦之中。
现在我们回溯一下这种对数学推理的赞颂似乎令人难以置信,确切地讲,它们只是用到了推理的细枝末节。但特别在18 世纪,当关于复数的意义和性质、负数和复数的对数,微积分的基础、级数的求和以及其他我们还没有描述的问题的热烈论战充斥文献时,我们称其为“战国”时代是比较合适的。 到1800 年,较之于逻辑合理性,数学家们更热衷于结果的确定性。从证明的观点来看,有结果,就能产生信念,我们将很快看到,正是19 世纪后期的工作使其无愧于理性时代这个名称(见第八章)。
当大多数数学家满足于寻求新事物而忽视几何时,一些领袖人物醒悟到了数学的逻辑困境,杰出的挪威天才阿贝尔强调指出,分析正濒临绝境。在1826 年给汉森教授的一封信中,他抱怨道:
人们可以在分析中轻易找到大量模糊不清的东西,你也许很奇怪会有那么多人去研究分析,那是因为它完全没有计划性、系统性。最糟糕的是它从来没有使人信服过。即使在高等分析中,也少有用逻辑上站得住脚的方式证明过的定理。人们可以到处发现这种从特殊到一般而得出结论的蹩脚方式,罕见的是这种方式却很少得出矛盾。
阿贝尔在1826 年1 月给他以前的老师霍姆伯的信中特别提到了发散级数:
发散级数是魔鬼的发明,把不管什么样的证明都建立在发散级数基础上是一种耻辱。利用发散级数人们想要什么结论就可以得到什么结论,而这也是为什么发散级数已经产生了如此多的谬论和悖论的原因。......对所有这一切我变得异常关心,因为除几何级数外,在全部数学中曾被严格地确定出和的单个无穷级数是不存在的。换句话说,数学中最重要的问题也就是那些基础最不牢固的事情,尽管这种级数令人非常惊奇,但它们中的大多数都是正确的,我正试图为这种正确性寻找理由,因为这是一件饶有趣味的事情。
就像对一般人来说,借酒消愁并不能真的化解烦恼一样,数学在物理学中取得的成就也不能使某些数学家漠视其逻辑困境,许多大胆的探索者坚信他们所发现的是上帝的设计,但是由于18 世纪后期这种信念被人们所抛弃,所以他们从中获得的安慰也变得毫无价值(见第四章)。失去了信念的支持,他们不得不重新检验自己的工作,可是他们面对的是模糊不清、证据不足、自相矛盾,甚至是完全的是非混淆。他们认识到数学并不像过去所认为的是推理的典范,不过是用直觉,几何图形,特别是形的永恒性原理之类的原理和求助于被证明可以接受的形而上学来取代推理而已。
建立逻辑结构的理想是由古希腊人明确提出来的,为数不多的几个在算术、代数和分析方向上为之努力的数学家都被这样一种信念所激励着,即数学家们至少已经在某一重要领域——欧几里得几何上做出了成绩。他们认为既然别人能够丈量奥林匹克山,那么他们也可以做到。他们并没预见到,为所有现存数学提供严格基础的任务,远比1850 年时数学家们所想象的要困难得多,他们更不会预见到另外一些麻烦。
第八章 不合逻辑的发展:天堂之门
现在人们可以说,绝对的严格已经达到了。
——彭加勒
数学批评运动的创建者们认识到,两千多年来数学家们只是在充溢着直觉,似是而非的证明以及归纳推理和符号表达式的形式运算的荒野上漫游,他们期望着能在一片空白上建立合适的数学逻辑基础,摒弃那些模糊的概念和矛盾,改进如欧氏几何这样的数学分支已有的基础。这项工作在19 世纪20 年代就已经开始了,并且,随着非欧几何渐为人知,也在愈加广泛地加速进行。它逐渐揭示出欧氏几何在结构上的缺陷,可以明显看出,过去被认为是严格证明的典范,无懈可击的堡垒,也经不起细致推敲。稍后,也就是1843 年,四元数的产生又向实数、复数运算的自以为是提出了挑战。当然,还有一些对自己工作过于自信的数学家,继续粗劣地推理,一旦得到正确的结果,便更错误地相信他们的证明和理论是无懈可击的。虽然严谨的思想家们承认必须摒弃数学是现实世界的真理的主张,但他们还是对数学在力学、地球力学、声学、流体动力学、弹性力学、光学、电磁学以及工程学的许多分支等诸多领域辉煌的成就感到由衷的敬佩。尽管数学是在真理战无不胜旗帜的庇护下,但它一定还借助了某种基本的,也许是神秘的力量才取得其成就。数学对自然的超常的适用性虽然还需进一步解释(见第十五章),但是,没有人能否认这一事实并胆敢把这样一种无所不能的工具弃置不顾。当然,它不应当受到由逻辑困难和矛盾所带来的混乱的威胁,而且,尽管数学家们一度违背了逻辑严密性的原则,但他们也不准备使他们的学科永远建立在实用的基础上。否则,他们的声望也将受到影响。
正因为如此,有一些数学家仓促之中又重新踏上了与原来截然不同的道路,从另一个角度去认识他们所开辟的数学世界。他们决心要竭尽全力构造,在某些地方是重建数学的基础。欲使数学内部井然有序,须要采取一些有力措施。很明显,并没有坚实的土壤可供建立数学大厦之用。以前那些看上去十分牢固的真理基础,已经被证明是不可信的。也许构造另一种坚实的基础结构会稳固些,但就要求有完整的、字斟句酌的公理和定义,以及所有结论的明晰的证明,不管它们看上去是多么的显而易见。用逻辑的前后一致与彼此相容取代对实际情况的依赖,公理和定理互相照应,可使得整个大厦无懈可击。不管它建筑在什么样的土地上,都与基础紧密相依,尽管随风摇摆,却稳如泰山。数学家们由建造微积分的逻辑开始,因为微积分是建立在实数系统和代数的基础上的,但这两者都没有逻辑基础。从纯粹逻辑的观点来看,这种步骤就像一个五十层的办公大楼塞满了家具和其他设备而楼主突然发现整个大楼摇摇欲坠,必须重建,于是他下令从第20 层开始。
出发点选在何处颇有一番说道。我们都知道,在19 世纪以前,各种类型的数被放肆应用,尽管没有逻辑基础,也没有人对其性质是否正确多加关注。神圣的欧氏几何虽然一直受到怀疑,但是在实际应用中并没遇到任何麻烦。事实上,两千多年的可靠的使用确保了其未加证明的逻辑的正确性。另一方面,微积分是整个分析的源泉,在这个浩瀚的领域内,严格的证明,悖论甚至矛盾都出现了,而且并不是每个结论都能得到实际的认可。
在19 世纪初,神父、哲学家、数学家波尔察诺(BernhardBolzano)、阿贝尔和柯西都认为微积分的严格化问题必须加以解决。不幸的是,波尔察诺在布拉格工作,因而他的著作几十年后方为人知。而阿贝尔27 岁就去世了,所以其工作并不深入。只有柯西一直处于他那个时代数学界的中心。1820 年时,他被认为是最伟大的数学家之一。正是柯西揭开了数学严格化运动的序幕,其工作受到广泛的注意,并且产生了深远的影响。
柯西决定在数的基础上建立微积分逻辑。为什么在数上呢?因为牛顿之后的英国人,曾尝试用几何学使微积分严格化,但失败了。对柯西来讲,很明显,几何学并不是合适的基础,而且,莱布尼茨之后的大陆人,一直尝试用分析的办法。在1820 年时,尽管非欧几何鲜为人知,但是已使数学家们心存犹疑。而在另一方面,在哈密尔顿1843 年引入四元数以前,实数系统里还没有发生过任何困扰数学家们的事儿,即使是四元数也不能威胁到实数系统的正确性。
柯西同样很明智地把微积分建立在极限的概念上。这一正确方法也被数学界思维敏锐者所推崇。17 世纪的瓦里斯在其著作《无穷小的算术》(1655 年)及苏格兰教授J?格雷戈里在他的《论圆和双曲线的求积》(1667年)中,还有18 世纪的达兰贝尔都确信极限概念是合适的基础。其中达兰贝尔的观点是最为著名的,因为在他发表文章的时候,有牛顿、莱布尼茨、欧拉的工作可以借鉴。在他为《百科全书》(1751—1765)所撰写的条目“极限”中,明确认为:
当一个量以小于任何给定的量逼近另一个量时,可以说后者是前者的极限,尽管前者绝不会超过后者......。极限理论是微分学真正形而上学的基础......
达兰贝尔在《百科全书》的另一条目“微分”中,讨论了巴罗、牛顿、莱布尼茨、洛尔和其他人的工作。他说,微分(无穷小)是一个无穷小量,它可小于任何给定的量。但他又解释说,他用这些字眼是为了使其与流行的用法一致。这一术语,他说是一种缩写形式,晦涩难懂,极限是正确的语言和方法。他批评牛顿用速度来解释导数,因为某一瞬时速度并没有清楚的概念,而且这里还引入了一个非数学的运动概念。在他的《杂记》(1767年)中,达兰贝尔再次指出,“量是物非物,若它是物则还未消失,若它非物,则已杳无踪影。”他再次提出极限概念,但是,他并没有将这一概念用于微积分,而且他的同时代人也未接受他的建议。
极限的思想还出现在卡诺的《反射》和惠利尔的获奖论文中,后者曾获柏林科学院一次竞赛的奖励。卡诺的文章虽未得奖,但也还说得过去,所以柯西很可能是受了他们的影响。不管怎样,在他著名的《代数分析教程》(1821 年)引言里,他明确表示:关于这一方法,我将尽力达到数学中所能要求的全部严格。
尽管在这本教材的标题中有“代数”字样,但柯西反对当时所依靠的大多数代数。他的意思是说,他的同事总是假设,对实数成立的对复数也成立,对收敛级数成立的对发散级数也一定成立,对有限量成立对无穷小量也同样成立,等等。他是那样小心翼翼地定义和建立起微积分的基本概念:函数、极限、连续、导数和积分。他还把无穷级数分为有和的收敛级数与没有和的发散级数。当然,后来这一定义失效了。 1826 年10 月,阿贝尔给他以前的老师霍姆伯的信中称柯西“是现在唯一一个知道怎样对待数学的人”。阿贝尔还补充说,柯西有点傻,也有点固执,但老天爷心里自有一杆秤。①
虽然柯西竭力使分析严格化,并在1829 年他的《教程》再版中声称他已经实现了最完全的严格,但是他处理的概念还是难以捉摸,他犯了许多错误。他关于函数,极限,连续和导数的定义基本上正确,但所用的语言模糊,不确切,与他的同事们一样。他认为连续即隐含着可微(见第七章),因而他建立的许多定理在假设中只要求连续,而在应用中却是可微的。即使他注意到犯了错误,也不改初衷。柯西在十分仔细地定义了定积分之后,接着就证明了每一个连续函数都是可积的。但是,他的证明是错误的,因为他没有考虑一致连续的要求。尽管仔细区分了收敛极数与发散级数,但他关于收敛级数的一些断言和证明是错误的。例如,他断言连续函数的无穷级数的和是连续的(没有一致收敛的话,这是错误的)。他把无穷级数逐项积分,认为积分级数就是原级数所表示函数的积分。这里,他又同样忽视了一致收敛的要求。他给出了被称作柯西条件的收敛序列的判定准则,但他不能证明这一条件的充分性,因为这需要他和他的同行们都不具备的实数系统的知识。柯西相信,如果一个双变量函数在它的两个变量分别趋近某一点时,它在这一点有一个极限,那么当这两个变量同时变化并趋近这一点时,它也一定有一个极限。
起初,分析严密化的工作曾引起了轩然大波,在巴黎科学院的一次科学会议上,柯西公开了关于级数收敛性的理论。会后,拉普拉斯匆匆返回家里避不见人,检查他在《天体力学》所用的级数。幸而,他发现每个级数都是收敛的。
有点荒谬的是,柯西并不愿被束缚于他自寻的严密化。尽管他写了三本旨在建立严密化的教科书(1821 年,1823 年,1829 年),但在他不断写出的研究论文中,他都忽视了这一点。他定义了连续性,但从未对他所使用函数的连续性加以证明。虽然他十分强调级数和广义积分收敛性的重要性,但在他与级数,傅立叶变换和广义积分打交道时,却从未考虑过收敛的问题。他把导数定义为一个极限,但他也给出了一个像拉格朗日给出的那样纯粹形式的方法(见第六章)。他承认了如1-1+1-1+......这样的半收敛级数(振荡级数),并认为条件收敛级数(既有正项也有负项的级数)可以重排。他还犯了一些其他错误,他对什么是真理心明如镜,却从未用自己教科书里所确立的标准来建立真理。
柯西的工作激励了他人更多促使分析严密化的工作,但是主要的成就还得归功于另一位大师魏尔斯特拉斯( KarlWeierstrass)。正是由于他的工作,分析的基本原理的严密化才得以完成。1858~1859 年,他在柏林大学任教时,开始讲述关于基础的工作,而最早的记录是1861 年春由许瓦尔兹(H.A. Schwarz)所做的笔记。魏尔斯特拉斯的努力终于使分析从人们久已置疑的完全依靠运动学、直觉理解和几何概念中解放出来。魏尔斯特拉斯在1861 年就清楚,连续并不隐含着可微。1872 年他向柏林科学院提出了一个处处连续却无处可导的函数的例子(在1875 年由杜布尔-雷豪(Pauldu Bois Reymond)为他出版),这不啻是一声炸雷,动摇了人们头脑中根深蒂固的观点。早在1830 年,波尔察诺就以几何形式给出了一个例子,但没有发表,塞莱里埃(CharlesCellérier)也在1830 年左右给出了一个例子,但直到1890 年才公布。
① 我们没有必要追究柯西提出的定义和定理的技术细节,我们的目的是要说明柯西所做的严格化的工作极为出色。——原注
魏尔斯特拉斯的例子没有早出现是微积分发展史上的幸事,正如皮卡(Emile Picard)在 1905 年所说的那样:“如果牛顿和莱布尼茨知道了连续函数不一定可导,微分学将无以产生。”的确,严谨的思想也可阻碍创造。
柯西,甚至魏尔斯特拉斯,在分析严密化工作之初,都把实数和复数系统看作是无懈可击的。是哈密尔顿,四元数的发明者,在1837 年为实数和复数系统提供逻辑基础迈出了第一步。哈密尔顿知道复数可以用来表示平面向量,所以他寻求能表示空间向量的三元数(见第四章)。他将复数的性质进行推广,其结果刊于论文《代数偶:关于时间的引论》之中。然而,其中他假设实数具有熟悉的性质。为了替代复数中的a+b -1,哈密尔顿引入了有序实数偶(a,b),并且他定义了数偶间的运算,以便和它们以a+b -1形式运算时取得同样的结果。值得注意的是,哈密尔顿由此产生了寻找一套新复数理论的念头,因为同他的前辈们一样,他对-1甚至负数都感到不安。而后,在他的论文里,他写道:
呈现在这里的数偶理论是为了使(复数)的隐含意义充分体现。并且,由这一显著的例子说明,一些平常看上去只是简单符号,并无法理解的表达式,可以寓以实义。
在文章中,他进一步表示:
在单数理论中、符号-1是无意义的(着重号为哈密尔顿所加),其只表示一种不可能的开方运算或纯粹一个虚数。而在数偶理论中,同样的符号-1是有意义的,其表示一种可能的开方运算或实数偶,称作(像我们已经看到的那样)数偶(-1,0)的基本平方根。在这后一理论中, -1可以被合理地使用,但在前一理论中则不行。我们可以把任一数偶(a1,a2)写作:
(a , a ) = a a 1 2 1 2 + -1......在同样的表达式中,把-1解释为第二单元,或者就是纯粹的第二数偶(0,1)。
这样,哈密尔顿清除了在复数系统中他所谓的“玄奥之障”。
哈密尔顿在他的数偶理论中,预先假定了实数的性质。在1837 年他的论文中,他尝试给实数系统一个逻辑的结构。由时间的概念,他推出了正整数的性质,又扩展到有理数和无理数,但过于牵强。特别是关于无理数的处理,既模糊且错误百出,为数学家们所不齿。哈密尔顿对实数和复数的基础只是略加研究,他的重心在四元数。因此,像他那个时代的大多数人一样,他毫不犹豫地利用实数和复数的性质。
魏尔斯特拉斯第一个认识到如果不能更好地理解实数系统,也就不能使分析严密化。他第一个在我们熟识的有理数性质基础之上,给出了无理数的严格定义的性质。他在19 世纪40 年代就从事这项工作,但他没有及时发表,直到60 年代他在柏林大学通过授课才公之于众。
其他的几个人,著名的有戴德金和康托尔,顺理成章地在有理数性质之上,正确地定义了无理数并建立了它们的性质。他们的工作成果在70年代得以发表。戴德金像魏尔斯特拉斯一样,在讲授微积分时才认识到清晰的无理数理论的迫切性。在《连续性与无理数》(1872 年)一文中,他这样写到,从1858 年至今,他“比以往更迫切地感到,算术中缺乏严格的基础”。在他关于分析理论的工作中,康托尔也认识到了无理数理论的迫切性(见第九章)。这样,借助魏尔斯特拉斯的工作,戴德金和康托尔终于证明出2 3 = 6。
无理数的逻辑还不完善。戴德金认识到这一点,并且,在《数的性质和意义》(1888 年)一文中,他描述了可以作为有理数的公理方法的基本性质。皮亚诺(GiuseppePeano)借鉴了戴德金的观点和格拉斯曼《算术教程》(1861 年)中的一些观点。他在《算术原理》(1889 年)中,从关于正整数的公理,成功地导出了有理数的结果。这样,实数和复数系统的逻辑结构已唾手可得。
作为一个副产品,数系基础的建立也解决了熟悉的代数学中的基础问题。为什么用字母代替实数或复数时,其可以像正整数一样进行运算,而结果丝毫不差呢?答案在于其他类型的数和正整数一样,具有同种形式上的性质。不严格地说,就是2×3 = 3×2成立,同样有2? 3 = 3? 2成立。所以当ab 被ba 代替时,不管a、b 代替的是正整数还是无理数,结果总是正确的。
数学史上这一系列事件的发生顺序是耐人寻味的,并不是按着先整数、分数,然后无理数、复数、代数学和微积分的顺序,数学家们是按着相反的顺序与它们打交道的。他们看上去是极不情愿地去处理那些本可以留在最后,并能很好地理解的数,他们非到万不得已才去进行逻辑化的工作。不管怎么说,大约1890 年左右,在埃及人和巴比伦人能使用整数、分数和无理数的六千年后,数学家们终于可以证明2+2=4。看来,即使是最伟大的数学家也被迫考虑严密性。
在19 世纪下半叶,另一个瞩目的问题被解决了。从高斯确信他的非欧几何是相容的时候(这也许因为他认为非欧几何是物理世界的几何),到大约1870 年,高斯在这方面的研究工作和黎曼的无薪教师就职报告得以发表近六十年间,大多数数学家并没有认真地考虑过非欧几何(见第四章),因为其内容过于偏激。数学家们宁肯相信,或者说是希望某一天能在非欧几何中发现矛盾,这样它们也就成了一纸空文。
幸运的是,所有的基本非欧几何的相容性问题都被解决了。方法经受住了检验,特别是后来创建的理论。由黎曼在1854 年的论文(见第四章)所提出的非欧几何之一——双椭圆几何,与欧氏几何有根本的不同。没有平行线,任何两条直线相交于两点;三角形内角之和大于180°,许多定理也同欧氏几何中相应定理截然不同。贝尔特拉米在1868 年指出,如果将双椭圆几何的直线看作球上的大圆,平面上的这一几何同样适用于球面。
这一解释似乎讲不通。所有非欧几何的发明者们认为他们所定义的直线同欧氏几何中定义的直线毫无二致。但是,我们可以回忆一下欧几里得关于直线及其他一些概念的定义是多余的(见第五章)。在任何一个数学分支中,总有未定义的概念,像亚里士多德强调的那样,只要这些直线满足公理即可。但球面上的大圆的确满足双椭圆几何的公理。当双椭圆几何的公理适用于球面上的大圆时,其定理也同样适用,因为定理总是逻辑的结果。
若认可了将直线作为大圆,那双椭圆几何的相容性可以如下建立:如果双椭圆几何中有矛盾的定理的话,那么在球面几何中也会出现矛盾的定理。而球面是欧氏几何的一部分,因此,如果欧氏几何是相容的,那么双椭圆几何也必然是相容的。
双曲几何的相容性就没有这么简单了(见第四章)。但是,既然双椭圆几何的相容性可以用球表面作为一个模型来建立,那双曲几何也可以由某个与欧氏几何相关的构型来建立。我们在这里不追究细节,但是,我们应注意到这一事实,即双曲几何的相容性也意味着欧氏几何中平行公理是独立于其他公理的。否则,即它可以由其他公理推出,那它只能成为双曲几何的定理。因为,除了平行公理,双曲几何的其他公理,同欧氏几何中相应的公理是一模一样的。但是欧氏几何的这一“定理”将与双曲几何的平行公理矛盾,从而双曲几何是不相容的。因此,数年来由欧氏几何其他公理推导出平行公理的努力,注定是劳而无功。
有这样一个奇异的现象,即被看作是几何的非欧几何,它们的直线不具有通常的意义,可以适用于与人的想象截然不同的圆形,这一事实将导致举足轻重的结果。如同我们说过的那样,完全不同的解释是可能的,因为任何公理的发展中未定义的概念是必然存在的。这些解释被称作模型。这样,我们目睹了由于某种物理意义而发明的数学分支可以适用于截然不同的物理或数学的情形。
非欧几何的相容性建立在欧氏几何相容性的基础之上,对19 世纪七、八十年代的数学家而言,欧氏几何的相容性是不容置疑的。除了高斯,罗里切夫斯基、鲍耶和黎曼,欧氏几何还被看作现实世界的必然几何,没有人相信其中会有矛盾,但是,其相容性并没有逻辑的证明。
对大多数轻蔑非欧几何的数学家来说,接受相容性证明有另外的原因。这些证明赋与非欧几何以意义,但只是将其作为欧氏几何意义上的模型。因此,人们是从这个意义上,而不是把它作为可应用于现实世界,其中直线具有通常意义的几何来接受的。当然,这与高斯,罗巴切夫斯基和黎曼的观点不同。
现在严密化工作只剩一个主要问题了。欧氏几何被发现是有缺陷的,但是与分析不同,几何的本质和概念是清晰的。因此,确定非定义的概念,将定义精确化,补充遗漏的公理,完成证明,相对而言较为轻松。这项工作分别由帕斯(Moritz Pasch),韦隆内(Giuseppe Veronese),和皮埃里(Mario Pieri)完成。希尔伯特借助于帕斯的研究成果,给出了目前最常使用的形式。几乎在同一时刻,由兰伯特、高斯、罗巴切夫斯基和鲍耶发明的非欧几何,以及19 世纪所发明的其他几何,特别是投影几何的基础,都给出了。
到1900 年为止,算术、代数和(建立在整数公理基础上的)分析及(以点、线和其他几何概念为基础的)几何已经被严密化。许多数学家赞成进一步通过解析几何把所有几何建立在整数的基础之上,但几何尚有疑点。
关于非欧几何的一个教训是,曾被视为严密之典范的欧氏几何实际上是有缺陷的,这一令人痛苦的记忆仍然萦绕在数学家们的心头。1900 年以前,把全部几何归结为数这一工作并未真正开展起来。尽管如此,当时大多数的数学家总是说数学的算术化,虽然精确地来讲应是分析的算术化。这样,1900 年在巴黎举行的第二届国际数学家大会上,彭加勒断言:“今天分析领域中只剩下了整数,及整数的有穷和无穷系统,它们由相等或不相等的关系网连结着。”帕斯卡说过“所有超越了几何的都超越了我们的理解力”,1900 年时,数学家们更愿意说:“所有超越了算术的都超出了我们的理解力”。
最初目标有限的运动,在得到日益增多的拥护者的同时,遇见的问题常常会超出最初的计划,甚至会被这些问题淹没。关于数学基础的批评运动也纠缠于逻辑,即在由一个数学步骤推出另一个中的推理原理。逻辑科学是由亚里士多德在他的《工具篇》中奠定的。他明确指出,他注意到了数学家们所使用的推理原理,把它们抽象出来,而且发现它们是适用于所有推理的理论。他的基本原理之一就是排中律,即所有有意义的断言非真即假。这可能是他从数学命题,如所有正整数非偶即奇中抽象出来的。亚里士多德的逻辑主要由三段论构成。
两千多年来,被数学家们占据了一席之地的知识界一直接受亚里士多德的逻辑。不错,对一切信仰及教条提出质疑的笛卡尔确实提出过我们总能知道逻辑原理是否正确这一问题。他的回答是,上帝不会欺骗我们。这样,他就为我们拥有这些原理的正确性找到了一个合理的辩护。
笛卡尔和莱布尼茨想把逻辑定律拓广为一个统一的推理的科学、一个统一的推理的演算方法,适用于所有的思维领域。同时,他们还有这样的想法,即像代数那样用符号来严密和便利推理定律的使用。笛卡尔是这样提及数学方法的:“比较起前人所馈赠给我们的知识工具来说,它作为所有其他方法的源泉是最有力的。”
莱布尼茨的普遍逻辑构想比笛卡尔的更为明确,它需三个基本元素。首先是普遍性——一种统一的科学的语言,其可以部分或大部分符号化,适用于由推理得出的所有真理。第二个元素是一个包揽无遗的推理逻辑形式的完备集合——推理演算——它允许由最初的原理进行任何可能的演算。第三个——技巧组合——所有基本概念的集合。在此形式之上可定义其他所有概念,它是一个思维的程序,对下面每一简单概念赋以一个符号,通过对这些符号的组合和运算允许更为复杂的概念的表达式和处理。
基本原理,比方说将是同一律,即A 就是A,而不是非A,从这些原理,所有的理性真理,包括数学中的理性真理,都可推出。而且,还有事实真理的存在必须以他所谓的充分推理原理为条件,不可能有别的情况。莱布尼茨是符号逻辑的创始人,但他在这一领域的工作直到1901 年才被认识到。
不管是笛卡尔,还是莱布尼茨,都没有发展推理的符号演算,他们只写下了一些零散的片断。这样,直到19 世纪,亚里士多德的逻辑依旧盛行。在1797 年的《纯粹理性批判》第二版中,康德称逻辑为“一个封闭的完整的学说体系”。虽然到1900 年,大多数的数学家们仍继续用符合非正规的口头表述的亚里士多德的原理来进行推理,但他们也开始用一些其他并未被亚里士多德接受的原理。他们并未严格检验自己的逻辑原理,而是自认为他们使用的是合理的推理逻辑,实际上,他们使用的原理直觉上是合理的,但并不是准确的逻辑原理。
当大多数的科学家全神贯注于数学的严格化时,有一部分人开始探讨当时所使用的逻辑。下一个大的发展当归功于布尔(GeorgeBoole),一位爱尔兰科克王后学院的数学教授。
布尔的工作无疑是受到皮科克、格雷戈里和笛?摩根(见第七章)代数观点的启发。虽然他们的型的永恒性原理并不能真的证明代表实数、复数的文字系数的算术运算的正确性,但他们可能是无意识地采纳了这样一个新的代数观点,即符号和运算可用来表示任何事物,并且哈密尔顿在四元数上的工作(1843 年)也的确表明,其他的代数也是可能的。布尔1848年在一篇文章中综述了他称之为算子演算的代数推理。注意到这样一种观点,即代数不只是处理数,且代数的定律也不一定是实数和复数的定律。在他的《逻辑的数学分析》(1847 年)的开篇他讲到这一点,并提出了一门逻辑代数。他的主要著作是《思想规律的研究》(1854 年)。布尔的主要观点没有莱布尼茨的野心勃勃,但更贴近于莱布尼茨的推理演算,即现存的推理规则可以由符号形式来表达,这样可以严密化并促进现存逻辑的应用。在他的书中,他这样叙述道:
下列论文的目的是为了研究思维运算的基本规则,推理正是依据这些规则而完成的。给出演算的符号语言表示式,并在此基础上建立逻辑科学和构造它的方法。
布尔也考虑了在思维中的特殊应用,例如,概率律。符号化使科学家们受益无穷。在证明过程中,人们可能由于无意识地引入了并非自己所指的意义或使用了不正确的演绎原理而出现错误。即如,把光线作为光学现象讨论时,说到“看见光”或一物体的“光重”是令人迷惑的。但是,如果用l 来表示物理光线,则所有关于l 的进一步符号分析,都将指的是光学现象。而且,所有的证明就是符号集合用符号转换规则而不是用逻辑定理非正式形式转化成另一集合。这些规则用严密且易于应用的形式表示了正确原理。
为了正确评价布尔的逻辑代数,让我们先了解一些他的观点。假设用x、y 表示事物的集合,例如,表示狗的集合和红色动物的集合。那么xy表示既属于x 又属于y 的事物的集合。在狗和红色动物这种情况下,它表示红色的狗的集合。对任何x、y 而言,有xy=yx。若z 代表白色物体,且x=y 的话,则有zx=zy。从xy 的意义还可推出xx=x。
符号化的x+y 表示在x 中或在y 中或既在x 中又在y 中的事物的集合(这在后来被杰文斯(WilliamStamleyJevons)做了修改)。这样若x 代表男人的集合,y 代表选民的集合,那x+y 则是男人和选民的集合(这一集合也包括了女性选民)。因此可以证明,若z 表示年龄超过35 岁的人的集合,则有z(x+y)=zx+zy若x 是一集合,则1-x 或-x 是所有不在x 中事物的集合。这样,若1表示所有事物的集合,而x 表示狗,1-x 或-x 则表示非狗的事物,这样-(-x)表示狗的集合。等式x+(1-x)=1 说明每一事物要么是狗,要么不是狗。这就是集合的排中律。布尔示范了如何在不同的领域运用这种纯代数操作来进行推理。
布尔也引入了所谓的命题逻辑,虽然这一逻辑的使用应当追溯到斯多伊克斯(Stoics)。在这种解释过程中,p 总是代表,如,“约翰是一个男人”且假定p 是指“约翰是一个男人”为真。则1-p(或者-p)表示“约翰是一个男人”为假。同样,-(-p)表示约翰不是男人不为真,即,约翰是一个男人。命题的排中律,即任何命题非真即假,布尔将之表达为p+(-p)=1,其中的1 表示真。乘积pq 表示命题p、q 均真。同理p+q 表示或者p 为真或者q 为真或者p、q 都真。
笛?摩根掀起了另一场变革。在他的主要著作《形式逻辑》(1847 年)中,笛?摩根引入了这样的观点,逻辑必须处理普遍意义上的关系。亚里士多德的逻辑处理的是动词“是”的关系。一个典型的例子是“所有的人都是要死的。”如笛?摩根所说,亚里士多德的逻辑不能证明由“一匹马是一个动物”到“一匹马的头是一个动物的头”的推理,这需要增加一个前提即所有的动物都有头。亚里士多德确实提及了逻辑的关系,尽管是含混不清且不广泛。而且,亚里士多德的许多著作以及中世纪学者们的补充在17 世纪时已失散了。
显而易见,需要有关系的逻辑,这样,基于关系“是”的论断,如:
A 是一个p;
B 是一个p;
因此,A 和B 都是p。
这显见是错误的,如以下的论断:
约翰是一个哥哥;
彼特是一个哥哥;
因此,约翰和彼特都是哥哥(相互间),显然这是错误的,类似地:
苹果是酸的;
酸是一种味道;
因此,苹果是一种味道。
也是一个不正确的结论。没有发展关系逻辑是亚里士多德逻辑的主要缺陷,这一缺陷莱布尼茨也注意到了。
关系通常不能翻译成主词+谓词,其中谓词仅仅表明主词包含于由谓词所说明的集合中。因此,必须考虑表示关系的命题,例如:2 比3 小或点O在点p 和点R 之间。也必须考虑它们的否、逆、联合等其他联系的命题。关系逻辑由皮尔斯(Charles SandersPeirce)在他从1870 到1893年的几篇论文中得以发展,并被施罗德(Ernst Schr?der)系统化。皮尔斯引入了特殊的符号概指表示关系的命题。这样,lij 就表示“i 爱j”,实际上,他的关系代数是很复杂的,并不实用。以后我们将看到在现代符号逻辑中如何处理关系。
逻辑科学的另一扩展(布尔曾涉猎过),由皮尔斯有效地引进。他强调了命题函数这一概念。就像数学处理的函数,如y=2x,而不是关于常数的命题,如 10=2×5。“约翰是一个男人”是一个命题,而“x 是一个男人”则是一个命题函数,其中x 是一个变量。命题函数可以包括两个或更多个变量,如在“x 爱y”中。由于皮尔斯的功绩,推理得以延伸到命题函数中。
皮尔斯还引入了所谓的“量词”。普通语言相对于量词来说,是很模糊的,如以下两句:
一个美国人领导了独立战争。
一个美国人信仰民主。
用“一个美国人”这一词语表示两种不同的意思。第一句指的是一个特殊的美国人:乔治?华盛顿;而第二句指的是每一个美国人。通常这一含混可以由短语使用的上下文来判别,但这种含混不清对于严密的逻辑思维来说却是不可接受的。论断本身必须是明确的,解决的办法就是使用量词。我们可能希望能断言一个命题函数对某个集合中的所有元素都为真,例如:每一个美国人。如果对所有的x,x 是一个男人,那么就能断言美国的所有人都是男人,“对所有的x”即是一个量词。另一方面我们希望说至少有一个x,使得x 是在美国的男人。在这种情况下,“至少存在一个x使得”是量词。这两种量词分别由符号"x、$x 来表示。逻辑在关系、命题函数、量词上的扩充包含了在数学上使用的推理种类,使得逻辑更加丰富。
弗雷格(GottlobFrege)是耶拿(德国一城市)的一位数学教授,在数学化逻辑的方向上,他迈出了19 世纪的最关键一步。弗雷格写了几本重要著作,《概念演算》(1879 年)、《算术基础》(1884 年)和《算术的基本法则》(第一卷:1893 年;第二卷:1903 年)。他继承了命题逻辑、涉及关系的命题、命题函数和量词等观念,他自己也做出了一些贡献。他引入了一个命题的叙述和判定它是真的这二者之间的区别。用符号├放在命题的前面表示肯定。他区分了元素x 和仅含x 的集合{x},还区分了元素属于集合和集合蕴涵于另一集合。
弗雷格还将一个更广泛的蕴涵概念,称为实质蕴含形式化,它的字面形式上的表达将追溯到墨伽拉的菲罗(PhiloofMegara)。逻辑处理关于命题和命题函数的推理,这一过程中蕴涵是最重要的。如,我们知道约翰是一个聪明的人,而聪明的人长寿,那么可以推导出这样的蕴涵:约翰将长寿。实质蕴涵与通常使用的蕴涵有所不同。当我们假定,如,“如果下雨,我将去看电影”,两个命题间不仅有一定的关系,而且是蕴涵关系。即若前提“天下雨”成立,则结论“我去看电影”必然成立。而实质蕴涵的概念允许p 和q,即前提和结论,可以为任何命题。命题之间不必存在因果关系或其他任何联系。可以这样说“如果x 是一个偶数,我就去看电影。”而且,实质蕴涵允许甚至当x 是一个偶数为假时,结果也成立。即“若x不是偶数时,我将去看电影。”更进一步,它允许蕴涵“若x 不是偶数时,我将不去看电影”。这个蕴涵仅当x 为偶数而我没有去看电影时为假。从形式上来说,若p 和q 均是命题,若p 为真,蕴涵“p 蕴涵q”当然意味着q 为真。但是,实质蕴涵允许,其至p 为假时,无论q 真假与否,蕴涵“p 蕴涵q”都是真的。只有当p 为真而q 为假时,这一蕴涵为假。这一蕴涵观点是通常意义的延伸。不过这一延伸并不造成任何危害,因为我们只有当知道p 为真时,才用“p 蕴涵q”,而且,实质蕴含同日常用法有某些相通之处。考虑这一论断:“若哈罗德今天发工资,他将购买食品”。这里,p 是哈罗德今天发工资,q 是他购买食品。现在他可能仍在购买食品,即使他今天没发工资。因此,我们把p 为假q 为真的情况纳入合理蕴涵,当然,这一结论不为假。相似地有,“若哈罗德今天没发工资,他将不购买食品”也不是假命题。作为另一个,最后一种情况的更好例子,莫若“若木头是金属,则木头是可锻造的。”我们知道两个命题都是假的,而蕴涵是真的。因此,我们把p 为假而q 为假的这种情况也包含在作为p 蕴涵q的正确情况。概念的重要应用是能从p 的真实性以及p 蕴涵q 的蕴涵中判断q,当p 为假时的扩展在符号逻辑中是方便的,且最有效的。但是,由于无论q 为真或假、p 为假都蕴涵q,实质蕴涵也就允许一个错误的命题蕴涵任何命题。对于这一“缺陷”,有人会反驳说,在一个正确的逻辑系统和数学中,假命题是不应当出现的。不管怎么说,对实质蕴涵的概念一直存在反对意见。例如,彭加勒用这样的事例嘲笑它,说有些学生在考试中用错误命题得出了正确命题。但是,尽管在这一概念上还需做更大的努力,实质蕴涵现在成了一种规则,至少在符号逻辑中是作为数学基础使用的。
弗雷格做出的另一更大贡献,在以后被证实是举足轻重的。逻辑包括许多推理原理,好像欧氏几何关于三角形、矩形、圆和其他图形的论断一样。由于19 世纪末其他数学分支的重新组织,几何中的许多论断可以由极少的基本论断——公理导出。弗雷格为逻辑精细地做了这一工作。他的符号和公理是复杂的,我们仅仅从字面上指出逻辑的公理发展的方法(见第十章)。作为一个公理来采用论断“p 蕴涵p 或q”无疑是稳妥的,因为p或q 的意义是,p 或者q 中至少一个是真的。若我们一开始便假定p 为真,则p 和q 中的一个肯定为真。
我们也可以把下述作为公理:若由A 表示的某命题(或命题组合)为真且A 蕴涵B,B 为另一命题(或命题组合),则我们可以单独地判断B。这一公理,称为推理规则,使我们能推导或判定新的命题。由上面的公理我们可推导出,例如:
p 为真或者p 为假这一推导组成了排中律。
还可以推导出矛盾律,其字面形式是p 和非p 不能同时为真,两种可能只能有一种成立。矛盾律应用于数学中所谓的间接证明中。若我们假定p 为真,又推导出它为假,我们得到了p 和非p,但两者不能同时成立,因此p 一定为假。这种间接方法经常采用另一种形式,我们假设p 为真,且它蕴涵q,但q 已知为假,因此,由逻辑定律,p 一定为假。许多其他常用的逻辑定律都可由公理演绎而来。这种逻辑的演绎结构始于弗雷格的《概念演算》,在他的《基本法则》中得以发展。
弗雷格还有一个更宏大的目标,在以后的章节中我们将细述(见第十章)。这里简单提一句,他在他的逻辑工作中试图为数和代数分析构造出一个新的基础,这一基础比19 世纪最后几十年中的批评运动还要严格得多。
另一个用符号逻辑来改进数学的严密性的关键人物是皮亚诺。像戴德金一样,他在数学中发现现存的严格性不完善,因而献身于改进逻辑基础。他不仅将符号逻辑用于逻辑原理,而且用于数学公理的表示式,并且用符号逻辑原理操作符号公理进行定理的推导。他明确而坚定地认为,我们应当放弃直觉,而这只有用操作符号运算才能做到,符号避免了普通词语间直觉联系带来的危险。
皮亚诺将量词、连词例如“和”、“或”、“非”引入了自己的符号系统。他的符号逻辑只具雏形,但影响甚大。他所编辑的杂志《数学评论》(创建于1891 年,于1906 年出刊)和所著的五卷《数学公式》(1894—1908年)是他主要的贡献。在《公式》中他给出了以前所提及的整数的公理。皮亚诺创建了逻辑学家的学派,而皮尔斯和弗雷格的工作在罗素1901 年发现弗雷格的贡献之前一直鲜为人知。罗素于1900 年获晓了皮亚诺的工作,比起弗雷格的,他更欣赏皮亚诺的工作。
从布尔、施罗德到皮尔斯、弗雷格,逻辑中的变革组成了数学方法的应用:符号系统和从逻辑公理中得到逻辑原理的推导证明。所有的这些关于形式逻辑或符号逻辑中的工作吸引了逻辑学家和数学家,因为符号的使用避免了心理上、认识上、形而上学的意义和暗示。
包括命题函数关系,如“x 爱y”或“A 在B、C 之间”,以及量词的逻辑的系统现在一般称为一阶谓词演算或一阶逻辑。虽然对某些逻辑学家而言,它并不能覆盖数学中所有用到的推理,例如数学归纳法,它是现代数学家颇为青睐的系统。鉴于以后我们将涉及数学的逻辑结构,在这里让我们强调一点,数学和逻辑的严格化是首先由欧几里得通过公理途径达到的。这一方法的一些特色在19 世纪的公理化运动中愈来愈清晰,让我们回顾一下它们。
首先是定义概念的必要性。因为数学独立于其他学科,所以定义也必须用其他的数学概念来说明。如此,这一过程将导致定义的无限循环。解决这一问题的方法是基本概念必须是不加定义的。那么怎么用它们呢?又怎么知道对于他们可以断言哪些事实呢?答案在于公理确定了未定义(已定义)概念,告诉我们什么可以判定。这样,如果点和线未定义,则两点确定一条直线的公理和三点确定一个平面的公理,可以用来推导关于点、线、面更进一步的结论。尽管亚里士多德在他的《工具论》、帕斯卡在他的《几何精神论》中,以及莱布尼茨在《单子论》中都强调了未定义概念的必要性,但数学家们还是忽视了这一事实,结果给出了许多毫无意义的定义。格高尼(Goseph-DiazGergonne)早在19 世纪初即指出公理将告诉我们对未定义的概念可以做出什么样的结论;它们给出了所谓的隐含定义。直到1882 年帕斯再一次强调未定义概念的必要性,数学家们才开始严肃地考虑这一问题。
① 为了囊括数学中所有用到的推理,一些逻辑学家们提出了所谓的二阶逻辑,这要求将量词用于谓词。这样,若表示x=y,我们希望断言所有适用于x 的谓词都适于y,通过包含“对所有宾语而言”这样的语句或用符号x=y((F)(F(x)(F(y))来量化谓词。——原注
任何演绎系统一定包括未定义概念,其能翻译成满足公理的含义,这一事实给数学家们引入了一个新层次的抽象。这一点早被格拉斯曼在他的《线性扩张论》(1844 年)中提出。他指出几何当不同于物理空间的研究,几何是一个纯数学结构,可以运用于物理空间,但不拘于这一解释。后来,公理的研究者们:帕斯、皮亚诺和希尔伯特,强调了这种抽象性。虽然帕斯明白存在未定义概念且只有公理限制它们的意义,但他只在头脑中构造几何。皮亚诺洞悉帕斯的研究,在他1889 年的文章中更清楚地认识到许多其他的解释也是可能的。希尔伯特在《几何基础》(1899 年)中指出,虽然用的概念是点、线、面等,但如果它们遵从所涉及的公理的话,可以是啤酒杯、椅子或任何物体。演绎系统多种解释的可能性实际上是非常有益的,因为它允许更多的应用,但我们将发现(见第十二章)它也引起一些令人困扰的结果。
帕斯通晓现代公理体系,他提出的观点的意义在19 世纪末显然并未被接受,即必须建立公理集合的相容性,也就是说,它们不会导致矛盾的定理。非欧几何中相容性问题曾出现,但已被满意地解决了。但是,非欧几何仍令人感到奇怪。对一些基本的分支,像整数理论或欧氏几何,任何关于相容性的疑问看上去是不切实际的。不管怎么说,帕斯认为这些公理系统的相容性应该建立起来,弗雷格附和他这一观点,他曾在《算术基础》(1884 年)中写道:
把一个单纯的假设当作自己的结果来着手处理问题是很普遍的,我们假设在任何情况下,执行减法、除法、开方的运算都是可能的,而且认为我们已经做了足够多的这种运算。但是为什么我们不假定任何三点可以画出一条直线?为什么我们不假设所有的加法、乘法定律在三维复数系统中会像在实数中一样成立?因为这些假设包含着矛盾。如这样我们首先要做的是证明我们的其他假设不包含任何矛盾,直到我们做了这一切,像我们希望的,严格才不会是空想。
皮亚诺和他的学派也在19 世纪90 年代开始比较严肃地对待相容性问题。皮亚诺相信建立相容性将很容易。
数学的相容性很可能在希腊时代就被怀疑,为什么到19 世纪末它才得以显露?我们已经注意到,非欧几何的创立迫使人们意识到,数学是人为的,只是对现实世界的近似描述,这种描述是相当成功的,但从反映宇宙的固有结构而言,它并不是真理,因而不必是相容的。实际上,19 世纪末的公理化运动使数学家们认识到数学和现实世界间有一条壕沟,每个公理体系都包含未定义概念,其属性在这些公理意义上是明确的。但这些概念的意义并不固定,虽然我们头脑中直觉地具有数、点及线的概念。值得肯定的是,公理是用来确定属性,从而使这些概念确实具有我们本能地与之联系在一起的属性。但是我们确实做到了这一点吗?我们能确保没引入一些想要的属性或蕴涵,而导致了矛盾吗?
公理化方法的另一个特点也是由帕斯指出的。数学任一分支的公理最好是独立的,即这一分支中的任一公理不应当由其他公理推出来。如果这样的话,被推导出的公理只能是一个定理。确定一个公理的独立性的方法是给出其他公理的一个解释或模式,其中这些公理都满足,而欲加讨论的那个不满足(这一解释不必与欲加讨论的公理的否定相容)。例如,欲由欧氏几何的其他公理建立平行公理的独立性时,可以用双曲非欧几何来解释,在这种几何中除平行公理外,所有欧氏几何的其他公理都满足,一个既能满足所论公理又能满足与其相矛盾的公理的解释是不相容的。因此当用一个解释或模式来证明一个公理的独立性时,首先必须知道这一模式是否相容。这样,像我们以前提到的,欧氏几何平行公理的独立性是由在欧氏几何中建立一双曲非欧几何模式而确立的。
虽然我们后面的大多数时间是关注着数学公理化引起的疑问,不涉及重大的问题,但在20 世纪初公理化方法被认为是完美的。没有人比希尔伯特对它更为推崇了,他是那时世界上顶尖的数学家。在他的文章中关于“公理化思维”(1918 年出版),他宣称:
任何可以成为数学思维对象的东西,其理论的建立一旦成熟,它就会成为公理化的方法,并由此直接进入数学。通过探寻公理的每一更深的层次......我们可以洞悉科学思想的精髓,获得我们知识的统一,特别是借助公理化方法,数学应该在所有认识中起到主导作用。
在1922 年他又断言:
公理化方法,确实是,而且始终是不论在哪个领域中探求事实精髓的合适的、不可缺少的工具。其逻辑性是无懈可击的,同时也是成熟的,因此也保证了分析的完全自由。进行公理化意味着除了有关问题外,不需考虑其他知识。起先没有公理化方法时,人只是幼稚地思考,把一些特定的关系当作教条,公理化方法清除了这种幼稚性。
人们一般认为数学家们都会赞成在一个坚实,严格的基础上建立自己的科学,但是数学家们也是人,一些基本概念如无理数、连续性、积分、导数的精确定义未被所有的数学家们乐于接受。许多人并不理解新的技术语言,而把这些精确的定义看作是无稽之谈。他们认为对数学的理解,甚至对严格的证明都是没有必要的。这些人觉得直觉已经够好的了,尽管对于没有导数的连续函数和其他逻辑上正确但非直觉的创造倍感惊讶。皮卡在1904 年这样提及偏微分方程中的严格:“真正的严格是富有成效的,与那种纯形式和繁杂的严密截然不同,那种严密工作给它所触及的问题投上了阴影。”埃尔密特在1893 年5 月20 日给斯蒂杰斯的一封信中写道:“我简直惊恐万状,不愿意面对这一不幸的现实,没有导数的连续函数!”彭加勒在他的数学哲学(将在以后的章节中研究)中也抱怨道:“在以前,新的函数引进时,目的是为了应用它们。今天却恰恰相反,构造函数是为了证明前人的错误,而本身毫无半点用处。”
有许多人坚持说他们的定义和证明正是严格化所产生的结果,即使如鲍莱尔这样的大师也如此捍卫自己,其他的人则反对这种吹毛求疵。哈代1934 年在一篇文章中称严密化是例行公事。还有一些人仍旧不理解严密化,因而防御性地贬损它,有一些人称之为数学中的混乱,对于新的观点,即在当时的情况下有助于数学的严密化的观点,数学家和其他的人同样不乐于接受。
严密化工作揭示了数学创造的另一面。严密化满足了19 世纪的需要,而最后的结果也告诉了我们关于数学发展的一些事实。新建立的严密结构也许保证了数学的正确性,但这一保证几乎毫无必要。算术、代数、欧氏几何中没有一个定理因此而改变,而分析的定理只是比以前要更仔细地表述了。于是,想用一个连续函数的导数时必须假设其是可导的。事实上,所有的这些新的公理化结构和严密所做的无非是证明了数学家所知道的那些东西确实是那样的。确实,这些公理只能产生现存的这些定理而非其他。因为这些理论整体来说是正确的。所有的这些意味着数学并非建立在逻辑之上而是建立在健全的直觉之上。严密化正像阿达马指出的那样,仅仅是对直觉承认的东西加以确认,或者如魏尔所说,逻辑是数学家们想要保证思想健康和强壮的卫生手段。
不管怎样,到1900 年严密化已经再次强调了它的地位,而且,即使是晚了几个世纪,也终于获得了确认。数学家们可以宣称他们根据希腊人所设定的标准完成了自己的使命。他们可以比较放心地依赖这些知识了,因为除了一些细枝末节的修改之外,他们在经验或直觉上建立起来的绝大多数已被逻辑所证实。事实上,数学家们如此欢欣鼓舞,竟至有些得意忘形了。他们回顾几次危机:无理数、微积分、非欧几何和四元数,他们为自己克服了这些创造带来的灾难而喝彩不已。
在1900 年巴黎举行的第二届国际数学大会上,彭加勒,希尔伯特领袖地位的主要竞争者,作了一重要讲话。尽管他怀疑一些数学中引入的过分精炼的价值,但仍夸耀道:
我们最终达到了绝对的严密吗?在数学发展前进的每一阶段,我们的前人都坚信他们达到了这一点,如果他被蒙蔽了,我们是不是也像他们一样被蒙敝了?......但今天在分析中,如果我们不厌其烦地严格的话,就会发现只有三段论或归结于纯数的直觉是不可能欺骗我们的。今天我们可以宣称绝对的严密已经实现了!
彭加勒在他的著作《科学的价值》(1905 年)所收集的一篇论文中又重复了他的大话。当我们观察到这些科学家在使他们这门学科的许多分支严密化时所表现出来的热情时,不难找到如此飘飘然的原因,除极少数愚者,数学现在的基础已被所有数学家所接受,因此他们完全可以欢呼雀跃了。在伏尔泰的讽刺剧《公正》中,哲学家潘格洛斯博士甚至在被绞死之前,还这样说道:“在所有可能的世界中,这是最好的。”恰如有些数学家,不知道他们马上要被自己竖起的绞刑架吊死,还在说他们已进入了最美好的境地。实际上,暴风雨正在酝酿,如果参加1900 年国际数学家大会的数学家们抬头看看窗外,他们也许就会警觉,但是他们却都沉溺于庆祝的杯光酒影之中了。
但是,还是有这么一个人,同样在1900 年大会上清醒地认识到数学基础中的漏洞并未完全堵住。在这次会议上,希尔伯特列出了他认为是数学发展中最重要的23 个问题。第一个问题包括两部分,康托尔引入了超限数来表示无限集中元素的个数,关于这一创举,希尔伯特提出的问题是,证明整数个数这一超限数之后,第二大超限数是所有实数的个数。在第九章中我们将论及这一问题。
第一个问题的第二个部分是要求一种重排实数的方法,使得这样重新排序后的集合是所谓的良序集。虽然在以后我们将论及这一问题,但现在只要这样说就行了,即:实数集的良序化要求从良序化后的实数集中选出的任一子集都有最小元。在实数的通常排列中,若选择比5 大的所有实数做为一个子集,那么这一子集将没有最小元。
希尔伯特的第二个问题则更为明显并有更大的影响。我们已经注意到,相容性问题的产生同非欧几何有关,而且也给出了在假设欧氏几何相容的情况下的证明。希尔伯特通过解析几何这一媒介,指出如果算术科学是相容的,则欧氏几何是相容的。因此,在他第二个问题中他要求有算术科学是相容的证明。
康托尔的确注意到了希尔伯特第一问题的两个部分,而且帕斯、皮亚诺和弗雷格也注意到了相容性的问题,但是只有希尔伯特在1900 年认为这些问题是十分重大、而不是暂时的。毫无疑问,大多数的科学家听到希尔伯特在1900 年第二届国际数学大会上的发言后,都认为这些问题无足轻重,纯属异想天开。他们转而被希尔伯特所提出的其他问题所吸引,因为对算术的相容性,人们深信不疑。许多关于非欧几何相容性的疑问——它是奇特的,甚至与直觉截然相反——是合情合理的。但是实数系统已经用了五千多年,无数关于实数的理论均被证明,仍未发现任何矛盾。实数公理产生了许多著名定理,这样的公理体系怎么会是不相容的呢?任何关于希尔伯特明智地提出上述问题,并且把它放在23 个问题之首的疑问很快消散了。屋外云涛翻涌、山雨欲来,有些数学家开始听到了雷声,但甚至是希尔伯特也没能预见到等待他们的将是怎样一场风暴!
第九章 天堂受阻:理性的新危机
数学中不存在真正的论战。
——高斯
逻辑是使人走向错误的艺术。
——无名氏
经历了几个世纪在理性迷雾中的摸索,到1900 年,数学家们似乎已经赋予了他们的学科一种理想的结构,也就是欧几里得在他的《原本》中所描述的那种。他们最终承认了未定义概念的必需,一些含混或令人不愉快的定义被取消,一些分支也被建立在严格公理的基础上。正确、严谨、演绎的证明取代了基于直觉或经验的结论,甚至逻辑学的原理也被发展用以完善数学家们过去常用的那种不正规的,不清晰的证明方式。就我们所知,到1900 年时,它们的应用是可靠的。至此,正如我们已经说过的那样,数学家们因此倍感欣喜。正当他们额手称庆之时,新的发展却搅乱了他们的平静生活,这甚至超出了19 世纪前半叶时非欧几何和四元数所造成的影响。正如弗雷格所言:“当大厦即将竣工的时候,基础却崩溃了。”
希尔伯特曾经呼吁数学界注意一些尚未解决的关系到数学基础的问题(见第八章),这其中,建立不同公理系统的相容性问题是最基本的。他也意识到公理化方法使得未定义概念及其有关公理的运用成为必需,凭直觉,这样的概念及公理有着很特殊的意义。例如,点、线、面这些词语,都有实在对应物,而欧氏几何的公理,正是表述这些概念间的物理事实的。然而,正像希尔伯特所强调的、纯粹的欧氏几何逻辑并不要求点、线、面被束缚于某种特定的解释,而且对这样的公理,应该用尽可能少的假定,而致力于推导出更多的东西。尽管有人试图把公理公式化,以使他们能断言哪些东西看起来有实在意义,但在公式化的同时,也存在着危险,即这些公理可能成为不相容的,也就是说会导致矛盾。帕斯、皮亚诺和弗雷格已经意识到了这种危险,希尔伯特在1900 年的巴黎数学家大会上也强调了这个问题。
把物理事实抽象公式化时,可能出的毛病用一个粗浅的比喻也许更容
易明白。发生了一起罪案(许多人会同意数学是一种罪过),一个侦探在调查案件时,有一些未定义概念,如罪犯、犯罪时间等。无论得到什么事实,他都记录下来,这就是他的公理,然后他对事实进行推理,以期对案子能做出一些判断。他很可能做出矛盾的推论,因为他所做的一些假设,尽管尽可能的基于已发生的事情,却仍然可能超出事实或只是接近事实,虽然在实际情况中并不存在矛盾。的确存在犯罪和罪犯,但推理会得出这样的结论,罪犯身高五英尺,同时,他身高六英尺。
如果不是为了新的发展,那么,各公理系统相容性的证明能否成为关键性问题,还是值得怀疑。到1900 年,数学家们认识到他们不能再依赖于数学的物理真实性来肯定它的相容性。以前,当欧氏几何被当作物理空间的几何时,其中定理的连续推导会导致矛盾是不可思议的事情。但是到1900 年,欧氏几何被看成不过是建立在一组二十条左右人为公理上的逻辑构造,彼此矛盾的定理出现是确实可能的。那样的话,许多以前的工作会变得毫无意义,这是因为,如果两个彼此矛盾的理论出现的话,每一个都可以用来证明另一个的矛盾之处,因此,推导出来的定理会毫无用处。但希尔伯特通过证明,只要算术系统的逻辑构造是相容的,则欧氏几何也是相容的,排除了这种可怕的“如果”,也就是说,实数系统必然是相容的,对此几乎不存在什么忧虑和危机。
但是,令所有人惊愕不已的是,刚过1900 年,就在构成并延伸我们关于数的知识的基础理论中发现了矛盾。因而到1904 年普林斯海姆(AlfredPringsheim),一位杰出的数学家说,数学所寻找的真实就是相容性。当希尔伯特在1918 年的一篇文章中再次强调这个问题的时候,他已有了比1900年讲话时更充足的理由。
在旧体系中导致矛盾并让人们大开眼界的新理论是关于无穷集合的。分析的严密化使人们必须考虑,收敛的无穷级数(有一个有限和)和那些发散级数的区别。在这些级数中,三角函数的无穷级数,即以傅立叶命名的傅立叶级数,起了极其重要的作用。而一些在严密化过程中产生的问题,在康托尔着手解答时暴露了出来。这导致他考虑数集的理论,特别是引入无穷集,像所有奇数,所有有理数和所有实数的集合的计数。
当康托尔把无穷集看成一个可以被人的心智思考的整体时,他就打破了长久以来的定论。从亚里士多德起,数学家们就能区分实无穷与潜无穷。比如说,地球的年龄,如果有人认为它是在某个确定时间创生的,它的年龄就是潜无穷。因为无论什么时候,它虽然有限,却在持续增长。所有(正)整数的集合也可以被看成是潜无限的。因为,即使一个人数到了一百万,他还可以考虑再加一、加二,等等。然而,如果地球在过去是一直存在的话,则任何时刻其年龄都是实无穷的。同样,所有整数的集合被当作一个整体时是实无穷的。
将无穷集看成是实无穷、还是潜无穷,这个问题由来已久。亚里士多德在他的《物理学》中得出的结论是:“可选择的是无限具有潜性的存在......不会存在实无限。”他坚持认为数学中不需要后者。希腊人通常认为无穷是不能接受的概念,它是一个不着边际且不确定的东西。后来,这些讨论曾一度使人迷惑不解,因为许多数学家像谈论数一样谈论无穷,却并没有弄清它的概念或确定它的性质。比如,欧拉在他的《代数学》(1770 年)中说1/0 是无穷大(而他并没有定义无穷,只是用符号表示它),并且说:毫无疑问2/0 是1/0 的二倍。在有极限的场合运用∞符号产生了更多的混乱,当趋于∞时, 趋于零。在这里符号∞仅意味着可以取越来越大的值,并大到一定值(是有限的),以使和的差小于一任意值。这儿并没有涉及到实无穷。
然而,多数数学家,像伽利略、莱布尼茨、柯西、高斯和其他一些人都清楚地知道潜无穷集和一个实无穷集的区别,却拒绝考虑后者。如果他们必须得谈及,比如说,所有有理数的集合,他们不会赋一个数给这个集合,笛卡尔说过:“无穷可以被认知,但不能被理解。”高斯在1831 年写给舒马赫的信中说:“我反对把无穷量作为现实的实体来用,在数学中这是永远不能允许的,无限只不过是一种说话方式,我们所说的极限是指,某些比可以随意地接近它,而其他的则被允许无界地增加。”
因此,当康托尔引入实无穷集时,他不得不完善他的创造,以与过去最伟大的数学家们所持有的概念相抗衡。他论证说,潜无穷实际上依赖于一个逻辑上优先的实无穷。他还证明:无理数,比如说2,当用小数来表示时,要涉及到实无穷集,因为任何小数只能是一个近似。他意识到,他正在和他的前辈们彻底决裂。1883 年他说:“我使自己同普遍的关于数学中无穷的观点和经常被保护的关于数的本质的观点处于敌对位置。”
到了1873 年,他不仅主张把无穷集合看成一个存在的全体,还开始对它们加以分类。他根据两个无穷集包含着相同或相异的元素数来决定其区别,他的基本想法是利用一一对应。正如我们认为,5 本书和5 个弹子都可以用同样的数5 来代替,是因为我们可以把每一本书与每一颗弹子来配对。康托尔也将一一对应运用于无穷集合。现在,可以建立起下面的所有正整数与偶数间的一一对应关系:
1 2 3 4 5?
2 4 6 8 10?
也就是说,每一个正整数恰好同一个偶数即它的两倍数相对应,且每个偶数恰好同一个正整数即它的一半相对应。康托尔因此得出结论,这两个集合包含同样多的元素个数。它是这样的一个对应,即全体正整数的集合,可以与其自身的一部分一一对应;这结论对早期的思想家来说,很是荒谬,也促使他们抵制有关无穷集的任何成果。但康托尔并没有因此而退缩,他预见到,无穷集合将遵循新的不适于有限集的法则,就好比四元数所遵循的新规则是实数所不具有的。事实上,他将无穷集定义为这样的集,其与自身的一个子集可以一一对应。
其实,康托尔也对自己用一一对应导致的结果惊愕不已。他证明了一条直线上的点和一个平面上的点(甚至是n 维空间)之间存在着一一对应。他在1877 年给戴德金的一封信中写道:“我看到了它,却不敢相信它。”然而,他还是相信了,而且在确立无穷集合的相等时坚持了他的一一对应原理。
康托尔还定义了无穷集合大小的含义。如果集合A 同集合B 的一部分或子集能建立起一一对应,但集合B 不能同A 或其子集建立起一一对应关系,则集合B 大于集合A。这个定义仅是为了无穷集合才发展的,对有限集合则显而易见。比如说有5 个弹子和7 本书,你可以建立起弹子同一部分书的一一对应,但所有的书不能同全体或一部分弹子建立起这种关系。利用他的这种关于集合等或不等的定义,康托尔得出了惊人的结论,即正整数等价于有理数(所有正、负整数和分数)集,却小于实数(有理数和无理数)集。
正如采用数字符号5、7、10 等来标识一个有限集中的元素数很方便一样,康托尔也决定采用符号来标识无穷集合中的元素数。整数集及可以同它建立起一一对应关系的集合含有同样多的元素数,他用符号à0。(阿列夫零)来表示这个基数。全体实数的集被证明大于整数集,他就用了一个新符号c 来表示其基数。
进一步,康托尔能够证明,对于一个任意给定的集合,总存在一个比它更大的集合。例如,由一个给定集合的所有子集组成的集合大于原集合。我们不追究这个定理的证明,但只要设想一个有限集,就能够看出这个定理是合理的。比如,如果有一个含4 个元素的集合,可以构造出4 个含有1 个元素的不同集合,6 个含有2 个元素的不同集合,4 个含有3 个元素的不同集合和一个含有4 个元素的集合。要是再加上空集,我们会发现所有子集的数目正好是24,当然它是大于4 的。特别的是,通过考虑整数集的所有可能的子集,康托尔证明了2à0=c,这里c 是实数集的基数。
19 世纪70 年代,康托尔研究无穷集合时,这个理论,曾被当作是无足轻重的,他所证明的关于三角级数的定理也非基本性的。可是到1900年时,他的集合理论已在其他数学领域中大量使用,而且,他和戴德金已经预见到,在建立整数(有限和超限的)理论,在分析曲线和维数的概念上,集合论都是有用武之地的,甚至可以成为整个数学的基础。其他一些数学家,如鲍莱尔和勒贝格在将积分一般化时,也有求于康托尔的无穷集合理论。
因此,康托尔本人发现了困难就不是微不足道的事情了。他已指出了存在着越来越大的超限集和与之相应的超限数。1895 年,康托尔开始研究由所有集合组成的集合,它的基数应该是能存在的最大数了。然而,康托尔已经证明过一已知集合的所有子集构成的集合,其基数大于这已知集合的基数,因此,存在着一个比最大的数还要大的超限数。康托尔认定人们同时必须要区分开他所称为相容的和不相容的集合,并在1899 年就此写信给戴德金,意思是不能谈论由所有集合组成的集合及其基数。
当罗素第一次看到康托尔关于所有集合的集合的结论时,他并不相信。他在1901 年的一篇随笔中写道,“康托尔一定犯了某个微妙的小错误,我会在将来的某些工作中对此加以阐明。”他还补充说,一定存在着一个最大的超限集合,因为如果什么都考虑进去了,那么就没有什么可以增加的了。罗素致力于这件事,并给这个当时时髦的问题又加上了他的“悖论”。对此,我们将马上予以讨论。16 年后,当罗素重印他的随笔《神秘主义与逻辑》时,他增加了一条注脚对他的错误表示歉意。
除了我们已经谈及的超限数——称之为超限基数,康托尔还引入了超限序数,二者的区别相当微妙。设想一个集,比如说,由便士组成的集,其数目通常是最重要的,而怎样组成则无所谓。但如果按学生们在一次考试中的成绩把他们分等,就会有第一、第二、第三等等。比如说有十个学生,他们的分数就构成了从第一到第十的集合,且这是由有序数组成的集合。尽管一些早期文明能够区别序数与基数,他们仍采用同样的符号来表征由十个对象组成的有序集,就像对无序集所做的那样。这种做法被包括我们自己在内的后续文明所继承。因此,在十个人中的每一个被确定后,这样排列起来的人数是十个,因而无论是有序集还是无序集都用10 来表示。然而,对于无限集合而言,有序与无序的区别是十分重要的,因而采用了不同的符号来表示。比如对于有序自然数集1,2,3,......,康托尔用ω来表示其序数。相应的,有序集1,2,3,......,1,2,3 的序数表示为ω+3。康托尔还引入了超限序数的分层,其可以扩展至ω?ω、ωn、ωω乃至更高。
在创立了超限序数的理论之后,1895 年,康托尔意识到关于这些序数也存在着一个难题。同年他把这告知了希尔伯特,1897 年,布拉利-福蒂(Cesare Burali-Forti)首先公开了这一难题。康托尔确信序数的集合可以按某种合适的方式加以排列,正如熟知的实数可以按大小排序一样。一个关于超限序数的定理是这样的,由不超过α的所有序数组成的集合,其序数大于α。如序数集1,2,3......ω的序数是ω+1。因此,由所有序数组成的集合有一个比该集合中最大的序数还要大的序数。实际上,布拉利-福蒂指出,从1 加到最大的序数就可以得到一个更大的序数。但这构成了矛盾,因为原集合已包含了所有的序数。布拉利-福蒂得出结论,序数集的部分有序是可能的。
要是仅面对着上述两个问题,大多数数学家们毫无疑问会满足于住在19 世纪末数学的严格性所创造的乐园里。关于是否存在最大的超限基数或序数的问题,也可以睁一眼闭一眼。毕竟,没有最大的整数这一事实,并不使人感到不安。
然而,康托尔的无穷集合论激起了许多抗议。除了我们讲过的以外,这个理论在许多数学领域上得以应用,而一些数学家们仍拒绝接受实无穷集合及其应用。克罗内克(LeopoldKronecker)与康托尔素来交恶,称康托尔为骗子。彭加勒则认为无限集合论是邪气与病态的坟墓。“下一代人”,他在1908 年说,“将把集合论当作一种疾病,而人们已经从中恢复过来了。”许多其他的数学家甚至到19 世纪20 年代还试图避免使用超限数(见第十章)。康托尔为自己的工作辩护,他声称他是一个柏拉图主义者,相信存在一个独立于人的客观世界。人们不得不考虑这些想法并承认它们的真实性。为了对付哲学家们的批判,康托尔援引了神秘主义甚至上帝。幸运的是,康托尔的理论得到了其他一些人的欢迎,罗素称康托尔是19 世纪最伟大的智士之一。他曾在1910 年说:“解决了先前围绕着数学无限的难题可能是我们这个时代值得夸耀的最伟大的工作。”希尔伯特断言:“没有人能把我们从康托尔为我们创造的乐园中驱逐出去。”他在1926年评价康托尔的工作说:“这对我来说是最值得钦佩的数学理智之花,也是在纯粹理性范畴中人类活动所取得的最高成就之一。”
关于集合论产生矛盾的原因,豪斯多夫(FelixHausdorff)在他的《集合论基础》(1914 年)中做了相当巧妙的描述,他这样勾勒了这门学科的特点:“在这个领域中什么都不是自明的,其真实陈述,常常会引起悖论,而且似乎越有理的东西,往往是错误的。”然而,康托尔的工作使得大多数数学家感到迷惑不解,其原因全然不是因为各种大小不同的无穷集合是否可被接受。康托尔在试图确定所有集合组成的集合的基数和所有序数组成的集合的序数时所发现的矛盾,使数学家们认识到,他们不只是在新的创造中运用了相似概念,而且在被认为是毫无问题的经典数学中就加以运用了。他们宁愿把这种矛盾叫做悖论,因为悖论是可以被解决的,而数学家们希望确信这些问题可以被解决,现在通常用的术语是自相矛盾。让我们来看一下这些悖论吧!一个非数学的例子是这样的:“所有的法则皆有例外。”而这个陈述作为一个法则也必有其例外。因此,存在一个没有例外的法则。这一类陈述是指向自身并否定自身的。广为人知的非数学化的悖论是说谎者悖论,它曾被亚里士多德和许多后来的逻辑学家讨论过。关于这个命题的经典句式是:“这个命题是错误的。”我们用S 来表述这个命题,如果S 为真,则所说的是真,因而S 是错误的;若S 为假,则所言亦为否,因而S 又必为真。
这个悖论还有许多变体。一个人可以对他所做的某项断语这样评价:“我在说谎。”这个陈述是真的,还是假的呢?如果他真在说谎,那么,他所说的就是真的;而如果他所说的是真话,则他又在说谎。还有一些变体涉及到较为间接的自指。比如,有这样两个句子:“后一句话是错误的,前一句话是对的。”这就会产生矛盾。因为如果第二句话是正确的,那么第一句话就是错误的,但如果第二句话是错误的,正如第一句所言,则第二句话是正确的。
哥德尔(KurtG?del),本世纪一流的逻辑学家,给出了一个与上述矛盾陈述略有差异的变体:在1934 年5 月4 号,A 做一单一陈述:“A 在1934 年5 月4 号所说的每一句话都是假的。”这个陈述不可能是真的,因为它断言了自身是假的,但它也不可能是假的,因为如果它是假的,A 就在5 月4 日做了一个真实陈述,而他又只讲了这一句话。
数学上真正麻烦的矛盾的开端是由罗素在1902 年提出并告知弗雷格的。当时弗雷格正准备付印他的《基本法则》的第二卷,在那本书里他正试图建立有关数系基础的新方法(我们将在下一章中对此多加讨论)。弗雷格所用的集合或类的理论,正好涉及了罗素在致他的信中所提到的矛盾,其内容印在罗素的《数学原理》(1903 年)中。罗素研究了康托尔的所有集合组成的集合悖论,并有了他自己的观点。
罗素的悖论与“类”有关,由一类书组成的类不是一本书,因而不能属于自身;但一类想法仍可以是一个想法并属于自身。还有,目录的目录仍是目录。因此,有一些类能属于自身而另一些则不。设N 是由所有不属于自身的集合组成的集合,那么N 又属于谁呢?若N 属于N,依定义不应如此;若N 不属于N,则由其定义应属于N。当罗素首次发现这个矛盾时,他认为困难可能出在逻辑的某个地方而非数学自身。但这一矛盾却动摇了元素的类这一在数学中广泛应用的概念,希尔伯特称这个悖论对数学界有着灾难性的后果。
1918 年,罗素的悖论被他本人通俗化,这就是广为人知的“理发师”悖论。一个乡村理发师,宣称他不给村子里任何给自己刮脸的人刮脸,但却给所有不给自己刮脸的人刮脸,当然,理发师自夸无人可与之相比。一天他发生了疑问,他是否应当给自己刮脸?假如他给自己刮脸的话,则按他声言的前一半,他就不应当给自己刮脸;但是假如他不给自己刮脸的话,则照他自夸的,他又必须给自己刮脸。理发师陷入了逻辑上的困境。数学中发生的另一个有代表性的悖论,最先由格雷林(KurtGrelling)和纳尔逊(LeonardNelson)在1908 年叙述,是关于可以描述自身和不可以描述自身的形容词的。例如形容词“short”(短的)和“English”(英国的)可以修饰自身而“long”(长的)和“French”(法国的)则不然。又如“polysyllabic”(多音节的)这个词是多音节的,但“monosyllabic”(单音节的)这个词却不是单音节的。看来可以这么说,一个词或者可以用于自己, 或者不可以。我们称那些能描述自身的词为同己的(autological),称那些不能描述自身的词为异己的(heterological)。现在让我们来考虑异己的这个词自身,如果它是异己的,由于它能描写自身,所以应该是同己的;但如果它是同己的,则依同己的定义,它要能描述自身,所以它又是异己的。这样一来,每一个关于这个词的假设都会导致矛盾,用符号来表示这个悖论就是:词X 是异己的,若X 并非X。1905 年理查德(Jules Richard)提出了另一个悖论,用的是同康托尔用来证明实数的基数大于整数的基数一样的途径。它的论述稍嫌繁复,博德内恩图书馆的贝里(G.G.Berry)将其简化,并把它交给罗素,后者在1906年发表了这一悖论,被称作“单词悖论”。每一个整数都可以通过若干种方式用单词描述出来,例如,5 这个数可以表示成“five”(五)这个单词或词组“the next integerafter four”(四后面的整数)。现在考虑那些所有可能的用不多于100 个英文字母进行的描述,这样至多有27100种描述方式,因而也势必存在由27100 种描述方式所能描述的最大有限整数,那么,一定有不能用27100 种描述方式描述的整数。考虑“the smallestnum-ber notdescribablein 100 letters or fewer”(不能用 100 个或更少的字母描写出来的最小的整数),但这个数却正好用少于100 个字母就描述出来了。
然而,许多20 世纪早期的数学家不愿理睬上述这些悖论,因为它们涉及的集合论在当时是新兴的且无足轻重。其他一些人,意识到这些悖论的影响不仅限于经典数学,还关系到通常的推理,因而感到无所适从。一些人曾试图接受威廉?詹姆斯在他的《实用主义》中提出的建议,“当你遇到矛盾时,你必须澄清它。”从拉姆塞(FrankPlumptonRamsey)起,一些逻辑学家,曾尝试区分语义造成的矛盾和真实的即逻辑上的矛盾。他们称“单词悖论”、“异己的悖论”和“说谎者悖论”为语义的,因为它们涉及到一个词的真实性和可定义性或模糊应用等概念,相应地采用这些概念的严格定义能解决上述悖论。另一方面,罗素的悖论、康托尔的所有集合的集合的悖论和布拉利-福蒂悖论被认为是逻辑上的矛盾。罗素本人并没有做这样的区分,他确信所有悖论都产生于一种他称之为恶性循环原理的谬误,他这样描述道,“凡涉及到一个集的整体的东西必不能是该集中的一部分”。换句话说,如果定义一组元素的集而又必须用到该全集自身,则这定义是毫无意义的。这个解释是罗素在1905 年给出的,彭加勒在1906年接受了它,他还杜撰了“非断言定义”这一术语,即一个要定义的对象是用包含这个对象在内的一类对象来定义的,这种定义是不合逻辑的。举一个罗素本人在《数学原理》中提出的例子(见第八章),排中律说所有命题非对即错。但是这个定律自身也是一个命题,因此,尽管它的意图是断言逻辑定律的真实性,但它既是一个命题则也有可能是错误的,正如罗素所言,这个定律的陈述毫无意义。一些其他的例子可能会有所帮助。一个全能的上帝能创造一个不能被毁灭的东西吗?当然可以,因为他是万能的。可既然他是万能的,他又能毁灭任意东西。在这个例子里,“万能”这个词的范围涉及到一个不合理的总体,这一类悖论,正像逻辑学家塔斯基(Alfred Tarski)所指出的那样,尽管是语义上的,也向语言自身发出了挑战。
为了解决悖论,人们还做了许多其他努力,“所有法则皆有例外”的矛盾被当作无意义而摒弃了。有人还补充道,存在语法上正确的英文句子,而在逻辑上则是无意义或错误的, 如这个句子:“Thissentencecontainsfourwords”(这句话包含四个单词)。另外,由于由所有不属于自身的类组成的类被当作是无意义的或不存在的,原来的罗素悖论也得到清理。“理发师”悖论的“解决”是通过断言不存在这样的理发师,或是要求理发师将自己排除在他给刮脸和他不给刮脸的人组成的类之外。正像这样的陈述:教所有在班上的人的老师要排除自己。罗素拒绝最后一种解释,他在1908 年的一篇文章中表达了这样的意思,“最好是这样与一个长鼻子的人交谈:当我谈到鼻子的时候,我已经除去了那些过分长的长鼻子”,而这是一个避免一个痛苦的话题不成功的尝试。
“全部”这个词的意义是含混的,对于某些情况,一些语义上的悖论就源于“全部”这个词的用法。布拉利-福蒂悖论涉及到所有序数的类,这个类包括了整个类自身的序数吗?另一方面,异己的悖论定义了一类单词,这个类是否包括了“异己的”这个词本身呢?
罗素和彭加勒对非断言定义的反对意见,已经广为接受了。不幸的是,这种定义曾经在经典数学中被采用过,引人注目的例子是最小上界的定义。设有由3 到5 之间的数组成的集合,其上界,也就是大于该集合中最大数的数,有5、5.5、6、7、8 等等。这其中存在一个最小上界,即是5,因此,最小上界是根据一类包含了要定义上界的上界而定义的。另一个有关非断言定义的例子是在给定区间上一个函数的最大值,最大值就是函数在该区间上所取值中最大者,这些概念在数学中是最基本的,许多分析内容都是基于它们做出的。此外,许多非断言定义还被用在其他有关的数学内容中。
尽管那些与悖论有牵连的非断言定义能够导致矛盾,但使数学家们感到迷惑的是,就他们所知而言,并非所有的非断言定义都会导致悖论。诸如,“约翰是他们队里个头最高的”和“这句话很短”之类的陈述,尽管是非定义的,却实在是无害的。陈述“在数集1,2,3,4,5 中最大的数是5”也是如此。实际上,采用非定义陈述是普遍的。例如,如果一个人定义了一个所有包含多于5 个数的类所组成的类,他也就定义了一个包含自身的类。又如,由所有用不多于25 个单词可以定义的集合S 也包含S。数学中充斥着这类定义,其是数学频频告急的真正起因。
不妙的是,我们没有一个标准来断定哪些非断言定义是无害的,哪些是有害的。因此,存在着发现更多的会导致矛盾的非断言定义的危险。这个问题从策梅罗(Ernst Zermelo)和彭加勒第一次讨论时起就显得很急迫,彭加勒提议禁止使用所有的非断言定义。魏尔,本世纪前半叶的顶尖数学家,担心一些非断言定义真的会导致悖论,于是做了很多努力来重新定义最小上界以避免非定义性。可他没能成功,他惴惴不安地得出结论,分析的基础是不牢固的,可能应该牺牲其中的一部分。罗素的禁令:“我们不能容许任意地确定集合和不分青红皂白地把这个集合构成其他集合的一部分”,这当然无助于解决哪些非断言定义可以被允许的问题。
尽管矛盾的基本起因看起来已经明了,但仍存在着怎样构造数学来尽可能减少这些矛盾的问题。更为重要的是,要确保数学中不再出现新的矛盾。现在,我们可以看出为什么相容性问题在20 世纪初变得如此紧迫了。数学家们宁愿把矛盾看成是集合论的悖论,然而,集合论的工作确实让他们看到了在经典数学中可能存在的矛盾。
在构造坚实的数学基础的努力中,建立相容性成为要求最迫切的问题,但在20 世纪初,人们也认识到,从确定已取得的成果的角度出发,其他一些问题也非次要。在19 世纪后期,批判精神已经深入人心,数学家们开始重新审查以前所接受的一切。他们选定了一个看起来似乎没有问题的断言,它曾经在许多早期证明中运用过,并没有引起人们的关注。这个断言就是,给定任意一组集合,有限的或是无限的,总可以在每个集合中选取一个元素构成一个新的集合。例如,可以从美国五十个州中的每一个州选出一个人构成一个新的人的集合。
策梅罗在1904 年发表的一篇论文,使数学家们意识到,上述断言实际上以一条称作选择公理的公理为先决条件。这与当时的历史情况有某些关联,为了能将超限数按照大小来排列,康托尔需要这样的定理,即任一实数集都是良序集。一个集是良序集首先其必须是有序的,有序的是指,比方说,在整数的情况下,若a 与b 是集合中的任意两个数,要么a 位于b前,要么b 位于a 前。进一步,如果有a 先于b,b 先于c,则a 必先于c。如果一个集合的任一子集无论怎样选取,都有为首元素,则它是良序集。因此,所有的正整数,按照通常次序排列,就是良序的。而按通常次序排列的实数集是有序的但非良序的,因为它的包含大于零的数的子集,没有为首的元素。康托尔曾猜测每个集合都可以良序化,他于1883 年引入了这一概念,虽经使用却未加证明,而且,我们可能还记得,希尔伯特曾在1900年的国际数学家大会讲演中提出这个问题。策梅罗在1904 年证明了这个定理,并在证明过程中提醒大家注意他用了选择公理这一事实。
正如过去多次发生过的一样,数学家们先是无意识地使用了某条公理,后来才不仅意识到了正在使用它,而且还得去考虑接纳这样一条公理的基础。康托尔曾在1887 年无意识地使用了选择公理去证明任意无限集都有一个基数为à0 的子集。它还曾经含蓄地运用于拓扑学、测度论、代数和泛函分析的诸多证明中。例如,它曾被用来证明在一有界无限集合中可以选取一个序列收敛于该集合中一极限点。作为最基本的应用,它还被用来从有关整数的皮亚诺公理出发来构造实数。还有一个应用是证明一个有限集合的幂集,即一个有限集合的所有子集组成的集合为有限的。1923 年,希尔伯特称此公理对于数学推理的基本原理而言是不可或缺的普遍公理。皮亚诺最早呼吁人们注意选择公理,在1890 年,他曾写道,不能无限次地使用任一定理,即从许多类中的每一类抽取一个元素。在他处理的问题(微分方程的可积性)中,他给出了一个确定的选择法则从而解决了困难。列维(Beppo Levi)在1902 年同样认同了这条公理,施密特(ErhardtSchmidt)则在1904 年把它推荐给了策梅罗。
策梅罗对选择公理的明确使用激起了一场反对的风暴,就在紧跟着的一期颇有影响力的刊物《数学年鉴》(1904 年)上,鲍莱尔和伯恩斯坦(FelixBernstein)的论文都批驳了该定理的使用。这些接踵而至的批评意见随即以鲍莱尔、贝尔(RenéBaire)、勒贝格和阿达马这批领头数学家之间的交换信件形式发表在《法兰西数学会通报》上(1905 年)。
批评意见的要点是,除非有一个确定的法则指定从每个集合中选取哪一个元素,否则就没有做出真正的选择,也就没有构成新的集合。若这种选择在证明过程中发生变化,则证明也就是无效的。如鲍莱尔所言,一次不合法的选择就是一次有关信念的举动,该公理已经超出了数学的范围。试举罗素在1906 年给出的一个例子,如果我有一百双鞋,并宣布取出每双鞋中左脚的那一只,则我表述了一个清晰的选择。但如果我有的是一百双袜子并要说出从每双袜子中选出哪一只来,我就没有可以依照的法则来这样做。然而,选择公理的维护者们,尽管承认可能缺少选择的法则,却看不出有这种法则的必要性。对他们来说,选择是逐一确定的,因为人们认为它们是确定的。
还有另外一些反对者和反对的依据。彭加勒承认这条公理,却不承认策梅罗对良序化的证明,因为其中存在非断言陈述。贝尔和鲍莱尔不但反对这条公理,也反对其证明,因为它没有表明良序化是怎样达到的,而只证明了可以被达到。布劳维的哲学我们将在后面讨论(见第十章),他拒不承认实无穷集,也反对选择公理。罗素的反对意见是,一个集合只有当其所有成员共有一种属性时才算是确定的。例如:可以通过戴绿帽子这一特征定义所有戴绿帽子的人的集合,但是选择公理并不要求被选定的元素具有某种确定的属性,它只是说我们能从每一个给定集合中选取一个元素。策梅罗本人,满足于在直觉意义上运用集合的概念,对他来说,从每个给定集合中选出一个元素可以清楚地构成一个集合。
阿达马是策梅罗唯一坚定的盟友,在他为康托尔的理论辩护的基础上,他力言选择公理也可接受。对于阿达马来说,对象存在的断言并不要求描述它们,如果仅是存在的断言就能使数学得到发展,那么这样的断言是可以接受的。
为了答复批评意见,策梅罗给出了良序定理的第二种证明,其中同样使用了选择公理,并指出这二者是等价的。策梅罗为公理的使用辩护说,除非它导致矛盾,否则数学就得使用它。他认为选择公理“具有一种很快会让人清楚的纯客观性质。”他同意这条公理不是严格自明的说法,因为它牵涉到无限集的选择,但它仍是一种科学的需要,因为这公理可以用来证明重要的定理。
许多选择公理的等价形式也被提了出来,如果选择公理能同集合论的其他公理一起被承认的话,这些都将成为定理。然而,所有的想用少一点矛盾的公理替代该公理的企图都未能成功,一个能被全体数学家们接受的公理看来是不大可能出现的。
关于选择公理的关键问题是存在对数学意味着什么。对一些人来说,它涵盖了所有有用又不会导致矛盾的理性概念,如一个普通封闭表面积是有穷的;对于另一些人来说,存在意味着具体的、清晰的特征识别或概念的实例,能使人们指出或至少描述它,而仅有选择的可能性是不够的。在接下来的一些年中,这些观点的冲突更加尖锐,对此,我们将在后面的章节中详加讨论,但现在这公理成为了争论的焦点。
除了这些,在此后的几十年里,随着数学的扩展,许多数学家继续使用选择公理,它是否是合理的、可接受的数学的争论在数学家中极为盛行,它成了仅次于欧几里得平行公理而被讨论得最多的公理。正如勒贝格所评论的,由于没有一致的意见,双方除了互相攻讦以外不解决任何问题,他本人除了对这条公理采取否定的和不信任的态度外,还表示使用它,既要大胆,也要谨慎。他坚持认为未来的发展会帮助我们做出决断。
20 世纪初期,另一个问题也开始困扰着数学家们。起初,这个问题还显得不是那么紧要,但是当康托尔的超限基数和序数的理论应用得越来越广泛后,它的解决就变得十分迫切了。康托尔在他的后期工作中,在超限序数理论的基础上,建立了超限基数理论。例如由所有可能的有限序数的集合构成的集合的基数为à,由所有可能的,具有可数基数(à)的集合的序数组成的集合的基数为à。按照这种方式,他得到了越来越大的基数,并用à0、à1、à2?来表示,每一个都是前一个的后继者。但是,他很早以前曾在关于超限数的研究中证明过,所有实数的基数为à,简记为c,而2à是大于à0 的。他接下来提出的问题就是,c 是à1 系列中的哪一个呢?因为à1 是à2 的后继者,所以c 应大于或等于à1,他猜测c=à1。他于1884 年提出并发表的这一猜测,称作连续统假设①。这个假设的另一种稍微简单一些的陈述方法是,在à0 和c之间不存在其他超限数,或实数的任意无限子集的基数是à0 或c①。在本世纪的最初年代里,连续统假设引发了许多没有解决的矛盾,除了可以用它证明新定理之外,即使对于可用来建立集合论的无穷集,一一对应和选择公理的理解,它也显得十分重要。
这样一来,本世纪初数学家们面对着几个棘手的问题,已经发现的矛盾亟待解决,所有数学的相容性的证明更为重要,以便确信不再产生新的矛盾,这些问题都是决定性的。由于选择公理对于许多数学家来说无法接受,因而许多基于该公理的数学内容也得划个问号,它们能用一个更为人接受的公理加以证明吗?抑或选择公理整个就是多余的呢?随着新的发展,连续统假设的重要性越来越明显,它也必须被证明或证否。
尽管数学家们在20 世纪初所面对的问题是严峻的,但在另外的情况下它们可能并不会引起什么巨变。的确,有一些矛盾必须解决,但实际知道的矛盾只限于集合论——也许总有一天会严格起来的新分支。至于在经典数学中可能发现新矛盾的危险,或许是由于使用了非断言定义所致,而当时相容性问题已经归结为算术系统的相容性问题,且没有人对它有疑问。实数系统已经延用了五千多年,数不清的关于实数的定理得到过证明,并没有发现什么矛盾。一条公理,现在即指选择公理,曾经被隐含地使用过,而且还要继续使用下去,可能并不会让很多人感到不安。19 世纪后期的公理化运动就曾暴露出许多公理都被隐含地使用过。连续统假设在当时不过是康托尔理论的一个细节,而一些数学家还在嘲弄康托尔的整个理论。数学家们曾经面临过更严峻的困难,他们也能处之泰然,比方说,在18 世纪,尽管充分知晓微积分基础中的根本困难,他们还是在微积分的基础上建立了许多分析的分支,随后分析才在数的基础上严密化。
我们引述过的这些问题好比是一根火柴,其点燃导火索,然后使炸弹引爆。一些数学家仍以为数学是一个真理体系,他们希望能建立起这个体系,弗雷格已经在从事这样一项活动。进一步,对选择公理的反对不仅仅限于该公理所言,以康托尔为代表的数学家引入了越来越多的理念结构,并认为它们和三角形的概念具有同等真实性。但其他一些人则抵制这些概念,认为它们过于脆弱,不能在其上构造结实的东西。关于康托尔的理论,选择公理和相似概念的基本问题是数学概念在何种意义上存在着呢?难道它们必须与物理实体相对应或是其理想化的写照吗?亚里士多德曾经思考过这个问题,对于他和大多数希腊人来说,实体对应物是必不可少的。这就是为什么亚里士多德不肯承认无限集合为一个整体及正七边形的缘故。另一方面,柏拉图主义者,康托尔就是其中之一,都相信他们所信奉的观念存在于独立于人的客观世界中,人类只是发现了这些想法,或如柏拉图所说的,回忆起它们。
① 设想一个基数为(1 的集合,考虑其全部子集组成的集合,其基数为2(1,而2(2>(1,因而可以推测2(1=(2,2(n =(n+1,这就是广义连续统假设。——原注
① 后一种形式并不涉及选择公理。——原注
存在问题的另一面是存在证明的价值问题。例如,高斯曾经证明过每个实系数或复系数的n 次多项方程至少有一个根,但是该证明并没有指出怎样计算这个根。类似地康托尔证明过实数多于代数数(多项式方程的根),因此,存在着超越无理数。然而,这个存在性证明不能使人指出更不用说计算出哪怕一个超越数。20 世纪早期的一些数学家,如鲍莱尔、贝尔和勒贝格认为纯粹的存在性证明是没有价值的,存在性证明应使数学家们能按想要达到的精度来计算存在量,他们称这样的证明为构造性证明。还有另一个问题困扰着某些数学家。数学的公理化是同对许多明显事实的直觉接受背道而驰的。的确,这场运动去除了一些矛盾和晦涩的东西,比如在分析领域就是如此。但它也强调对于直觉是显而易见的事物的清晰的定义、公理和证明,即便它们明显到起初察觉不到对直觉的信赖的地步(见第八章)。作为结果的演绎结构既复杂,涉及面又甚广,例如,基于整数公理的有理数特别是无理数的发展都显得琐碎而复杂,所有这些,都给一些数学家,特别是克罗内克造成这样的印象,即过于做作,且不必要。克罗内克是一个著名团体的领袖,他们觉得不必借助逻辑手段来使构造更可靠,人的直觉使人相信就足够了。
另一个争论的焦点是,随着数学逻辑体系的成长,使得数学家们意识到,即便是逻辑学原理也不能非正式和随意地使用。皮亚诺和弗雷格的理论要求数学家们在推理过程中,将属于一个类的元素和属于另一个类的类,严格地区别开来。这些区别看起来似乎是在卖弄学问,与其说是一种帮助,还不如说是一种障碍。
更为重要的是,在19 世纪末,尽管还不是很明朗,但已经有许多数学家开始对逻辑原理无限制的适用性感到不安。什么能担保它们可以应用于无限集合?如果逻辑原理是人类经验的产物,那么,对于它们是否能扩展到没有经验基础的理念结构是有疑问的。
早在1900 年以前,数学家们已经开始对我们刚才叙述过的这些基本问题产生分歧,而新的悖论不过是加深了已经存在的分歧。一些年以后,数学家们开始带着渴望回首在矛盾出现之前的那段短暂而幸福的时光。杜布依-雷蒙(Paul du Bois-Reymond)描述那段时光为“我们仍住在天堂里”的时候。
第十章 逻辑主义与直觉主义
逻辑学派的理论并非不毛之地,它生长着矛盾。
——彭加勒
集合论中悖论的发现,以及意识到其他经典数学中也可能存在悖论,使数学家们开始认真对待相容性问题了。由于选择公理的任意使用,就提出了这样一个问题,即数学中的存在意味着什么,而且这一问题备受瞩目。真正的无限集是不是一个合理的概念?在重构数学基础和开创新的数学分支时,越来越多地使用无穷集合将这个古老的争议重新提到人们面前,而19 世纪后期的公理化运动并没有涉及这个问题。
然而,并不是这些问题和前一章中所述问题,使得数学家们重新对正确的数学基础这一问题做全面的考虑,这些问题使原来已经冒了烟的观点分歧,变成了白热化的争议。一些新的带根本性的数学方法,早在1900年之前就被提出来,并在一定程度上给予了仔细的探讨,但它们并未受到人们的注意,大多数数学家没有认真地对待它们。本世纪最初的十年中,数学巨人之间为关于数学基础的新数学方法而爆发了一场战争,他们分裂为两个对立的阵营,并向对方宣战。
逻辑派是这些派别中的一个,其论点简言之,就是所有的数学都可由逻辑推导出来。在20 世纪初,几乎所有的数学家都认为逻辑法则是一个真理体系。因此,逻辑学家们断言,数学也一定是一个真理体系,而且由于真理是相容的,因而他们说,数学也一定是相容的。
像所有的创新一样,这一论点在得到明确的形式和广泛的注意之前,许多人对它做出了贡献。数学可由逻辑推出这一观点,可以上溯到莱布尼茨。莱布尼茨区分了理性真理(或必然真理)和事实真理(或称偶然真理)(见第八章),莱布尼茨在写给朋友科斯特的一封信中解释了这一区别。一个真理是必然的,若它的否定蕴涵着矛盾;如果一个真理不是必然的,就称它是偶然的。上帝是存在的,所有的直角都相等,这些都是必然真理。而我本人是存在的,自然界中存在着某种物体,它有一个恰为90°的角,这些则是偶然真理,它们可能正确,也可能不正确。因为整个宇宙都可能是另一种结构,而上帝从无数的可能结构中选出了他认为最为合适的。数学真理是必然真理,所以它们一定是可由逻辑推出的,而逻辑的规则也是必然真理,而且在任何可能的世界体系中都是正确的。
莱布尼茨没有将由逻辑推出数学这一工作继续下去,在差不多200 年的时间里,其他持有相同见解的人也没有做这件事,例如,戴德金直截了当地肯定,数不是由时间和空间的感觉得来,而是“一种纯粹思维规律的直接产物”。有了数,我们才有时间和空间的精确概念。他开始发展这一论点,但也没有继续下去。
最后,受戴德金的影响,弗雷格发展了逻辑派的理论,他对数理逻辑的发展做出了很大贡献。弗雷格相信,数学和法则是解析的,它们是蕴含在逻辑原理中的。而逻辑原理是先验真理,数学定理及其证明说明了什么是蕴含,并不是数学全部都能用于现实世界,但它当然是包含了理性真理的。弗雷格在《概念演算》(1879 年)中,在明确表述的公理之上构筑了逻辑学。此后在他的《算术基础》(1884 年)和两卷著作《算术的基本法则》(1893 年,1903 年)中继续从逻辑前提出发,推导算术的概念和数的定义及规律。从数的规律出发,就有可能推出代数,分析甚至几何,因为解析几何是从代数形式来表述几何的概念和性质。不幸的是,弗雷格的符号体系对数学家们来说太复杂、太生疏了,因此他的工作,在当时并没有什么影响。有一个具有讽刺意味的故事。1902 年正当《算术的基本法则》第二卷要付印的时候,他接到罗素的一封信,罗素说他的工作涉及了“所有集合的集合”这一概念,但这是会导出矛盾的。弗雷格于是在第二卷的结尾写道:“一个科学家再不会碰到比这更难堪的事情了,即在工作完成的时候,它的基础垮掉了。当这部著作只等付印的时候,罗素先生的一封信,就使我陷入这种境地。”在他写这部著作的时候,弗雷格并不知道悖论已经被提出来了。
罗素独立地构想出了同样的计划,在他进一步发展它的时候,他发现了弗雷格的工作。罗素在他的自传(1951 年)中说,他也受到皮亚诺的影响,后者是他1900 年在第二届国际数学家大会时遇到的:这次大会是我的精神生活的一个转折点,因为在那里我遇见了皮亚诺。在此之前,我已听说过他的名字,也知道他的一些工作。我突然明白了,他的符号提供了我多年来一直试图寻找的分析的工具,而且,从他那里我获得了一直以来想要从事的工作的一种新的有效的技术。
在《数学原理》(第一版,1903 年)中,他进一步写道:“所有的数学都是符号逻辑这一事实是我们这个时代最伟大的发现之一......”在本世纪之初,罗素和弗雷格一样,相信如果数学的基本定理能由逻辑推出,则由于逻辑一定是个真理体系,那么这些定理也是真理,相容性的问题也将得到解决。在《我的哲学发展》(1959 年)中,罗素说,他试图得到“一种完美的数学,它是无可质疑的”。
罗素当然知道皮亚诺从有关整数的公理推出了实数,也知道希尔伯特为整个实数系统给出了一个公理集。然而在《数学哲学导言》(1919 年)中,他提到了有点类似于戴德金的一种策略:“我们所需要的这种假设方法有很多优点;正如窃取总是比诚实劳作来得快一样。”罗素真正关心的是十或十五条关于数的公理的假设并不能保证这些公理的相容性与真实性。正如他所说的,这一假设毫无必要地增加了未来之旅的难度。而在本世纪初,罗素还确信逻辑原理是真理因而是相容的,怀特海(Whitehead)则在1907 年提醒道:“不可能有关于逻辑前提本身的相容性的形式的证明。”
在许多年里,罗素一直相信,逻辑原理和数学知识的实体是独立于任何精神而存在并且仅为精神所感知的。这种知识是客观的,永恒的,这一立场在他1912 年的著作《哲学的问题》中给予了明确的阐述。
在真理问题上,罗素的意图是要走得比弗雷格更远。年轻时他相信数学揭示了现实世界的真理,然而,在欧氏几何和非欧几何(它们都与现实世界相吻合(见第四章)却彼此不相容)中,他却不能肯定,哪一个是真的。在《关于几何基础的随笔》(1898 年)中,他确实找到了一些他认为是客观真理的数学法则,例如物理空间一定是齐次的,即在任何地方都具有相同性质。然而,一定存在一个客观的真实世界,我们能够得到关于它的正确知识,对比之下,空间的三维性则只是一个经验事实。因此罗素试图寻找具有客观真实性的数学规律,而这些规律应是可由逻辑公理推出来的。
在1903 年的《原理》中罗素强调了关于数学的客观真理性的立场,他说:“一切关于实际存在的命题,例如,我们生活其中的空间,都来自于实验或经验科学,而不是数学。当它们属于应用数学时,它们是通过纯数学的一个命题中的一个或多个变量赋以常数值而得到的......。”甚至在这一版中,他仍然相信一些基本的客观真理存在于由逻辑推出的数学中。对于怀疑论者没有绝对真理的观点,罗素回击道,“数学对于这样的怀疑主义,将永远责难它们,因为真理的殿堂巍然耸立,不会因为任何怀疑的讥讽而有所减损”。
罗素在他的《原理》中概要说明的思想在怀特海和罗素的详尽著作《数学原理》(共3 卷,第一版1910~1913 年)中得到了发展,由于这部著作是逻辑派立场的权威性论述,我们的说明将以此为本。
这个学派从逻辑本身的展开出发,谨慎地提出一些逻辑的公理,由此推出定理,它们可以用于以后的推理。和任何公理化理论一样(见第十二章),这个展开是从一些不定义的概念开始的,这些不定义的概念中有:基本命题的概念,肯定基本命题的真,一个命题的否定,二个命题的析取,以及命题函数的概念。
罗素和怀特海解释了这些概念,虽然正如他们指出的,这种解释并不是逻辑展开的一部分,他们所谓的命题和命题函数实际上是皮尔斯已介绍过的。例如:“约翰是人”是一个命题,而x 是人,则是一个命题函数。一个命题的否定是指:“这个命题成立不是真的”。因此,如果用p 表示“约翰是人”这个命题,那么p 的否定(记作~p)是指“约翰是人不真”或“约翰不是人”。两个命题p 与q 的合取记作p?q,是指p 与q 都必须为真;两个命题p 与q 的析取记作p∨q,是指p 或q 为真。这是“或”的意思,正如“男人或女人都可申请”中说的,即男人可以申请,女人可以申请,或者两者都可申请。“那个人是男人或女人”这句话中,“或”具有更一般的意义,即非此即彼,不能两全。在数学中按第一个意思来用“或”这个词,虽然有时只有第二种意思是可能的。例如:三角形是等腰的或四边形是平行四边形”说的是第一个意思。我们也说一个数必为正的或负的,而关于正数和负数的一些事实说明二者不能都是真的。因此在《原理》中,肯定p 或q 就是指p 并且q 都是真的,或者p 不真而q 真,或p 真而q 不真。
在命题之间最重要的一种关系是蕴涵,即一个命题的真强制着另一个命题的真。在《数学原理》中,定义了蕴涵,记为é,它与弗雷格的实质蕴涵(见第八章)意义相同,即péq 就是若p 为真,则q 必真;而若p 为假,则不论q 为真或假都有péq,即一个假命题蕴涵任意命题,蕴涵的这一定义至少与可能发生的事是相容的。因此,若a 是偶数为真,则2a 必为偶数,而若a 是偶数为假,则2a 可能为偶数或者(当a 是分数时)2a 可能不是偶数,由假命题,a 为偶数两个结论都可得到。
当然,必须要有逻辑公理才能推导定理,其中的一些是:
A.一个真的基本命题所蕴涵的命题是真的。
B.(p∨p)ép.
C.qé(p∨q)
D.(p∨q)é(q∨p)
E.p∨(q∨r)éq∨(p∨r)
F.由p 的肯定和péq 的肯定可得q 的肯定。作者们由这些公理出发推导出逻辑的定理。
为说明逻辑本身已形式化,并成为演绎的推理手段,我们来看一下数学《原理》开头的几个定理。一个定理是,假设p 蕴涵p 不真,则p 不真,这就是归谬原理。另一个定理是,若q 蕴涵r,那么就有若p 蕴涵q,则p蕴涵r(这是亚里士多德三段论的一种形式)。一个基本定理是排中律:对于任意命题p,p 是真的或是假的。
在建立起命题逻辑之后,两位作者开始处理命题函数,它们实际上表示的是类或者集合,因为命题函数用性质来描述集合,而不用把集合中的元素指点出来,例如,命题函数,“x 是红的”这个命题函数就表示所有红色的物体组成的集合。
罗素和怀特海当然希望能够避免由于定义一个包含自身在内作为一个元素的集合而引起的错误。他们解决这个困难的办法是要求,“任何牵涉着一个集合的所有元素的东西,都不能成为这个集合的元素”。为了在《数学原理》中实现这一制约,他们引入了层次理论。
层次理论是复杂的,但其思想是简单的。个体(例如约翰或某一本书)是层次0。关于个体的性质的断言,是层次1,关于个体性质的命题,则是层次2,每一个断言都比它所描述的低层的事物层次为高。用集合的术语来说,层次理论说的是个体元素的层次为0;个体的一个集合层次为1;许多个集合组成的一个集合层次为2;依此类推。这样如果说a 属于b,则b的层次一定比a 高,同样,不能说一个集合属于它本身,当把层次理论回到命题函数上时,情况变得略为复杂一些。命题函数不能由这个函数本身定义的东西作为变元(变量的值),因此函数就比其变量的层次要高。基于这一理论,两位作者,讨论了当时的悖论,并且说明层次理论避开了悖论。
层次理论可以避免矛盾的优点用一个非数学的例子可以更清楚地说明。我们来考虑“凡是规则都有例外”这一叙述引起的矛盾(见第九章),这一叙述是关于“任何书都有印刷错误”这样的特定的规则的,而关于所有规则的陈述,通常被解释为若用于它本身则导出了矛盾,即存在没有例外的规则。在层次理论中,一般规则具有更高的层次,因此,它关于特定的规则的陈述不能用于自己,从而一般规则不一定有例外。
类似地,“它谓”悖论,将那些不能用于自身的词定义为它谓的——是所有它谓的词的一个总的定义,因此,它比任何一个它谓的词层次都高。所以不能问一个它谓的词本身是不是它谓的。但可以问一个特定的词,比如,短的是不是它谓的。
说谎者悖论也可以通过层次理论得到解决,正如罗素所指出的,陈述句“我正在说谎”是指“我正在肯定一个命题,而它是假的”,或“我肯定一个命题p 而p 是假的”。若p 是第n 层的,则关于p 的断言,层次是高于n 的,因此,若关于p 的断言是真的,则p 本身就是假的;而若关于p 的断言是假的,则p 本身就是真的,但这里并不存在矛盾。用同样的方法,还能解决理查德悖论。所有这些都涉及到一个关于低层断言的层次更高的断言。
很明显,层次理论需要对语句仔细地按层次加以区别。然而,要想按层次理论来建立数学,开展起来将极为复杂。例如:在《原理》中,两个东西a 和b 相等,是指如果对b 适用或b 成立的每一命题或命题函数,都对a 成立,反之亦然。但是这许许多多的断言是不同层次的,因而相等这一概念,就相当复杂。类似的,由于无理数是用有理数定义的,而有理数是用正整数来定义的。无理数比有理数有更高的层次,它们都比整数的层次类型高,因此,实数系由不同层次的成分构成,于是不能得出关于所有实数的定理,而必须对每个层次的数分别陈述,因为适用于一个层次的定理,不能自动地适用于其他层次。
层次理论带来的另一复杂命题是关于有界实数集的最小上界的概念(见第九章)。最小上界定义为所有上界中最小的,因此,最小上界是用实数的集合来定义的,于是它一定比实数层次高,而它本身不是实数。
为了避免这种复杂性,罗素和怀特海巧妙地引进了约化公理。命题的约化公理认为任何较高层次的一个命题与一个层次为0 的命题等价,命题函数的约化公理认为任何一元或二元命题函数与一个层次为1,具有相同数目的变元(变元可以是任何层次的)的命题函数是共存的。这一公理也为支持《原理》中使用的数学归纳法所需要。
在叙述了命题函数之后,两位作者就讲到关系理论,关系是通过两个或多个变量的命题函数来表示的,这样“x 爱y”就表示了一种关系。由关系理论得出用命题函数定义的明确的类或集的理论,在此基础之上作者们将要引入自然数(正整数)的概念。
自然数的定义当然是有点意思的,它依赖于先前引入的类之间的一一对应关系。如果两个类是一一对应的,则称其为相似的。所有相似的类,具有一个共同性质:它们的元素个数相同,而且相似的类可以有多个共同的性质。罗素和怀特海在这一点所做的,正如弗雷格做过的,是把一个类的元素个数定义为所有与之相似的类所组成的类。这样,3 这个数目就是所有的三元素类所组成的类,而三元素的记号是{x,y,z},其中x≠y≠z。因为数目的定义事先假定了一一对应的概念,看起来这个定义似乎是循环的,但是,作者指出,一个关系是一一的,如果当x 和x′都对y′有这个关系时, x 与x′必是恒同的,而当x 对y 和y′都有这个关系时,y与y′必是恒同的。因此,一一对应的概念,并未牵涉到数目1。
有了自然数以后,就能建立起实数系和复数系、函数以及全部分析。几何可以通过数用坐标和曲线方程来引进,然而,为了实现他们的目标,罗素和怀特海又引入了两条公理。为了定义自然数(以命题函数的形式)以及更为复杂的有理数,无理数及超限数,怀特海和罗素引进了无穷类存在的公理(类已由逻辑术语适当地定义)和层次理论所需的选择公理(见第九章)。
这就是逻辑派的宏大计划,他们在逻辑上的工作有很多可说的,我们在这里只是一带而过。我们必须着重指出的是,他们在数学上的工作,就是要把数学奠定在逻辑的基础上,不需要任何数学公理,数学不过是逻辑的主题和规律的自然延展。
逻辑派的做法受到很多指责,约化公理激起了反对,因为它显得太任意了。尽管没有证明说它是错的,可也缺乏证据说明它的正确性。它曾被说成是可喜的,意外的,而不是逻辑必需的。拉姆赛尽管是支持逻辑派理论的,但他也用这样的话来指责其公理:“这样的公理在数学中是没有位置的;任何不用它就不能证明的东西,根本就不能看成是得到了证明”。另一些人说,这个公理是智力的廉价品。魏尔则明确宣布放弃这个公理。有些评论称,这个公理重新引入了非断言定义。也许最重要的问题是它究竟是不是逻辑的公理,以及由此提出的数学是建筑在逻辑基础之上这一论点是否确实可靠。
1909 年彭加勒说:约化公理比数学归纳法更靠不住,更含糊不清,前者实际是用后者来证明的,它是后者的另一种表现形式。但是数学归纳法是数学的一部分,是构筑数学大厦必需的。因此,我们不能证明其相容性。罗素和怀特海在《原理》第二卷第一版(1910 年)中说明引入这一公理的理由是为了得到某些特定结果。很明显地,他们为使用了这个公理而不安,这里是作者为它作的辩解:
说到约化公理,既然它支持的推理和由它产生的结果,看起来都是合乎情理的,所以直觉上它应该是正确的,然而尽管不大可能证明它是错误的,却也不大可能证明它是由一些基本或更明显的公理推导出来的。
后来,罗素自己也很关心约化公理的使用,在他的《数学哲学导论》(1919 年)中,罗素说:
从严格的逻辑化来看,我找不出任何理由来相信约化公理是逻辑必然的,这就是说,它在所有可能的世界中都是真的。因此,在逻辑体系中,承认这个公理是个缺憾,即使从经验来看是真的。
在《原理》的第二卷第二版(1926 年)中,罗素重新叙述了约化公理,但这产生了一些新的困难。比如,不允许高阶无穷,省去了最小上界定理,并使得数学归纳法的使用更为复杂。罗素再一次说明他希望能从更明显的公理中推导出约化公理,然而他又一次承认其是逻辑的缺憾。罗素和怀特海在数学《原理》的第二版中一致认为,“这个公理有着纯粹的实际的合理性,它导出想要的结果而不是其他。”他们也意识到它能导出正确结论的事实并不是一个很有说服力的论据,因而做了各种尝试,把数学归结为不含约化公理的逻辑。但他们并没有深入地探讨,而且有些作法被批评为引入了错误的证明。
对逻辑基础更多的批评,指向了无穷公理。批评的焦点在于,整个数学的结构根本上是建立在这个公理的正确性之上,然而却没有丝毫理由来相信其真理性。更糟的是,根本没有办法对其真理性做出判定。而且,它是不是个逻辑公理也还是个问题。
凭心而论,应该指出的是,罗素和怀特海对于将无穷公理作为逻辑公理也很踌躇,他们被这个公理的内容具有“真实的外表”这一事实所困扰,困扰他们的不仅仅是它的逻辑性,还有它的真实性。《数学原理》中术语“个体”的一种解释是构成宇宙的终极粒子或元素,这样一来,尽管无穷公理是以逻辑术语表述的,它却似乎提出了这样一个问题,即宇宙是否由有限个或无限个终极粒子构成的,这个问题或许物理学能够回答,但肯定不是数学或逻辑学所能回答的。然而,如果引入无穷集,如果要证明用无穷公理推导出来的数学定理是逻辑定理,似乎就必须将它作为一个逻辑公理来接受,简而言之,如果将数学“归结”为逻辑,那么,逻辑似乎就一定要包含无穷公理。罗素和怀特海,还使用了选择公理(见第九章),他们称之为乘法公理:给定一个不相交类(互斥类)的类,且它们中没有空类,则存在一个类,恰由每个类中的一个元素组成。我们知道,这个公理所引发的讨论和非议,比其他任何公理都多——除了欧几里得的平行公理。罗素和怀特海为选择公理同样感到不安,他们不能说服自己把它和别的逻辑公理同样地当作逻辑真理。然而,若将由这个公理推出的经典数学归结为逻辑,同样也只有承认它是逻辑的一部分。
约化公理、无穷公理及选择公理的使用,对整个逻辑的观点,即数学可以从逻辑推导出来,提出了质疑:逻辑与数学的区别在哪儿呢?逻辑派观点的拥护者说,《数学原理》中所用的逻辑是“纯逻辑”或“纯化了的逻辑”;另一些人则对于三个有争议的公理耿耿于怀,对所用的逻辑的“纯粹性”提出疑问,因此他们否认数学甚至数学的任何一个重要分支已被归结为逻辑。有些人则愿意将逻辑一词的意义加以推广,使它能包含这些公理。
罗素是坚定的逻辑派观点的捍卫者。有一个时期他为他和怀特海在《原理》第二卷第一版中所做的一切作辩解,在《数学哲学导论》(1919 年)中他说:
(数学和逻辑的)同一性的证明,当然是细节问题。从逻辑和数学共同接受的前提出发,用演绎的方法得到显然是数学的结果,我们就会看出,不可能画出一条清晰的分界线,其左边是逻辑,右边是数学。如果还有些人不肯承认数学和逻辑的同一性,我将提请他指出,在《数学原理》的一系列定义和推导中,他们认为在哪儿是逻辑的结束,哪儿是数学的开始。显然,任何答案都不可能是准确的。
考虑到20 世纪初时关于康托尔的工作和选择公理以及有关无穷公理的非常尖锐的争论,罗素和怀特海没有限定把这两个公理作为他们的整个系统的公理,而只是在特定定理中用到了这两个公理(《数学哲学导论》1926 年,第二版)。然而,有很大一部分经典数学的推导必须用到它们,在《原理》第一卷的第二版(1937 年)中,罗素已放弃了最早的观点。他说:“什么是逻辑的原理,已经变得相当任意了”。无穷公理和选择公理“只能通过经验来证实或否证”。不过,他仍然坚持逻辑和数学是统一体。
然而,批评并未就此中止,魏尔在《数学和自然科学的哲学》(1949年)中说,《原理》中数学的基础不仅仅是逻辑,还有一种逻辑学家的天堂,一个具有某种结构极为复杂的,“终极内涵”的宇宙。......有哪个头脑现实的人会敢说他相信这个超自然的世界呢?......这个复杂的结构对我们信仰力量的压制,并不亚于早期教会神父或中世纪经院哲学的教条。
还有一个关于逻辑主义的批评,尽管在《原理》的三卷中都没有发展几何学,但很清楚,正如我们前面提到的,使用解析几何就可以做到这一点。不过,也有人指出说,《原理》通过归约为自然数的公理集,就把算术、代数和分析归约为逻辑,但是数学的“非算术”部分,例如几何、拓扑学和抽象代数,并没有归约为逻辑。这一观点被逻辑学家卡尔?汉普尔(Carl Hempel)接受,他说:尽管在算术中可能“以纯逻辑概念的术语”给未定义概念或原始概念赋以习惯的意义,“类似的过程却不能用于非算术派生的那些规则中”。另一方面,逻辑学家奎因(Willard Van OrmanQuine)则认为“数学可以归约为逻辑”。因为对几何来说,“一种约化为逻辑的方法唾手可得”,而且拓扑学和抽象代数“符合逻辑的一般结构”。罗素本人则怀疑是否能单从逻辑推出所有的几何。
对于整个逻辑派的观点,还有一种严厉的批评。即:假如逻辑派的看法是正确的,那么,全部数学就是一种纯形式的,逻辑演绎的科学。它的定理遵循思维的规律,而思维规律所做的精巧的演绎,是如何表示广泛的自然现象,数的运用、空间几何、声学、电磁学以及力学的,则似乎无法解释。魏尔就此讥讽逻辑派是从无到无。
彭加勒也同样对其认为是无意义的逻辑符号操作持批评态度。关于他的观点,我们在后文中将给予更多的描述。在1906 年的一篇随笔中(这时罗素和希尔伯特已经对他们的方案给出了充分的描述),他说:这门科学(数学)不必单只为了自己的缘故而永久地注视着自己的肚脐;它与自然相联,而且必然会有回归自然的一天。那时必然要将这些纯语言的定义抛弃,而且不会再为这些空洞的词语所蒙蔽。
在同一篇随笔中,彭加勒还说:
逻辑主义必须加以修正,而人们一点也不知道还有什么东西可以保留下来,毋需多说,这里指的是康托尔主义和逻辑主义;真正的数学,总有它实用的目的,它会按照它自己的原则不断地发展,而不理会外面狂烈的风暴,并且它将一步一步地去追寻它惯常的胜利,这是一定的,并且永远不会停止。
另一种对逻辑派的严肃批评断言,在数学的创造中,感性的或想象的直觉必须提供新的概念,而不管它是否来自于经验。否则的话,新的知识从哪里产生呢?但是在《原理》中,所有的概念都归约为逻辑概念。形式化显然在任何实际意义下,都不能表示数学,它只有外壳,没有内涵。罗素本人在另一场合曾说:数学是这样一门学科,在其中我们永远不会知道自己所讲的是什么,也不知道我们所说的是不是真的。这就可以用来反驳逻辑主义。
新的思想如何被引入数学?如果数学的内容可以全部由逻辑推出,那它怎么能用于现实世界?对此并不容易回答,罗素和怀特海也没有给出回答。逻辑主义不能解释为什么数学适用于物理世界这一论点被数学适用于基本物理原理这一事实反驳了。而这一点,只要涉及到实在,就成了前提。数学技术勾画出物理原理的含义,譬如说PV=常数,F=ma。这结论仍然适用于物理世界,这就产生了疑问:为什么世界符合数学推理呢?我们后面将要回到这个问题上来(见第十五章)。
在《数学原理》第二版出版后的几年中,罗素继续考虑逻辑派的方案,在1959 年的《我的哲学发展》中他承认他的哲学发展,就是由逐步放弃“欧几里得主义”到尽可能地拯救其确实性构成。毫无疑问,对逻辑主义的批评,影响了罗素后来的思想。本世纪初罗素刚开始他的工作时,他认为所有的逻辑公理都是真理。在《数学原理》 1937 年的版本中,他放弃了这个观点,他不再相信逻辑的原理是先验真理,而数学是从逻辑推导出来的,所以它也不是先验真理。
如果逻辑的公理不是真理,那么逻辑主义就没有回答数学的相容性这一最为重要的问题。含义模糊的约化公理使相容性陷入了更大的窘境。在《数学原理》的第一、二版中,罗素对于接受约化公理的原因是:“由它可以推出许多毋庸置疑的命题,如果约化公理是错的,那就没有同样可信的方法可以保证这些命题的正确性了,并且从它也推不出什么可能错误的命题”。罗素解释的这番原因,实际上并没有什么意义。《数学原理》中接受的(在许多逻辑系统中也接受的)实质蕴涵,甚至当其原命题不成立时,也允许蕴涵成立。因此如果一个假命题P 被作为公理引入,则p 隐含g 可以在此体系中成立而且g 仍然可能真。既然在《数学原理》的逻辑中,一个“不容置疑”的命题,可以从一个错误的公理中推出来,因此,这样一个论点是毫无意义的。
《原理》受到许多方面的批评,我们在上面并没有给予明确的考虑。型的分层证明是有效的和有用的,但它是否完全达到了它的目的,我们并不确定。型的方法的引入是为了防止产生悖论,而且它确实有效地阻止了集合论和逻辑中已知悖论的产生,但这并不能保证不会出现新的悖论,届时型的分层恐怕也于事无补。
然而,有些卓越的逻辑学家和数学家,例如奎恩和丘奇(Alon-zoChurch)尽管对逻辑主义的现状有所指责,却仍大力倡导它。许多人从事着消除其缺陷的工作。一些并不全然赞同逻辑主义观点的人说,逻辑,继而数学,是分析的,也就是说,它仅仅是对公理所陈述的扩充。这样,一些逻辑派方案的热心支持者,转而去寻找消除它引起反对的原因和它发展中的一些冗赘之处,这被一些人视之为遥不可及的理想。还有一些人,攻击它是完全错误的数学概念。总而言之,就那些可疑的公理和冗长而复杂的发展来看,批评者们有充分理由说逻辑主义是由不确定的假设来推出已知结论的。
另一方面,罗素和怀特海的工作确实做出了贡献。逻辑的数学化始于19 世纪后期(见第八章),罗素和怀特海进行了一次彻底的完全符号形式的逻辑公理化运动,从而大大推动了数理逻辑这门科学。对逻辑主义也许可以用罗素在《记忆之像》中的一段话作为最后的总结:
我像人们需要宗教信仰一样渴望确定性,我想在数学中比在
任何其他地方更能找到确定性。但我发现,许多数学证明——我的老师希望我接受——却是错误百出。而且,假如真的在数学中找到了确定性,那它一定是数学的一个新领域。它有比迄今为止认为是安全的领域更加坚实的基础。但当工作进行时,我不断地想到大象和乌龟的寓言。把大象置于整个数学的基础上之后,我发现大象摇摇欲坠,于是再造一个乌龟来防止大象倒下,但这乌龟不比大象更安全。而在经过20 年左右的艰苦工作后,我得出的结论是,在对于使数学更确信无疑这一工作上,我已无能为力。
在《我的哲学发展》(1959 年)一书中,罗素承认“一直以来,我希望在数学中找到的绝对的确定性消失在一个令人迷惑的迷宫中了。......它确是一个复杂的概念的迷宫。”而这也不是罗素一人的不幸。
正当逻辑主义形成之时,一群称为直觉主义者的数学家们使用了截然不同、全然相反的方法来证明数学的确定性。逻辑主义者越来越依赖于精巧的逻辑来加固数学的基础。而另一些人却在偏离甚至放弃逻辑,这真是数学史上最富矛盾的一件趣事。从某一方面来说,二者追求的是同一目标。19 世纪后半期的数学从阐述现实世界设计的固有法则这一意义上来说,已经放弃了对真理的追求。早期的逻辑主义者,特别是弗雷格和罗素,相信逻辑是一个真理体系。因此,如果数学确实是建立于逻辑之上,则它也是真理体系,尽管他们最后从这一立场退到了只要实用认可的逻辑原理上。直觉主义者则通过唤醒人们内心所确认的约束意识来寻求数学真理。从逻辑原理所推导出来的东西,不比直接感悟的更可信,悖论的发现,不仅肯定了逻辑主义不可信,也促进了明确的直觉主义观念的形成。
从广义的角度来讲,直觉主义可以追溯到笛卡尔和帕斯卡。在《思维的指导法则》一书中,笛卡尔说:
我们不惮错漏地在此公布知性上升为知识的途径,这样的途径有两种:直觉和演绎。我所说的直觉并非各种感觉的验证,也不是被自然而然夸大的想像的错误判断,它是来自于缜密的头脑中的概念。它是如此清晰和明白,对于它所理解的东西,根本不含任何可疑之处,或者说——两种说法其实是一样的——审慎而缜密的头脑中自明的概念,是仅由理性获得的概念,并且因为更简单而比演绎本身更确定。尽管我们在前文中所说,在演绎过程中,人的头脑也不会出错。因而,我们每个人都可凭直觉知道:我们存在、我们思考、三角形仅由三边围成、球面由单面所围成、以及如此种种。......
也许有人要问,为什么要在直觉中加入这种由演绎得来的其他类型的知识,也就是说,加入了从我们对其有确定知识的事物中得到其必然结果的过程。我们不得不采用这第二步,因为对于许多并不是自明的事物,只要它们是从真理和无可争辩的原理中而来,并经过连续不可分的思维活动(对每一件事都有清楚的直觉)得到,那么它们就会打上确定性的烙印。正如这样一种情况:尽管我们不能在一瞥之间就把一条长链中的所有中间环结尽收眼底,但如果在依次看过以后,我们能回想起它们从头到尾都是一环扣着一环的,那么,我们就可以知道最后一环和第一环是连在一起的。这样,我们将直觉和演绎区分开来,因为在后一种情况中我们构想了某种步骤或顺序,并且与前一种情况中的不同。......由此,我们便通过直觉或演绎(这要取决于我们如何看待它们)得到直接出自于原理的命题。尽管这些原理本身只能由直觉知晓,而稍远的结果则只能依靠演绎得到。
帕斯卡也十分相信直觉,在数学研究中,他表现出了极强的直觉力,他预见到了重大的结果,作出了超人的猜测,并找到了捷径。后来他视直觉为一切真理的源泉,在这方面他的一些话久已闻名于世。“心有其理,非理之所能知。”“推理是那些不明真理的人用以发现真理的迟钝、愚笨的方法。”“孱弱无能的理智啊,你该有自知之明”。
从很大程度上来说,直觉主义是由哲学家康德开始的。尽管他主要是个哲学家,但康德于1755 年1770 年间却在哥尼斯堡大学教授数学和物理,
他认为我们的所有感觉都来自于一个预先假定的外部世界。然而,这些感觉或感性知识并不能提供多少知识,所有感性知识都包含了感知者和被感知物体间的相互作用。心智将这些感性知识梳理清楚,得到对空间和时间的直觉。空间和时间并不是客观存在的,而是心智的创作。心智,为经验提供了对空间和时间的理解,而经验只是唤醒心智。知识可能是从经验开始的,但并不真正来源于经验,而是来源于心智。独立于经验,我们可以在先验的或真正的知识中前进多远,数学是其光辉的例证。康德称这样一种方法为综合方法。即它能够提供新的知识,而分析的命题,例如“所有物体都是可延展的”,并不能提供新的知识,因为延展性是物体固有的属性。相反,直线是两点间的最短距离,这一命题是综合的。
尽管康德在肯定欧氏几何是先验综合真理这一点上是错误的,这却是他那个时代中哲学家和数学家普遍信奉的观点。由于这一错误,后起的哲学家和数学家便对他的哲学体系抱怀疑的态度。然而,康德关于时间是直觉的一种形式的分析,以及心智提供基本真理的普遍观点却具有经久不衰的影响力。
如果数学家们对笛卡尔、帕斯卡、康德这些人的观点了解得更多一些,他们就不至于被直觉派的思想所震慑,至少在刚开始的时候,这种思想被认为是过于偏激了。不过,笛卡尔、帕斯卡或康德都没有提供一种对全部数学的直觉方法,就数学基础的方法而言,直觉主义确实是现代的。现代直觉主义最近的先驱是克罗内克,他的警句(在一次餐后演说中所说)“上帝创造了整数,其他的都是人的工作”广为人知。在他看来,像康托尔和戴德金通过一个一般集合论得出的普通整数的复杂的逻辑推导,比直接接受整数还不可靠。因为在直观上这是清楚的,而且无需更可靠的基础。除整数外,所有的数学结构必须建于具有清楚意义的术语的基础之上。克罗内克建议把实数系统的结构建立在整数和可以计算实数的方法基础之上,而不是仅仅给出一个一般的存在定理,因此,他接受了无理数,因为它们是多项式方程的根,且是可以计算的。
康托尔证明了存在超越无理数,即不是代数方程的根的无理数。 1882年,林德曼(Ferdinand Lindermann),证明了π是一个超越无理数,就此,克罗内克对林德曼说“你那关于π的美妙的探讨有何用处呢?既然根本不存在这样的无理数,为什么要研究这样的问题呢?”克罗内克并不是否认所有的无理数,而仅仅是针对那些不能提供怎样计算的证明的。林德曼的证明不是构造性的,事实上,借助于π的一个无穷级数表示式,π可计算到小数点后的任意位,但克罗内克并不接受这个级数的导数。
克罗内克只承认“潜无限”,因此,他拒绝接受无穷集和超限数。他认为:康托尔在这一领域的工作不是数学,而是玄学,经典分析只是文字游戏而已。他应该加上这么一句:如果上帝还有另一种数学,他应为他自己而创建。克罗内克陈述了自己的观点,但并未继续发展下去,也许,他对自己偏激的观点并不是太认真。鲍莱尔、贝尔、勒贝格可称为半直觉主义者,他们对选择公理的反对我们已有论述。他们把实数系作为基础,他们的详细观点颇具历史意义。因为,尽管他们关于具体的事物有着自己的看法,但他们都没有能深化一门系统的哲学。彭加勒与克罗内克一样,认为不必定义整数,或在公理基础上构造它们的性质。因为我们的直觉先于这一结构而存在。彭加勒还认为,数学归纳法并不真正保证结论的普遍性和新结果的产生,它听起来是直觉的,但却不能把这一方法归结为逻辑。
彭加勒认为,数学归纳法的本质还需要检验,因为它至今仍是争论的一个核心。用这种方法,例如,要证明对所有的正整数π有1+ 2 + 3+ + n =n2? (n +1) (1)需要证明n=1 时结论为真,然后证明若对于正整数k 结论成立,则对于k+1也成立。因此,彭加勒提出,这种方法引入了无限多个变量。这种方法肯定,由于(1)在n=1 时为真,故n=2 时为真。由于n=2 为真,则n=3 时为真;如此类推,对所有的正整数都为真。由于没有容括无限个变元的逻辑原理,因而归纳法并不能从这样的原理推出。因此,彭加勒认为相容性并不能由所谓的数学到逻辑的归约得到证明。
至于说到无穷集,彭加勒认为“真正的无限并不存在,我们所说的无限,只是无论已有多少物体存在,但创建新的物体的无穷的可能性仍存在。”
彭加勒全然反对繁杂的符号逻辑方法,在他的《科学与方法》中,他甚至讥讽它。他说到了布拉利-福蒂在1897 年的一篇文章中对整数的定义简直是个符号的迷宫。彭加勒说,这对于从未听说过数1 的人来说,是个绝好的定义。他又进一步地说:“我很担心,这个定义包含了一个预期理由①,因为我注意到了其前半部分的数1 和后半部分的字非。”
彭加勒接着便援引了库蒂拉这位早期的逻辑主义支持者关于零的定义,零是“空类的元素个数。那么什么是空类呢?空类是不含元素的类。”库蒂拉接着又给出了符号化的定义。彭加勒解释说:“零是满足一个永远不能满足的条件的物的数目。但是因为‘永远不能’指的是‘在任何情况下都不’,我无法看出这里有任何大的进步。”
随后,彭加勒批评了库蒂拉关于数1 的定义。库蒂拉说,1 就是任何两个元素都相同的类的个数。“但是,如果我们问库蒂拉,2 是什么时,恐怕他又不得不使用1 了”。
直觉主义的创始人,克罗内克、鲍莱尔、勒贝格、彭加勒和贝尔都是数学巨匠,他们对标准数学证明和逻辑派的方法提出了大量的批评,他们提出了新的原理,但其成就却是零星和不完整的。他们的观点由荷兰数学教授、也是直觉主义哲学的奠基人布劳维并入了一个明确的阐述中。布劳维在他的博士论文《论数学的基础》(1907 年)中提出直觉主义哲学。从1918 年开始他在许多杂志上阐述和发展了他的观点。
① 一种逻辑错误。把未经证明的判断作为证明论题的依据。——译注
布劳维在数学上的直觉主义立场来源于他的哲学。数学是起源和产生于头脑的人类活动,它并不存在于头脑之外,因此,它是独立于真实世界的。头脑识别基本的、清晰的直觉,这些直觉不是感觉或经验上的,而是对某些数学概念直接的确定,其中包括整数。基本的直觉是对一个时间序列中的不同事件的确认,“当时间进程所造成的贰性(twoness)的本体,从所有的特殊事件中抽象出来时,就产生了数学。所有这些贰性的共同内容所留下来的空洞形式就变成数学的原始直觉,并且由无限反复而产生了新的数学对象。”布劳维认为无限反复意指自然数的连续序列的形成。康德、哈密尔顿(在他的《代数:时间的科学》中)以及哲学家叔本华(ArthurSchopenhauer)都曾坚持整数来源于时间的直觉这一思想。
布劳维认为数学思维是智力构造的一个过程,它建造自己的天地,独立于经验,并且只受到必须建立于基本的数学直觉之上的限制。这种基本的直觉概念不应被理解为像在公理理论中的那种未下定义的概念,而应设想为某种东西,只要它们在数学思维中确实是有用的,用它就可以对出现在各种数学系统中的未下定义的概念做出直观上的理解。另外,数学是综合的,它包含的是真理而不是推导出逻辑的隐含意义。
布劳维认为“要在这个构造过程中发现数学唯一可能的基础,必须再三思考,反复斟酌:哪些论点是直觉上可接受的,头脑中所自明的;哪些不是。”是直觉而不是经验或逻辑决定了概念的正确和可接受性。当然,必须记住,这一陈述并未否认经验所起的历史作用。
除了自然数以外,布劳维坚持认为加法、乘法和数学归纳法在直觉上是清晰的。而且,当头脑已获得自然数1,2,3......的概念后,使用“空洞形式”无限重复的可能性,从n 到n+1 的步骤,就产生了无穷集合。然而,这种集合只是潜无穷,因为对于任一给定的有限数集,总可以加入一个更大的数。布劳维否定了康托尔的所有元素都“一下子”出现的无限集,并因此否定了超限数理论、策梅罗的选择公理以及使用了真正的无限集的那部分分析。在1912 年的一次演讲中,布劳维确实接受了直至ω的基数和可数集。他还承认了由有理数序列无规则排列所定义的无理数,即“自由选择的序列”。这一定义是模糊的,但确实给出了一个实数的不可数集。而在另一方面,几何则涉及到了空间,因此,它不像数那样是完全受我们头脑支配的,综合的几何学属于物理科学。
关于无穷集的直觉派的观点,直觉主义者魏尔在1946 年的一篇文章中写道:
数目的序列,其增长超过任何一个已达到的阶段,......它是一簇开向无穷的可能性;它永远处于创造的状态中,并不是一个本来就存在的封闭王国。我们盲目地把一个转换为另一个,这正是我们的困难(包括那些矛盾)的真正根源——这是比罗素的恶性循环原理所指出的更为基本的根源。布劳维让我们睁开了双眼,他使我们看到:在超越一切人类所能实现绝对信仰中培育起来的经典数学走过了头,它与那些可称为真实意义和真理(以显明为基础)的命题间究竟有多远。
布劳维接着讨论了数学与语言的关系。数学是一个完全自足的活动,它独立于语言,措辞和语言表达只是为了阐述真理,数学思想更深地扎根于人脑中而不是在语言中。数学直觉的世界与感知的世界相对,语言作为理解一般事物的工具存在于后者中,而不是数学中。语言通过符号和声音唤起人脑中思想的摹本,其区别类似于爬山的行动与用语言来描述这一行动之间的区别。但是数学思想不依赖于语言的外衣,并且事实上要更为丰富。就算采用了包括符号语言的数学语言,思想也无法被完全地表述出来。此外,语言与真正数学的主旨也是大相径庭的。
更有意思的是直觉主义关于逻辑的立场,这一点在它反对逻辑主义时尤为突出。逻辑属于语言,它提供了一套规则体系,用以导出更多的词语关系,这也是为了交流真理。然而,这里所说的真理在被从直觉上领悟之前并不是真理,而且也并不能保证它一定能被领悟到。逻辑并不是发现真理的可靠工具,用别的方法不能得到的真理,逻辑也一样不能推导出来。逻辑的原则是在语言中归纳观察到的规律性。它们是运用语言的一种手段,或者说,它们是语言的表现理论,逻辑只不过是一座宏伟的语言大厦。数学上最重要的进展不是通过完善逻辑形式而是通过变革其基本理论来得到的,是逻辑依赖于数学,而不是数学依赖于逻辑。逻辑远不如我们的直觉概念可靠,数学也并不需要逻辑来保证。历史上,逻辑原理是从有限的物体集合的经验中抽象出来的,而又符合一个先验的有效性,于是,也就适用于无限集合了。
由于布劳维不承认任何先验的,有约束力的逻辑原理,也不承认这种
从公理推导结论的数学工作,因此他拒绝接受19 世纪后期的公理化运动和逻辑学派。数学不受逻辑规则的限制,懂得数学并不需要懂得形式的证明,由于这一原因,那些悖论变得无足轻重。悖论是逻辑而不是真正的数学的缺陷,因此,相容性这个魔鬼没有任何的意义。相容性肯定是正确思想的结果,这些思想是有意义的,其正确性可以通过直觉来判定。
然而在逻辑的领域中确有一些清晰的、直观上可接受的逻辑原理或程序,它们可以用来从老定理中确定新定理,这些原理是基本数学直觉的一部分。可是并非所有的一般逻辑原理都可被基本直觉所接受,我们对从亚里士多德时代以来就被接受的逻辑原理必须要有所判别。数学家们一直是过于随便地使用着有限制的亚里士多德法则,以至于导致了自相矛盾。直觉主义者会问,在处理数学结构时,如果偶尔忽略了直觉而工于语言结构,那么什么又是允许的或安全的呢?
因此,直觉主义者们对哪些逻辑原理是允许的进行了分析,以使通常的逻辑与正确的直觉一致并能把它正确地表达出来。布劳维引用了排中律——这个被用得过于随便的逻辑原理为例。这个原理在历史上起源于推理在有限集合上的应用,并由此抽象而来。它肯定两个有意义的断言或真或假,后来它就被认为是一条独立的、先验的法则,并且不加证明地被应用到无穷集合上去了。对于有限集可以通过检验每一个元素来判断是否所有的元素都具有某个特定的性质,而对于无限集合这个规则则不可实现。我们可能碰巧得知一个无限集合中的某个元素不具有这个性质,或者通过构造某种集合得知或证明每个元素都具有这个性质。但无论如何,我们都不能用排中律来证明这个性质是成立的。
这样,如果有人证明了在一个无限整数集中,不是所有的元素都是偶数,而得到至少存在一个奇数的话,该结论将被布劳维所否定,因为这一论证把排中律应用于无限集合。但是,此类论证在数学实体的存在性证明中被广泛地采用,例如在证明每个多项式方程都有一个根中(见第九章)就用到了它,因此许多存在性证明是不为直觉主义者所接受的。他们说,这样的证明对假定存在的实体来说太模糊了,排中律只可用于有限集合的情况。因此,对于一个有限整数集,如果证明了不是所有的元素都为偶数,那么就可以得出至少有一个为奇数的结论了。
魏尔对直觉主义关于逻辑的观点做了如下扩充:
根据他(布劳维)的观点和对历史的知识,经典的逻辑是从
有限集及其子集的数学中提取出来的。......忘记了这一有限的起源,人们就会错误地把逻辑看作是高于并且先于全部数学的某种东西,从而最终不加证明地将其应用到无限集合的数学中去。这是集合论的堕落和原罪,而悖论的出现就是其应受的惩罚。令人惊讶的不是这种矛盾的出现,而是矛盾出现得如此之晚。后来魏尔又补充道,“排中律可能对上帝来说是有效的,他能够一下子检查完自然数的无穷序列,而对于人的逻辑,这一点却是做不到的。”布劳维在1923 年的一篇论文中给出了一些定理的例子。如果我们否定排中律在无限集合上的应用,那么这些定理就是不成立的。①尤其是波尔查诺-维尔斯特拉斯(Bolzano-Weirstrass)定理——每个有界无穷集有一极限点——是不能证明的。闭区间上连续的函数存在极大值也是不能证明的。还有海涅-鲍莱尔(Heine-Borel)定理,即从任一个包含或覆盖一个点的区间的区间集中可选出有限个覆盖该区间的集,也遭到了否定。当然,这些定理的推论也是不可接受的。
除了反对不受限制地使用排中律来建立数学实体的存在以外,直觉主义者还提出了另一要求。他们反对用所有元素的属性来定义集合,例如,用红色这个属性来定义集合。直觉主义者认为适于进行数学讨论的概念或对象——确实存在的对象——必须是可构造的;也就是说,必须给出一种方法来在有限步骤内举出一个或多个实体,或者一种能将其计算到任意精度的方法②。这样,π是可以接受的,因为我们可以把它计算到任意小数位。如果只是证明了存在整数x、y、z、n 满足在n≥2 时,xn+yn=zn,但并未将这些数具体化,那么,直觉主义者是不会接受这一证明的。另一方面,素数的定义是构造性的,因为可以用有限的步骤确定一个数是否为素数。我们来考虑另一个例子。孪生素数是两个形如l—2 和l 的素数。例如,5 和7,11 和13 等等。是否存在无穷多对这样的孪生素数在数学上一直是悬而未决的问题。让我们任意定义一个使l—2 也是素数的最大素数l,如果这样的l 不存在,则定义l=1。经典主义者认为l 的定义是无懈可击的,不论我们是否知道有最后一对这样的孪生素数存在。因为,由排中律可知,这样的最后一对数要么存在,要么不存在。在第一种情况下,l 是使l—2为素数的最大素数。而在第二种情况下l=1,我们不能实际计算出l 的这一事实对于非直觉主义者来说是无所谓的。但是直觉主义者不接受上述l的“定义”是有意义的,除非可以计算出l,即除非是否存在无穷多对孪生素数这一问题得以解决。用选择公理构造无穷大的集合也是不被接受的。上面的一些例子说明:有些存在性证明不是构造的。因此,除了它们可能用了排中律以外,还有其他的理由来拒绝接受它们。
魏尔认为,非构造性的存在证明告诉世人宝藏的存在,但并未说明其地点。当用这样的证明来代替构造性证明时,其重要性和价值不可能毫无损减。他还指出,坚持直觉主义哲学意味着放弃经典分析的基本存在定理。魏尔称康托尔有关超限数等级的论述有如雾中之雾。他在《论连续》(1918年)中写道,分析是建立在沙地上的楼阁,只有由直觉方法建立起来的东西才是确定的。
① 从我们这里的目的出发,定理这个词的专用意义毋须深究。这里只是用来给出特定的例子。——原注
② 彭加勒是个例外。他认为形式主义者(见第十一章)可以接受不导致悖论的概念。——原注
对排中律的否定产生了一种新的可能性——不可判定的命题。对于无穷集合,直觉主义主张还有第三种状况,即可以有这样的命题,既不是可以证明的,也不是不可以证明的。他们给出了下面的例子:让我们定义π的十进制展开式的第k 位出现了第1 个零,其后依次跟着1 到9 这些整数。亚里士多德的逻辑认为k 或者存在,或者不存在。遵循亚里士多德的数学家则以此两种可能性为基础进一步进行论证。布劳维和直觉主义者普遍反对所有这类论证,因为我们并不知道我们是否能够证明k 存不存在。因此,根据直觉主义者的观点,一些明白而重要的数学问题永远不能在任何一种数学基础上得到解决。这个问题对于我们来说似乎是可以断定的,但实际上我们信念的基础只不过是因为它们涉及到了过去已经断定了的数学概念和问题。
按直觉主义者的观点,关于实数系、微积分、现代的实函数理论、勒贝格积分以及其他方面的经典结构和逻辑主义结构是不可接受的。布劳维和他的支持者们没有局限于批评,而是试图把数学建立在他们所描述的结构的基础之上。他们成功地挽救了上述学科的一部分,但是他们的结构过于复杂。就连魏尔也抱怨说,这些证明笨拙得令人难以忍受。另外,直觉主义者还重构了代数和几何的基础部分。
然而,重构工作进展缓慢。因此,希尔伯特在他的《数学的基础》(1927年)一文中说,“与现代数学的突飞猛进相比,直觉主义者所取得的少而孤立的结论既不完善也不相互关联,这些可怜的残余算得了什么。”当然,1927 年时,直觉主义者在按他们的标准重构经典数学方面,还没有取得太大的进展,但来自他们的哲学对手的挑衅激怒了他们。从那时起,越来越多的直觉主义者着手重建基础的工作。不幸的是,与逻辑学派一样,他们在什么是可接受的基础这一问题上也产生了分歧。有的认为应剔除所有广义集合论公理化的观点,他们限定自己只使用可以被有效定义或构造的概念。有的则是构造主义者,他们并不那么极端,他们不但不怀疑经典逻辑,而且还利用它所有的观点。有的则承认一个数学客体的类,并以此坚持构造过程。这样一来,就有许多人承认至少有一个实数类(不能扩展到整个实数连续统);而另一些人则只接受整数,他们只愿意考虑诸如那些可计算的其他数和函数的概念,而那些被认为是可计算的东西也不尽相同。因此,一个数如果可被某些由可接受的数构成的集合越来越精确地逼近,就好像一个一般无理数能被一个有限小数越来越精确地逼近,那么它就是可计算的。
不幸的是,构造性的定义绝不能说是清晰明确的。我们来考虑下述关于数N 的定义:N = 1+(-1)10pp假设p=3,则N=1-0.001 或0.999。设p=2,则N=1.01。现在我们把p 定义成π的十进制展开式中出现序列123456789 后的第一位。若不存在这样的p,我们定义N 为1;若存在这样的p 并且为一偶数,则N=1.000......直到第p 个位置,N 的小数部分在这一位上是1。若p 为奇数,则N=0.999......直到第p 位。然而我们并不知道这样定义的p 是否存在。若不存在,则N=1,若存在,但并不在π的十进制展开式的头一千位内,则我们不能写出N 的值。然而N 是被定义了的,甚至定义到了任意精度位上,N 还是构造性定义的吗?
当然,使用了选择公理或连续统假设的存在性证明不是构造性的,因此不仅对直觉主义者,甚至对许多非直觉主义的数学家来说都是不可接受的。
虽然在构造主义者之间存在着分歧,但还是可以说,他们重建了经典数学中的很大一部分。有些重建的理论所肯定的东西不如在经典理论中的多,对于这个问题,直觉主义者的回答是:尽管经典分析是有用的,但它的数学真理性却比较少。总之,他们的进展受到了很大的限制,而且,将他们的工作扩展到先前已接受的数学中去的前景并不美妙。由于进展缓慢,甚至连布尔巴基学派的数学家(关于他们,我们将在后文中讲述)也在1960 年说:“毫无疑问,直觉学派注定将会只作为一个历史奇观而被缅怀。”对直觉主义的批评可以引用诗人S.霍芬森的一段诗:
一点一点的,我们从事实中
抽去谬误,也抽去信念,
仅靠残留的真实的幻影,
我们忍饥挨饿,勉强为生。
然而,对直觉主义者来说,如果建立一个合理的基础必须牺牲经典数学的一部分,甚至是牺牲康托尔的超限数“天堂”的话,这个代价也还是不算太高的。
尽管直觉主义的反对者对直觉主义这种数学哲学的驳斥过于傲慢和武断,但对许多持有同情心的人们的批评则必须严肃对待。有这样一种批评指出,直觉主义者努力重建的,与其原则相一致的理论并不能由人类的直觉提出,也很难用人类的直觉来保证。这些理论已被数学家所用过的所有方法、所有类型的推理、猜想、从特殊情况中所得到的归纳,以及那些来源不明的瞬间灵感所得出。因此,在实践中,像所有的数学家一样,直觉主义者实际上依赖的是常规的建立方法,甚至是古典逻辑,尽管直觉主义者寻求的是一种与他们自己的原则相一致的重建理论的证据。直觉主义者也许会这样回答:尽管须要用到一些发现的常规方法,它们的结论还是肯定能被人类的直觉所接受的。然而,在不否定直觉主义中其他思想的重要性的情况下,事实仍然是:许多连直觉主义者都接受的理论对直觉来说也是如此的微妙和不可思议,很难相信人的头脑能直接认识到它们的真实性。
创造的常规方式和数学的理想化、抽象化的常规方式是基本的,这一论断由F.克莱因和帕斯更推进了一步。直觉能发现一种连续却无处可导的函数或一条填满正方形的曲线(皮亚诺曲线)吗?这种创造,即使可由直觉提出,也必须经过理想化和抽象化的提炼。克莱因说简单幼稚的直觉是不准确的,而经过提炼后的直觉却又根本不是真正的直觉,它来自于建立在公理基础上的逻辑发展。我们将最终依赖于从公理出发的逻辑推理。对此,布劳维说,一个公理系统必须用解释或模型的方式来证明相容性(见第八章),而这种解释或模型本身也必须是相容的。他尖锐地问道,我们总能找到这样的解释,而且不依赖于直觉基础而接受其相容性吗?
魏尔也对传统的创造方式和证明更为有力这一断言提出了挑战。在他的《思维与自然》(1934 年)中,他说:“那种指望着揭示一个比展现在直觉面前的自然更为深入的自然的想法是个不太可能实现的梦想。”
一些直觉主义者的对手们也赞同数学是一种人类的创造。但他们认为对错是客观决定的,而直觉主义者依靠的却是难免出错的人类头脑的自明。在希尔伯特和伯奈斯(Paul Bernays)关于数学基础问题的著作第一版的论述中,我们看到了直觉主义哲学致命的弱点。如果正确性意味着人类头脑的自明,那么我们可能依赖什么样的概念和推理呢?而对所有人类都具有客观有效性的真理又在哪里呢?
另一个对直觉主义的批评指出直觉主义与数学在自然中的应用无关。直觉主义没有把数学和感知联系起来。布劳维承认直觉主义没有实用价值,实际上,布劳维否定人类对自然的支配。不管批评是什么,魏尔在1951年说,“我想每个人都必须接受布劳维的批评,他所想要坚持的是这样一个信念:数学命题陈述的是纯粹的真理,基于显明的真理。”
直觉主义学说引起了一个相关的问题。正如我们所知,他们坚持认为正确的,可接受的思想能被并且已被人类的头脑所领悟。这些思想并非起源于语言形式,实际上,语言只是传输这种思想的一种不完善的工具。这个已被详细讨论过的问题就是思想是否能脱离语言而独立存在。一方面,存在着这样一种观点,可用圣约翰在《福音》中所说:“打世界创立之初,就存在着语言。”尽管圣约翰并没有什么数学头脑,但他的论述却与希腊哲学观和一些现代心理学家的观点不谋而合;另一方面,见克莱则坚决认为语言是思想的累赘。
欧拉在给普鲁士王国腓特烈一世的侄女安霍-德骚(Anhalt-Dessau)公主的信中(发表于1768—1772 年间),讨论了这个问题:无论一个人运用抽象的能力有多么强,同时还在头脑中融入了一般的思想,但如果没有书面的或口头的语言作为帮助,他就不可能取得重大的进展。这两种方式都包含了大量的词汇,它们只是与我们思想相对应的一些特定的符号。它们的含义是由习俗或由群居在一起的人们的默认所决定的。
从这里可以看出,对人类来说,语言唯一的目的就是在人类之间相互传递他们的感知。一个孤立的人没有它也可以过得很自在,但我们只要稍加思考就足以明白:人类确实需要语言。这是与其他人沟通的需要,同时也是培养、磨炼他们自己的思想的需要。
阿达马在《数学领域中的创造心理》(1945 年)中考查了这样一个问题:数学家们是如何思考的。他发现在创造过程中,所有的数学家实际上都避免使用准确的语言,他们用的是含糊的、可见或可触摸到的印象。爱因斯坦在一封信中(后被载入阿达马的书中)描述了这种思维模式:写下来的词句或说出来的语言在我的思维机制里不起任何作用。......那些似乎可用来作为思维元素的心理实体,是一些能够“随意地”使之再现并且结合起来的符号和多少有点清晰的印象。......对我来说,上述那些元素是视觉性的,也有一些是肌肉型的。只有在第二阶段,才有必要费神地去寻求惯用的词或其他记号。......
当然,形象化在创造行为中起了主要作用,将欧几里得平面划分为两部分的无限长直线就来自于形象。这样,问题就可以归纳为,大脑对一个事实(不管是怎样得到的)的把握是否已达到如此确定的程度(就如同直觉主义者所主张的那样),以致于使用准确语言和逻辑证明来表达变得不是那么重要了呢?作为一种能促进与形式逻辑主义者交流的友好表示,海丁(ArendHeyding)这位继布劳维后的直觉主义的主要倡导者,在1930 年发表的一篇论文中,提出了直觉主义命题逻辑的形式法则。其中只包括了经典形式逻辑的一部分。例如,海丁允许p 为真的命题蕴涵着p 为假为假的命题。但是如果p 为假为假,却不能导出p 为真,因为关于p 的断言是不可构造的。排中律——p 或非p 必为真——这里没有用到。但是如果命题p 蕴涵着命题q,那么q 的否命题则蕴涵着p 为假。直觉主义者并不认为这种形式化是基本的,它只是对思想的不完全表达。此外,形式化并非海丁一家所独有,直觉主义者在可接受的逻辑原则问题上各有分歧。
尽管直觉主义者对数学添加了很多限制,尽管还存在着来自直觉主义哲学其他部分的批评,但直觉主义却带来了有益的影响。它首次严肃讨论了有关选择公理的问题并将其放到了显著的地位上。数学中的存在性意味着什么?它对于解释魏尔的理论,对于知道那个具有特殊性质却无法认识或计算的数的存在有什么好处吗?那种对排中律没有限制地、天真地扩展无疑需要重新考虑。直觉主义者最有价值的贡献也许就是他们在计算数或函数问题上所坚持的主张,即在论证这些数及函数的存在时,仅证明不存在将会导致矛盾。要详细了解这些数就好像要与朋友住在一起而不是仅仅知道有个朋友住在这个世界的某个地方。
逻辑主义者与直觉主义者的对抗只是在围绕着建立数学的适当基础的纷争中的首次交锋。其他的竞争者也加入了这场纷争,我们暂且拭目以待。
第十一章 形式主义与集合论公理化基础
与现代数学的浩翰大海相比,那点可怜的残余算什么。直觉主义者所得到的是一些不完整的、没有联系的孤立的结论。
——大卫?希尔伯特
出现于本世纪头10 年,在数学基础上观点完全相反的逻辑主义与直觉主义哲学,只是这场大纷争中首先登场的两大派系。关于数学基础思想的第三大派系是由大卫?希尔伯特领导并风行一时的形式主义派,而第四大派系集合论公理化派则是由策梅罗创建的。
希尔伯特在1900 年国际数学家大会的发言(见第八章)中,强调了证明数学相容性的重要。他还提出一种实数的良序方法,正如我们从策梅罗的工作中所知道的,良序原理等价于选择公理。最后,希尔伯特还建议数学家们致力于证明连续统假设的工作,这种假设声称在à0。和c 之间不存在别的超限数。早在令人困扰的悖论和关于选择公理的争论产生以前,希尔伯特就预见了解决所有这些问题的必要性。
在1904 年第三届国际数学家大会上,希尔伯特本人提出了他解决数学基础问题方法的纲要,其中包括证明相容性的方法。但是他在一段时间内并没有做更多实质性的工作。在以后的15 年中,逻辑主义者和直觉主义者广泛地发展了他们的学说,但希尔伯特委婉地指出,他对他们关于数学基础问题的解答并不满意。
希尔伯特相当冷静地驳回了逻辑主义思想。正如他在1904 年的演说和论文中所讲的,他主要的反对理由是,在逻辑漫长而复杂的发展过程中实际上已涉及到整数,尽管没有这样称呼它们。因此在逻辑的基础上建立整数的概念实质上就是循环论证。他还批评了以集合的属性来确定集合的方法:这样就必须通过层次和层次论来区分命题和命题函数,而层次论需要用到引起争议的约化公理。他很赞成罗素和怀特海的关于无穷集合应被包括进入的观点,但这须用到无限公理,希尔伯特希望别人能证明这不是逻辑公理。
在另一方面,直觉主义者的哲学也引起了希尔伯特的警觉,因为他们排除的不仅仅是无穷集合,而且还有建立在纯存在证明基础上的大部分分析。希尔伯特强烈地抨击了他们的哲学。1922 年,他说直觉主义者“想要使数学瓦解和变形”。在1927 年的一篇论文中,他抗议说:“禁止数学家用排中律就像禁止天文学家用望远镜或拳师用拳一样。否定用排中律所得到的存在性定理就相当于全部放弃了数学的科学性。”
魏尔在1927 年谈到希尔伯特对直觉主义的看法时,说道:“在直觉主义者的观点中,仅有一部分,也许是仅有可怜的一小部分经典数学理论是站得住脚的,这是个痛苦且不可否认的事实,希尔伯特是不能忍受这种残缺的。”
在反对逻辑主义和直觉主义的过程中,希尔伯特坚持认为两者都不能证明相容性。在1927 年的论文中,他宣称:为了奠定数学的基础,我们不需要克朗涅克的上帝,也不需要彭加勒的与数学归纳原理相应的特殊理解力(彭加勒曾说过利用数学归纳法无法证明系统的相容性)或布劳维的基本直觉,最后,我们也不需要罗素和怀特海的无限性、归约性以及完备性公理。这些公理是切实的、基本的命题,但是不能通过相容性的证明来建立。
20 世纪80 年代时,希尔伯特确定了他自己的数学基础方法,并在余生致力于此项工作。在他20 年代至30 年代初发表的论文中,1925 年的论文是最主要的一篇。其中写道:“对于无穷量,我的理论的目的是一次性彻底地解决数学方法中的确定性问题。”
他的理论的首要点就是既然逻辑的发展确实与数学思想有关,既然经典数学被留存下来,一些超逻辑公理(例如无穷公理)总要被引入,那么正确的数学方法必须包括既有逻辑又有数学的概念和公理。此外,逻辑必须研究那些包含某些超逻辑的具体概念的事物,例如整数,它们早在逻辑开始发展前就存在于直观中了。
希尔伯特所设想的逻辑公理与罗素的公理在本质上没有什么区别,尽管希尔伯特假设的更多一些,因为他不想参与为逻辑建立一种理论基础。但是,希尔伯特说,因为不能仅仅从逻辑中推导出数学——数学不是一种逻辑的结果而是一种自然存在的法则——每一个分支都必须含有包括逻辑和数学在内的适当的公理。此外,对待数学的最可靠的方法就是不把它当作实际知识而是当作一种形式上的法则,也就是说,当作一种抽象的、象征性的、与含义无关的法则(尽管,非正式地说,它的含义及它与现实的联系已融入其中)。根据逻辑学原理,演绎法可归结为对符号的操作。
因此,为了避免语言上的含义不清和对直觉知识的无意识应用(这也是产生一些悖论的原因),也为了清除其他的悖论以达到证明的准确性和客观性,希尔伯特决定对所有逻辑和数学的叙述用符号形式来表达。这些符号,尽管它们可以表达直观上的意义的感知,但不能在他所提出的形式数学中找到解释。希尔伯特希望包括一些甚至可以表示无限集合的符号,但是它们没有什么直观上的意义。这些理想的元素,如希尔伯特所称,是建立所有的数学所必需的,所以它们的引入是合理的,尽管希尔伯特相信在现实世界中仅有有限个事物存在,事物又是由有限个元素所组成的。希尔伯特的观点可以用一个比拟来理解。无理数作为数字是没有直观上的意义的。即使我们能引入一些尺寸为无理数的长度,这些长度本身并不能为无理数提供任何直观上的含义。但是无理数作为一种理想的元素即使是在初等数学中也是必不可少的,这也就是为什么数学家们能在1870年以前没有任何逻辑基础的情况下用到它们的原因。希尔伯特认为复数,也就是那些与-1有关的数,它们在实数中没有直接相对应的数,但是对它们可以建立可行的普遍性的定理:例如每个n 阶多项式方程正好有n 个根,以及一整套被证明甚至在物理研究中都具有广泛应用的复变量理论。不管符号所代表的是否是直觉上有意义的事物,所有概念和运算中的符号本身都是无意义的。对于数学基础来说,数学思想的要素就是符号和由符号组合或串联而成的命题。这样形式主义者就要花相当大的代价:处理一些毫无意义的符号,去探求确定性。
幸运的是,这些逻辑符号体系在19 世纪后期、20 世纪初期就已得到了发展(见第八章),所以希尔伯特得到了他所需要的现成的符号体系。例如记号~表示“非”,?表示“与”,∨表示“或”,→表示“蕴涵”,$表示“存在”,这些都是没有定义的或基本的概念。当然,对于数学来说符号体系早已存在。
希尔伯特所选择的逻辑公理意欲对亚里士多德逻辑的所有原理产生影响,人们很难对这些公理的可接受性产生怀疑。例如:有X、Y、Z 三个命题,其中一条公理说X 蕴涵X∨Y,按字面解释就是,如果X 为真,那么X或Y 为真。另外一条公理按字面解释为:如果X 蕴涵Y,则Z 或X 蕴涵Z或Y。一个基本公理就是蕴涵的规则或是推理的规则。公理认为,如果公式A 为真,并且公式A 蕴涵公式B,则公式B 也为真。这个逻辑法则在亚里士多德逻辑中被称为肯定式。希尔伯特还希望用到排中律,他还引入了一种用符号形式表达排中律的技术工具。在表述选择公理(自然它是一个数学公理)时也用到了这种技术工具。希尔伯特希望,不明确使用“一切”这个词就可以避免任何悖论。
在研究关于整数的数学分支中,根据希尔伯特的方案,存在着整数公理。举例说明:有一条定理a=b 蕴涵a′=b′,是说如果两个整数a 和b相等,那么它们的后继数(即下一个整数)也相等。另外,还存在着数学归纳公理。通常这些公理至少与自然现象的经验或已存在的数学知识有关。
如果用一个形式系统表示集合理论,那么,它必须包含说明哪一类集合被形式化的公理(用符号形式表达),这样,公理就可以允许这类集合:两个集合的和与一个给定集合的所有子集组成的集合形式化。
对于所有的用公式和符号组合表达的逻辑和数学公理,希尔伯特准备用客观的证明来说明他的想法。它包括以下过程:肯定某一个公式;肯定这个公式蕴涵另一公式;肯定第二个公式。一系列这样的步骤,其中所肯定的公式或蕴涵关系都是前面的公理或结论,这就构成了一个定理的证明。另外,用一个符号去代替另一个或一组符号也是一种允许的运算。这样,把逻辑公理用到以前建立的公式或公理的符号操作上去,就可以推导出公式。
一个公式为真,它必须且只须是这样一串公式中的最后一个,其中的
每一个公式,或者是形式系统中的一条公理,或者是由归纳法则所导出的公式。每个人都可以验证,一个给定的公式是否可以通过一串适当的推导得到,因为证明在本质上就是对一些符号的机械操作。这样,按照形式主义的观点,证据和严密性就是确定的、客观的。
于是对于形式主义者来说,数学本身就是一堆形式系统,各自建立自己的逻辑,同时建立自己的数学;各有各自的概念,各自的公理,各自的推导定理的法则,以及各自的定理。把这些演绎系统中的每一个发展起来,就是数学的任务。
这些就是希尔伯特关于数学结构的方案。但是能从没有矛盾的公理中得到结论吗?由于先前关于数学主要分支的相容性证明是在假设算术相容的基础上给出的——确实,希尔伯特本人已经指出欧几里得几何相容性可以归结为算术相容性——所以后者的相容性就变成了关键性问题。正如希尔伯特提出的,“在几何学和物理理论中,相容性的证明是通过把它归结为算术相容性来完成的。这种方法很明显不适用于对算术本身的证明。”那时希尔伯特所寻求的是与相对相容性相反的绝对证明。这也是他集中精力要解决的问题。他说在这一点上我们今后不能像在20 世纪初那样冒令人不快的意外之险。
现在,相容性观察不到了。一个人不能预见到公理中的所有内涵。然而,希尔伯特像几乎所有关心数学基础的数学家那样,根据一个假命题蕴涵着任一命题来运用实质蕴涵的概念(见第八章)。如果存在着一个矛盾,那么根据矛盾律,两个命题中必有一个为假命题,并且如果存在一个假命题,它必然蕴涵1=0。因此,想要证明相容性只须证明我们永远不会得出1=0 这个形式的语句。这样,如希尔伯特在1925 年的文章中所说,“在我们曾经历过的两次悖论中,头一次是微积分悖论,第二次是集合论悖论,我们不会再经历第三次,而且永远也不会。”
希尔伯特和他的学生阿克曼(Wilhelm Ackermann)、伯奈斯(PaulBernays)和冯?诺伊曼在1920 到1930 年间逐步开展了所谓的希尔伯特证明论或元数学,这是建立任何形式系统的相容性的一种方法。元数学的基本思想可以用一个比喻来理解:一个人想要研究日语的有效性和综合性,如果用日语研究就会由于语言的限制而对研究不利,但如果英语是一种有效的语言,那么他就可以利用英语来研究日语。
在元数学中,希尔伯特提议用一种特殊的无任何异议的逻辑,这些逻辑原理应该很明显为真,任何人都能接受它们。事实上,它们很接近于直觉主义原理。不使用那些有争议的推论——诸如用矛盾去证明存在,超限归纳,实无穷集,非断言性定义以及选择公理。存在性证明必须是构造性的。因为一个形式系统可以是无限的,那么元数学必须容纳这些概念和问题,它们牵涉到至少是潜无穷的系统,但是不能涉及到公式中无穷多个结构性质和无穷多个公式操作。可以考虑这样的公式,其中符号只代表实无穷集合,但是它们仅仅是公式中的符号而已。自然数的数学归纳法是可承认的,这是由于它证明的是到任一有限数n 的命题,而无须再去证明在整个自然数无限集合中的命题。
希尔伯特把元数学证明的概念和方法称作有限性(finitary),他对有限性的含义有些含混不清。在1925 年的论文中,他举了如下例子,“如果p 是一个质数,那么总存在一个质数大于p”这个论述是非有限性的,因为它是一个关于所有大于p 的整数的论述。而论述“如果p 是一个质数,那么在p 和p!+1 之间总存在一个质数”是有限性的,因为对于任何一个质数p,我们所要检验的是在p 和p!+1 之间的有限数中是否存在着一个质数。
在希尔伯特与伯奈斯于1934 年合作出版的书中,他是这样描述有限性的:
我们将经常用“有限性”这个词来表示问题中的论述、论断或定义限制在完全可构造的事物、完全可行的过程范围内,并在可具体检查的领域内执行。
毫无疑问,元数学将利用直觉语言和必须借助于符号表示的非正式语言。在国际数学家大会(1928 年)上,希尔伯特在谈到他的元数学方案时,非常自信地断言:“利用这种新的数学基础——人们完全可以称之为证明理论,我将可以解决世界上所有的基础性问题。”他尤其相信能够解决相容性问题和完备性问题,也就是说,所有有意义的论述将会被证实或推翻。那样也就不存在悬而未决的命题了。
可以预料,形式主义者的方案将会遭到他的对手们的非难。在《数学原理》(1937 年)第二版中,罗素说形式主义者所使用的算术公理不能准确地限制符号0,1,2......的含义。我们也同样可以按我们直觉上的愿望从100,101,102......开始,因此“有12 个门徒”的论断在形式主义中就没有意义了,“形式主义者就像一个只专注于如何使他的表看起来漂亮的制表匠,他忘记了表的报时作用,因而也就忽略了怎样使表走得更准。”数的逻辑定义明了地与现实世界联系起来,而形式主义理论却做不到这一点。
罗素还攻击了形式主义的存在性概念。希尔伯特已接受了无穷集合和其他理想元素,并且认为数学的任何一个分支的公理,其中包括排中律和矛盾律,如果不能导致矛盾,那么满足公理的实体就肯定存在。罗素认为这种存在性的见解是形而上学的。此外,罗素说,可以想象出公理的无矛盾系统的多样性是没有限制的。他接着说,我们只对可应用于经验材料的系统感兴趣。
罗素的非难让人想起了“五十步笑百步”的成语,他在1937 年时早已忘记了他曾在1901 年写过的话:“数学可定义为这样一门学科,在其中我们永远不知道我们谈论的是什么,也不知道我们所说的是否正确。”
形式主义方案对于直觉主义者来说是不能接受的。除了他们在关于无穷和排中律上的根本差异外,直觉主义者继续强调了他们是依靠数学的意义来决定其正确与否的,而形式主义者(和逻辑主义者)却是与理想的或是无意义的超自然世界打交道的。布劳维在1908 年就已经表示,在经典分析的基础理论中,其中包括波察诺-维尔斯特拉斯定理(一个相当专业化的定理:一个有界无限集合至少有一个极限点),逻辑与含义有明显的矛盾。当排中律应用于任一理论超出了有限可证明时,布劳维说,我们必须在我们关于正整数的先验真理与排中律的随意使用之间作出选择。随意使用亚里士多德逻辑会导致形式上有效而实质上无意义的论断。经典数学通过放弃许多逻辑结构中的含义而放弃了实在。
布劳维的批评使许多人认识到以前错误地认为毫无疑义的信仰是有用的,这种信仰就是:任何重大的数学理论总是某种根本性的客观实在的真实表述。这些理论恐怕只是实际上真实的事物和现象的理想化。但是,尤其是在19 世纪,经典分析中的许多内容除了在逻辑上令直觉主义者不满外,已经远远超出了直觉上的意义。接受布劳维的观点就是以经典数学缺乏直觉上的意义为理由来放弃相当一部分经典数学。
直觉主义者现在说,即使希尔伯特的形式化数学的相容性得到了证明,这种理论即这种形式化的数学也是没有意义的。魏尔抱怨说希尔伯特是通过“一种彻底的重新解释”来“拯救”经典数学的,也就是把它形式化了,而实际上是抽取了它的含义。“这样就把它在原理上从直觉系统转移,而形成一个根据固定规则进行的公式游戏。”“希尔伯特的数学也许是一种美妙的公式游戏,甚至比下棋更有趣。既然它的公式并不具有公认的可借以表示直觉真理的实在意义,那么它与认识又有什么关系呢?”为了维护形式主义哲学,我们必须指出只是为了证明相容性、完备性和其他性质才把数学简化成毫无意义的公式。数学作为一个整体,即使是形式主义者也不认为它仅是一种游戏,他们认为它是一种客观的科学。
与罗素一样,直觉主义者反对形式主义的存在性概念。希尔伯特坚持认为任何实体的存在性都可以通过它被引入时所在的数学分支的相容性所保证。这个相容性概念对于直觉主义者来说是不能接受的。相容性不能保证纯存在定理的真实性。早在两百多年以前,这种证明就由康德写在他的《纯粹理性批判》一书中:“对于取代概念的逻辑可能性(即这种概念不能自相矛盾)和对于事物的先验可能性(即客体须与概念相符),它们只能欺骗和取悦于头脑简单的人。”
20 世纪30 年代,形式主义者与直觉主义者之间发生了激烈的舌战。1923 年,布劳维指责了形式主义者。他说,“尽管公理化、形式化的处理可以避免矛盾,但也因此不会得到有数学价值的东西。一种不正确的理论,即使它没能被任何反驳它的矛盾所驳倒,但它仍是不正确的;这就像一种犯罪行为不管是否有法庭阻止它,它都是犯罪一样。”1921 年他在阿姆斯特丹大学的演讲中又一次讽刺说:“对于在哪里能找到数学严密性的问题,这两派提供了不同的答案。直觉主义者说在人类的理智中,而形式主义者说在纸上。”
希尔伯特也反过来指责布劳维和魏尔,说他们想要丢弃每件不适合他们的东西,还专横地颁布了一道禁令。在他1925 年的论文中,他称直觉主义是对科学的背叛。但是,正如魏尔指出的,在他的元数学中,他却把他的原则局限在基本直觉原则之内。
还有这样批判元数学原则的:元数学原则应该是被所有人接受的,但却只有形式主义者选择了它们。为什么他们的直觉就可以作为检验的标准?为什么直觉主义者不能探讨所有的数学?在元数学中,最终检验一个方法是否可行是看其是否具有说服力,但是这种说服力又是对谁而言呢?尽管形式主义者不可能应付所有的指责,但是在1930 年,他们有了一个对他们极为有力的论据。罗素及其拥趸同意逻辑公理不是真理,所以不能保证相容性。而直觉主义者只有在他们的直觉能保证相容性时才能坚持其正确性。但是,在另一方面,形式主义者对于建立相容性却有一个深思熟虑的程序。利用简单系统获得的成功使他们确信可以获得算术以至于全部数学相容性的成功。现在,我们暂且将他们搁置一边,来看一看另外一个研究数学基础方法的对手。
集合论公理化派的成员在开始时并没有形成他们独特的哲学,但是他们逐渐获得了支持,有了明确的方案。在今天,我们可以肯定地说这个派别在数学家中所拥有的支持者是与我们前面介绍的三个派别势均力敌的。我们可以把集合论公理化的起源追溯到戴德金和康托尔的工作中。尽管他们主要关心的是无穷集合问题,并且也都着手于在集合概念的基础上建立一种普通的整数(自然数)。当然,一旦整数建立了,也就能推导出全部数学了(见第八章)。
当康托尔的集合论的矛盾,就是那些涉及到集合的最大基数和最大序数以及罗素和理查德关于集合的矛盾出现时,一些数学家相信这些悖论的产生是由于滥用集合所致。康托尔大胆地引入了一些激进的观点,但他表达得相当不明确。他在1884 年、1887 年、1895 年对集合论分别给出了各种文字上的定义。他的集合论的概念实质上是:我们的直观或思想中明确的、可分辨的物体的总体。换句话说,对于每个实体X,我们只要知道X是否属于这个集合,这个集合就可以确定了。这些概念都是含糊不清的,康托尔的集合论的整个表示形式在今天通常被说成是幼稚的。因此集合论的公理化思想,做为一种经仔细选择的公理化基础,可以排除集合论中的悖论,正如几何和数系中的公理化可以在那些领域里解决逻辑问题一样。尽管集合论包含在数学的逻辑方法中,集合论公理化主义者更希望直接通过公理来研究它。策梅罗在1908 年的一篇论文中着手进行了集合论的公理化,他也相信悖论起因于康托尔对集合的概念没有加以限制。因此,策梅罗希望清晰明确的公理能够澄清集合的含义和集合所应具有的属性,尤其是他想要设法限制集合的大小。他没有什么哲学根据,只是力图避免矛盾。他的公理系统包含未加定义的集合的基本概念,以及一个集合被另一个集合所包含的关系。所有这些加上已定义的概念就可以满足公理中的陈述,只有公理所提供的集合的性质才能使用。在公理中,无穷集的存在性,以及像集合的并与子集的形成这一类的运算也由公理给出。策梅罗也用到了选择公理。
策梅罗的公理系统在1922 年由弗兰克尔(AbrahamA.Fraenkel)改进。策梅罗没有区分集合的属性和集合本身,它们被当作同义语使用。弗兰克尔在1922 年找出了它们之间的区别。这套被集合论公理化者最通常使用的公理系统叫做策梅罗-弗兰克尔系统。他们俩分别预测到了精致的、严密的数学逻辑的可行性,却没有详细说明逻辑的原理。他们认为这些都是在数学范围之外的,并且确信他们可以像1900 年以前的数学家使用逻辑一样来使用这些逻辑原理。
让我们权且以文字形式来表示策梅罗-弗兰克尔集合论中的几条公理。
1.如果两个集合含有同样的元素,那么它们是相等的(直观上讲,这确定了集合的概念)。
2.存在着空集。
3.如果x 和y 是集合,那么无序对{x,y}也是集合。
4.一组集合的并也是集合。
5.存在着无穷集(这个公理允许超限基数,这是关键的一条,因为它超越了经验)。
6.任何可用理论的语言形式化的属性都可以用来定义一个集合。
返回书籍页