张卜天新译著

作者:[英] 伊恩·斯图尔特

第一章数学概论


(资料图)

“现代数学的范围之广难以想象。”

——凯莱(A. Cayley),1883年的一次演讲

我们的学校突然转到“现代数学”,可能使人产生这样的印象:数学已经失去了对其意义的控制,抛弃了所有传统思想,取而代之的则是对人可能没有任何用处的异想天开的古怪创造。

这幅图像并不完全准确。据保守估计,现在学校里讲授的“现代数学”的大部分内容已经存在了一个多世纪。在数学中,新观念从旧观念中自然地发展出来,随着时间的推移被逐渐吸收。然而在学校里,我们同时引入了许多新概念,而几乎没有讨论它们与传统数学的关系。

抽象性和一般性

现代数学的一个更加引人注目的方面是渐趋抽象。每一个重要概念都包含不止一个对象,这些对象具有某种共同的性质。一种抽象的理论推导出关于这种性质的推论,然后可将这些推论应用于其中的任何对象。

例如,“群”这个概念可以应用于空间中的刚性运动、几何图形的对称性、整数的加法结构,或拓扑空间中的曲线变形。共同性质是,特定类型的两个对象结合可以产生另一个对象。两个相继进行的刚性运动产生一个刚性运动;两个数之和是一个数;两条曲线首尾相连形成另一条曲线。

抽象性和一般性是相辅相成的。一般性的主要优点在于省力。如果在一般条件下同一个定理一次就能得证,那么以不同的形式证明四次就没有意义了。

现代数学的第二个特点是它依赖于集合论语言。这种语言通常只是用符号表达的常识罢了。数学,尤其是当它变得更为一般时,对特定对象的兴趣要小于对整个对象集合的兴趣。5=1+4并不特别重要。任何4n+1形式的质数都是两个平方数之和,这一点很重要。后者谈论的是所有质数的结合,而不是某个特定的质数。

集合(set)仅仅是聚集(collection)罢了:我们用一个不同的词来避免与“聚集”一词相关的某些心理意味。[1]集合可以以不同的方式进行组合,产生其他集合,就像数可以(通过加法、减法、乘法……)进行组合,产生其他数一样。关于算术运算的一般理论是代数,因此我们也可以发展出一种关于集合论的代数。

与数相比,集合有一些优点,尤其是从教学的角度看。集合比数更具体。你不能把一个数拿给孩子看(“我手里拿着数3”),但可以给他看若干个东西:3个棒棒糖,3个乒乓球。你会给他看一个关于棒棒糖或乒乓球的集合。虽然数学里感兴趣的集合并不是具体的——它们往往是数的集合或函数的集合——但集合论的基本运算可以通过具体材料显示出来。

对数学来说,集合论比算术更基本——尽管基本的东西并不总是最好的出发点——集合论思想对于理解现代数学是不可或缺的。因此,我在第四章和第五章讨论了集合。在那之后,我会自由地使用集合论的语言,不过我会尽量只使用初等的集合论内容。过分强调集合论本身是错误的:它是一种语言,而不是目的本身。如果你对集合论了如指掌,而对其他数学一窍不通,那么你对别人没有什么益处。如果你懂很多数学,但不懂集合论,你也许会取得很大成就。但如果你碰巧懂一些集合论,你对数学语言会有更好的理解。

直觉和形式主义

越来越大的一般性伴随着越来越严格的逻辑标准。欧几里得之所以现在受到批评,是因为他没有一个公理说,经过三角形内一点的一条线必定会在某个地方与这个三角形相交。欧拉对函数的定义,即“用手自由绘制的曲线”,将不承认适合于数学家们希望用函数做的数学,而且无论如何,它太过模糊不清。(什么是“曲线”?)在这种事情上,一个人可能会做得过头,用大量符号逻辑取代语词论证,并通过盲目应用标准技巧来检验有效性。如果走得太过(在这种情况下过犹不及),就会破坏理解,而不是帮助理解。

要求更大的严格性并不只是一时兴起。一门学科越复杂、越广泛,采取一种批判的态度就越重要。一位社会学家若想理解大量实验数据,就必须抛弃那些做得糟糕或者结论可疑的实验。在数学上也是如此。“显而易见”往往被证明是错误的。存在着没有面积的几何图形。根据巴拿赫(Banach)和塔斯基(Tarski)的说法,[2]可以把一个球体切成六块,然后将各个球块重新组装成两个球,每个球的大小都和原来的球一样。从体积上看,这是不可能的。但这些球块并没有体积。

逻辑严格性提供了一种约束性的作用,在不安全的情况下或者在处理复杂的问题时非常有用。有些定理大多数专业数学家都相信必定为真,但除非得到证明,否则就是未被证明正确的假设,而且只能被用作假设。

在证明某种不可能的东西时也需要特别注意逻辑。用一种方法不可能完成的任务用另一种方法也许可以轻松完成,因此需要非常仔细的说明。人们已经证明,一般的五次方程没有根式解,[3]角不能用尺规三等分。这些都是非常重要的定理,因为它们意味着某些途径是不可能的。但要想确定这些途径确实是不可能的,我们必须非常谨慎地对待我们的逻辑。

不可能性证明是数学的典型特征。数学几乎是唯一能够确定其自身局限性的学科。它有时是如此痴迷于不可能性证明,以至于人们更感兴趣的是证明某种事情做不了,而不是弄清楚如何去做!如果自知是一种美德,那么数学家就是圣人。

张卜天新译著

然而,逻辑并非一切。任何公式本身都无法暗示某种东西。逻辑可以用来解决问题,但无法暗示应当解决哪些问题。没有人能把意义形式化。要想意识到什么东西是有意义的,你需要一定的经验,外加一种难以捉摸的品质——直觉。

我无法定义我所说的“直觉”是什么意思。数学家(或物理学家、工程师或诗人)正是出于直觉才这样做的。直觉赋予了他们对这门学科的“感觉”。有了直觉,他们无需给出形式上的证明就能看出某个定理为真,并且基于自己的眼光给出有效的证明。

实际上,每个人都有一定程度的数学直觉。玩拼图游戏的孩子就有这种直觉。任何一个把全家的度假行李成功地装进汽车后备箱的人都有。培养数学家的主要目标应该是把他们的直觉转化成一种可控制的工具。

关于严格性和直觉的优劣短长,人们一直争论不休。这两个极端都没有抓住要点:数学的力量恰恰在于直觉与严格性的结合。受约束的天才,有灵感的逻辑。我们知道,有些聪明人的想法从来都不太管用,有些秩序井然的人则因为过分井井有条而从未做出任何有价值的事情。这些都是需要避免的极端情况。

图形

学习数学时,心理比逻辑更重要。我看过一些逻辑异常严格的讲座,但没有一个听众能听懂。直觉应当优先,我们稍后可以用形式上的证明来支持它。直觉上的证明可以让你理解为什么某个定理必定为真,而逻辑只是提供了可靠的理由来表明它是真的。

在接下来的各章中,我试图强调数学的直觉一面。我没有给出形式上的证明,而是试图概述其背后的思想。在理想情况下,一本合适的教科书应当兼顾两者,但很少有教科书能够达到这一理想。

一些数学家(也许有10%)用公式思考,他们的直觉体现在公式中。其余的人则用图形来思考,他们的直觉是几何式的。图形所承载的信息要比文字多得多。多年来,学校并不鼓励学生画画,因为“图形不够严格”。这是一个严重的错误。诚然,图形并不严格,但它们对思考是必不可少的帮助,任何人都不应拒斥任何能够帮助他更好地思考的东西。

为什么?

做数学有很多理由,任何理解这一点的人都不大可能在读下一页之前要求证明数学的存在是合理的。数学美妙,激发思想,甚至有用。

我打算讨论的主题大都来自纯数学。纯数学的目标不是实际应用,而是智力的满足。在这方面,纯数学类似于美术——几乎没有人会要求一幅画应当有用。(与美术不同,数学一般承认批评标准。)但引人注目的是,纯数学是有用的。我举个例子。

在19世纪,数学家们花了大量时间精力来研究波动方程,也就是由弦或流体中的波的物理性质所产生的偏微分方程。尽管有物理上的起源,但这是一个纯数学问题,没有人能想到它对于波有什么实际用途。1864年,麦克斯韦提出了一些方程来描述电现象。对这些方程进行简单的操作就能得到波动方程,这使麦克斯韦预言了电波的存在。1888年,赫兹在实验室探测到了无线电波,从而用实验确证了麦克斯韦的预言。1896年,马可尼实现了首次无线电传输。

这一系列事件是纯数学变得有用的典型方式。首先是纯数学家为了好玩而摆弄某个问题;然后是理论家运用数学,但不试图检验他的理论;接着是实验科学家确证理论,但没有发展出它的任何用途;最后是实干家把商品送至等候已久的世界。

在原子能、矩阵理论(用于工程学和经济学)或积分方程的发展过程中,事件的顺序也是如此。

让我们看看时间尺度。从波动方程到马可尼:150年。从微分几何到原子弹:100年。从凯莱第一次使用矩阵到经济学家使用矩阵:100年。积分方程用了30年时间才从被柯朗和希尔伯特变成一种有用的数学工具发展到在量子理论中变得有用,而又过了很多年,量子理论才有了实际应用。当时没有人意识到,关于积分方程的数学会在一个世纪或更久之后被证明是不可或缺的!

这是否意味着,所有数学,无论现在看起来多么不重要,都应该得到鼓励,因为它有些微的可能性在2075年成为物理学家们碰巧需要的东西?

波动方程、微分几何、矩阵、积分方程,所有这些东西在第一次提出时就被认为是重要的数学。数学有一个相互关联的结构,一个部分的发展常常会影响到其他部分:这便导致某些数学内容被认为是“核心”,而重要的问题就在这个核心。甚至连全新的方法也通过解决核心问题来证明其重要性。后来被证明有实际用途的数学大都来自这个核心区域。

数学直觉胜利了吗?或者是否任何被认为不重要的数学都不会发展到可能有用的程度?我不知道。但可以肯定的是,被数学家一致认为琐碎或不重要的数学将不会被证明是有用的。研究“广义左拟堆”(generalizedleft pseudo-heaps)这样晦涩而偏狭的理论绝不会把握未来的关键。

然而,一些非常漂亮和重要的数学在实践中也被证明是无用的,因为现实世界并不是这样运作的。某位理论物理学家基于非常一般的数学理由推导出了宇宙半径公式,从而为自己赢得了很高的声誉。这个公式令人印象深刻,其中夹杂着若干个e、c、h,此外还有几个π和√s。作为理论家,他从未费心用数值求出它。几年以后,才有人有足够的好奇心将这些数值代进去,得出答案。

10厘米。

张卜天新译著

[1]有人告诉我,在荷兰语中恰恰盛行相反的用法:现在在数学中使用的“set”一词,几个世纪以来一直被翻译成“collection”。

[2]参见W. Sierpinski, On the Congruence ofSets and Their Equivalence by Finite Decomposition, Lucknow UniversityPress, 1954;以及E. Kasner and J. Newman, Mathematics and the Imagination, Bell, 1949。

[3]要想得出多项式方程anxn+…+ a1x+a0=0

的根式解,我们必须找到一个关于系数a0、a1、……、an的求根公式,它只使用加法、减法、乘法、除法和开方运算。一个例子是二次方程ax2+bx+c=0的标准解,即

人们已经证明,一般五次方程不存在这样的求根公式。证明是通过伽罗瓦理论完成的,读者需要有良好的抽象代数基础。详情参见Galois Theory, E. Artin, Notre Dame, 1959;Introduction to Field Theory, I. T. Adamson, Oliver& Boyd, 1964;或Galois Theory, IanStewart, Chapman& Hall 1973。

推荐内容