必读网 - 人生必读的书

TXT下载此书 | 书籍信息


(双击鼠标开启屏幕滚动,鼠标上下控制速度) 返回首页
选择背景色:
浏览字体:[ ]  
字体颜色: 双击鼠标滚屏: (1最慢,10最快)

超弦:一种包罗万象的理论

P.C.W.戴维斯(英)
“科学与人译丛”出版说明
英国著名科学专栏作家布赖恩?阿普尔亚德在其《理解现在——科学与现代人的灵魂》一书中有这样一段话:
“1609年,加利莱奥?伽利略使用一架望远镜观看月亮。这一时刻,对世界的意义如此重大,以至人们将它与耶稣的诞生相提并论。因为,就像在伯利恒,自这一时刻,人类生活中的不可能成为可能。”
阿普尔亚德据此将科学划分为伽利略之前的科学,或称“智慧”,以及从1609年开始的现代科学。前一科学建立在推理基础上,后一科学建立在观察与实验基础上。经过如此划分,我们习以为常的科学,竟然只有400年的历史。
但人类就在这400年内经历了飞速发展。
我们有了蒸汽机,有了轮船,有了电话、电报,有了飞机、火箭,有了电视、电脑、互联网络,我们还有重力场理论、元素周期表、量子力学、相对论乃至被称为“自然中最基本物体”的超弦。工业革命、农业革命、信息革命使人类的社会生活发生了前人难以想象的变化。
人类改造了自然,也改造了人类自己。回顾这一切,人类完全有理由感到自豪。因为,人类就像上帝,也有自己的“创世纪”。人说,要有科学,就有了科学。科学是好的,它行之有效。
然而,“创世纪”中写道“到第七日,上帝造物的工已经完毕,就在第七日歇了他一切的工,安息了”。而人类的工却没有完毕,400年后的今天仍然不能安息。
就像有光必有影,人在发现、发明、创造、拥有上述一切的同时,还得到了原子弹、氢弹、核泄漏、酸雨、温室效应、臭氧层空洞乃至伴随科学技术而来的种种风险。
人类曾以为已找到了通往自由王国的必由之路,他将乘着科学的飞船,摆脱一切束缚,重新确立自己在宇宙中的位置。但在科学爆炸的二十世纪,人类终于开始反思:
科学行之有效,但它是否就是真理?
为此,我们编辑了这套《科学与人译丛》,陆续分辑推出。其中,有对信息崇拜的批判,有对生命起源的求索,有对技术所导致风险的分析,有对世界最新科学动态和研究方向的展望。数学家用对策论证明,完全的民主实际上并无可能;物理学家提出全新的超弦理论,试图统一描述所有的力、物质的所有基本粒子和时空,继量子力学和相对论之后,成为“第三次物理学革命的重要标志”……《译丛》汇集了物理学家、数学家、生物学家、天文学家、哲学家、人类学家、伦理学家……自本世纪后半期、尤其是在本世纪末打通自然科学与社会科学之间的隔膜,对科学这一决定人类命运的工具的深刻思索。通过这套丛书,我们期望读者可以对科学的现状、科学的未来、科学的正面与负面效应,有一个较为全面的了解,更好地认识科学、掌握科学、利用科学。
中国对外翻译出版公司
1997年2月
1996年8月22日,在本书初版一年半后,人民日报、光明日报发表文章指出:“美国科学家认为,……物理学领域第三次革命最重要的标志是一种全新的理论——弦论的提出”。
超弦狂想曲
——为《超弦》再版而作
1996年岁末,以《超弦》为代表的“科学与人译丛”以全票人选新闻出版署直属出版社优秀选题一等奖。消息传来,捧起这本“玄之又玄”的最新宇宙大统一理论,遐想联翩。
所谓“弦”,不过是一条细线,“超弦”,不过是一条超乎寻常细小的线性结构,它小到连电子显微镜也看不见。就是这样一条超乎寻常的“弦”,把组成物质世界的各种最基本粒子在它上面安排得井井有条,对它们的各种差异和不同作用,解释得头头是道,从而填平了爱因斯坦相对论和量子力学之间似乎不可逾越的鸿沟,迎来了用一种理论统一解释宇宙的新曙光。难怪越来越多的科学家欢呼:“弦论”标志着物理学第三次革命的开始!
以笔者愚见,最早提出“弦论”的,并非外国科学家,而是我们的老祖宗——老子。
“弦”字的一个解释是系在弓上的细绳,去掉“弓”字,剩下的“玄”,也就是细绳或细线了。所以“玄”的本意就是“弦”。“弦论”即“玄论”。最早用“玄”来解释宇宙的,就是老子。
《老子》开篇就提出了“玄论”,并指出这是认识宇宙变化的根本途径。老子说:“道可道,非常道。名可名,非常名。无,名天地之始。有,名万物之母。故常无,欲以观其妙。常有,欲以观其徼。此两者,同出而异名,同谓之玄。玄之又玄,众妙之门。”
老子在这里的用词,不是指通常意义上的概念(非常名)。而是用“无”表示宇宙开端,“有”形容宇宙万物。他强调在宇宙开端,要注意研究其变化(观其妙),在研究宇宙万物时,要注意各种物质引力伸展达到的边际(观其徼),并用“玄”把宇宙开端(常无)和宇宙万物形成后(常有)的规律统一起来。最后,又指出玄外有玄,玄玄相扣(玄之又玄)这一“弦论”是认识全部宇宙变化的根本途径。
现代科学的“弦论”则指出,宇宙开始形成的“大爆炸”瞬间,只适用量子力学,宇宙在发展膨胀过程中则适用爱因斯坦相对论。而“超弦”可以把这两者统一起来。
稍加比较,不难发现,《老子》开篇讲的就是“弦论”,就是宇宙普遍规律,而不是一般规律(非常道)。只是人们长期不能理解“玄”的含义,就给了“玄”字一个“莫名其妙”“脱离实际”的释义。
在我国古代经典中,论述宇宙普遍规律的,还有一部《易经》。英国世界科学史学家李约瑟博士曾提到,易经中的太极图和八卦以及六十四卦图,曾在德国科学家莱布尼兹发明现代计算机原理时,给他以极大的启发。笔者由此想到,太极图能否给现代宇宙统一论以启发?例如,太极图中“阴阳鱼”上的“鱼眼”放大来看,又是一个太极图,其中的小“鱼眼”又是小小太极图……。这和《超弦》中提到的:人类生活的三维世界之外还有三维或更多维的世界的推论是否有相通之处?既然现代科学宇宙论认为“虫眼”是通往宇宙深处的捷径,太极图中的“鱼眼”是否也就是两个世界之间的捷径?也许“鱼眼”就是“虫眼”?也许……
也许,我过分地异想天开了,也许,人们高兴得太早了。因为,你要是承认“弦论”,你就不得不承认它必然会推导出来的一系列超乎寻常的、令人难以接受的结论。其中之一就是:在人类生活的三维空间之外,还存在更多维的世界,宇宙可能是十维的。换句话说,就是天外有天,天有九重。再推论下去,中国古代神话中的“天堂”,和浮士德笔下的“地狱”岂不都有了科学根据?于是乎,“科学还是迷信?”的厉声质问,像炸雷一样把我从遐想中惊醒。
“超弦”至今仍然是一个有争议的理论,但在本书初次出版一年半后,《人民日报》和《光明日报》于1996年8月22日以“美国科学家认为以弦论为标志——物理学迎来第三次革命”为题,报道了越来越多的世界顶尖科学家开始对“弦论”寄予极大的希望。本书这次再版,特将这两篇报道附上,以飨读者。
最后,笔者想起了科学史上的一段往事。老伽利略在接受教庭审判时,虽然低下了头,但却喃喃地说道:“可是,地球仍然在转动着。”前不久,罗马教庭宣布对几百年前的这桩冤案予以平反。这使我鼓起勇气,用钱老学森评论特异功能的那句低沉的,然而却是坚定的话来作本篇的结束语和本书的开篇语:“科学的问题只能用科学的手段来回答!”
周轩进
译者的话
正如本书书名所提示的那样,关于“超弦”是否为一个包罗万象的理论这一问题在1988年本书原文版付梓之时尚无定论。可以告诉大家,时至今日,这一问题也还没有得到肯定的回答。尽管如此,作为近年来物理学中最活跃、最激动人心的分支之一,“超弦”理论是人们迄今为止在探索自然界终极理论这一方向上最为雄心勃勃的一次尝试,在概念和方法上均有创意。这一理论本身以及由之带来的一些新的学科分支仍处在不断发展之中。为此,我们将本书译成中文让更多的人了解“超弦”理论。
作为一本科普读物,本书用直观浅显的语言把当今科学研究最前沿的这些动态介绍给广大的读者,帮助他们了解科学,从而激发起他们,特别是青少年读者对科学的兴趣,这无疑是有意义的。值得指出的是,科普读物有其自身的特点,在表述上多采用生动形象的语言,为的是让一般读者能够对深奥的概念、原理有一个较为直观的了解。然而,这样做的同时难免会带来不够严格不够准确等问题。为改变这种熊掌与鱼不可兼得的局面,科普读物的作者是花费了苦心的,本书采用收集科学家访谈录的方式就是这种努力的一个佐证。尽管如此,科普读物还是科普读物,一般读者在阅读时不要误认为那些有趣的概念、新奇的名词就是科学本身。科学是严肃和求实的,绝大多数情况下是要借用复杂的数学来进行表述和计算的。那些为科普读物所误、连微积分也没学而整日痴迷于离奇荒诞想法或者纯粹思辩之中而不自知的读者不是没有,而这恰恰是与科普读物作者的初衷相悖的。当然,因噎废食是不明智的,尤其是在当今这样一个科技飞速发展的时代,科普工作更应该得到重视和加强。愿广大青少年读者在阅读时能够注意到上面所提的问题,回过头来认真打好基础,有一天真正踏入科学的殿堂,为人类文明进步做出贡献。
翻译过程中对原书中的个别明显排印错误做了改正。由于译者水平有限,舛漏之处难免,敬祈读者指正。
译者
一九九三年五月于北大 序
在过去几年中,一个全新的非凡的理论占据了物理学家的想象。这个理论,即弦理论或更成熟的形式即超弦理论,声称能统一地描写所有的力,构成物质的所有基本粒子和时空。简言之,它是一个包罗万象的理论。这个理论的核心是认为物理世界是由一些很小的弦构成的。这听起来可能很荒谬,但理论是构筑在美妙的数学观念之上的,而且结论与现实世界是如此自洽。
弦理论现在已经是理论物理最活跃的研究分支之一了,它吸引了很多著名的理论物理学家。一些科学家深受这个理论的前景的鼓舞,并且充满激情地宣称它可能成功。但是这个理论也不乏批判者,正如你将在书中读到的。
1987年,我们决定在英国广播公司三台纪实地回顾超弦研究的状况。这个节目《寻求超弦》在1988年初开始播出,内容是弦理论领头的支持者和反对者对这个论题的解释和意见。像我们以前的节目《原子中的幽灵》(牛津大学出版社,1986年)一样,它是先以纪实广播形式出现,然后再编辑成书的。我们觉得完整地出版这些采访录并保存它们是很有意义的。我们将尽量保持原始纪录的对话风格,当然,为了更适于付印,我们也不得不对采访录作一些变动。
本书旨在让物理学家和好奇的读者对弦理论的基本思想有透彻的了解。我们也希望读者通过阅读本书了解那些杰出的物理学家是怎样谈论和辩论当代的重要问题的。因为本书是面向普通读者的,我们要求被采访者尽量少使用专业词语。每一个采访都是独立的,可以分开阅读。但是为了贯穿全书,我们写了一个很长的引言,解释了一些理解本书所需的背景知识,包括相对论、量子论和粒子物理的概述。
虽然超弦理论仍在发展之中,但理论的精要已经建立,我们希望本书将为读者提供我们时代有可能是最伟大的科学进展的一个有用的而有趣的快照。
我们感谢伊安?莫斯博士在文字处理上对我们的帮助,同时也感谢艾琳?德莱堡小姐记录了录音。
P.C.W.戴维斯
J.R.布朗
超弦
你相信宇宙是由一些极小的弦构成,在人类生存的三维空间之外,还存在更多维的空间吗?
近年来,“超弦”理论已成为物理学中最活跃、最激动人心的分支之一,吸引了众多著名物理学家的注意,他们声称“超弦”理论是一个包罗万象的理论,能统一地描述所有的力,物质的所有基本粒子和时空。
1996年8月22日人民日报和光明日报以“美科学家认为以‘弦论’为标志—物理学迎来第三次革命”为题刊载文章,将“弦论”与量子力学和爱因斯坦的相对论相提并论。
1.引言
1.1什么是包罗万象的理论?
物理学是最自负的一门科学,物理学家把理解宇宙的奥秘视为自己的职责。而其他科学家只局限于研究一些具体的东西,像生物学家研究活的有机体,化学家研究原子和分子,心理学家研究人类及其他生物,等等。像神学家一样,物理学家们不承认任何系统在原则上处于他们的研究范围之外。
当然,物理学家也承认他们实际上对大多数系统的认识是很有限的。像云和雪花这样基本的系统就很难用物理学家熟悉的定律来构造模型。而由于一些生物系统极端复杂,即便最原始的生物如病毒或细菌,物理学家对它也一无所措。尽管这样,任何复杂系统不管多么神秘,其行为最终总是由物理定律所决定的,绝无例外。与此比较起来,那些在实践中的无能为力就显得微不足道了。
简化主义哲学一直引导着物理定律细致入微地主宰着宇宙的观念。这个思想学派的鼓吹者,包括许多科学家,一直相信原则上心理学、生物学、化学可以依次简化,最后到物理学。换句话说,‘诠释之箭’一直射向现实的最深一层,最终任何事物都可由物质的基本组成来解释。简化主义者因而断定,假如一个关于物质的基本组成的自洽而完整的理论能够被阐明,那么,这个理论就是一个包罗万象的理论。
在这里我们不准备争论简化主义的推理是否正确,但要提到最近物理学家讨论的包罗万象的理论(或TOE)正是贯彻这种精神。这种“包罗万象的理论”不是要解释所有事物,像在数学里面,几何公理并没有真正解释毕达哥拉斯(Pythagoras)定理。确实,毕达哥拉斯定理可以从这些公理演绎得到,但是证明是非常繁杂的。这足我们明白,即使明确了物理世界的基本组成元素,我们也不能过分以使期望理解所有事物的复杂特性。所以,物理学家们的包罗万象的理论不能解决许多实际问题,如给我们提供云和雪花的模型的答案,更不用说生命的起源和意识的本质。但是,按照简化主义哲学,对上述现象的解释原则上可以由包罗万象的理论演绎而来。
我们所知的第一个包罗万象的理论的例子是由公元前5世纪的古希腊哲学家留基伯(Leucippus)和德谟克利特(Democritus)提出的原子说,他们认为世界是由原子和虚空构成的。原子有许多种,它们是不可穿透和破坏的,因此是基本的。原子没有内部结构,它们不能说是由更小的东西组成的,它们很小,不能直接观察到,也不能在虚空中处于连续运动的状态。原子相遇,就会互相粘合构成延续的物体,而这些原子的重新排列则引起了物理世界的任何改变。
17世纪,伽利略(Galileo)和牛顿(Newton)的工作带来了现代科学的兴起。同时关于物体运动定律的认识也强烈地支持原子说。人们意识到原子的运动也遵循一些熟悉的物理定律。这些进步促使拉普拉斯(Laplace)发明了他著名的“魔力计算机”。
“一种智力,在任一给定时刻如能知悉所有的自然力和构成宇宙的所有物质的瞬时位置,而且它能分析所有的有关数据,则能用一个式子描述世上最大物体和最微小原子的运动。对它来说,没有东西是不可确定的,历史和将来在它的眼前展现。”
这当然是一个包罗万象的理论的尝试。
但是,一些事情在这个可能的包罗万象的理论里面是很奇怪的。没人尝试去解释为什么宇宙是由原子构成的,我们不知道它们来自何处,也不知道它们为什么有这样的质量和形状。原子之间相互作用力的本质也是含混不清的。牛顿发现了引力,但并不能完全解释原子间的力。进而,原子通过的空间和度量它们运动的时间完全是在理论范围之外的。时空被简单地认为是存在的,但它们不是物理。总之,伽利略、牛顿和拉普拉斯的工作并不能说是已经给出了一个很令人满意的包罗万象的理论。
直到19世纪下半叶,当詹姆斯?克拉克?麦克斯韦(JamesClerkMaxwell)的电磁理论补充了牛顿的力学和引力论后,这种情况才有所改变。在那段时间,人们设想所有自然力只是引力或电磁力的一些具体表现。虽然原子的存在,时空的非物理性等问题还没有解决,许多物理学家认为他们将来的任务只是把一些物理测量精确到下一个小数点,正如开耳芬(Kelvi'n)勋爵在1900年的英国科学进步协会的一次演讲中所说的:“物理中已经没有新的待发现的东西了,剩下的只是越来越精确的测量。”这就是当时对包罗万象的理论的普遍倾向。
再回顾当时的包罗万象的理论,我们发现一个不是十分令人满意的特点,即需要假设两种基本作用力:引力和电磁力。在1920年,数学家西奥多?卡鲁扎(Theodor Kaluza)设法补救了这个缺陷,他发现了两种力之间的一个可能的联系。因此如果物理学没有陷入概念的漩涡,一个可能的严谨的包罗万象的理论会在本世纪早些时候出现。
电子和放射性的发现,马克斯?普朗克(Max Planck)量子假说的成功和爱因斯坦(Einstein)的相对论的出现摧毁了牛顿——麦克斯韦时代物理的整个基础。牛顿的运动定律和他关于时空的常识性假设被抛弃了。甚至德谟克利特的原子假说也被微观世界的更细致和复杂的图像所代替,此时,原子不再是不可分的,具有确定的位置和动量的粒子。显然整个经典物理的基础已经坍塌。
大约到了1930年,原来的经典物理已经被新的理论框架:量子力学、广义相对论和原子的更精致的模型所取代。虽然一些细节还没有弄清楚,但是物理学好像又重新回复到一些相对简单的原理上来了。原子被发现只是复合的物体,它们由少数的满足相对论和量子力学的基本粒子(电子、质子、中子)所构成。事实上,受这种高度的乐观主义的影响,早在1923年爱丁顿(Eddington)就发表了他所声称的基本理论,一个基于神奇的数理逻辑关系之上的包罗万象的理论的尝试。在他于1946年去世以前,爱丁顿一直在设法深入研究这种想法。同时,爱因斯坦也在用他的余年的大部分时间寻找一种用纯几何描述的自然的“统一场论”。
但是现在我们知道,20年代建立包罗万象的理论的这些希望是不成熟的。中微子假设、正电子和μ子的发现,以及原子内核子之间额外作用力的发现都给宇宙的基本定律是在电子、中子和质子水平的简单作用这个想法带来了挑战。实验粒子物理有了长足的发展,大量的亚原子碎片和令人困惑的作用力被发现了,物理学比20年代所猜想的要复杂得多。
这些丰富的亚原子水平的现象背后隐藏的更深层次的结构又花费了物理学家半个世纪的时间,我们多少有了令人满意的理论。最近,一些物理学家又大胆地提出一种新的包罗万象的理论。这个理论,即超弦理论是最新的也是最令人信服的一个包罗万象的理论的尝试。这个方案所处理的对象是超微观的,比原子世界或实验高能粒子物理小1020倍。
我们能从一个真正令人满意的包罗万象的理论中获得什么呢?首先,它必须能解释物理学家为什么可以观测到许多基本粒子而且能预言它们所有的重要性质像质量、电荷、磁矩等等。其次,它能真实地描写粒子间所有的相互作用,即它不仅能解释自然的四种基本力,而且能解释它们的相对强度。理论计算也必须能准确给出一些粒子间散射振幅,衰变率、分支比等的观测数字。简单而言,理论必须能给出粒子物理中所有已经测量的常数。另外,它能解释时空的几何和拓扑,像可感觉的维数,并给出宇宙起源的令人信服的解释。
但是这还不是全部,一个包罗万象的理论同时要统一物理。 1.2自然核心的统一
任何人都可以构造一种包罗万象的理论,他可以随意翻阅一些教科书,写下所有的基本定律,所有已知的亚原子粒子和它们的相互作用力,即需要了解宇宙的所有东西。
这种方法有什么欠缺呢?从审美的观点来看,这样开出的清单太混杂不清了。一个好的包罗万象的理论必须不能单单是基本定律和事物的汇总,而应具有解释能力,它必须建立自然的不同侧面的联系。对这种包罗万象的理论的探索是某种程度的有信心的举动,而这种有信心的举动是建立在自然必定是简单的这个信念之上的。
一般来说,一个科学理论所作的独立假设越少,它就越有说服力。理论通常有一些由经验确定的自由参数,更深层次的理论必须能预言它们的数值。一个具体的例子是,1880年代的斯蒂芬-玻尔兹曼(Stefan-Boltzman)辐射定律确立了黑体辐射的能量密度与温度的四次方的关系,比例常数由实验确定。1900年普朗克的量子假说成功地解释了这个常数不是自然的独立的基本常数,而是可由某些物理常数,如光速、普朗克常数和玻尔兹曼常数导出的。
科学实验无数次表明我们越深入地探寻事物的本质,就能越多地发现它们之间的联系,同时由直接实验来确定的理论的那些随意性也就越少。现代的原子概念更深刻地表明原子如何由物质的同样的少量成分构成,所以它比原子的经典图像更先进。现今,已经没有必要假设90种左右对应着不同化学元素的基本物体,不同原子的物理和化学性质可以直接系统地由它们的组成部分来确定。
最终的包罗万象的理论,理想地说,是不需要参照实验的。所有事物都可以由所有其他事物来定义,仅剩下一个尚未确定的参数来定义理论适用的标度,此参数必须由实验来确定。(在这个最终的包罗万象的理论中,实验仅仅是用来定义测量的习惯,它不能确定理论的任何参数。)这种理论是基于可以导出所有事物的自然的基本原则的,这个原则设想是一个包容所有基本物理的简练的数学表式。按照芝加哥附近的庞大的粒子加速器设施——费米实验室的主任莱昂?莱德曼(LeonLederman)的话来说,它是一个简洁到甚至可以让你写在“文化衫”上的公式。
统一物理的努力有两种不同的方案,第一种是可称为“自上而下”的方案,从某个可能由简单性、美妙性,而且能以简练的数学形式表达的广义的原则出发,我们可以得到对世界的描述,从而得到对特殊事例的预言。
爱因斯坦的大部分工作是致力于“自上而下”这个方向的。广义相对论是建立在引力和惯性力的等价原则,以及物理是不依赖于描写事件的坐标系的原则上的。从这些基本的想法出发,爱因斯坦得出了引力场方程。这些方程以美妙性、简单性和紧凑性而闻名,但是,方程的解并不简单,行星运行或双星的引力波辐射非常复杂。所以,60年后的今天,这个理论蕴含的所有现象还没有被完全揭示。
另一个或许是更为普遍的科学研究方法是“自下而上”的方案。这种方法从现象学出发,系统地整理实验的原始数据,并推导出某些规律。这些规律被提炼成假想,推广到更普遍的定律,根据定律在新的领域对现象作出预言,再用实验验证预言。通过一点点的积累,科学家们得出了比这些事实的总和更深刻的理论。粒子物理就给这种方法提供了很多佐证,如夸克理论就是由实验所观测到的很多不同粒子的某些物理的相似性,经过逐步摸索,把它们归化为一些类或多重态。“自下而上”方法的重要性在于它总是伴随着实验的进展而发展,如果实验事实偏离了哲学上的优美,那么哲学就不会如想象的那样优美。
物理学经历了多次统一。牛顿声称天体的运行与地面附近的物体遵从同样的动力学和引力定律。麦克斯韦统一了电和磁,并阐明了光是电磁波的一种形式,从而建立了电磁场理论和光学的联系。爱因斯坦建立了时空,能量和质量的关系,并进一步延伸到时空和引力的联系。
近年来,更进一步统一自然的尝试集中于高能粒子理论,因为每当我们寻求更深层次的结构,就必须提高探测的能量。在这个框架里,主要的是两个理论,即相对论和量子论。近年来的统一物理的各种尝试的起点是这两种理论显然的不调和。在考察粒子物理之前,我们先简单地回顾一下相对论和量子论。
1.3相对论
在19世纪下半叶,牛顿的力学定律和麦克斯韦的电动力学对相对运动描述的不一致已经是很显然了。按照伽利略和牛顿的观点,在直线上的恒速运动是相对于某个参照系并且不会产生任何物理效应的,因此在平稳飞行的飞机上乘客不会对速度有真正的感受,而只能参照外部系统如窗外或地面上的物体来辨别飞机的运动。另一方面,麦克斯韦的方程预言电磁波,如光在自由空间以恒定的速度传播,光速是自然界的一个普适常数。理论没有提及测量这个速度的参照系,因此有人提出空间充满了不可见的称为以太的介质。以太可以被定义为一个绝对的静止系,而所有的运动在原则上都可以相对于它来加以测量。这好像解决了麦克斯韦的理论与伽利略、牛顿的相对性原则的矛盾。但是,实验测量地球通过以太的速度却给出了零结果。这简直太荒谬了,因为这意味着地球是静止的,而天空却围绕着它转动。
1905年,爱因斯坦的狭义相对论直接解决了这个详谬。他承认相对性原则,即直线匀速运动是相对的,但抛弃了以太假说。他引入了新的假想,即光速在所有坐标系的速度是一致的,这表明不管光源或观察者的运动状态如何,观察者总是接收到相同速度的光讯号。对同一个光脉冲,两个相对运动的观察者看到的脉冲速度相同。
爱因斯坦光速不变的新原则抛弃了时空的旧观念,牛顿对空间,时间和运动的观点被新的“相对性”理论所取代。时空的相对性概念的核心是空间距离和时间间距在运动状态不同的观测者是不同的,地球上的一个小时在一艘以不可思议的速度飞行的飞船上就可能只有半个小时,对长度也有类似的现象。但是当速度比光速慢很多时,相对论效应是不显著的。高能物理中粒子通常以接近光速的速度运行,相对论的时间膨胀效应就非常显著,如不稳定粒子在粒子加速器中运行时就比静止时寿命更长。
时空的延长缩短对力学定律有深刻的影响。像一个运动的物体,粗略地讲要比静止时重得多,在加速时其质量会增加。因此质量的概念就有点含混。物理学家通常把物体静止时(相对于进行测量的观测者)的质量定义为质量,与惯性有关的有效质量或相对论质量依赖于它的速度,并且随着速度的不断接近光速而不断地增加。相对论中关于质量、速度和能量的研究揭示了质量和能量的等价性,即质量是能量的一种形式,它们可以相互转化。这同时也隐示着在某些情况下,物质可能会以能量的其他形式出现,反之,能量也能用来产生物质。这些观点包含在爱因斯坦著名的方程E=mc2中,这里E、m、c分别代表能量、质量和光速。
这个理论的一个结论是运动物体不能越过光障,即不能从低于光速的运动加速到高于光速的运动。从物体的质量很容易看出,在以光速运动时,物体的质量将是无穷大,因而需要无法达到的无限大的能量来加速它。
以上的限制并不是说物体不能以光速运动,显然,光就是一个例子。以光速运动的粒子的静止质量必须是零(虽然不是实际质量,因为这样的粒子永远不会是静止的)。甚而,相对论也不排除超光速运动的可能。这种假想的粒子称为快子(tachyons)。按照相对论,它们不能以低于光速的速度运行,而它们的静止质量是虚数(即负数的方根)。如果快子的静止质量可以测量,这简直是不可想象的。但是,因为它不能以低于光速的速度运行,所以也就不存在静止质量的问题。
虽然快子在理论上是允许的,许多物理学家还是不太欢喜它。它那比光速还快的速度隐示着在某些情况下它们会从现在向过去运动。如果它与平常物体作用,可能会向过去传播信息,因此会引起所有各种因果性详谬。人们作了一些尝试,想通过重新定义时间箭头来克服这个困难(即把从A时向B时运动的快子看作从B时向A时运动的快子),但还不清楚这种作法是否自洽。在我们讨论量子理论时,快子的概念将会遇到更大的麻烦。
相对论预言的时空间隔的转化暗示时空是物理的一部分,而不仅仅是物理表现的舞台。事实上,转化的方式揭示了时空的内禀联系,它们可以看成是一个四度的连续体,称为时空。因而物理学家把世界视为四维,而非三维。爱因斯坦不久就意识到狭义相对论迫使我们不仅要放弃牛顿关于空间和时间的概念和力学定律,而且也必须放弃牛顿的引力论。按照牛顿的观点,引力是瞬时作用的,这表明引力效应的传播比光还快,因此与相对论矛盾。
到1915年,爱因斯坦完成了狭义相对论的推广,建立了新的引力理论。在原先的狭义理论中,他主要涉及的是匀速运动。如果物体加速,它的运动就不仅只相对于某些参照系。飞机中的乘客很容易感受到飞机的突然减速或倾斜。为了处理这种更普遍的运动方式,爱因斯坦假设加速产生的惯性力与引力是不可区分的。因此离心运动可以用“虚拟的引力”来形容,火箭的突然加速承受了“引力”。
伽利略和牛顿早就注意到了加速运动和引力的等价性,但是爱因斯坦首先把它提高到了自然的基本原理的地位。当落体自由下降时,下降所引起的“引力”将抵消了它的重量,自由下落的观测者将经受失重状态。现今的宇航员对这种状态是已经很熟悉了,但是在爱因斯坦的时代,他只能想象一个坐在自由下落的升降机里的观测者。
因为自由下落的升降机里的东西是失重的,里面的邻近物体的相对位置不会改变。所以,从地面上的观测者来看,这些物体下落的加速是相同的。是这个事实引发了不管物体的重量或构成如何,落体同时到达地面的观点。(据说伽利略在比萨斜塔用下落的球验证了这一点。)
严格说,前面提到的只有在我们忽略了三种情况时才能成立。第一是空气阻力,它虽然很复杂,但只是无关紧要的因素。(更精确的实验可以在没有大气的月球上进行。)第二是升降机里面物体之间微弱的引力,当物体非常轻时,这种效应就可以忽略。那些只是用来检测引力场而相互作用不显著的物体称作检测物体。
上面提到的忽略的第三个因素是地面的弯曲,虽然实际上这种效应很小,但对引力的理解是很关键的。为了了解这一点,请看图1。在图中,升降机中两个检测物体自由地落向弯曲的地面。如果地球的曲率可以忽略,则它们下落的路径是平行的,因此它们之间的相互位置不会改变。事实上,每个物体下落都指向地心,因此它们的路径是逐渐会聚的。升降机中的观测者无法看到外面的景物却能够从检测物体的会聚速度来推断地球的曲率。
图1.两个邻近的物体向地面自由下落,两条路径互相逐渐会聚。
图2(a)中4个检测物体排成菱形。当升降机下落时,中间的一对物体逐渐靠近。最底下的物体靠地面稍近,由于地球引力与到地面距离的平方成反比,所以,它所受的引力也稍强。因此最底下的物体比邻近的物体下落得要稍稍快点。同样道理,最上面的物体下落得要慢。菱形在水平方向上被压缩,而在垂直方向将拉长,最终将成为图2(b)的拉长的形状。
升降机的实验表明,需要一个抵消引力效应的参考系来验证自由下落。但是由于引力场不是恒定的,检测物体所置的位置不同,引力也会有所不同。这些引力的细微影响被称为潮汐力,因为它们在月球引力场中引起了海洋的潮汐。
图2(a)排成方阵的四个粒子自由下落。
图2(b)由于它们感受到的引力的不同,方块形逐渐变为菱形。
底下的粒子由于更靠近地面,因此受的引力较大,下落更快。
最上面粒子由于离地面较远,因此落得比较慢。外边的一对粒
子逐渐靠近,见图1。
可能有人会指出原始引力只是相对于某个参照系,只有潮汐力才是绝对的,才代替真正的引力场。所以爱因斯坦构造了广义相对论。它的基本特征是,像图例中菱形的几何形状的改变是不依赖于检测物体的构成或质量(检测物体的质量不能太大)。这表明弯曲是物体下落空间的基本特征,而非作用于物体的力的结果。换言之,你可以看到物体在弯曲或卷曲空间的自由下落,而不是受力的作用而下落。爱因斯坦因而得出引力只是几何,空间的几何的弯曲的观点。
让我们更仔细地解释它。首先,很重要的一点是相对论把空间和时间结合了起来,实际上,在这里有关系的是时空的弯曲而非仅是空间。(弯曲的时空可能但不一定就是指弯曲的空间。)在学校里我们学的是欧氏几何,它适用于平面或三维情况下的平直空间。而在一个弯曲表面上几何规律就有所不同,如图3所示,在球面不可能画平行线。球面上和直线相对应的是大圆,就像经线。图中画出两条经线,它们在赤道处相互平行,但在北极相交。在这种弯曲面上,线的弯曲类似于在非稳恒引力场中落体路径的弯曲。后者的不同主要在于弯曲的几何不是二维甚至也不是三维,它是三维空间和一维时间的弯曲。虽然很难观察四维的弯曲,但是数学上的描述是很方便的。
图3.弯曲的测地线。因为地球的几何不是平的,两条直线(测地线)
虽在赤道平行,但会在北极交汇。这类似于引起下落的升降机中两个
物体一起运动的潮汐力。
爱因斯坦的广义相对论把引力场看作是时空几何的弯曲或卷曲。在这种理论里,落体不再被认为是在引力作用下的下落,而是沿内在的弯曲时空的可能的最直路径(测地线)的运动。在牛顿的引力理论里,地球绕太阳的轨道的弯曲是因为太阳引力迫使它偏离直线;而在爱因斯坦的理论中,没有这样的引力(虽然我们将继续不精确地说“引力”),它认为太阳在地球周围引起了时空的弯曲,而地球在这个弯曲的时空中自由地沿着测地线运动。引力效应可以确切地看成几何效应,因为它是普适的:引力可以相同地作用于所有的检测物体。因此,甚至光线在引力场中也将沿着弯曲的路径传播。图4是实验测得的星光受太阳的引力而弯曲的图示。更大范围地,星系的分布依赖于空间的几何。
图4.光线受重力影响而弯曲。太阳引力引起了遥远的恒星A
的星光的弯曲,使得A看上去处于B处。这种移动可以在日食
时观察和测量。
可能存在宇宙范围的空间规则的曲率这一事实带来了有关宇宙拓扑的有趣问题。如果空间是平坦的,它必须是无限的或者拥有某种类型的边界。但是如果空间是弯曲的,则会有另外的可能。想象一个二维面,弯曲的面可能围成一个球体,或者一个环体(见图5)。(请记住虽然球体是三维的,但球面是二维的。)闭合的球面的三维推广(称为超球面)是能够想象到的。如果宇宙具有超球面的拓扑,它将拥有有限的体积,但却没有边界或宇宙边缘。现在虽然还不清楚空间实际上拥有什么样的拓扑,但是,我们将要看到,这在超弦中是很关键的。
图5.拓扑是研究线、面怎样联接的学科。球体的拓扑与环
体的拓扑是不同的,环体中有一个洞。
1.4量子论
相对论使我们不得不放弃一些关于空间、时间和运动的日常观念。它以抽象的图像,像卷曲时空这样很难想象的概念取代了牛顿的直观物理。量子论也同样需要对物质本质的日常观念作根本的重新评定。
量子理论始于1900年马克斯?普朗克关于电磁辐射以分立波包或量子存在的假设,这些量子称为光子。光子在某种程度可视为光的粒子,这与传统的观念即光和其他电磁辐射以波的形式存在是难以相容的。这个显然的矛盾由波粒二象性的概念加以解决。光按它被测量的方法不同而表现出类波动或类粒子的方面,但是,它不能同时以粒子和波动的形式存在。尼尔斯?玻尔(Niels Bohr)把这种事件称为单一现实的粒子和波动互补性,这种现实本身在我们的感觉范围之外。反之,电子,质子和其他亚原子物体,虽然通常被看作是粒子,在某些情况下也表现出波动性。而光子与这些物体的情况一般说来相同,所以也被看作粒子的一种。
量子论的核心——波粒二象性隐示着某些与亚原子物体有关的量不能很好地定义。像量子波动有确定的动量,但在空间中它是弥漫的,因此没有确定的位置。另一方面,如果能精确地测定电子或光子的位置(通过光敏屏幕),它的动量就不能确定。因此我们能由一类实验来决定物体的动量,而由另一类实验来决定物体的位置,但是这两类测量是互相排斥的,我们不能同时确定量子物体的位置和动量。总之,量子系统的行为具有著名的维纳?海森堡(Werner Heisenberg)的测不准原理所表示的模糊性。
表述测不准原理的一种方法是假定所有的测量量都受不可预计的涨落的影响,从而使得测量值不精确。不能相容的物理量成对存在,像位置和动量。位置和动量的测不准或模糊性程度如分别记为△X,△P,那么测不准原理则使得乘积△×△P永远大于一个普适常数:普朗克常数h。因此h代表了自然的模糊程度,h的数值很小(6.63×10-34焦耳秒),也就是说虽然原则上它可用于任何系统,量子模糊性只在原子和亚原子层次才很显著。
另一对测不准原理应用的物理量是能量E和时间t。此时,△E△t不能小于h。总之,测不准原理的这两种表现说明了只有在动量的测不准程度大的情况下才能有小程度的位置测不准的可能,而时间的测不准程度大可以减少能量的测不准。在很多情况下,这就是说辨别极短长度和时间间隔需要极大的动量和能量。量子论因此对每个时间和空间间隔都给予了自然的能量和动量标度,探测的范围越小,需要的能量和动量越高。所以,物理学家建造了很大的粒子加速器。同时,任何物质终极结构的理论都需要论及最小的距离和最大的能量。这些理论的高能特征是特别有趣的问题。
因为量子论本身具有的不确定性,对电子之类的物体,牛顿力学定律不再有效(即便考虑了相对论效应),而必须由全新的量子力学来代替,它是由海森堡、欧文?薛定谔(Erwin Schr?dinger)在20年代发展起来的。类似地,像麦克斯韦方程之类的电磁场方程也必须由新的场量子理论取代,这方面工作从30年代开始发展。
亚原子粒子通常以光速运动,因此要求描述它们运动的量子理论与狭义相对论自洽,这由保罗?狄拉克(PaulDirac)在1928年建立起来,他的工作正确地预言了反物质。进而量子论应用于场(像电磁场),将能得到与相对论自洽的数学理论,称为量子电动力学或QED,即便这样,理论也遇到了数学上的困难,这个疑难直到第二次世界大战后才被解决。现在,所有的物理现象的基本理论都必须与相对论和量子论自洽。 1.5亚原子粒子的世界
已知的亚原子粒子有数百种。电子、质子和中子只是其中的三种,其他粒子从宇宙射线中发现或在粒子加速器中通过其他粒子的对撞而产生。除了少数亚原子粒子以外,多数粒子都是极不稳定的,通常在极短时间内衰变成其他粒子。
一种给定的粒子的所有成员都是相同的,我们不可能区别两个电子。同时,所有粒子都有它的反粒子,除了质量相同外,所有其他量都相反。所以电子带固定的负电荷,而反电子(即正电子)带有同样数量的正电荷。
粒子带有一些本征的物理量,其中最重要的是质量和电荷。由于某种现在还不了解的原因,所有已知粒子的电荷都是电子电荷的简单的倍数;而不同粒子的质量就没有简单的数值关系。
亚原子粒子的另一个重要本征量是它们的内禀自旋。许多粒子具有类似于绕本身的轴转动的内部转动。然而事实上,自旋是量子力学的性质,没有经典力学的对应,它与地球绕地轴转动是不同的。宏观物体的自转的角动量可以在一个连续范围内取值,而亚原子粒子的自旋角动量是量子化
的,即只能取1h的整数倍,h是普朗克常数h除以2π。为表达方便,自
2
旋1h的粒子可以简单地说“自旋1”。电子自旋为1,光子的自旋为1,
2 2 2
? 3
Ω 粒子自旋为2,等等。
内禀自旋的几何特性也非常奇特。通常自转的物体需要旋转360°才能恢复原来的位置,而自旋1的粒子则需要转动720°。换句话说,自旋
2
1粒子需要周转两次才能像自转的经典物体那样回复原先位置,好像这2
个粒子比我们看到的世界要大。我们的空间相对于粒子的空间是双值的,我们看到世界的两个相同模本,每一个都转动360°,对粒子就是可以区
分的。显然自旋1 的粒子的空间的几何与通常空间的几何有本质与微妙的
2
区别。
粒子自旋的精确值对决定它的物理性质也十分关键。自旋为1h偶数倍的
2
粒子与自旋为1h奇数倍的粒子的行为极不一致,前者称为玻色子,后者称
2
为费米子。费米子受泡利(Pauli)不相容原理的约束,两个全同的费米子不能处于同一量子态。而玻色子则不遵守这一原理。
物质的基本构造单元可分为两类。一类称为轻子,最普通的轻子是电子。另一种轻子μ子的质量是电子的206倍,它不稳定,在两毫秒内衰变为电子。还有一种质量大于电子的轻子是τ子,在1970年代被发现,它很不稳定。
除了三种带电轻子外,还可能有三种电中性粒子,称为中微子。每一种中微子对应着一种带电轻子,因而它们分别称为电子中微子,μ子中微子,和预言的τ子中微子(τ子中微子未能探测到)。很长的一段时间人们认为中微子无质量,以光速运动。电子中微子质量确实很小,但没有任何令人信服的理由说明为什么它没有质量。现在还没有人知道它的确切质量。
六种轻子都是自旋1的费米子。它们的相互作用相对地较小,也不参与核
2
作用。反之,核内粒子相互作用很强,除了熟悉的质子和中子,还有很多与核有关的粒子,这些粒子和其他由核作用产生的粒子称为强子。
强子一般比轻子重得多。质子的质量是电子质量的1836倍。较重的强子通常是费米子,这些费米子的强子称为重子。另外有些强子是玻色子,称为介子。质子和中子是自旋为1的重子。最轻的介子是π介子,自旋为
2
0。表1列出一些常见的强子,大部分以希腊字母命名。所有强子中,只有质子是稳定的,其余的将衰变成较轻的强子或轻子。
强子如此之多表明它们不是基本粒子,而是有内部结构的复合粒子,这正与轻子相反,轻子一般被认为是基本的粒子。在60年代早期盖尔曼(Gell-Mann)和兹威格(Sweig)猜测所有强子都是由更小的组元即夸克组成的,现在,这猜想已被实验证实。
像轻子一样,可能存在六种夸克,奇妙地称为夸克的味道。具有的名字是上、下、粲、奇异、顶和底(或真和美)夸克。同样,像轻子一样,
夸克是自旋为1的费米子。
2
夸克以两种方式组成强子。第一种是三个夸克的组合,按照量子力学
1 3的原理,三个夸克的自旋或平行或反平行,所以总自旋为2或
2称为重子。由于组成夸克的味道不同,因此不同的夸克组合对应不同的已知重子。例如质子、中子、Ω-粒子分别由两个上夸克和一个下夸克,一个上夸克和两个下夸克,以及三个奇异夸克组成。
另一种方式是夸克和反夸克组合。量子力学原理则决定最后的产物是自旋为0或1的玻色子,对应着介子。因为介子只含一个夸克和一个反夸克,而重子含三个夸克,所以介子一般较轻。但因为粲夸克的质量比上、下夸克的大许多,所以由粲夸克-反夸克对组成的介子质量比质子实际上大很多。由于三个夸克组成一个重子,所以夸克的电荷量必须为基本单位(质
子的电荷)的1或2。这种分数电荷使得夸克在实验上非常奇特,但是一
3 3
般认为夸克不能自由存在,它们被禁闭在强子中。所有由粒子对撞来分解强子的努力都失败了,并且从已知的有关夸克的内部结构来看,夸克确实是完全禁闭的。
虽然物理学家不能研究孤立的夸克,电子射过核物质的实验为夸克的存在提供了一些间接证据。电子散射的花样显示了每个核粒子内存在三个重的微小物体。夸克存在的其他证据来自强子的衰变和高能对撞实验的强子喷注的产生等等。
多数物理学家认为夸克和轻子代表了物质结构的最基本层次,即所有的物质都由它们构造而来。当然也可以猜测这些粒子由更小的物体构成。事实上,一些物理学家认为,作为基本粒子,夸克和轻子数目太多。(除六种夸克味之外,每一个味道的夸克有三种“颜色”,因而总共有18种不同的夸克。)但是,承认夸克和轻子是基本的就会带来它们的存在形式的问题。
作为基本粒子,它们不能分裂也不能通过内部的重新排列变成其他的东西。因此长期以来夸克和轻子被认为是没有内部结构的点粒子。但是,我们将看到,点粒子假设在理论上有很严重的问题,这些基本粒子看来终究还是可能有某种内部结构的。
1.6四种力
在日常生活中,虽然自然界看上去好像有多种作用力,但事实上所有的这些作用力都可约化到最基本的四种。其中引力是人们最熟悉的,也是首先被牛顿用系统的数学理论所描述的。引力是唯一对任何物体都起作用的力。引力源于物体的质量,因此物体越重,引力越大。除了某些奇异的情形外,引力是相互吸引的一种力。
引力的作用范围是宏观的,甚至是宇宙范围的,所以被称为长程力。随着距离的增大,引力按平方反比律逐渐减弱。引力的绝对
表1.一些常见的强子
质量单位为Mev(百万电子伏特),电荷单位为质子电荷量,寿命单位为秒,在反粒子与粒子不一样的地方,另有记号(即粒子符号上加一杠,如反质子为P)。
强度很小,电子和质子之间的引力大约是它们之间静电力的10-40分之一,因此引力在亚原子层次的粒子物理中作用很小。尽管如此,它是自然的一种基本力,任何一种统一理论都必须处理它。
描述力的一个重要概念是场。牛顿认为引力是“超距的作用”,换句话说,即作用从一个物体瞬时传播到另一物体。以现代观点来看,每一个物体是力的场源(此时是引力场),另外的物体,受这个场的影响,感受到了那个物体的作用。引力随距离的增大而减小,这是因为远离场源处的场的强度依次递减。
1915年爱因斯坦的广义相对论革新了牛顿的引力论。我们已在1.3节中提到过,在这个新的理论中,引力场纯粹是一种时空曲率的弯曲。这种理论使引力明显地区别于其他力。
在牛顿的引力论之后,建立了理论基础的另一种力是电磁相互作用(电磁力)。电和磁的作用很容易在实验室中观察到。虽然古代人们就发现了电磁现象,但是直至19世纪才由麦克尔?法拉第(MichaelFaraday)和其他人发现了电和磁之间的密切联系。尔后,詹姆斯?克拉克?麦克斯韦成功地以一组方程统一了电和磁的作用,这是统一自然中各种力的第一个尝试。
电磁场的源是电荷。并不是所有粒子都带电,因此电磁作用不像引力,它不是对所有粒子都起作用;而它又很像引力,是以距离的平方反比递减的长程力。电磁作用比引力的强度要大得多,而且,因为电荷有正负两种,因此大的物体的总电磁力有可能相消,以致引力在宇宙范围内比电磁力大。
还有两种力是亚核水平的,它们是在日常生活中不可直接观测的。其中的一种叫强核力,是把质子和中子约束在核内的力。在10-15米范围以外,强相互作用(强力)迅速递减,因此它是短程力。它的性质与长程的引力或电磁力的性质相差极大。不仅质子和中子,而且所有的强子都受强作用力的作用,而轻子则没有。
强子间的力很复杂,这是因为强子不是基本的粒子而是夸克的复合体,夸克间的力才是基本的相互作用。这个力与电磁力很像但比它大很多。重子中由于三个关联的夸克相互作用而不像电磁力是二体力,因此荷的问题处理起来很复杂。对照于只有一种电荷的电磁力,强力有三种荷,称为“颜色”,记为红、绿和蓝。
最后一种力称为弱相互作用(弱力)。它作用于所有的夸克和轻子,强度比电磁力小得多,但远远大于引力。弱相互作用主要的作用是改变粒子而不对粒子产生推和拉的效应。它首先是用来解释β衰变,即一种不稳定核子的放射性效应。在典型的β衰变里,中子衰变成质子、电子和反中微子。这种由弱相互作用引起的过程改变了中子的夸克味,使一个上夸克变为下夸克。弱相互作用能改变夸克和轻子的味。在后一种情况中,电子可以变为中微子,等等。
中微子只经受弱相互作用(当然也有引力),因此它们的相互作用很弱。事实上,它能在固体铅中穿越好些光年的长度。中微子的冲击可以在星体的剧烈的死亡过程中被观察到。平均每个星系在几十年内都会有星体的爆发,称为超新星。几个世纪以来,已经观察到很多的实例。最近的一次是1987年春天发生的大麦哲伦星云(一个附近的小星系),从地球上能看得见。
超新星爆发的第一步是星体的核在自身重力下突然塌缩。在这个内部破裂的过程中,释出了大量的中微子,它们的极强的冲击力炸开了星体的外壳,把大量的物质抛入太空,从而形成一个膨胀的气体云。在1987超新星爆发时,中微子冲击力在视觉看到爆发的前几个小时已经在地面上被观测到。
弱相互作用范围很小。在这个力最早被发现时,曾假设它是接触性的作用,但现在通常认为它的作用范围是10-17米。
1.7媒介粒子
我们已经讨论过,亚原子粒子的行为必须用量子论处理,任何在亚原子水平上对力的描写因此都必须与量子论自洽。量子论的起始点是普朗克关于光是分立的波包或量子,即光子的假设。电磁波是以光子形式在空间中传播的,它具有粒子性。光子既不是夸克也不是轻子,它属于第三类粒子的家族。
在1.5节中我们谈到,虽然强子中既有费米子又有玻色子,但夸克是费米子,类似地轻子也是费米子。因此,物质的基本粒子都是费米子。光子与它们不同,它的自旋为1,是玻色子。光子的静止质量为零,按定义它以光速运动。
在讨论电磁力的作用时,必须讨论光子的存在。图6中是经典图像中两个带电粒子的运动路径。粒子相互接近时,A粒子的电磁场作用于B上,排斥力使B的路径偏折,反之,B对A的影响也是如此。在这个称为散射的过程中,粒子间交换动量和能量。
在量子论中,能量和动量是量子化的,即它们不是连续变化的,而是仅取某些分立的值。因此,图7的效应的量子解释与图6有些不同。两个粒子不再是通过电磁场的连续的能量和动量流,而是以交换光子的形式相互作用。图7中是单个光子的交换,波纹线代表光子。由于测不准原理,光子路径的方向是不确定的,发射和吸收光子发生在不确定的时间间隔△t内。从这个观点来看,光子是一种在带电粒子间传播电磁力的媒介粒子。物理学家称,像电子这种带电粒子与光子耦合,从而引起了电磁效应。
双光子交换也会发生,但是对散射效应的贡献比单光子交换小得多。三个、四个光子交换过程更弱。图6、7是按照里查德?费曼(RichardFeynman)命名的,称为费曼图,而其中的理论称为量子电动力学。对散射和其电磁效应的详细计算证明非常成功,并与实验结果惊人地一致。
自然力的所有力都可以这种方法处理。每种力都有它的媒介粒子。引力中光子的类似物称为引力子,它也是一种无质量的玻色子,但自旋为2。引力子与其他物体的耦合极弱,它们的效应还有待实验证实,但是,非直接的现实和物理的自洽性都预言了它的存在。光子和引力子的无质量与电磁力和引力的长程性密切相关。
引力子与光子的另一个重要区别是光子与带电粒子耦合,而引力子与所有粒子耦合,包括引力子。就是说引力子也受到重力
图6.在经典物理中,带电的粒子的相互作用是由动量的连续传输而引起的。
图7.两个带电粒子如电子的排斥力可以从它们之间的光子传递算出。
图8.引力子相互作用的费曼图一例。
的作用,而且相互作用,如图8所示。这样的图表示引力是非线性理论,即引力不满足线性叠加律。在线性理论如电磁理论中,光子束可能相互交错,但是没有相互作用。引力的非线性本质使得它的量子化理论很难建立(参阅1.12节)。
我们谈到过,强作用力类似于电磁相互作用,但它有三种荷,称为颜色,为解决这种复杂性,需要至少有八个媒介粒子。它们被称为胶子,自旋为1,是强相互作用的场量子。但是,像引力子一样,胶子之间有相互作用,即胶子像夸克一样带有颜色。这种理论称为量子色动力学(或QCD),是非线性的。夸克之间的力因此与距离的关系与通常情况很不一样。大多数力的强度随距离的增加而减小,但胶子作用力正好相反。在短距离内或高能范围力很小,但当夸克分开时,它们之间相互作用就会加强。这很类似于弹性弦,且力随距离的增大而增大是没有限度的。如果是这样的话,夸克就会永远被束缚在强子内。
最后,弱作用力也有它的媒介粒子,称为W,W,Z粒子。它们的自+ -
旋为1,但与其他的媒介粒子不同,它们的质量不为零。实际上,它们的质量很大,W、Z的质量分别是质子质量的80和90倍。媒介粒子的质量不为零这一事实说明弱相互作用是短程的力。Z粒子与光子除了质量以外非常相似,W粒子是带电的,W实际上是W的反粒子,它们的电荷数值都- +
是一个单位的电子电荷。
1.8对称和超对称
虽然研究对称性所需要的高等数学是在本书范围以外的,但是它的基本概念是不难掌握的。为明确概念,想象一些简单的几何图形:正方形、等边三角形、圆(见图9)。每个图形都有丰富有趣的对称性质。试着在一本书的破折线上垂直地放一面镜子,镜中图像的形状不会改变。在每种情况下,左边的图形都是右边图形的反射。对此,一种有趣的表达方法是:这些图形在破折线轴的反射中是不变的。注意反射对称性的轴的个数对不同的图形是不同的:正方形有四个,等边三角形有三个,而圆形有无穷多个(把镜子置于任一条直线上)。
图9.几何对称性的例子,每个图形按破折线反射不变。
我们在这些图形中可以发现其他的对称性。如果三角形按中心的点被转动120°,240°,360°,图形不变。正方形有四个不改变其形状的转动角:90°,180°,270°,360°。可以说它们在以120°和90°的倍数角度转动下不变。圆按圆心转动任何角度都不改变其形状。对称性因此可以是连续的,也可以是分立的。圆的转动是一个连续的操作,任何时候都不改变其形状。另一方面,正方形和三角形的转动及反射对称是分立的。
用什么来表明圆比正方形的对称程度要高是一个有趣的问题。我们注意到正方形比圆形的结构复杂。当把圆稍微变一变形,或在圆上添加一个点时,转动对称性就会被破坏。在这两种情况下,都是在圆上面附加新的结构。通常一个结构简单的系统有更高的对称性。
结构最简单的系统可能是空的空间。转动它时没有什么会改变,在给定方向的移动也是如此。我们可以说空的空间在所有的方向和位置上都是一样的。(忽略了引力的弯曲效应,在粒子物理中完全可以这么假设。)同时,在镜象反射下空的空间是不会改变的。这一基本的观察可以由于空间的几何结构(距离和角度)在连续的转动和平移和在任何平面的反射下是不变的这种说法而表达得更为精确。
在这个无结构、空的世界中,时间也具有对称性。在没有事件发生的虚空中,任何时刻都是等同的,也就是说有时间平移不变性。同时时间反演不变,即没有区别过去和未来的时间箭头。
实际上的世界当然不是空的,它充溢着各种场,粒子和不休止的量子作用。空的空间的对称性被破坏,或许它们将是近似对称的。如在太阳系中,不是所有的方向都是等价的,向着太阳的事物与背着太阳的事物截然不同。但是在许多情况下这种偏离是不重要的,可以忽略。
假设一个处于外层空间的孤立粒子,这个粒子可以是一个台球或者原子(假设忽略量子效应),同时,假设像太阳和其他粒子与它距离太远,以至不能对它的行为产生影响,而且任何场的作用都是很微小的。在没有力的作用下,粒子是不会古怪地向某一方向运动的。我们假设某些外部的力被忽略了,在没有力的情况下,粒子肯定是不能运动的。这种想法的基础完全是我们对空间在平移下是对称的猜测。如果空间的某一部分与其他部分一样,为什么粒子会选择某一特定方向运动,而不选择其他方向呢?
类似的推理可用于转动。不能想象,不外加作用物体会突然转动。为什么它顺时针而不逆时针转动呢?此外,物体以空间某一特殊的方向转动为轴转动。如果空间在转动下对称,就没有特殊的方向,所以物体不可能自发地转动。
这些粗略的讨论可以用精确的数学语言描写。数学理论可以提供空间几何对称性与物体动力行为的关系。事实上,不存在自发运动对应着动量和角动量的守恒定律。空间平移不变直接导出粒子的动量守恒,转动对称性则导出角动量守恒。除此之外,能量守恒可以看作是时间平移不变的结果。因此物理中最基本、最深刻的定律是源于空的空间没有结构这样一个基本而平凡的事实,它表明对称性维持着自然世界的秩序。
所有的力是否都遵从空间和时间的几何对称性?麦克斯韦的电磁理论和引力显然都满足我们刚讨论过的对称性。在很长一段时间里,物理学家假设核力也满足这些几何对称性。当然,如果在亚核水平,能量、动量和角动量不再守恒,就会带来新的问题。
物理定律怎样由分立的几何对称性描述呢?假如放映一部关于某个自然过程的影片,并投影到镜中去,我们能发现任何不同吗?我们能在镜中看出任何现实中不能实现的过程吗?而且如果影片从后向前放映,我们能观察到任何违反物理定律的过程吗?
举个简单的例子,假如影片是关于一个转动的球体(见图10)。转动轴定义了一个特定的方向,我们画根线作记号,在镜子中它的手征改变了,即转动方向相反,我们看到了一个以相反方式转动的球。但是自转的方向是没有什么特别的,所以镜中的转动与外面的转动有同样的可能存在。当然如果这个球体是地球,镜象的转动是不可能的,因为这时太阳将由西至东运动而不是由东至西运动。但是,我们讨论的是物理定律的对称性,而不是现实世界的某个大的物体。在亚原子世界,不可能用地球上的“大陆”来区别两种粒子,因此这种偶然的复杂性是不存在的。
转动球体的例子也解释了时间反演对称性,倒着放映的影片中转动倒转。从过程本身我们不能判断它是正着或倒着放映,因
图10.反射对称性。转动球体在现实世界中顺时针转动,在镜象中逆时针转动。如果我们不能识别镜子,我们不能区别哪一个球是实体,哪一个球是镜象。两者都是同样可能的过程。镜象中过程在转动球体的影片倒映中也发生。
为球体没有特征,看起来两种都是可能的。同样,在日常生活中我们很容易判断像高楼塌毁,水珠溅射,绘画这样过程的倒着放映的过程是不可能发生的。但是在微观世界中,转动倒转没有什么特别的地方,同样,粒子碰撞和分解的时间反演也不是很奇怪的。只是当很多粒子共同活动的过程倒转了,我们才会怀疑时间反演对称性的正确与否。例如,中子自发分解的质子、电子和反中微子的过程如倒过来看,我们将看到大量的不可能的质子、电子和反中微子的复合。
日常生活中的对称性虽然可以以许多方式存在,但是在几何上特别显然(见图9)。时间对称性已经讨论过,还有一些不是直接与空间和时间有关系的,在物理上非常重要的对称性。一个简单的例子是电荷反演的分立对称性。电子和反电子可以看作是互为镜象的粒子,同时正电子也可看作是电子的电荷反演。它们的电荷数值的相等隐示着电荷反演是精确的对称,因此我们猜测物理定律在电荷反演下不变。
从一些非常弱但又没有人怀疑的假设出发,有一个非常有趣的数学定理,证明了物理定律在空间反演,时间反演和电荷反演这些操作联合作用下不变。这些操作分别记为P,T,C。这个定理称为CPT定理。
在50年代中期,物理学家在强子的弱衰变的某些过程中遇到困难。两个美籍华人,李政道(Tsung Dao Lee)和杨振宁(ChenNing Yang)为了解决这个问题,大胆地提出了弱作用可能破坏宇称守恒的观念。虽然那时几乎所有人都假设宇称守恒,但奇怪的是没有人对弱作用作过实。验随之,另一个美籍华人吴健雄(Chien-Shiung Wu)的实验证明了弱相互作用确实破坏宇称守恒。
吴健雄的实验包括测定从钴60核发射的β衰变粒子的方向,实验的目的是确定这个方向与钴核自旋轴的相对关系。如图11,按惯例图中自旋矢量方向与转动成右手螺旋关系,吴健雄发现在与钴核自旋方向相背时,发现电子的可能性更大。在镜中看,正好相反,所以衰变确有偏好的手征,镜象中过程是不可能的。实验直接证明了β衰变中宇称的破坏。
宇称不守恒是弱相互作用的普遍特征。一个简明的例子是μ衰变的-电子e和中微子。虽然中微子不能直接观测,但是μ子自旋方向和电子-
运动方向是很容易测量的。我们发现,虽然电子可以在相对于μ子自旋轴的任何方向发射,但是电子更可能在μ子自旋
图11.宇称破坏。吴健雄的实验证明了Co60核β衰变的粒子倾向于在核自旋矢量方向一侧发射。在镜中这个不对称性正好相反。
图12.当μ-衰变时,发射的电子倾向于图中自旋轴的右侧(图
中略去中微子)。显然它的镜象是不对称的,镜象中电子取左
侧。这正是反粒子的衰变过程的取向。
看起来是顺时针的一边发射。
在图12中,右边是衰变过程的镜象反射。镜中μ子自旋倒转,所以镜中电子更可能在μ子自旋看起来是反时针的一边发射。因此镜象反射改变了μ子自旋方向与发射粒子运动方向之间的关系。类似的分析可用于反粒子过程,即带正电荷的μ子(u)衰变为正电子(e)。我们发现+ +
的情况正好相反,这种过程的方向取舍正如图12中的镜象过程,而且这种发射方向的不对称性与图12中镜象过程完全一致。这种结果与物质和反物质的对称性一致,它隐示宇称反演P和电荷反演C的联合过程CP中μ子衰变过程是不变的。因此,即使宇称P被破坏,CP也保持对称性。
弱相互作用中宇称不守恒的发现对物理学家来说是一个非同寻常的结果。虽然宇宙中某些复杂结构具有特定的手征性(如DNA),物理定律中优先手征的存在则具有更深刻的涵义。它意味着即使没有复杂结构,自然也能分辨左、右手。物理学发展的历史表明,每当有新的数学发现,总会带来物理的巨大的进展。特别是在对称性的研究中,虽然数学描述的对称性很难想象,但它们能给我们提供对自然的新的重要原则的认识。探索新的对称性已经成为物理学家认识世界的一个重要手段。
到这里为止,我们已讨论的连续的对称性都涉及空间或时空。但是具有更抽象性质的连续对称性也能被发现。我们知道,每个守恒定律总是对应着一种对称性,那么电荷守恒定律背后的对称性是什么呢?电荷有两种:正电荷和负电荷。电荷守恒定律指出正电荷的总数量减去负电荷的总数量是一个不变量。如正电荷和负电荷相遇,则两个电荷相互抵消。同样,正电荷可以伴随同样数量的负电荷产生。但是任何电荷的净增或净减都是不可能的。
电荷如果守恒,有人会问是否存在导致这个定律的对称性。各种动力学守恒定律,如动量和能量守恒定律是与连续的几何对称性相联系的。电荷守恒定律涉及抽象的性质而非动力学的性质,它对应着某种抽象的对称性。作为一个日常生活中抽象对称性的例子,可以考虑通货膨胀的问题。当英镑或美元贬值时,一个拿固定收入的人的财产则随之贬值。但如果这个人的收入是与经济指数相关的,即他的收入随货币贬值而增加,则他的实际收入与货币的价值是无关的。一种学究气的说法是与指数有关的收入在通货膨胀变化下是对称的。
物理中有很多非几何对称性例子。一个例子是提举重物作的功。这个功只依赖于重物所提升的高度差,而不依赖于提升路径,也不依赖于绝对位置,即在海平面和地面把重物提升同样的高度差所需作的功相等。因此,存在一种自由选择起点的对称性。
电场中也存在类似的对称性,这里电压类似于高度。在电场中如果电荷从一点移到另一点,所需的能量只依赖于移动路径上两点之间的电压差。如果在这两个点上电压增加的量相同,需作的功相等。这是麦克斯韦电磁方程的一个重要对称性。
上面的三个例子是物理学家所称的规范对称性。这些对称性可以看作是分别重新标度钱币、高度和电压。它们不是几何的,而是抽象的对称性,我们不能直观地观察到这种对称性。但是它们仍是有关系统性质的重要标记。的确,正是电压的规范不变性,保证了电荷的守恒。规范对称性在寻求自然中各种相互作用的理想的量子理论中起着核心的作用,而且统一力的尝试都是在规范对称性的范围之内的。
我们已经看到,物理对称性有两类,即几何对称性如转动和反射,和抽象对称性如规范对称性。在70年代早期,理论物理学家发现了一个未知的比像转动和平移这种操作更深刻,更有效的几何对称性,它就是超对称。
在1.5节中已经提到,费米子所感受的空间的几何结构与玻色子所感受的空间的几何结构有着本质的差别。费米子必须转动720°才能回复到原先的位置。这种双值性决定了它的几何对称操作如转动的代数与玻色子完全不同。玻色子和费米子如此不同的一个原因就是它们的几何特征完全不同。
超对称的新的特点是它提供了一个可以同样描述费米子和玻色子的框架,这在通常空间的几何操作的框架内是不能处理的。在超对称理论中,在通常的四维时空上附加另外的四维,称为超空间,目的是为了容纳费米子奇异的几何性质。因此这些附加的“费米维数”不是如我们所知的空间或时间的维数。
附加维数的几何规则是非常奇特的。以转动作为一个例子,很容易证明,如果连续作两次转动,则结果是依赖于两次转动操作的次序。图13中的书作两次90°转动,两种情况下最后书的取向是完全不同的。如果两个转动分别记为R1和R2,则两种情况的差别可记为R1R2≠R2R1,或R1R2-R2R1≠0。式子R1R2—R2R1称为R1和R2的对易子。从这些对易关系出发,我们能建立描述书或玻色子所处空间的转动代数。同样也能类似定义在附加的四个费米子维数中的转动R。但是,由于这部分超空间必须描写内禀自旋的奇特的几何性质,所以我们处理的是反对易子R1R2+R2R1,而不是对易子。看起来很随便的一个符号替换却在数学描写上有极大的区别。自洽地结合这两种数学理论,我们就得到了玻色子和费米子的统一的描写方法。超对称操作能从通常空间转到附加的费米维数,即能把玻色子变为费米子,把费米子变为玻色子。所以我们可以把费米子和玻色子看成一个几何存在的两个不同的投影。
直此为至,超对称只被看作一种数学性质。我们想知道现实世界中是否有超对称。如果世界是超对称的,我们将期望能看到费米子和玻色子的直接的物理联系。例如每个已知的费米子都有对应的玻色子,每个已知的玻色子都有对应的费米子,即每个粒子都有其超对称伴侣。
从现在已知的玻色子和费米子来看,这种对称性是不成立的。
图13.转动互不交换。在上边过程中,把书沿垂直和水平轴作90°
转动,在下边的过程中,次序颠倒,两次过程结果不一致。但这并不意味着超对称与现实世界无关。首先,在物理中更深层次的对称性经常会在某些系统的物理态中破缺。这种对称性破缺在电弱作用理论中是必然的,而力的更深层次的对称性是隐藏着的。因此有可能自然本身是超对称的,但是在现今所考察的现象中是破缺的。
其次,没有理由认为已知的费米子是已知的玻色子的超对称伴侣,很可能存在着已知粒子的尚未发现的超对称伴侣。我们可以假设存在光子的超对称伴侣,但是它与通常物体的作用极弱,所以还没有观测到。类似地,我们有胶子、引力子的超对称伴侣,有费米子、超夸克和超轻子。现今这些奇怪的超对称伴侣都是假设的,因此超对称是一个理论上强有力的观点,但缺乏实验证明。
1.9力的统一
当麦克尔?法拉第在1830年代发现电磁感应现象时他就在自然界的两种相互作用力——电和磁之间建立了一种明确的联系,虽然直到1850年代由于麦克斯韦在数学上的洞察力才给出一种完全统一的电磁理论。尽管如此,在1850年法拉第就进一步猜测在电与引力之间或许存在某种联系。为探究这一想法是否真实,法拉第制作了几件巧妙的装置,它们可以用来检验比如说落体是否产生电场。图14的漫画说明了这一装置的大致原理。法拉第的实验结果是否定的,但这并没有打消他的信念,即深入下去,电力和引力是某种普遍的超力的构成部分。
随后关于统一引力与电磁作用的认真尝试是在1921年。那时爱因斯坦发表他的引力理论——广义相对论还不过几年。正如在第1.3节介绍的那样,这一理论的一个重要特点是空间和时间统一成为一个四维时空。受此启发,德国数学家西奥多?卡鲁扎决定,作为一种简单尝试,通过附加一维额外的虚空间自由度来写出五维而不是四维的爱因斯坦引力场方程。这一尝试出人意料地富有成果。在通常的四维时空中看,这一五维的爱因斯坦场方程不但给出了通常的四维引力方程,同时还给出另外一组方程,而它们恰好就是电磁场的麦克斯韦方程组。所以,通过在五维时空中表述引力人们可以从一个单一的理论中同时得到引力论和电磁理论。换句话说,按照卡鲁扎的理论电磁作用原本不是一种单独的力,它不过是引力的一个方面,尽管是在一个有着不可见的更高维空间自由度的世界里。
图14.法拉第试图用这个漫画来揭示电力与引力之间的联系(该图由A.德?鲁米拉提供)
A:小球B:垫子C:阻流圈D:电流计E:皇家学院F:M.法拉第
S:绳子
这一理论的主要弱点在于:事实上现实世界中我们只感受到四维自由度。所以,如果要认真看待五维时空的想法,就有必要解释什么是第五维自由度。1926年瑞典物理学家奥斯卡?克莱因(OscarKlein)对此给出了一个非常简洁的回答。克莱因认为我们没能察觉到那一维额外自由度的原因是,在某种意义上它“卷缩”到一个非常小的尺度。这情形好比软水管。从远处看,水管就像一条弯弯的曲线。一旦走近细瞧,才发现我们先前认作曲线上的一点原来竟是绕管子圆周的一个环(图15)。按克莱因的猜测,设想我们的宇宙就类似软水管。我们通常当作三维空间的一点其实是绕第四个空间轴的一个小环。从空间中的每一点衍生出一个小圈,它的方向既非向上向下,或向左向右,也非我们所能感觉的空间的任何其他方向。我们没有察觉到这些小圈——这使得克莱因能自圆其说——的原因是由于它们的周长小到令人难以置信的地步。
图15.从远处看一根软水管就像是一条线。一旦走近就会发现线上的
P点却原来是绕管子的一个圆环。极有可能三维空间中我们通常当作
的一点实际上是绕另外一个空间自由度的小环。这种想法构成了卡鲁
扎——克莱因电磁与引力统一理论的基础。
对克莱因的想法要花些力气才能习惯。这里的部分困难在于很难具体设想那些小圈是在什么地方环接起来的。这些圈并不在我们的三维空间里,它们将空间扩展,正如一条波浪线刚性地绕某一个圈移动会形成一根管子。在二维空间我们很容易设想这一情形,但在四维却不能。尽管如此,这一想法仍是有意义的。克莱因能够从电子或其他粒子所带电荷单位的已知值以及这些粒子之间的引力强度计算出那些绕第五自由度的小圈的周长。这一周长的值为10-30厘米,或约为一个原子尺度的10-17倍。无怪我们迄今未能察觉这一假想的第五自由度,因为它如果存在的话也将卷缩到一个比我们目前能够分辨的(甚至在亚核粒子物理中的)任何结构要小得多的尺度。
虽然卡鲁扎-克莱因理论构思精巧,但在50多年里它始终仅仅是一种数学上的奇思异想。随着1930年代弱和强相互作用的发现,统一引力与电磁作用的设想已远非当初那么诱人。任何成功的统一场论都将不得不容纳四种力而非原来的两种。因此,在科学家们对有关弱和强相互作用有了恰当的了解之前,统一是不可能实现的。
在1950年代开展起来的关于亚核粒子及其相互作用的研究揭示出一种令人困惑的复杂景象,它阻碍任何简单的统一。事实上,在已知的四种力中,只有电磁作用存在一种理论(量子电动力学)既内部自洽又与相对论和量子力学这些十分重要的理论相协调。
其他三种力在当时均未得到人们的很好认识。宇称不守恒的发现要求对弱相互作用的理论进行全面彻底的检修以便使它的作用量中可以包含左右不对称项。这一点做到了,但相应的理论只对一些简单弱作用过程给出有意义的结果并且过程涉及的能量尚不可太高。对于大多数过程来说理论计算的结果毫无意义。所以这一理论在数学上不自洽,缺乏预言力,因而明显地存在根本性缺点。
强相互作用在当时则全然没有被了解。确实,强子之间的相互作用那时看上去似乎涉及除单一的强核力外不同场与力的复杂纠缠。现在,我们知道强子之间的相互作用事实上只是更为基本的夸克之间的相互作用的一种复杂的残余表现,但在早期人们试图把强子间的力看作是基本的相互作用。早在1935年日本物理学家汤川秀树(Hideki  Yukawa)通过类比量子电动力学给出了强作用的模型,其中引入了在强子之间传递强相互作用的“媒介”粒子从而导致了对π粒子的成功预言。尽管如此,很快就发现这种交换π粒子的模型只能给强核力一种粗略的描述。而且,像弱相互作用的情形一样,对于强过程的计算往往给出毫无意义的结果。
在1950年代,引力处于一种很特殊的地位。与弱和强相互作用不同,引力在经典(即非量子)水平上存在一个自洽的,非常优美的理论形式,即爱因斯坦的广义相对论。而且这一理论所导致的独特预言也为实验所证实。但是,物理学家在试图给引力一种量子力学的描述时遇到了广义相对论的主要困难。同弱相互作用的情况类似,数学上的不自洽使得理论对于哪怕是最简单的一些过程也无能为力。
在五六十年代引力论的量子形式所存在的困难为绝大多数物理学家所忽略,因为引力通常只在天文尺度才变得显著而在这一尺度爱因斯坦的经典引力论完美无缺。引力子与其他粒子的耦合太弱以至于它们不被发现并且在粒子物理中不起直接的作用。然而量子引力的困难如果存在的话要比弱和强相互作用所遇到的困难大得多。广义相对论在20世纪物理学中占据中心位置,这不仅仅是因为它的成功预言。这一理论建立在非常深刻,明晰和优美的原理基础上,它在原理上如此简单;在数学上如此吸引人;它将引力归结为纯粹的几何。所以这一理论在哲学上如此诱人,有一种无法抗拒的美感。
相比之下,量子理论有着相当不同的地位。它不具备广义相对论那种内在的简明与美学上的吸引力。它的基本假设是与直觉相悖的,就观察者而言它在哲学的自洽性方面也存在着严重的疑问(关于后面这一点,请读者参阅我们的另一本书《原子中的幽灵》)。但另一方面,量子理论在应用上的成功又远远超过广义相对论。量子力学已成为粒子物理,核,原子,分子和固态物理,物理化学,现代光学,恒星天体物理学以及宇宙学等不可或缺的组成部分。
人们常说20世纪的物理学是建筑在相对论和量子理论之上的。前者极为优美令人叹服但在应用上颇具局限性;后者虽然多少有些哲学上的含混却在科学上创造了无与伦比的记录。两者不相协调这一事实意味着在物理学的核心处存在深刻的灾难性的矛盾。所以任何一个成功的包罗万象的理论必须设法消除这一矛盾。
1.10统一的规范理论
多年来量子引力的问题一直被认为是完全无法处理的。随着物理学家把他们的注意力转向弱和强的相互作用,这一问题几乎被彻底搁置在一边。在60年代初期,希尔顿?格拉肖(SheldonGlashow)以及其他一些物理学家注意到,尽管弱作用与电磁作用表面上非常不同,但在更深层次上它们却具有相当多的共同点。例如,它们都是通过自旋为1的玻色子传递的,而且在许多方面,可以类比电荷、电场等概念引入弱“荷”与弱“流”来描述弱相互作用。电磁作用与弱相互作用的主要不同在于光子是无质量的,所以电磁作用是长程力;而弱相互作用的场量子却很重,使得弱相互作用的力程非常短。如果弱相互作用也能具有电磁力一样的长程性,那么两种相互作用就几乎是完全相同的。因而物理学家们开始相信或许有可能在一个共同的理论里同时包括两种力,从而将麦克斯韦在19世纪开创的统一计划进一步扩展。
数学上的分析表明光子无质量这一性质是与麦克斯韦电磁场方程组的规范对称性密切相关的。正是后来证明十分重要的这一规范对称性保证了量子电动力学在数学上的自洽性。相反地,弱相互作用的“媒介”粒子具有质量,这将使得相应的动力学可能具有的任何规范对称性遭到破坏。这一性质使得弱相互作用的早期理论不尽如人意。如果能够克服这一困难,那么将有希望找到一个描述弱相互作用的自洽理论并且使之与电磁作用统一起来。
在60年代后期,斯蒂芬?温伯格(Sieven Weinberg)和阿卜杜斯?萨拉姆(AbdusSalam)各自独立地发现有可能在不破坏弱作用内在的规范对称性的情况下使弱“媒介”粒子获得质量。这一质量可以通过弱作用场内部一定的相互作用来自发地产生,而不是在理论的基本层次——动力学方程之中引入。质量的这种自发产生是一种次级效应,可使动力学所具有的规范对称性免受影响。
弱作用的规范对称性可能是自发破坏而不是动力学破坏,这一想法是基于同物理学许多分支中人们较为熟习的其他对称性自发破坏形式的类比。图16描述了基本的经典力学中的一个例子。如图所示,设想一个小球位于“墨西哥帽”顶。小球处在这一位置显然使得整个系统的状态相对于过顶的垂直轴具有转动对称性。而且,因为重力作用在竖直方向,所以对于系统来讲所有水平的方向都是等同的。因而小球所受的力也同样具有转动对称性。于是,在这一位形中小球的位置(也就是系统的状态)反映了作用在它上面的力的内在对称性。然而,这一状态很明显是不稳定的。如果小球受到扰动,它将顺着帽子的顶面滚下,通过消耗势能,最终会
停在“帽沿”的某一个位置上。(图16)这时的位形是稳定的,但转动对称性被破坏了。小球落在帽沿的哪一个位置并不十分重要,事实上它是完全随机的。然而小球处在帽沿上使得体系的状态不再反映作用在它上面的力所具有的对称性。这里,基本的力所具
图16.对称性自发破坏。小球位于“墨西哥帽”的顶端。这种位形是
转动对称的。然而这种状态是不稳定的,小球会自发地滚落到帽沿上
去并停留在帽沿的任意一点上。这样,转动对称就破坏掉了。系统以
牺牲对称性换取了稳定。
有的对称性依然存在,但它被状态的非对称性所掩盖。这种对称性破坏方式称为“自发”破坏。温伯格和萨拉姆提出W和Z粒子(弱作用的“媒介”粒子)是通过弱作用内在规范对称性的自发破坏获得质量的。这样,至关重要的对称性依然存在,只不过是隐藏起来而已。假定对于“媒介”粒子质量的这种解释成立,那么弱作用就与电磁作用具有相同的基础,从而可能存在一种共同的描述。然而,在系统真实的量子状态下,尽管通过适当的安排可以使得光子保持零质量从而仍然反映相应的规范对称性,但W和Z则由于它们的大质量已不再能够体现内在的规范对称性。
为了使上面的论述成立,温伯格和萨拉姆引入了一种附加的量子场,这种场按照它的发明者的名字被称为希格斯(Higgs)场。希格斯场量子是有质量无自旋的玻色子,它与电磁-弱作用场相耦合的效果是给出一种同图16所示的“墨西哥帽”完全类似的势能(尽管相应的势能曲面是在一个抽象的空间而非图中所画的真实空间)。在这种耦合的作用下,系统选择了最低能量状态(类似于小球处在帽沿)从而使W和Z获得大质量。
格拉肖-萨拉姆-温伯格理论很好地解释了有效的低能弱作用与电磁作用在强度上的差别。按照这一理论,两种力的实际作用强度是差不多的,和电荷e类似,引入一个弱荷g,由它得到一个有效的弱耦合常数g/M,其中M是W粒子的质量。因为M很大(约为质子质量的80倍),所以弱耦合的有效强度,正如它的名字所表明的那样,是非常弱的。
在理论中,比例e/g是一个自由参数,通常用关系式e=gsinθ中的角度θ来表示。θ的值要由实验来测定,大约为28°。所以θ决定了两种力实际强度的相对大小。
对于该理论,一个关键的理论上的证实在于消除了困扰老的弱作用理论的那种数学上的不自洽。而且,新理论的高能行为是完全令人满意的。事实上,对于人们感兴趣的过程,当能量升高时,弱作用与电磁作用的差别就相应地减小,当能量与M(80Gev,1Gev=109电子伏特)可比时,两种相互作用基本上具有完全一样的性质了。
就实验而言,新的理论预言了一系列可以测量的细微的物理效应。其中之一是中微子在不产生新粒子的情况下对中子的散射。这一过程在老的弱作用理论中是不可能发生的。1973年在欧洲核子研究组织(CERN),一项由一束很强的中微子流穿越气泡室的实验无可争议地显示出,中微子被气泡室中原子核所含的中子散射。然而,关于G-W-S理论的最为明显的证实是在1983年末和1984年初,那时在欧洲核子研究组织的质子——反质子对撞机上首次产生了W和Z粒子。它们的质量同利用已知数据所作的理论预言吻合得很好。
这些令人鼓舞的成功已经导致了这样的信念;即弱作用与电磁作用实际上是一种统一的电弱作用的两个方面。然而,参数θ的值仍然不能由理论确定,所以,或许称“合并”比较统一更好些。
这一成功的关键因素是理论的规范对称形式,它促进了对于用其他一些规范理论描述强作用和引力以及它们同电弱作用最终统一的理论的研究。
对于规范对称的描写要用到一个数学分支,称为群论。一个群就是数学上一些元素(实际中经常用一些矩阵来表示)的一个集合,集合中的元素可以由乘法(满足一定的技术限制)组合起来。每一种对称性可以用产生它的群来命名。一个非常简单的例子就是圆环上的对称性。一个圆环在绕其中心轴转动任何角度时保持对称。这些转动构成一个群,称为U(1),其中U代表“么正”的意思,是一种特定的数学性质。碰巧电磁场的规范对称性正是这种U(1)对称,不过是在某一抽象空间中,而非真实的空间。
电弱作用把U(1)群同一个称为SU(2)的较为复杂的群联合起来,S代表“特殊”,我们在这里并不关心它在数学上的具体含义。正如在1.6节中所讨论的那样,强作用可以用量子色动力学作生动的理论描述。这也是一种规范理论,只不过是基于一种更为复杂的规范群——SU(3)。在70年代中期,人们作了许多尝试来统一电弱作用与量子色动力学以便得到一种“大统一力”。这些大统一理论,或简记为GUT的目的是找到一种更具包容性的较大的群使得量子色动力学的SU(3)和电弱作用的SU(2)以及U(1)统统成为它的子群。在这些方案中,θ不再是一个自由参数,而可以通过大群分解为所要求的子群的特定方式确定下来。
大统一理论的一个主要特点是将三种力的源的特性混合在一起。于是标志电弱作用的轻子与强力的源——夸克联系起来。夸克和轻子(至少就目前已经知道的而言)具有相同的数目,这一事实暗示了它们之间的这种联系。它们之间的混合是通过交换一组新的媒介粒子来实现的,这组新的媒介粒子统称为X粒子。通过交换一个X粒子,一个夸克可以转变成一个轻子,反之亦然。
同电弱统一的情形一样,在低能情况下,三种力有着各不相同的特性,而高能时它们归结为同一种相互作用。达到这种统一所需的能量可以由夸克之间的相互作用随间距加大而增大的性质确定下来。回顾一下海森堡测不准原理,它将一定的能量和动量与一定的距离和时间相联系。由此可知,低能实验揭示了夸克间距离较大的行为,而高能实验则探索夸克彼此非常靠近时的短距离行为。因而,有可能计算在多大距离上——由测不准原理可以相应地换算成能量——夸克间的相互作用强度降到电弱作用的水平。在这一能量附近,统一变得明显,因为所有三种力具有差不多的强度。相应的大统一能量比电弱统一的尺度大了约1013倍,远远超出了现有实验的限度。
所幸的是,大统一理论还有一些关于低能情况的预言。正如已经提到的,大统一理论将夸克和轻子混合在一起。在发生统一的能量尺度上这些原本不同类别的粒子将成为一体。而在相对较低的能量尺度上,这种混同尽管微弱但还是可以探测得到的。夸克——轻子混合的最为引人注目的后果,就是预言质子不稳定,是可以衰变的。在一个衰变的方案中,构成质子的底夸克转变为一个正电子,而两个顶夸克中的一个变成一个顶反夸克。这一反夸克与原来的那个顶夸克一起构成一个π粒子。
寻找质子衰变事例成为检验大统一理论的一个关键。不幸的是,预言的质子寿命随模型的不同而不同,为1028年或者更长。直接探测的结果显示,质子寿命远远长于1033年,这或许表明在探测技术上存在无法克服的困难。所以,测量质子衰变的失败只能用来排除一些理论模型。
用来寻找衰变事例的方法是,对从大量材料中放射出来的粒子进行监测。同所有的量子现象一样,质子衰变是一种统计过程。所以,比如说,1032年的平均寿命就意味着在含有1032个质子的材料中一年内大约能探测到一个衰变事例。
已经有几个这样的实验。其中之一是在伊利湖底的一个深盐矿井里(选择这样的地点是为了尽量减少宇宙射线的影响,否则它的效应将掩盖人们真正感兴趣的事例),那里放有一个大水箱,其中悬置着排成阵列的光子计数器。在质子衰变过程中放射出来的快速带电粒子在通过水时将产生特有的脉冲光。实验的目的就是要探测这一次级辐射。截止到本文撰稿时,在这些实验中尚未记录到确信无疑的质子衰变事例。
对于大统一理论的另一个潜在的检验来自于一个完全不同的领域——破单极。所有已知的磁体都是双极的,即它们同时具有南极和北极。这是因为,任何情况下磁源可以归结为电流环,比如原子中电子的运动。沿环路的电流将在环的一侧产生北极而在相对的另一侧产生南极。所谓的磁“荷”从未在自然界中观察到。一个磁荷将表现为一个单独的北极或南极,于是,更为通常地称之为一个磁单极。
尽管缺乏对磁单极的观测证据,保罗?狄拉克研究了如何将磁单极纳入量子物理学。在1930年代初期的一篇经典文章中,狄拉克发现,如果磁单极存在,它们的磁荷m必须与基本电荷单位e存在一个简单的关系,显然地写出为,em=h,或在h前乘一个整数因子。除其他方面外,这一奇特的结果还意味着,如果宇宙中哪怕只有一个磁单极,那么e的值将在任何地方都是固定的。从而解释了为什么电荷的数值总是一个基本单位的整数倍。
然而,狄拉克的工作并未就这一假想的磁单极可能具有的其他性质,比如它的质量给出任何提示。多年来,物理学家们倾向于认为磁单极是自然界规律所允许的却被造物主所遗弃的那些粒子中的一个。这一看法随着大统一理论的到来而发生了巨大的改变。这些理论中不仅可以有磁单极,并且事实上要求必须有磁单极。而且,关于磁单极可能具有的性质,理论提供了一些更进一步的重要细节。
预计磁单极的质量与X粒子的质量相当,大约是质子质量的1015倍。这一质量如此之大(和一个细菌相差无几),从而解释了为什么在粒子对撞实验中没有产生磁单极。而在另一方面,在宇宙的早期或许达到过(产生磁单极)所必需的能量,所以,一些科学家已经就大爆炸遗留的宇宙磁单极进行了搜索。
如果那些宇宙磁单极存在,并同其他宇宙辐射一起轰击地球的话,它们将产生一系列可以探测的效应。例如,一个磁单极与一个原子核碰撞可能会引起质子衰变。磁单极还可能具有一个明显的电磁特征。如果电流是绕一个超导体环运行的,则环的磁通量是量子化的,即它的值是h的整数倍。如果一个磁单极穿过环路,那么磁通量会由于电磁感应而增加一个固定量。所以,实验者只需要使环路处于超导状态,剩下的事就是等着磁单极从中穿过。除了在1982年的情人节那天得到过一个戏剧性的假信号外,至今尚未在这类或任何其他实验中探测到磁单极。 1.11超引力
在1970年代,尽管统一电磁,弱和强作用的方案取得了令人鼓舞的进展,引力却仍然孤傲不群。然而,这期间引力学家们也决非无所事事。在70年代中期,他们对超对称的概念作了重要的推广。我们知道,超对称基本上是一类抽象的几何对称(见1.8节)。而爱因斯坦的广义相对论当然是引力的一种几何理论。所以,有几位研究人员各自独立地发现,超对称几何也可以作为引力几何理论的基础,相应的理论就称为超引力。
超引力包括了爱因斯坦的广义相对论,但作了扩充。爱因斯坦的理论在极限条件下仍然成立,因而理论同观测的精确符合并未受到破坏。超引力带来的主要特点是,引力子已不再是传递引力的唯一媒介粒子。请回忆一下,超对称是在费米子与玻色子之间提供了某种联系。如果对自旋为2的引力子实施一个超对称操作(即包含从普通空间到额外的费米自由度作
转动的数学运算,那么理论就描写一个自旋3的粒子。自然界中尚未发现
2
自旋3的基本粒子,所以这是一种新粒子。这类新粒子称为引力量
2
子,对于不同的模型,它们的种类数目是不同的,可以从1到8不等。引力量子如果存在,将同引力子一样具有极弱的耦合,因而很难在实验中测到。
进一步的超对称操作可以产生更多的粒子,它们的自旋为1,1和0。
2在一个人们比较赞同的超引力理论中,引力量子的超对偶粒子总数达172个,由于这一理论中有8种引力量子,人们称之为N=8的超引力理论。人们尝试把其中的一些超对偶粒子同高能物理中已经知道的粒子去一一对号入座,以便提供一种可能的超统一方案。在这种包罗万象的理论中,其他几种力的媒介粒子——光子,胶子,W和Z粒子——和引力子一起都将属于同一个巨大的超“族”,即通过超对称联系在一起的一个粒子多重态。于是,有可能把所有的力统一起来,原来的每一种力只代表某个单一的具有超对称的超力的一个侧面。但这还不是理论的全部内容。因为,超“族”中还包括有费米子,它们或许同组成物质的基本粒子——夸克和轻子有关。这样,有可能对物质以及相互作用进行统一的理论描述。
尽管这一宏大的理论结构有着如此诱人的魅力,但从已知粒子中寻找引力子的超对偶还仅仅是一种理想而已。不过许多理论家已经兴奋地宣称超引力可能就是人们长期以来梦寐以求的那个包罗万象的理论。剑桥大学的史蒂芬?霍金(Stephen Hawking)在他就职 Lucasian数学讲座教授的演说中提到,假使N=8的超引力大有希望,那么“理论物理的终结为期不远了。”人们为进一步优化理论以及探索它的细节作了巨大努力。为类比起见,发展了其他一些较引力而言容易分析的场论的超对称形式。其中重要的进展是,发现当理论在大于四维的时空中构造时,超引力的几何结构可以大大简化。对于N=8的超引力,最为有利的维数是11。
80年代初,当一部分理论家们忙于在11维时空中重新表述超引力理论时,与之并行地,另外一部分人则开始在克莱因-卡鲁扎理论框架下研究额外自由度的问题。他们的目的是要把原来只涉及引力与电磁作用的理论进行扩充,以便同样能够描述弱作用和强作用。这是可能做到的,因为温伯格和萨拉姆的理论以及量子色动力学为弱与强力提供了非常类似于电磁理论的规范场论描述。
在克莱因-卡鲁扎的原始理论中,电磁作用仅仅通过附加一维时空自由度(使得总维数为五)而引入的。这是同传递电磁作用只需一种光子这一事实相联系的。换句话说,是同电磁场的规范对称性为最简单的U(1)对称相联系的。而另一方面,弱和强作用则具有较复杂的规范对称(SU(2)和SU(3)),所以需要一个多重态的媒介粒子传递它们的相互作用。于是,在扩充的克莱因-卡鲁扎理论中它们各自要求的额外自由度均大于一维。汇总起来,时空的维数刚好也是11。
在11维的克莱因-卡鲁扎理论中,只存在一种力——引力。而电磁,弱和强力只不过是引力的附属品。所以,扩充的克莱因-卡鲁扎理论在一个统一的框架下对自然界所有的力给出一种完全几何的理论描述。这里,成功地描述一个量子场论所需要的那种至关重要的抽象规范对称性与更高维时空的几何对称性是一回事。
由超引力与克莱因-卡鲁扎理论同样得到11维自由度,这一巧合是颇具启发性的。于是,物理学家们开始认真谈论起同时具有超对称与高维自由度的包罗万象的理论了。现在人们逐渐认识到,那些一开始作为纯数学手段应用到超引力的额外自由度是真实的物理自由度,它们通过克莱因-卡鲁扎的原始理论中描述的方式卷缩到一个很小的尺度上。
不幸的是,这种11维的理论存在一个被证明是致命的弱点。弱作用的一个明显特征是它破坏左右镜象对称(也就是说,它是宇称不守恒的)。这意味着基本粒子必须具有一定的左右手标志——或称“手征性”。在日常生活中,我们认为左手与右手之间的差别是理所当然的,但手征性的存在实际上依赖于三维空间更深层的性质。研究表明,确定的手征性只存在于单数维的空间中。这就是说,空间的维数是奇数。因而时空的维数必定是偶数。否则自然界的规律中将没有手征性。一句话,11维时空理论不成立。
1.12数学的困难
在前面的叙述中,我们曾几次提及相互作用的量子理论描述中所存在的数学自洽性问题。本节中,我们将较为详细地考察一下这些数学问题的本质。
关于量子场论所遇困难的第一个线索实际上来自经典的电磁理论。一个困难就是电子的结构问题。电子的一个原始图像是一个均匀分布的带电小实心球。因为同号电荷相斥,所以电子中的一部分电荷会排斥另一部分电荷,从而存在将电子分裂开来的向外作用的力。由于平方反比律,如果假定电子的半径很小的话,这一向外作用的力将会非常强。
为使电子不致分裂,必须有某种内力作用。这些亲和力应该是无论电子如何运动而始终精确地抵消那种分裂的趋势。以一种与狭义相对论协调的方式描述这一平衡作用的尝试被证明是徒劳的。物理学家们最终不得不回避这一困难,认为事实上电子是点粒子,也就是说它的半径为零,于是不存在力学理论所适用的内部结构。
这种想法只不过是通过引入一个问题来解决另一个问题而已,因为当电子成为点粒子时,它的静电能存在着困难。把电荷分布在半径为r的球面上的能量正比于r-1,所以,如果允许r为零,那么相应的能量则为无穷大。在狭义相对论中存在质能关系,于是无穷大的静电能意味着电子具有无穷大的质量。
尽管方程中存在一个无穷力或“发散”项是一个严重的问题,但是,如果这一“发散”项本身并不代表可测的物理量的话,那么这一问题就不一定是灾难性的。在没有引力作用时,能量并不是可测量的,可以测量的是能量之差。于是,人们可以通过相差一个无穷大来重新标度能量的零点位置以使测量到的电子质量是有限的。这种重新标度称为重整化。尽管在中间步骤中存在无穷大,但仍可以得出有限的结果,这样的理论称为可重整化的。
在1930年代,关于量子电动力学的工作就开始了,这是一个描述电子与电磁力的载体——光子相互作用的理论。在量子电动力学中,有关电子的电磁自作用问题更为微妙。事实表明,无穷大带来的困难比经典理论所遇到的困难更为严重。在量子电动力学中,电磁力是通过交换光子传递的。在这种描述中,自作用表现为带电粒子先发射一个光子然后再将它吸收掉。这种情形尽管难以形象地描绘,但是,海森堡的测不准原理使得我们不必追究上面提到的那个光子到底是如何转过弯来的,它的位置和运动是模糊不清的。这一过程可用图17中的费曼图表示。
图17.电子发射和吸收光子。这种过程给电子罩上了一层电磁能外衣,于是在计算电子的自能时会出现无穷大。
图17中的波浪线表示光子,代表了围绕电子的电磁能量。它对电子质量的贡献同经典电动力学中的大小完全一样。如果再次假定电子为点粒子,那么这些光子携带的能量就没有限制。原因可以追溯到关于能量的测不准关系。光子运动的距离越短,则所花费的时间越短,因而能量的不确定程度就越大。对于一个点粒子来说,往返过程几乎完全不花时间,于是,光子可以具有无穷大的能量。具体的计算表明,从围绕其周围的光子那里,电子可以获得无穷大的质量。
但此时的重整化要难得多。首先,理论中还存在诸如电荷等其他一些无穷大,这些无穷大也需要重整化。其次,图17只表示对电子质量的一种无穷大贡献,发散项同样还来自发射和重新吸收两个,三个,四个……光子。事实上,存在无限多个无穷大项,乍看起来似乎需要无限多个相应的重整化操作。如果真是那样的话,理论显然就变得毫无意义。事实上,只需要单独一种重整化就可以从可观测量中消除所有的发散。证明这一点需要较多的数学。的确,过了几乎20年人们才做到这一点。这一性质十分稀有同时也很重要,它在很大程度上依赖于理论的规范对称性。
量子电动力学并不是已知的量子场论中唯一可重整化的理论,但却是目前最为重要的理论。它所给出的预言惊人地准确,因而被视作其他相互作用的典范。相反,关于弱相互作用的旧的理论是不可重整化的,基于爱因斯坦广义相对论的量子引力论也是不可重整化的。在这两种理论中,无穷大无休止地重现,使得理论失去内在自洽性,变得毫无预言力。
同无穷大问题密切相关的是反常问题。当一个理论“量子化”时,也就是把经典理论按照量子力学的规则重新表述,某些对称性在这一过程中被破坏掉了,这种现象叫作反常。这样的称呼并无恶意。反常的出现意味着所挑选的经典理论中存在某种对称性,这种对称性在相应的量子理论中不再成立。由于对称性同守恒律之间的密切联系,反常可能导致违反一些被奉为神明的守恒律,例如,能量和电荷在相应的量子理论中可以不再守恒。关于这一现象是如何发生的,可以大致这样理解。如果一个量Q是守恒的,那么它的变化率为零,正如我们已经看到的那样,量子化的过程经常涉及到一些量被乘以无穷大的因子。于是,有可能出现这种情况,即Q的变化率被乘以无穷大。这样得到的乘积为0×∞。这个表达式看起来是毫无意义的,但是经过适当地定义,它可以表示一个有限的量。这正是存在反常时的情形:Q的变化率不再为零,于是关于Q的守恒律被破坏掉了。
1.13弦理论
在1980年代早期,寻找统一理论——或许甚至是一个包罗万象的理论——的工作就已经进入了一个既令人神往同时也让人失望的阶段。有些概念,诸如超对称和高维自由度等,看来似乎为研究提供了很有希望的途径。在构造量子引力理论时曾经困扰人们的诸多有关无穷大的问题在超引力理论中即使仍然存在,至少也是可以得到改善的。同时,扩充的克莱因-卡鲁扎理论尽管不甚完善,仍为统一四种相互作用提供了诱人的理论框架。总之,当时的理论家们非常乐于接受把超对称和高维自由度结合在一起的统一方案,正是在这一点上,他们开始注意到弦理论。
弦理论的起源可以追溯到1960年代后期以及加布里埃尔?维尼齐亚诺(GabrielleVeneziano)的工作。当时,很多物理学家致力于解释那些被不断发现的强子,它们是在粒子加速器的高能碰撞中产生的强相互作用粒子。那时,物质结构的夸克模型尚未建立起来。
特别令人感到困惑的是那些寿命只有10-23秒量级的短寿命强子。它们统称为共振态,因为,它们很明显不是基本粒子而像是其他强子的某种激发态。人们可以设想,由于高能碰撞,强子的内部成分被激发到更高的
能级上去。研究表明,其中一些共振态具有很高的自旋(如11)。更进一
2
步,人们发现了这些强子的质量和自旋间的一种规则的关系。
为了解释这些事实,维尼齐亚诺专门提出了一种模型。当时,它还仅仅是一种没有任何内在物理图像的数学方案。然而,在随后的进一步研究中变得越来越清楚,维尼齐亚诺的模型是描述一根弦的量子化运动。对于以往那些总是用粒子来构造物质的理论来说,这是一次引人注目的尝试。并且至少在某些方面,与那些传统的粒子模型相比,弦模型同实验符合得更好。
至少从一种意义上讲,强子的弦理论证明是对的。就目前所知,强子包含夸克,而夸克之间存在相互作用。可以想象,这种相互作用所产生的束缚就好比是连接在夸克之间的橡皮筋。事实上,夸克之间的相互作用力和橡皮筋一样,随着间隔加大而加大。当夸克运动起来时,强子内部的相互作用就像一根扭转的弦。就夸克而言,这种相互作用力很强,致使相互作用能可以同夸克的静质量相匹敌。在这种情况下,橡皮筋比其两端的夸克更显得重要。所以,用一根弦来描述整个强子的运动并非完全不当。
在早期,弦理论一直被当作不过是一种粗略的近似。另外一个问题是,它看来只适合描述玻色子。尽管如此,个别研究人员仍对弦模型作了深入的探索,并得到某些有趣的结果,它们表明理论是强有力的。然后,在1970年,约翰?施瓦茨(JohnSchwarz)和安德烈?尼夫厄(AndréNeveu)找到了描述费米子的弦理论。
大约在1974年,人们发展了量子色动力学,而弦理论作为强子的模型则不再引起人们的兴趣。如果不是施瓦茨和他当时的合作者乔尔?谢尔克(Joel Scherk)发现了另一个完全不同的并且更加令人振奋的新途径的话,弦理论很可能会就此消亡。早期的弦理论所遇到的问题之一,是它所描述的粒子中存在自旋为2的零质量粒子,而这种粒子在强子谱中并没有具体对应。然而,它却精确地描述了引力子——引力的“媒介”粒子。于是谢尔克和施瓦茨建议,或许弦理论事实上是一个引力理论,甚至可能是一个包罗万象的理论。
经过10年的时间,这一大胆的设想才获得了更为广泛的信赖。在这期间,包括约翰?施瓦茨和米歇尔?格林(在内的一小组理论家处理了所有的数学上的自洽性问题——快子,无穷大,反常,高维自由度的引入,超对称的引入。令人啼笑皆非的是,当时他们被认为是在一个完全荒诞的理论上白废时间。今天,情况完全不同了,弦理论——按现在的说法叫作超弦理论——引起了当今世界上一些最优秀的理论物理学家的重视。
在下面的章节里,包括施瓦茨和格林在内的一些弦理论的创始人将详细地描述弦模型。他们讲述了弦理论的一些历史和现状,并就将来的发展作了展望。他们还就弦理论是否能够成为一种包罗万象的理论这一关键问题发表了看法。
毫无疑问,弦理论是极其吸引人的。理论家们大谈它那令人称奇的优美结构和丰富内涵。但是,研究弦理论的另一个动因在于,它最终会给出一种关于自然界所有粒子以及相互作用的定量描述,那么它将是人类历史上最伟大的科学成就之一。的确,人们可以声称它是简化主义科学的顶峰,因为我们终于能够找到构成世界的最小单元并且由此阐明宇宙发展的基本原理。无怪有些研究人员一夜之间放弃从事多年的研究项目而转向弦理论。在粒子物理以及引力理论领域中,几乎没有哪个讲座或发表的杂志不或多或少地涉及到弦。
然而,并非所有物理学家都对此感到满足。有人争辩说,弦理论家们的努力无论在哲学上还是在科学上都是引人误入歧途的。更有甚者称弦理论是彻头彻尾的谎言。这些批评意见在后面的访谈录中有所反映,读者可以自己判断究竟谁是谁非。但有一点是公认的,即从来没有任何科学事业像弦理论这样胜败悠关。
2.约翰?施瓦茨(JohnSchwarz)
约翰?施瓦茨是加州理工大学物理系教授。他的早
期工作,特别是同米歇尔?格林合作的那些工作,对于弦
理论这一课题从一潭死水发展为今天强有力的超弦理论
起了推动作用。
用弦模型描绘基本粒子的想法由来已久,您能否谈一点儿弦理论的早期情况?
弦理论有着非同寻常的历史。这一课题的提出最先是为了解决一个同目前弦理论所处理的完全不同的问题。起初,大约在1968-1970年,人们发展弦理论是为了解释强核力。就这一点而言,弦理论取得了一定的成功,但决非彻底的成功。而到了1970年代中期,另一个称为量子色动力学的理论被提了出来并成功地描述了强相互作用。结果,早期的弦理论尽管有大量的工作要做,但随着量子色动力学的产生,到1970年代中期,大多数人就放弃了这一课题。我之所以没有放弃,是因为在量子色动力学发展之前,或者说差不多同时,我正在同当时在加州理工大学访问的法国物理学家乔尔?谢尔克合作。我们注意到,试图用弦理论描述强核力所碰到的问题之一是,理论中总会出现一种强核区并不存在的特殊粒子。就是说,这是一个零质量,角动量为2的粒子,在核过程中从未观测到任何这类粒子。可是我们知道,这种粒子存在于爱因斯坦的广义相对论,这是一个引力的理论,而这种粒子通常称为引力子——一种传递引力且满足量子力学规律的粒子。引力是非常不同于强核力的一种相互作用,在通常情况下,它非常非常微弱,所以,既然我们发现弦理论中总是出现这种粒子,我们就决定放弃用弦来描述强核力的方案转而考察是否可以用它去描述引力。现在看来,当时其他基本相互作用也在经历类似的转变。
事实上是转祸为福。
是的。这需要观念上的巨大转变,因为起码它意味着弦必须比我们原先想象的要小得多。
这里所指的是哪种尺度?
当我们考虑用弦来描述粒子时,我们的想法是,弦应该有一个核子的典型尺度,即10-13厘米大小。当用到引力理论时,就存在一个由引力结构带来。的自然长度单位,称为普朗克长度,它要比核子尺度小得多——是核子尺度的1020分之一。人们有时这样形容,普朗克尺度之于一个原子的大小如同一个原子之于太阳系的大小。在我们讨论用弦来统一引力与其他力时,我们所谈论的是极小极小的尺度。
所以,用弦来描述引力理论及统一理论的想法产生于1974年,那时弦理论提出来已有五年了。乔尔?谢尔克和我当时在继续这方面的工作,不幸的是,六年后他去世了。于是,从1979年起我开始同来自伦敦玛丽皇后学院的米歇尔?格林合作。
在讨论那些进展之前,我是否可以问一下,您关于旧的弦理论中的质子和中子的图像是什么?是否在某种意义上假定每个质子和中子内都存在一根弦呢?
好的,粗略地讲,图像是这样的:强子,如中子和质子,是由夸克构成的。夸克这一概念差不多是20年前由盖尔曼和兹威格引入的。这些夸克必须由某种力束缚在一起,所以物理图像就是:弦即是对于把夸克束缚在一起的那种力的描述,有点像橡皮筋。可以认为,夸克是系在这些弦的端点上的。
那么,它们整体以某种方式扭转?
是的。
这一想法的主要困难是什么?
存在着几个困难。一个是我已经提到的,这个零质量自旋为2的粒子的出现在数学上是势所必然,但在核子区可以找到的粒子谱中却没有对应物。
另一个困难非常奇妙,因为,理论的数学自洽性要求时空维数大于4。在原始的弦理论中,同时还存在着其他一些不足之处,这个理论要求维数等于26。1971年,皮尔?拉蒙特(Pierre Ramond),安德烈?尼夫厄和我一起发展了一种改进的弦理论,它的时空维数降为十,而事实上现今流行的正是这一理论的某个变种。就描述核子而言,存在额外的自由度是一个非常严重的问题,因为我们完全清楚,真实世界只有三维空间自由度和一维时间自由度。于是,如果你想要一个现实的理论,就不能有额外的自由度。
当时您是否希望通过某种重新表述来得到一个四维时空中的自洽理论呢?
是啊,那些年人们作了很多努力——同样我也为此付出了部分精力——以期找到这两种弦理论的一些变形,使得它们的维数是四而非十或26。沿着这一线索,人们提出了很多有趣的方案。他们总是从一个数学上十分优美的系统出发,但后来却将它弄得丑陋不堪并且毫无说服力,最终不可避免地导致数学上的不自洽。
原始弦理论所遇到的其他问题之一是存在所谓的快子,它们是一些比光速还快的粒子。这是否不可避免?
在26维的玻色弦理论中这是一个不可避免的特征。十维弦理论的优点之一就是有可能通过选择理论的形式使其不包含任何快子。我们知道,这种粒子是同基本原理不相协调的。
旧的弦理论大概也有某些成功之处吧?
是的。这个理论的提出是有充分理由的。它抓住了许多一般特征,而我们知道这些特征是一个强核力理论应该具有的,它们包括,粒子在高能情况下如何发生相互作用的一定特征,不同粒子的质量和角动量,以及描述它们之间联系的模式等一些其他相关特征。
今天,回顾那个阶段,是否可以确定地说,不应再把弦作为核子的一种图像,它已由量子色动力学代替了呢?
量子色动力学已经被高能物理界公认为描述强核力的正确理论。我认为这方面的证据是非常可信的。然而,通过某种方式重新表示量子色动力学会使得弦在其中扮演重要的角色看上去仍然十分可能。但是在这种意义上的弦,其数学上的行为将同15年前提出的弦完全不同。这样一个弦理论的精确结构只能由我们今天所了解的知识不甚明确地导出。事实上,比起我们目前正在研究的看上去非常含混的超弦理论,它似乎要困难得多。
弦理论发展中的真正转折点是什么?换句话说,把它推至粒子物理研究最前沿的是什么?
这始于我在1980年同米歇尔?格林的合作。当时我们改进了早先我同乔尔?谢尔克的工作,建立起十维弦理论的数学行为的细节。关于这一十维弦理论,我要提到的重要特色之一是,它具有一种非常特殊的对称性,称为超对称,这种对称性把叫作玻色子和费米子的两类不同的基本粒子联系了起来。
您可否谈谈这两类粒子?
所有的基本粒子分成两大类,这两种类型的粒子,即玻色子和费米子在两个重要方面是不一样的。它们所携带的角动量一般称为“自旋”,一个玻色子的自旋是基本单位的偶数倍而费米子的自旋是同一个基本单位的奇数倍。
另一个区别是同量子理论的问题的密切联系,它与全同粒子交换时理论的行为有关,表现为,在这种交换下,理论是否不变,或是相差一个负号。交换费米子会带来一个负号因子。
您是在说起对称是将这两类粒子合并为一种描述的方法。
是的,正是这样。或许为了不那么抽象我应该说夸克和电子就是费米子的例子,而光子和引力子则是玻色子的例子。
我们把费米子当作构成物质的粒子而把玻色子作为在它们之间传递相互作用的粒子,这么说对吗?
我想这是一个好的划分办法。
所以,您所说的超对称在现代弦理论中是一个非常重要的概念。那么,它带来哪些发展呢?
这说来话长了。事实上,早在1971年,十维弦理论的发现可以说是超对称理论的真正开始。其中一个方面是作为引力理论的超对称推广,这一理论称为超引力理论,于1976年完成,现在被合并到超对称的弦理论中,简称为超弦理论。
在研究超对称弦理论性质的那些年里,我和格林发现了一系列我们感到激动人心的事情。按传统方法构造一个引力理论时,所遇到的诸多重要问题之一是,当人们设法满足量子理论的要求时,计算常常会导致毫无意义的发散表达式。这种情况类似于一个数被零除,这样的计算是无法进行的。所以,当你试图进行引力的量子理论计算时,就得到这些没有确切定义的结果。这看来是所有那些把基本粒子当作数学上的点粒子进行处理的理论所共有的特征,而这种点粒子处理是一个传统的办法。
所以,弦理论的重要特点就是用称为弦的一维曲线来代替那些点(粒子),于是,我们发现一个令人振奋的结果,即在弦理论中当我们计算引力的量子修正时,能够得到有意义的数值,这些数是由有限的表达式给出的。这似乎是首次表明有可能得到一个同量子力学协调并包含引力的有限理论。这是很令人兴奋的。我们大约在1982年前后完成了这项工作。
差不多同时,我们还发现了其他一些超弦理论,其中包含我们所说的开弦(即弦的两端点自由);另外一些弦形成环路,我们称之为闭弦。所以,在原始的超弦理论中既有开弦也有闭弦,但是稍晚一些我们发现,有可能使理论只包含闭弦。这看来是一种重要的区别,因为,目前大有希望的理论正是那些只含闭弦的理论。事实上,从很多方面讲,它们是更容易研究的。
在我们的基本理论中要对自然界作出解释,而关于自然界的诸多重要事实之一是左右手征存在差别。所以理论不应具有镜象对称——这称为宇称破坏。这是关于弱和强作用的标准模型具有的一个重要性质,而我们知道,这一理论在低能情况下是适用的。以一种更为基本的观点,特别是在超弦理论的框架下去理解这种不对称,对我们是一种挑战。
现在看来,在已经得到的几种超弦理论中,除了一种以外其他的都具有这种左-右不对称,因而,它已经成为十维理论的一个基本特征。所以,这是非常鼓舞人心的。然而,这种具有左-右不对称的理论存在着某种崩溃的倾向并且带来不自治的结果,这种不自洽性不是我刚刚提到过的那种无穷大,而是一个与之密切相关的问题,称为反常。这里的基本想法是,在考虑量子力学之前,理论具有一定的基本对称性,于是,就存在一个非得回答的问题,即量子力学修正是仍然保证这些对称性还是破坏了对称性。如果量子力学修正破坏这些对称性,那么理论就不自洽,因而也将变得没有意义。只要理论具有左-右不对称,这种不自洽总是要发生的。所以,理论具有左-右不对称一方面是令人兴奋的事情,另一方面也是一种巨大威胁,因为它们可能导致相应的反常从而变得不自治。
1984年,米歇尔?格林和我一起对其中一种超弦理论作了计算,要看看这种反常到底会不会发生。计算结果令我们大吃一惊。我们发现,一般说来确实存在着反常,使得理论不尽如人意。但是,在一开始构造理论时有可能选择特别的对称结构。事实上,对称性的选择有无穷多种可能性。然而,只有其中的一种可以使得表达式中的反常奇迹般地抵消掉,其他的选择则不具备这一性质。所以,在无穷多种可能性中,只有唯一的一种可以挑选出来试一试。
在处理粒子以及相互作用的传统场论方法中存在两类困难。一类是无穷大项的出现,另一类是这些所谓的反常,反常会在理论量子化过程中带来不受欢迎的破坏对称性的因素。所有这两类困难都会导致理论的不自洽,但是对于超弦而言,这两类问题似乎都有办法得到解决,只要是在这个唯一选择好的超弦理论中进行。那么如何选择出这个唯一的理论呢?选择的特征是什么?
我已经提到过,这种特殊的对称结构是从无穷多种可能的结构中挑选出来的,而这种结构是在研究反常问题之前就已经存在的。这种对称结构称为SO(32)。
几乎在这同时,我们还发现存在另外一种称为E8×E8的对称结构似乎也是一种自洽的选择。奇怪的是,当时我们还没有得到一种确定的超弦理论可以具有这种对称性。所以,我们得到一种超弦理论,它具有我们认定的对称结构中的一种;而对于剩下的那种对称结构,我们还没有找到可以具有这种对称性的理论。但是,在那之后不久,来自普林斯顿大学的被称为“普林斯顿超弦四重奏”的四位物理学家发现了两类新的超弦理论,他们称之为异常弦,其中一类具有E8×E8对称性。另外的那一类具有SO(32)对称性,这是具有SO(32)对称性的第二个例子。
E8×E8理论是最令人感兴趣的,因为这种对称性看来最有希望解释已观测的粒子的唯象结果。
但如此一来,我们似乎有很多可供替换的弦理论。这是不是一件糟糕的事情?
这个数目仍然是相当小的。当然,原则上讲,你是对的。最好是只存在一种可能的理论,而它能够解释一切。我想,可以说我们已经在这个方向上取得了较大的进展,尽管这方面的情况同人们所听到的并不完全吻合。在十维理论中目前有三类异常弦理论(除我已经提到过的两类外,第三类是后来被发现的)和三类非异常的超弦理论,所以迄今共有六类。然而,很有可能通过进一步的研究发现其中有一些实际上是不自洽的。那么这个数目就会减小。还有,三类异常弦理论可能原本是一种理论的不同形式而已。事实上,它们的相互等价是可以证明的,所以应该把它们当作一种理论。这样,通过上面的推证,极有可能使得这个数目减少到一,即只有唯一的一种理论。
为什么理论必须在大于四维的时空中构造不再成为问题?
一旦我们放弃强子方案——用弦描述强核力——转而讨论用弦描述引力以及其他相互作用力,那么额外自由度就成为一个优点,而非缺点。因为,引力理论是描述时空几何的,所以在一个引力理论中,完全可以设想存在额外自由度,只不过由于理论自身的几何原因,这些额外自由度卷缩成紧凑的小球而已。
所以理论中将会存在额外自由度。但是,理论还应该告诉人们如何处理这些额外自由度,因为在解方程过程中,如果一切按计划进行的话,就会发现方程的解保证了这额外的六维自由度缩成一个小球,这个小球如此之小以致于人们无法观测到它。
到底有多小呢?
似乎表明应该是我前面提到的那个长度单位——普朗克长度。那是一个非常小的长度,只有10-23厘米。
您是说,在空间的每一点,或者说是我们认作空间的一点,事实上是一个尺度为10-33厘米的六维小球。因而我们没有察觉到这些额外自由度就不足为奇了。
它们太小了,根本无法注意到。
那么我们如何来想象这些弦呢?是否应该认为粒子,比如说夸克或者电子,在某种意义上是由这些弦构成的呢?能否认为它们当中存在一根弦,一个圈或者诸如此类的东西呢?
好,让我以一种稍微不同的方式来表述。对于一根弦来说,它可以以不同的方式振荡或摆动,转动等等,其中任何一种可以被认为是描述某种特殊类型的粒子。因而,可以认为电子是一种振动模式,夸克是另外一种振动模式,而引力子又是与它们不同的某一种振动模式。
就是说,其中只有一种类型的弦,但以不同的方式运动,也就是说运动的模式不同而已?
是的。
您刚才提到,超弦理论中最有希望的是E8×E8形式,那么这两种E8的重要意义是什么?
在问题得到彻底解决之前,很难完全弄清究竟是怎么回事。但目前看来令人感兴趣的一种可能性是,这两种E8对称性之一包含了迄今已经知道的粒子物理的所有对称性,这些对称性是从目前所能达到的能量范围内的实验中总结出来的。另外的E8对称则描述一种新的物质,有时称为影子物质(shadow matter),它同我们所熟悉的普通物质没有相互作用或者仅存在很弱的相互作用。如果你打算由此构思科幻小说的话,你可以想象由这种影子物质组成的各种星系和行星,它们是不可见的,因为它们同我们看得见的光线没有相互作用。
所以,一种奇妙的可能性是,与第二种E8对称相联系的影子物质是完全不可见的,因为它们同我们能够探测得到的光不发生相互作用。
那么此时此刻有可能正好有影子物质从我们谈话的这间屋子中穿过,而我们没有察觉到它?
是的。不过你仍然可以对它有所制约,因为它同我们所了解的引力存在相互作用——普通物质与影子物质所受的引力是一样的。
所以我们能够探测到一个影子行星?
下一页 尾页 共4页
返回书籍页