必读网 - 人生必读的书

TXT下载此书 | 书籍信息


(双击鼠标开启屏幕滚动,鼠标上下控制速度) 返回首页
选择背景色:
浏览字体:[ ]  
字体颜色: 双击鼠标滚屏: (1最慢,10最快)

信息简史-詹姆斯·格雷克

_5 詹姆斯·格雷克(美)
在整个20世纪50年代,香农始终是这个自己创立的领域里的学术领导者。他写出了大量艰深、充满各种定理的论文,其中很多都蕴涵着进一步发展的可能,为扩展该领域的研究奠定了基础。香农研究的主题之一是信道,麦克卢汉后来也将之称为“媒介”。他对信道进行了严谨的数学分析,研究很快得到了应用并取得了丰硕的成果:广播信道和窃听信道、有噪信道和无噪信道、高斯信道、有约束信道、反馈信道、有记忆信道、多用户信道和多址接入信道,等等。(当麦克卢汉宣称媒介即讯息时,他是在开玩笑。事实上,媒介既独立于讯息,又与它密不可分。)
香农取得的重要成果之一是有噪信道编码定理,它指出利用纠错编码可以有效地抵消噪声和失真的影响。一开始,这个成果所预示的前景可望而不可即,因为纠错编码需要用到大量计算,而计算在当时并不便宜。但到了20世纪50年代,在纠错编码上的进展开始逐渐将香农预示的前景变成了现实,对此的需求也日渐明显。其中一个应用是,在使用火箭和人造卫星进行太空探索时,它们需要借助有限的能量将讯息送出遥远的距离。随着纠错编码和数据压缩技术的齐头并进,编码理论也成为了计算机科学的关键组成。没有编码理论,就不可能有调制解调器、光盘和数字电视等。而对于研究随机过程的数学家来说,编码定理也可以用来度量信息熵。
与此同时,香农还取得了其他许多为今后的计算机设计奠定基础的理论进展。其中一个发现给出了在一个具有多个分支的网络中,如何使流量最大化的方法,这里的网络可以是通信网、铁路网、电网或水网。*还有一篇论文则有一个直截了当的题目,《采用劣质继电器构建可靠的电路》[不过在发表时,题目被改为了《采用不甚可靠的继电器构建可靠的电路》(“Reliable Circuits Using Less Reliable Relays”)[67]]。香农还研究过开关函数、率失真理论和微分熵等。虽然公众对于这些研究一无所知,但他们却能广泛感觉到计算时代到来的震撼,而这其中香农与有力焉。
注释:*P.Elias,A.Feinstein,and C.E.Shannon,“A Note on the Maximum Flow Through a Network,”IRE Transactions on Information Theory2, no. 4 (1956): 117–119.——译者注
1948年,香农在一篇论文中探讨了一个他自称“本身无关紧要”的问题:如何给机器编程,来让它下国际象棋。[68]人们早在18和19世纪就做过此类尝试,但这些在欧洲各地巡演的自动下棋机器偶尔会被人拆穿是里面藏着小人。到了1914年,西班牙数学家、工程师莱昂纳多·托雷斯克韦多(Leonardo Torres y Quevedo)公开展示了一部真正的、纯机械的下棋机器,名字就叫棋手。它会下一种简单的三子残局:单车杀王。
现在香农指出,执行数字运算的计算机经过设计之后,能够下完整的棋局。他解释道,这些“包含数千个真空管、继电器和其他零件”的设备,能够在“记忆体”内存储许多数,而经过一个巧妙的翻译过程后,这些数可以用来表示棋盘上的方格和棋子。香农提出的基本原理一直被所有国际象棋程序沿用至今。当时计算尚还处于青涩年代,很多人很快就设想,计算机能够计算出所有可能的走法和子力组合,从而完美解决国际象棋问题。他们认为运算快速的电子计算机能完美地下棋,就好像他们当时也认为它能做出可靠的长期天气预报一样。然而,香农经过粗略计算后指出,一盘典型的国际象棋棋局涉及的可能组合数目超过了10120——这个数要远大于以纳秒计的宇宙年龄。因此,在香农看来,计算机不能靠蛮力搜索来下国际象棋,而是要像人下棋那样进行推理。
香农甚至还登门拜访了美国国际象棋冠军爱德华·拉斯克,而拉斯克也给了他一些改进建议。[69]1950年,香农为《科学美国人》杂志撰写了一篇介绍先前论文的通俗文章,在其中他提出了那个浮现在所有人脑海中的疑问:“这种下棋机器‘思考’吗?”
答案完全取决于我们如何定义思考……从行为主义的观点来看,这部机器表现得它似乎在思考。我们总是认为,要下好国际象棋需要推理能力。因此,如果我们把思考视为是外部行为而非内部方法的一种属性,那么这种机器显然在思考。
不过,根据香农在1952年的估算,大概需要三名程序员花费六个月的时间,才只能让一台大型计算机的下棋水平勉强达到马马虎虎的业余水准。“而比起预先编好程序的棋手,能自主学习的计算机棋手的问题恐怕要留待更远的将来来解决。目前提出的各种方法显然都太过缓慢,想必还没等赢下一盘棋,机器就已经报废了。”[70]但重要的是,要探索通用计算机尽可能多的潜在用途。
香农也不忘施展自己的奇思异想。他设计并建造了一台机器,用来做罗马数字的算术运算,比如IV(4)乘以XII(12)等于XLVIII(48)。他将这台机器命名为THROBAC一号,取自“简型罗马数字守旧计算机”(THrifty ROman-numeral BAckward-looking Computer)的首字母缩写。他还建造过一台“读心机”,用来玩小孩猜奇偶的游戏。所有这些奇思异想之举都有一个共同点,那就是将算法应用到了新领域中去,即将思想抽象映射到数学对象上去。香农退休后还写过一篇数千字的长文,分析抛球的科学原理,其中提出了一系列定理和推论,并凭借记忆引用了诗人E. E.卡明斯的诗句:“某个混账会发明出测量春天的机器。”[71]
在20世纪50年代,香农还尝试设计一种能自行修复的机器。[72]如果其中某个继电器坏了,机器能自动找到并替换它。他甚至考虑过这样一种可能性,一种机器通过从环境中收集零件并加以组装,从而实现自我复制。虽然贝尔实验室乐于让香农出去谈论这些话题,演示他那能学会走迷宫的机器,但并不是每个听众都感到满意。“弗兰肯斯坦”之类的说法开始出现,怀俄明州的一名报纸专栏作家就写道:“我很纳闷,你这年轻人是否意识到自己在摆弄的是些什么东西。”
要是你启动了一部这样的机械计算机,却忘了在出去吃午餐时关掉它,那会发生什么事呢?我来告诉你。它在美国就会像野兔在澳大利亚一样。在你算出 701 945 240乘以 879 030 546等于多少之前,这个国家的每个家庭就都有了一台自己的小计算机……
香农先生,我无意批评你的这些实验,但坦率地讲,我对哪怕是一台计算机都丝毫没有兴趣。更别提要是有一堆计算机挤到我周围,又是乘又是除,又做其他什么它们擅长的事,那我一定会相当生气。 [73]
在香农对信息论的“时尚”提出警示两年后,一位年轻的信息理论家彼得·伊莱亚斯在一份学术期刊上发表了一篇社论,其中对一篇题为《信息论、光合作用和宗教》的论文提出了批评。[74]当然,这篇论文是杜撰的。但在当时确实有过一批论文,讨论诸如信息论、生命和拓扑学,信息论与组织损伤物理学,信息论与文职系统,信息论与心理药理学,信息论与地球物理学资料解释,信息论与晶体结构,信息论与旋律,如此等等。伊莱亚斯的父亲曾作为工程师在爱迪生的实验室工作,而他本人则是位严肃的专业研究者——他就对编码理论作出了重要贡献。对于这些堆砌概念、投机取巧而又毫无新意的所谓“跨学科”研究,他十分警惕:“这篇论文讨论了信息论与心理学(或遗传学、语言学、精神病学、商业组织)在用语和概念框架上出人意料密切的关系……诸如结构、模式、熵、噪声、发送器、接收器以及编码等概念(只要适当加以阐释)都对双方至关重要。在首次为心理学奠定了稳固的科学基础之后,论文作者谦虚地将填充自己所提出的框架的工作留给了心理学家。”伊莱亚斯把这称为偷窃,并呼吁这些同人放弃偷窃,开始诚实的劳作。
香农和伊莱亚斯的警告都发表在一份知名的信息论学术期刊上,而这份期刊只是当时为数众多且在不断增加的专门研究信息论的新期刊之一。
有一个流行词在各个学术圈里业已名声不好,那就是熵。另一位学者科林·彻里就抱怨道:“我们见到‘熵’被用在了语言、社会系统、经济系统以及各种苦于缺乏新方法的研究当中。它具有某种笼统性,因而成为一些人的救命稻草。”[75]他没有说到,毕竟当时还看不出端倪,信息论正开始改变理论物理学和生命科学的研究轨迹,而熵正是促成了这种改变的原因之一。
虽然当时信息理论家对于许多社会科学学科的直接影响已经过了巅峰,他们所用的数学也越来越适用于计算机科学而非心理学,但他们曾经的贡献是实实在在的。他们催化了许多社会科学学科的发展,为其迎接即将到来的新时代作好了准备。在这些学科中,信息转向的痕迹无法被消除。
注释
[1] Heinz von Foerster, ed.,Cybernetics: Circular Causal and Feedback Mechanisms in Biological and Social Systems: Transactions of the Seventh Conference, March 23–24, 1950(New York: Josiah Macy, Jr. Foundation, 1951), 155.
[2] J. L. Doob, review (untitled),Mathematical Reviews10 (February 1949): 133.
[3] A. Chapanis, review (untitled),Quarterly Review of Biology26, no. 3 (September 1951): 321.
[4] Arthur W. Burks, review (untitled),Philosophical Review60, no. 3 (July 1951): 398.
[5] Proceedings of the Institute of Radio Engineers37 (1949), in Claude Elwood Shannon,Collected Papers,ed. N. J. A. Sloane and Aaron D. Wyner (New York: IEEE Press, 1993), 872.
[6] John R. Pierce, “The Early Days of Information Theory,” IEEE Transactions on Information Theory19, no. 1 (1973): 5.
[7] 1834年,法国物理学家安德烈–马里·安培就曾使用了 cybernétique(Essai sur la philosophie des sciences)一词,不过这里的意义是“治理的艺术”。
[8] “Boy of 14 College Graduate,”The New York Times,9 May 1909, 1.
[9] Bertrand Russell to Lucy Donnelly, 19 October 1913, quoted in Steve J. Heims, John von Neumann and Norbert Wiener(Cambridge, Mass.: MIT Press, 1980), 18.
[10] Norbert Wiener to Leo Wiener, 15 October 1913, quoted in Flo Conway and Jim Siegelman,Dark Hero of the Information Age: In Search of Norbert Weiner, the Father of Cybernetics(New York: Basic Books, 2005), 30.
[11] Norbert Wiener, I Am a Mathematician: The Later Life of a Prodigy(Cambridge, Mass.: MIT Press, 1964), 324.
[12] Ibid., 375.
[13] Arturo Rosenblueth et al., “Behavior, Purpose and Teleology,” Philosophy of Science10 (1943): 18.
[14] Quoted in Warren S. McCulloch, “Recollections of the Many Sources of Cybernetics,” ASC Forum6, no. 2 (1974).
[15] “In Man’s Image,”Time,27 December 1948.
[16] Norbert Wiener,Cybernetics: Or Control and Communication in Animal and the Machine,2nd ed. (Cambridge, Mass.: MIT Press, 1961), 118.
[17] Ibid., 132.
[18] Warren S. McCulloch, “Through the Den of the Metaphysician,” British Journal for the Philosophy of Science5, no. 17 (1954): 18.
[19] Warren S. McCulloch, “Recollections of the Many Sources of Cybernetics,”11.
[20] Steve J. Heims,The Cybernetics Group(Cambridge, Mass.: MIT Press, 1991), 22.
[21] Heinz von Foerster, ed.,Transactions of the Seventh Conference,11.
[22] Ibid., 12.
[23] Ibid., 18.
[24] Heinz von Foerster, ed.,Transactions of the Seventh Conference,13.
[25] Ibid., 20.
[26] Jean-Pierre Dupuy,The Mechanization of the Mind: On the Origins of Cognitive Science,trans. M. B. DeBevoise (Princeton, N.J.: Princeton University Press, 2000), 89.
[27] Warren S. McCulloch and John Pfeiffer, “Of Digital Computers Called Brains,” Scientific Monthly69, no. 6 (1949): 368.
[28] J. C. R. Licklider, interview by William Aspray and Arthur Norberg, 28 October 1988, Charles Babbage Institute, University of Minnesota, http://conservancy.umn.edu/handle/107436 (accessed 6 June 2010).
[29] Heinz von Foerster, ed.,Transactions of the Seventh Conference,66.
[30] Ibid., 92.
[31] Ibid., 100.
[32] Ibid., 123.
[33] Ibid., 135.
[34] Quoted in Flo Conway and Jim Siegelman,Dark Hero of the Information Age,189.
[35] Heinz von Foerster, ed.,Transactions of the Seventh Conference,143.
[36] Heinz von Foerster, ed.,Cybernetics: Circular Causal and Feedback Mechanisms in Biological and Social Systems: Transactions of the Eighth Conference, March 15–16, 1951(New York: Josiah Macy, Jr. Foundation, 1952), xiii.
[37] Heinz von Foerster, ed.,Transactions of the Seventh Conference,151.
[38] Heinz von Foerster, ed.,Transactions of the Eighth Conference,173.
[39] “Computers and Automata,” in Claude Shannon,Collected Papers,706.
[40] Heinz von Foerster, ed.Transactions of the Eighth Conference,175.
[41] Ibid., 180.
[42] Quoted in Roberto Cordeschi, The Discovery of the Artificial: Behavior, Mind, and Machines Before and Beyond Cybernetics(Dordrecht, Netherlands: Springer, 2002), 163.
[43] Norbert Wiener,Cybernetics,23.
[44] John Bates to Grey Walter, quoted in Owen Holland, “The First Biologically Inspired Robots,”Robotica21 (2003): 354.
[45] Philip Husbands and Owen Holland, “The Ratio Club: A Hub of British Cybernetics,” in The Mechanical Mind in History(Cambridge, Mass.: MIT Press, 2008), 103.
[46] Ibid., 110.
[47] “Brain and Behavior,” Comparative Psychology Monograph,Series 103 (1950), in Warren S. McCulloch,Embodiments of Mind(Cambridge, Mass.: MIT Press, 1965), 307.
[48] Alan M. Turing, “Computing Machinery and Intelligence,”Minds and Machines59, no. 236 (1950): 433–460.
[49] Ibid., 436.
[50] Ibid., 439.
[51] Alan M. Turing, “Intelligent Machinery, A Heretical Theory,” unpublished lecture, c. 1951, in Stuart M. Shieber, ed., The Turing Test: Verbal Behavior as the Hallmark of Intelligence(Cambridge, Mass.: MIT Press, 2004), 105.
[52] Alan M. Turing, “Computing Machinery and Intelligence,” 442.
[53] Claude Shannon to C. Jones, 16 June 1952, Manuscript Division, Library of Congress.
[54] Translated in William Harvey, Anatomical Exercises Concerning the Motion of the Heart and Blood(London, 1653), quoted in “psychology,n,” draft revision Dec. 2009,OED Online,Oxford University Press, http://dictionary.oed.com/cgi/entry/50191636.
[55]North British Review22(November 1854), 181.
[56] William James to Henry Holt, 9 May 1890, quoted in Robert D. Richardson,William James: In the Maelstrom of American Modernism(New York: Houghton Mifflin, 2006), 298.
[57] George Miller, dialogue with Jonathan Miller, in Jonathan Miller, States of Mind(New York: Pantheon, 1983), 22.
[58] Homer Jacobson, “The Informational Capacity of the Human Ear,” Science112 (4 August 1950): 143–144; “The Informational Capacity of the Human Eye,” Science113 (16 March 1951):292–293.
[59] G. A. Miller, G. A. Heise, and W. Lichten, “The Intelligibility of Speech as a Function of the Context of the Test Materials,” Journal of Experimental Psychology41 (1951): 329–335.
[60] Donald E. Broadbent,Perception and Communication(Oxford: Pergamon Press, 1958), 31.
[61] Psychological Review63 (1956): 81–97.
[62] Frederick Adams, “The Informational Turn in Philosophy,”Minds and Machines13 (2003): 495.
[63] Jonathan Miller,States of Mind, 26.
[64] Claude Shannon, “The Transfer of Information,” talk presented at the 75th anniversary of the University of Pennsylvania Graduate School of Arts and Sciences, Manuscript Division, Library of Congress.
[65] “The Bandwagon,” in Claude Shannon,Collected Papers,462.
[66] Quoted in Steve J. Heims,The Cybernetics Group,277.
[67] Notes by Neil J. A. Sloane and Aaron D. Wyner in Claude Shannon,Collected Papers,882.
[68] Claude E. Shannon, “Programming a Computer for Playing Chess,” first presented at National IRE Convention, 9 March 1949, in Claude Shannon,Collected Papers,637; and “A Chess-Playing Machine,” Scientific American(February 1950), in Claude Shannon,Collected Papers,657.
[69] Edward Lasker to Claude Shannon, 7 February 1949, Manuscript Division, Library of Congress.
[70] Claude Shannon to C. J. S. Purdy, 28 August 1952, Manuscript Division, Library of Congress.
[71] “Scientific Aspects of Juggling,” unpublished, in Claude Shannon,Collected Papers,861.卡明斯在《声对声,唇对唇》(“Voices to Voices, Lip to Lip”)一诗中的原文为:“只要你我有唇相吻,有声放歌,谁管是否某个混账独眼龙会发明出测量春天的工具?”
[72] Claude Shannon to Irene Angus, 8 August 1952, Manuscript Division, Library of Congress.
[73] Robert McCraken, “The Sinister Machines,”Wyoming Tribune,March 1954.
[74] Peter Elias, “Two Famous Papers,” IRE Transactions on Information Theory4, no. 3 (1958): 99.
[75] E. Colin Cherry,On Human Communication(Cambridge, Mass.: MIT Press, 1957), 214.
第9章 熵及其妖(你无法通过搅拌将果酱和布丁区分开来)
思维干涉了可能事件的发生概率,从而从长期来看,也干涉了熵。
——戴维·L. 沃森(1930)[1]
如果说当时没有一个人知道熵到底意味着什么,那是有点夸张。但说它是那些少有人理解的词之一,这却是不假。根据在贝尔实验室里流传的一个说法,是约翰·冯·诺伊曼建议香农使用这个词,因为没有人懂这个词的意思,所以他与人争论时可以无往而不利。[2]这件事虽然子虚乌有,但听起来似乎有点道理。这个词在一开始甚至出现过意义颠倒,而即便到了现在,它也依然是极其难以定义。《牛津英语词典》就一反常态,没有给出这个词的明确释义:
1. 该词指代某种定量因素,它决定了部分物质的热力学状态。
热力学的主要奠基人之一德国人鲁道夫·克劳修斯在1865年首次引入了“熵”这个词,当时他需要为自己发现的某种量想个名称——这种量与能量有关,但又不是能量本身。
热力学是伴随着蒸汽机的发展而兴起的,事实上一开始只是作为“蒸汽机的理论研究”。[3]它关注热量或能量转换为功的过程。而当这种转换发生时(热量驱动了引擎),克劳修斯认识到,热量实际上并未损失,只是从较热的物体传递到了较冷的物体,并在传递途中做了些功。正如法国工程师尼古拉·萨迪·卡诺所反复指出的,这就像一部水车:水从高处流往低处,水量并没有增加或减少,但水在往低处流动的途中做了功。卡诺把热量也想象成了这样一种物质,即热质。热力学系统做功的能力,并不取决于热量本身,而取决于冷热之间的温差。把一块热石头投入冷水中就可以做功(比如产生的蒸气可以推动涡轮机),但整个由石头和水组成的系统的总热量维持不变,并且最终石头和水会逐渐达到同一温度。相反,无论一个封闭系统内含有多少能量,只要系统内的所有物体的温度都相同,它就无法对外做功。
克劳修斯想要度量的正是这种能量不可用(无法用于做功)的程度。他想出了熵(entropy)这个词,它源自希腊语的“转换”(τροπ,tropē)一词。*他的英国同行很快领悟到了其中的要点,但认为克劳修斯把关注点放在消极一面上是弄反了方向。詹姆斯·克拉克·麦克斯韦在其《热理论》一书中就建议,将熵的意义颠倒过来(“能够被转换为机械功的那部分能量”)会“更方便些”。这么一来:
注释:*克劳修斯有意使entropy(熵)与energy(能量)一词的结构相似,因为他认为这两个量在物理重要性上有着密切关系。——译者注
当系统的压力和温度变得均匀一致时,熵就耗竭了。
不过没过了几年,麦克斯韦便来了个一百八十度的大转向,决定沿用克劳修斯的用法。[4]他重写了该书,并添加了一条略显尴尬的脚注:
在本书先前各版中,我曾认为,克劳修斯把他所引入的“熵”的概念定义为无法被转换为功的那部分能量,是不妥当的。我进而将它重新定义为可用的能量,但这导致了热力学用语中的严重混乱。因此,在这一版中,我已经努力遵循克劳修斯的原始定义来使用“熵”一词。
但这里的问题不只在于是从积极一面还是从消极一面来看待,还存在于更微妙的层次。麦克斯韦先前把熵视为能量下属的一个类别,即可被用于做功的能量。但现在经过重新考虑后,他意识到热力学需要的是一个全新的量度。因此,熵不是能量的一种,也不是能量的数量,而是如克劳修斯所说,是能量的不可用程度。尽管听上去很抽象,但它与温度、体积或压力一样,也是个可以度量的量。
熵成为了一个图腾般的概念。有了它,热力学“定律”能被简洁地加以表达:
第一定律:宇宙的能量守恒。
第二定律:宇宙的熵恒增。
这些定律还有许多别的表达形式,有数学化的,也有好玩的,比如,“第一定律:你不可能赢;第二定律:你也甚至不可能打成平手”。[5]但不论形式如何,它都预示了宇宙的宿命:宇宙在走下坡路,一条不断衰退的不归路。我们的最终结局,就是熵最大化的状态。
威廉·汤姆森,即开尔文男爵,通过描述这番暗淡的前景,使得热力学第二定律吸引了公众的想象力。他在1862年宣称:“虽然机械能不灭,但一个普遍趋势是机械能会耗散,导致在整个物质宇宙内,运动会停止,势能会耗竭,而热能则会逐渐增加和扩散。这样最终整个宇宙会归于一个静止和死寂的状态。”[6]因而后来在H. G.威尔斯的科幻小说《时间机器》里,熵主宰了宇宙的最终命运:生命衰灭,太阳死亡,“令人厌恶的毁灭气息笼罩着整个世界”。不过,热寂并不是一片寒冷,而是不温不火、了无生气。1918年,弗洛伊德也从熵的概念中找到了某些有用之处,虽然他对此的理解有偏差:“在考虑从心理能量到实体行为的转换时,我们必须用到熵的概念,这个概念不允许撤销已发生的事情。”[7]
汤姆森的耗散一词可谓恰当。能量没有损失,只是耗散了;耗散掉的能量仍在,但已无法被人利用。最早开始关注混乱(无序)本身,把它视为熵的本质特性的,则是麦克斯韦。无序,它听上去竟不太像自然科学的概念,倒有点与知识、智能或判断等相似。麦克斯韦指出:“由此可得出的一个结论是,能量耗散的概念取决于我们的知识水平。可用的能量,是那些可以按我们的希望被引导进某个渠道中的能量。而耗散掉的能量则是那些我们无法掌控或按意志加以引导的能量,比如分子混乱扰动的能量,也就是我们所谓的热量。”我们能做什么、能知道什么,成了定义的一部分。谈到有序和无序,就不可避免地要涉及行为者或观察者,涉及心智:
混乱,如同与之相关的术语秩序一样,并不是物质本身的属性,而是与观察它们的心智息息相关。一本写得很整洁的备忘簿,在一个不识字的人看来并不混乱,在那位知道上面记着什么的主人看来也不混乱,但在其他识字却读不懂内容的人看来,它则显得无比混乱。同样地,耗散掉的能量的概念,对于不能自主利用任何自然界能量的存在物,或是能够跟踪每个分子的运动并在恰当时机俘获它们的存在物而言,都是没有意义的。[8]
秩序是主观的,因人而异。秩序和混乱似乎并不是数学家会尝试去定义或度量的一类东西。但他们真会就此束手吗?如果无序对应于熵,那么或许它也可以进行科学处理。
热力学的先驱们考虑了一种理想情况,即一个密闭容器中的气体。气体由原子构成,它并不像看上去那样简单或平静,而是包含了大量不断扰动的微粒的系综。原子看不见摸不着,在当时还是一种理论假想物。但如克劳修斯、开尔文、麦克斯韦、路德维希·波尔兹曼和威拉德·吉布斯等理论家都接受流体由原子构成的观点,并据此推导出了结论:微粒的运动杂乱无章、碰撞频繁且持续不断。他们意识到,正是微粒的这种运动构成了热。热不是物质,不是流体,也不是燃素,而只是分子的运动。
每一分子个体都必定遵守牛顿运动定律,因而在理论上,每个动作、每次碰撞都是可度量、可计算的。可是分子的数量实在太多了,无法一一加以度量和计算。但借助概率,新出现的统计力学在微观细节与宏观行为之间架起了桥梁。假设这个密闭容器被一块隔板隔成两半,A和B,并且A的气体比B的热,也就是说,A 的分子运动得较快,能量较高。但只要一去掉隔板,分子就开始混合。较快的分子碰撞较慢的分子,同时进行能量交换。最终一段时间后,气体的温度会变得均匀一致。但令人费解的是,为什么这个过程不可逆呢?在牛顿运动方程中,时间可以取正值,也可以取负值。从数学上说,两个方向都能成立,但在现实中,过去和未来可不会这么轻易就对调。
法国物理学家莱昂·布里卢安在 1949年就说道:“时间一去不返,这一事实让物理学家感到大惑不解,毕竟所有基础物理定律都是可逆的。”[9]不过,麦克斯韦对此并没有太多困惑。他在给瑞利男爵(约翰·威廉·斯特拉特)的信中写道:
如果这个世界是个纯粹的动力系统,并且如果你能精确地将该系统中所有粒子的运动在同一刹那反转,那么所有事物就会回到它们的起点,雨滴会从地面升起,飞回云里,如此等等。人们会看见自己的朋友从坟墓回到摇篮,直到自己也来到出生之前,尽管谁也不知道那是种怎样的状态。
麦克斯韦在这里想表达的关键是,如果从微观细节上观察个体分子的运动,无论时间是向前还是向后,分子的行为都是一样的。我们可以把电影倒放,但我们把隔板去掉,观察密闭容器内的气体时,这个混合过程在统计上说是单向的。即便我们观察该流体很长很长的时间,它也不会自动分成一边热一边冷的两半。在汤姆·斯托帕德(Tom Stoppard)的话剧《世外桃源》(Arcadia)中,聪明的小托马西娜有一句台词:“你无法通过搅拌将果酱和布丁区分开来。”这恰与“时间一去不返”的说法异曲同工。此类过程只能朝一个方向进行,而概率则是背后的原因。并且值得注意的是,所有的不可逆过程都必须用同样的原因来解释,这一点物理学家花了很长时间才算接受。比如,时间本身就取决于几率,或如理查德·费曼喜欢说的,“世事无常”:“总而言之,不可逆性是由于世事无常所导致的。”[10]而密闭容器内的气体从混合变得区分开来,这在物理定律上并非不可能,只是概率极其小罢了。因此,热力学第二定律只是在概率意义上成立:在统计上,万事万物都将趋于熵最大化。
不过,虽说第二定律不是必然,但这并不妨碍它成为科学的基本定律。正如麦克斯韦所说:
寓意。热力学第二定律等同于真理的程度与下述命题等同于真理的程度相同:把一杯水倒入大海以后,就不可能再取回同一杯水。[11]
热量自发地(没有外部帮助)从较冷的物体传向较热的物体,与有序自发地(没有外部帮助)从无序中产生,两者的不可能程度相当。它们在根本上可以用统计学来解释。计算一个系统的所有可能组合,可以发现其中无序的状态要远多于有序的状态。在大多数组合或“状态”中,分子全乱作一团;只有在极少数状态中,分子是整齐有序的。因此,有序状态的熵低,出现概率也低。而如果要达到可观的有序度,那么其出现概率更可能会非常低。图灵曾开玩笑地提出过一个数值N,其定义为“一支粉笔从房间一头扔到另一头,并在黑板上写下一行莎士比亚诗句的几率”。[12]
最终物理学家开始用微观状态和宏观状态来讨论熵。一个宏观状态可以是,所有气体集中在密闭容器的上半部,而与之对应的微观状态则是全部粒子的位置和速度的所有可能组合。这样一来,熵就成了概率在物理学上的等价物:某一给定宏观状态的熵,就是它所对应的微观状态数目的对数。因此,热力学第二定律揭示的是,宇宙从可能性较小的(有序的)宏观状态演化为可能性较大的(无序的)宏观状态的趋势。
不过,将如此重要的物理现象归结为仅仅是由于概率,这不免仍然让人困惑。说物理学完全允许混合气体自发地分成冷热两边,而这之所以不会出现只是由于几率和统计学,这种说法真的正确吗?对于这个难题,麦克斯韦提出了一个思想实验加以说明。设想“一个有限的存在物”,它控制着分隔密闭容器的隔板上的一个微孔。它能够看清飞来的分子,能够判断它们运动的快慢,并能够选择是否让它们通过。这么一来,它改变了原来的几率。通过筛选较快的分子和较慢的分子,它可以使得 A更热而 B更冷,并且这样做时,“无需做功,只需一个眼明手快的存在物发挥其智能即可”。[13]这个存在物不遵从普通概率。通常的情况是,不同事物会彼此混合。但要将它们筛选出来,就需要信息。
汤姆森很喜欢这个设想,并把这个想象出来的存在物称为妖(demon):“麦克斯韦的智能妖”、“麦克斯韦的筛选妖”,以及随后简单的,“麦克斯韦妖”。在大不列颠皇家协会的一次晚间讲演上,汤姆森生动地描述了这个小家伙:“它与一般动物的区别只[只!]在于,它体积极微小且身手极敏捷。”[14]借助两只装有不同颜色液体的试管,他演示了看上去不可逆的扩散过程,并宣称,只有那个妖能反演这个过程:
它能让密闭容器内的半边空气,或半根铁棒变得滚烫,同时另外一半却变得冰冷;能引导一盆水里的水分子的能量,使得水升高至某个高度,同时相应降低水的温度(每升高772英尺降低1华氏度);能“筛选”食盐溶液或两种气体的混合物内的分子,从而反转正常的扩散过程,使得溶质聚积在一起,而留下其他地方都是水,或使得两种气体分别占据密闭容器的不同区域。
对此,《科普月刊》的记者感到不以为然,甚至认为这荒唐可笑:“据说,整个自然充斥着无数这样荒诞微小的小鬼,它们无所不知,甚至能操控那些决定和维持着所有自然秩序的看不见摸不着的运动。当像剑桥大学的麦克斯韦和格拉斯哥大学的汤姆森这样的人物,都公开支持如此浅陋的假说,需要借助这种对原子又敲又踢的小恶魔来解释观察到的自然现象的变化时,我们不禁要问,接下来又会是什么?”[15]但这位记者没有理解关键所在。麦克斯韦并没有暗示他的妖真实存在,它只是教学工具而已。
这个妖能看见我们看不见的,毕竟我们太大也太慢了。具体来说,它能看见,热力学第二定律只是在统计意义上成立,而不是由某种物理原因所决定的。事实上,在分子水平,这条定律就会被随机地违背。而这个妖则是用具有目的性的行为替代了这种随机性。它用信息降低了熵。麦克斯韦从来没有想到,他的妖会如此广为流传,如此经久不衰。美国历史学家亨利·亚当斯甚至尝试将熵的概念纳入他的历史理论当中。1903年,他在给弟弟布鲁克斯的信中写道:“人如同原子,而那个掌控着热力学第二定律的麦克斯韦妖则应当成为总统。”[16]其实不妨说,这个妖统治的是一道大门,一道从物理世界进入信息世界的大门。
这个妖的力量让科学家十分羡慕,其卡通形象也常出现在物理学期刊中,用来活跃版面。虽然它确实是个想象之物,但原子本身一直以来也被视为是想象出来的,而这个妖竟能将原子驯服。自然规律看似不可抗拒,但这个妖却可以违背它们。它就像一个盗贼,通过操弄一个个分子来撬锁。法国数学家亨利·庞加莱就写道:“只有如麦克斯韦妖这样拥有无限敏锐的感官的存在物,才能梳理这团乱麻,并扭转宇宙不可逆的走向。”[17]而这不正是人类所梦寐以求的吗?
借助手中优于以往的显微镜,科学家在20世纪初开始考察细胞膜的主动筛选过程。他们发现,活细胞透过细胞膜吸收、过滤外界的物质,并在内部进行加工处理。种种具有目的性的过程似乎在微观水平上不断运作着。那么是谁或什么在操控这一切?答案似乎就在生命本身。1914年,英国生物学家詹姆斯·约翰斯通强调,“我们不能将魔鬼学引入科学”。[18]他指出,在物理学中,个体分子仍然无法为我们所控制。“它们的运动及其轨迹缺乏协调,可以说是‘一片混乱’。因此,物理学只考虑统计意义下的平均速度。”这就是为什么物理现象不可逆的原因,“因而在后者这门科学中,麦克斯韦妖不存在”。那么生命呢?生理学呢?约翰斯通进而提出,地球上的生命,作为一个整体,其过程是可逆的。“因此,我们必须寻找证据,证明生物体能够控制个体分子原本缺乏协调的运动。”
一方面,我们人类的大部分努力都用在了引导自然界的力量和能量,使之转到它们原本不会采取的轨迹上去;但另一方面,我们却长久以来都没有把原始生物,或甚至高等生物的身体组织也视为具有这种引导物理–化学过程的能力。这岂不是咄咄怪事?
既然生命依旧如此神秘莫测,或许麦克斯韦妖也有可能不只存在于卡通当中。
再后来,麦克斯韦妖也开始困扰一位非常年轻的匈牙利裔物理学家莱奥·齐拉特。这是位极富想象力的人物,在日后提出了电子显微镜、核连锁反应、直线加速器、回旋加速器等设想。他那位名气更大的老师,阿尔伯特·爱因斯坦,曾出于好意劝他到专利局谋取职位,所幸他并未听从。在20世纪20年代,齐拉特曾思考过热力学应当如何处理永不停歇的分子涨落。顾名思义,涨落就是偏离均值,就像逆流而上的鱼儿会时上时下。人们自然会想,要是能利用这种涨落的话,又会怎样呢?这样的想法令人难以抗拒,有人甚至据此设想了一种永动机*——永动机可是异想天开者和夸夸其谈者的圣杯。但这其实只是“我们为什么利用不了所有热量”的另一种说法。
注释:*比如,气体分子的随机撞击带动叶片和转轮,另一端的棘轮和掣爪则使转轮只能朝一个方向转动。对其不可能性的分析可见:《费恩曼物理学讲义(第1卷)》,第46章。——译者注
麦克斯韦妖还引发了另一个悖论。在一个封闭系统中,对这个能够区分较快分子和较慢分子并控制其通过的妖来说,它无异于拥有了一个源源不绝的有用的能量来源。又或者不是这个想象的小恶魔,而是其他“智能生命”呢?比如一个实验物理学家,他无需拥有操控个体分子的特异功能:“如果我们将这个实验者视为某种解围之神——他能准确地了解每时每刻自然的现有状态,并能在不消耗功的前提下干涉其宏观状态的走向,那样的话,永动机是可能实现的。”[19]然而,只要引入一个具有大脑的生命,生物现象本身便会带来问题。齐拉特指出:“神经系统本身的存在,就是依赖于能量的持续耗散。”[他的朋友卡尔·埃卡特(Carl Eckart)便精辟地总结道:“思考产生熵。”[20]]因此,在他的思想实验中,齐拉特设想了一个圆柱容器内盛有气体的热力学系统,智能生命则由一种“无生命设备”来取代,其运作只需度量少量信息。他还指出,这样的设备需要具有“某种记忆功能”(论文发表于1929年,当时图灵还是个十几岁的孩子。但如果用图灵后来提出的术语来说,齐拉特是把麦克斯韦妖的心智视为了一部具有双稳态存储的计算机)。
齐拉特进而证明了,即便是这样的永动机也必然会失败。而其中的关键在于:信息不是免费的。麦克斯韦、汤姆森等人都默认知识是现成的——关于分子运动速度和轨迹的知识就直接摆在了这个妖的眼前。他们没有考虑到,获取这些信息是需要成本的。不过,他们也不可能考虑得到,毕竟在那个相对单纯的时代,对他们来说,信息简直属于另一个平行宇宙、另一个灵魂世界,与这个他们试图研究的由物质和能量、粒子和力构成的世界并无关联。
然而,信息是物理的(information is physical)。麦克斯韦妖则在两者之间架起了桥梁,它每处理一个粒子,就是做了一次信息与能量的转换。齐拉特发现(当时他并未使用信息一词),只要精确核算每次度量和记忆,这种转换也是可以精确计算的。根据他的计算,每获取一单位的信息总是会相应带来一定的熵增加——具体来说,熵会增加klog2个单位。这个妖每次在两个粒子之间作出选择时,都会消耗一比特信息。熵增加会出现在每个循环结束时,这时旧的记忆不得不被清除(最后的这一点细节齐拉特并没有在论文中明确提出,但体现在了所用的数学当中)。只有把所有这些也妥善地考虑进去,似是而非的永动机才会无处容身,而宇宙也才会恢复和谐,“重新与热力学第二定律保持一致”。
就这样,齐拉特完成了通往香农“信息是熵”的构想的最后一环。但对香农来说,他看不懂德文,也没有关注过《物理学杂志》。他在后来回忆道:“我想,齐拉特当时确实是在思考这个问题。他曾跟冯·诺伊曼提起过,而冯·诺伊曼也可能跟维纳说起过。但他们都没有跟我谈到过此事。”[21]香农是从头构建了熵的数学理论。
在统计力学中,熵度量的是一个物理系统的微观状态的不确定程度,即处于所有可能微观状态中的一种的概率。这些可能微观状态的出现概率不一定相等,因此,物理学家的公式是: 。
而在信息论中,熵度量的是一条讯息的不确定程度,即身为由信源发出的所有可能讯息中的一条的概率。这些可能讯息的出现概率不一定相等,因此,香农的公式是: 。
两者形式上的相似性,并不是巧合:自然对相似问题本当给出相似答案。事实上这是同一个问题。要减少密闭容器内气体的熵,要对外做功,就必须以信息支付成本。类似地,一条确定的讯息会减少由所有可能讯息组成的集合的熵——这个集合用动力系统的术语来说就是相空间。
维纳的观点则与香农的稍有不同。这位同行兼对手在公式面前添加的是相反的符号,不过这对一个意义一开始曾出现过颠倒的用语来说倒也正常。香农说信息就是熵,而维纳则说信息是负熵。维纳认为,信息代表秩序,但有序的事物并不一定含有很多信息。香农曾向维纳指出过其中的差异,但认为这无关紧要,不过是“数学上的文字游戏”,而且他们算出的数值结果会是相同的。
我考虑的是,从一个集合中作出选择时会有多少信息产生——这样一来,集合越大,产生的信息越多。而你考虑的是,集合越大,不确定性越高时,对于该情况的知识就越少,因而信息也就越少。[22]
换句话说,H度量的是出人意料的程度。再换句话说,H是通过只允许回答是或否的问题来猜出一条未知讯息时所需问问题的平均数目。在现实中,香农的说法占据了上风,并在后来的物理学家和数学家手中结出了累累硕果,但由此引致的混乱还是持续了许多年时间。无序和有序,还需进一步的区分。
我们都像麦克斯韦妖一样活动。生物体(organism),顾名思义,时刻在组织(organize)。也正是在日常经验中,我们可以发现一向冷静的物理学家之所以会在两个世纪里对这个卡通形象一直难以忘怀的原因。我们分拣邮件、堆造沙堡、拼凑拼图、复盘棋局、收集邮票、给麦穗脱粒、按字母表顺序排列书籍、创造对称形式、创作十四行诗和奏鸣曲,以及整理自己的房间。所有这些活动并不需要巨大的能量,只需保障我们能够发挥智能便可。我们繁衍生息,我们扰乱了趋向热平衡的趋势——这里的“我们”不仅仅是人类,也包括所有生物在内。虽然试图对这些过程进行热力学核算无异于白日做梦,但有一点可以确信,即我们是在一点一点、一比特一比特地减少熵。原始版本的麦克斯韦妖有时被誉为“超级智能”,因为它能够一次识别一个分子,区分较快的和较慢的,还能操控它的微孔。但与真正的生物体相比,它只是个白痴天才。生物体降低了无序度,这不仅见于其所在的环境,也见于其本身,见于其骨骼、肌肉、囊泡和生物膜、外壳和背甲、叶和花,以及循环系统和代谢通道——这些无疑都是体现出模式和结构的奇迹。有时看来,我们存在于这个宇宙似乎就是为了一个知其不可而为之的目的——控制熵。
1943年,埃尔温·薛定谔在都柏林三一学院的一系列公共讲座上,试图回答一个困扰人们已久的难解之谜:生命是什么?这位喜好抽烟和戴领结的量子物理先驱,已经用自己的名字命名了一个量子力学的基本公式。但在涉足其他领域时,跟许多人到中年的诺贝尔奖得主太经常会做的那样,他不得不牺牲部分严谨性,而代之以一些大胆推测。因此,他一开讲就先向听众道了歉:“这个困境无法打破,除非我们当中有人敢于尝试去综合各种已有事实和理论,哪怕用的是一些二手的和不完全的知识,哪怕有可能使自己成为别人的笑柄。”[23]虽然如此,根据这次讲座的内容整理出版的小书却对后来影响深远。该书没有发现什么新东西,甚至也没有提出什么新东西,却奠定了一门新兴学科的基础,一门融合了遗传学和生物化学的交叉学科。该学科的一位奠基者后来曾这样写道:“有点类似于《汤姆叔叔的小屋》引发了南北战争,薛定谔的图书也引发了这场生物学革命。而当尘埃落定后,它留下了分子生物学作为自己的遗产。”[24]当时的生物学家从不曾读到过这样的东西,而物理学家则意识到,这预示着下一个可能取得重大成果的课题或许便是在生物学领域。
薛定谔首先从他所谓“神秘的生物恒定性”入手。不同于充斥着随机运动和涨落的密闭容器中的气体,也似乎无视不确定性占主导的薛定谔的波动力学,生物体的结构表现出令人惊叹的恒定性。这种恒定性不仅伴随着生物体的一生,并且还能通过遗传代代相传。薛定谔感到,这是个需要解释的现象。
于是他设问道:“生命的特征是什么?一个物体怎样才可以说是活的?”对此,他跳过了通常的解释,比如会成长、会进食、会繁殖等,而从尽量简单的角度来回答:“只要它在不断‘做些什么’,比如移动、与周围环境进行物质交换,诸如此类,并且持续时间要大大长于我们预期无生命物体在类似情况下做这些活动的持续时间即可。”[25]当一个无生命的系统孤立地处于均匀一致的环境中时,其中的运动最终会静止下来,温度会最终达到均匀一致,化学反应也会最终停止——“整个系统沦为一团静止的、惰性的物质”,热力学第二定律得到了遵循,而熵达到了最大化。然而,生物体却可以保持不稳定的状态。后来维纳在《控制论》中进一步考虑了这个问题。他认为,酶可能就是“亚稳的”麦克斯韦妖——亚稳的意思是,不那么稳定。[26]他指出:“酶的稳定状态就是失去催化活性,而活的生物体的稳定状态就是死亡。”
薛定谔认为,能够短暂地违背热力学第二定律,或至少看上去如此,正是生物体“看上去如此神秘”的原因。生物体看上去像永动机那样运作,使得许多人相信它们当中存在一种特殊的、超自然的生命力。除此之外,另一种流行的观念,即生物体依赖与周围环境交换物质或能量而存活,也被他视为荒诞不经。同一元素的不同原子之间并没有什么差别,而此一卡路里热量与彼一卡路里热量之间也并无高下之分,那么交换又有何益处呢?相反,他指出:生物体以负熵为食。
“换一种看上去不那么自相矛盾的说法,”他又不无悖论地补充道,“新陈代谢的本质是,生物体成功地使自己摆脱在其存活期内所必然产生的所有熵。”[27]
换言之,生物从周围环境中汲取秩序。草食动物和肉食动物以各种结构为食;它们摄取物质组织得井然有序的有机化合物,消化吸收之后,再将其排出体外,这时物质的“有序度已大大降低——但并未完全退化,因为它还能被植物利用”。与此同时,植物则还从阳光里吸收了能量以及负熵。对于这些过程,能量的核算尚可以完成,毕竟只是严格程度会有不同。但有序度的核算就没那么简单了。秩序和混乱的数学考量仍然困难重重,而相关的定义也不免陷入循环定义。
薛定谔进一步指出,对于生命如何存储和延续从自然吸收的秩序,我们还知之甚少。当时的生物学家借助显微镜,已经对细胞积累了大量的认识。他们在体细胞和受精卵中观察到了许多丝状物,他们称之为染色体。不同物种各自有着特定数目的染色体,它们成对出现,通常被视为生命遗传特征的载体。用薛定谔的话来说,染色体内保存着生物体的“模式”:“正是这些染色体,或很可能仅仅只是我们透过显微镜实际看到的染色体对中的一套丝状物,包含着某种决定了个体未来发展的全部模式的编码脚本。”生物体的每一个细胞竟然都“拥有完整的(两套)编码脚本”,这让薛定谔感到十分神奇——为何如此还不得而知,但这想必与生物体的功能有着某种至关重要的关系。[28]他将这比做一支军队里的每个士兵都对将军的作战计划的细节了如指掌。
这些细节指的是一个生物体的众多离散的“属性”,尽管当时对于如何界定一个属性尚还不清楚。(薛定谔就指出:“试图将一个生物体的模式分解成众多离散的‘属性’,这既不合适,也不现实,毕竟生物体在本质上是个统一体,是个‘整体’。”[29])某种动物的眼睛颜色,或蓝色或棕色,或许可以称得上是一种属性,但关注个体在这上面的差异恐怕更为有用,而这种差异当时被认为受染色体内的某种东西所控制。薛定谔使用的是基因一词:“某个遗传特征的假想的物质载体。”当时人们还无法看见这种假想的基因,但预期应该为时不远。根据显微镜观察结果,当时的科学家估算出单个基因的体积约等于边长为300埃(大致为100个液体中的原子或150个固体中的原子的长度)的立方体,包含的原子数不超过一百万或数百万个。然而,这些微小实体却必须找到某种方法封装下一个生物体的全部模式,不论它是一只果蝇、一株杜鹃,还是一只老鼠、一个人;并且这个模式还必须是个四维对象,即生物体的三维结构,再加上从胚胎到成年的每个发育阶段的演变。
为了探寻基因的分子结构,人们很自然地会将目光投向最井然有序的一类物质——晶体,试图从中寻找线索。晶体具有相对恒定的形式,可以从微小的起始开始,生成越来越大的晶体结构,并且当时的量子力学也已经开始深入探究晶体当中的作用力。不过,薛定谔意识到有机体与晶体还是有所区别。晶体太过有序了,只是“以一种相对乏味的方式,在三个维度上周期性地重复相同的结构”。晶体尽管看上去很精致,但其中每个原子或原子团的作用是完全等同的。相反,他认为,生命必然是基于更高程度的复杂度,其结构必定不是通过可预测的重复而成,而每个原子或原子团的作用也并不是完全等同的。他发明了一个术语来描述这种结构——非周期性晶体,并进而提出了一个假说:“我们相信一个基因,或可能整条染色体,是一种非周期性晶体。”[30]对于周期性与非周期性之间的巨大差异,他不禁强调再三:
两者结构上的差异,就好比一张普通墙纸与一件精品刺绣,比如一件拉菲尔的挂毯,那样有着天壤之别。前者只是以有规律的周期重复着相同的模式,而后者看不出有乏味的重复,有的只是精致、协调且富有意义的设计。[31]
法国物理学家莱昂·布里卢安后来沿着薛定谔的思路,进一步比较了活的生物体与死的晶体之间的差别。他注意到,晶体具有一定的自我修复能力,比如受到一定压力挤压时,其原子会调整到新的位置,以维持晶体结构的稳定。但这种自我修复是有限的,相较之下,生物体的自我修复能力就高超得太多了:“活的生物体能自己愈合伤口、治愈病症,甚至能再生因意外受损的大块结构。这是生物体最引人注目、也最令人意外的属性。”[32]跟薛定谔一样,布里卢安也用熵来联系起最小的和最大的尺度。
地球并不是一个封闭系统,生命便是以渗入地球系统的能量和负熵为食。阳光和雨露滋养作物(俗话说得好,三月风、四月雨,带来五月的花),作物提供食物,其中的循环大致如此:首先,创造出不稳定的平衡(如燃料、食物、瀑布等);然后,所有生物都来利用这些储备。
这样一来,生物使得通常的熵计算变得更复杂了。类似地,信息也会如此。布里卢安就问道:“取一份《纽约时报》、一本讲控制论的书,以及一堆分量相当的废纸,它们的熵一样吗?”如果你拿它们来烧火炉,自然它们的熵是一样的。但如果你是拿它们来读,那它们的熵就不同了。墨点的不同排列组合包含不同程度的信息,或者按维纳“信息是负熵”的说法,包含不同程度的负熵。
为了进行观察和度量,物理学家也需要从周围环境汲取负熵(比如他需要用到电池、电源、压缩空气等),从而将负熵转化成信息。布里卢安进而提出了一个大胆的猜想:物理学家根据观察和度量建立起科学知识,推导出科学定律,并利用这些定律,设计和制造出自然界中原本没有的、其结构非常罕见的机器和设备,这是不是又将信息转化成了某种形式的负熵呢?[33]
有些人认为,齐拉特的论文为麦克斯韦妖的棺材钉上了最后一根钉子。但这并不是麦克斯韦妖的结束——还远远没有。要想彻底解决该问题,驱走这个妖,要求我们更为深入地理解一个与热力学相隔甚远的领域:机械计算。正如彼得·兰兹伯格所写的:“麦克斯韦妖,死于莱奥·齐拉特的一篇论文发表之时,享年六十二岁。但它又化身为了一个顽皮而可爱的鬼魂,继续在物理学城堡里阴魂不散,时时作响。”[34]
注释
[1] David L. Watson, “Entropy and Organization,”Science 72(1930): 222.
[2] Robert Price, “A Conversation with Claude Shannon: One Man’s Approach to Problem Solving,”IEEE Communications Magazine22 (1984): 124.
[3] 这种说法可见于如:J. Johnstone, “Entropy and Evolution,”Philosophy 7(July 1932): 287.
[4] James Clerk Maxwell, Theory of Heat,2nd ed. (London: Longmans, Green, 1872), 186; 8th edition (London: Longmans, Green, 1891), 189 n.
[5] Peter Nicholls and David Langford, eds., The Science in Science Fiction(New York: Knopf, 1983), 86.
[6] Lord Kelvin (William Thomson), “Physical Considerations Regarding the Possible Age of the Sun’s Heat,” lecture at the Meeting of the British Association at Manchester, September 1861, in Philosophical Magazine152 (February 1862): 158.
[7] Sigmund Freud, “From the History of an Infantile Neurosis,” 1918b, 116, in The Standard Edition of the Complete Psychological Works of Sigmund Freud(London: Hogarth Press, 1955).
[8] James Clerk Maxwell, “Diffusion,” written for the ninth edition of Encyclopaedia Britannica, inThe Scientific Papers of James Clerk Maxwell,ed. W. D. Niven, vol. 2 (Cambridge: Cambridge University Press, 1890; repr. New York: Dover, 1965), 646.
[9] Léon Brillouin, “Life, Thermodynamics, and Cybernetics” (1949), in Harvey S. Leff and Andrew F. Rex, eds., Maxwell’s Demon 2: Entropy, Classical and Quantum Information, Computing(Bristol, U.K.: Institute of Physics, 2003), 77.
[10] Richard Feynman,The Character of Physical Law(New York: Modern Library, 1994), 106.
[11] James Clerk Maxwell to John William Strutt, 6 December 1870, in Elizabeth Garber, Stephen G. Brush, and C. W. F. Everitt, eds.,Maxwell on Heat and Statistical Mechanics: On “Avoiding All Personal Enquiries” of Molecules(London: Associated University Presses, 1995), 205.
[12] Quoted by Andrew Hodges, “What Did Alan Turing Mean by ‘Machine,’ ” in Philip Husbands et al.,The Mechanical Mind in History(Cambridge, Mass.: MIT Press, 2008), 81.
[13] James Clerk Maxwell to Peter Guthrie Tait, 11 December 1867, in The Scientific Letters and Papers of James Clerk Maxwell,ed. P. M. Harman, vol. 3 Cambridge: Cambridge University Press, 2002), 332.
[14] Royal Institution Lecture, 28 February 1879,Proceedings of the Royal Institution9 (1880): 113, in William Thomson,Mathematical and Physical Papers,vol. 5 (Cambridge: Cambridge University Press, 1911), 21.
[15] “Editor’s Table,”Popular Science Monthly15 (1879): 412.
[16] Henry Adams to Brooks Adams, 2 May 1903, in Henry Adams and His Friends: A Collection of His Unpublished Letters,ed. Harold Cater (Boston: Houghton Mifflin, 1947), 545.
[17] Henri Poincaré, The Foundations of Science,trans. George Bruce Halsted (New York: Science Press, 1913), 152.
[18] James Johnstone,The Philosophy of Biology(Cambridge: Cambridge University Press, 1914), 118.
[19] Leó Szilárd, “On the Decrease of Entropy in a Thermodynamic System by the Intervention of Intelligent Beings,” trans. Anatol Rapoport and Mechthilde Knoller, from Leó Szilárd,“ber die Entropieverminderung in einem thermodynamischen System bei Eingriffen intelligenter Wesen,”Zeitschrift für Physik53 (1929): 840–856, in Harvey S. Leff and Andrew F. Rex, eds.,Maxwell’s Demon2, 111.
[20] Quoted in William Lanouette,Genius in the Shadows(New York: Scribner’s, 1992), 64.
[21] Shannon interview with Friedrich-Wilhelm Hagemeyer, 1977, quoted in Erico Mariu Guizzo, “The Essential Message: Claude Shannon and the Making of Information Theory” (Master’s thesis, Massachusetts Institute of Technology, 2004).
[22] Claude Shannon to Norbert Wiener, 13 October 1948, Massachusetts Institute of TechnologyArchives.
[23] Erwin Schrdinger,What Is Life?,reprint ed. (Cambridge: Cambridge University Press, 1967), 1.
[24] Gunther S. Stent, “That Was the Molecular Biology That Was,” Science 160, no. 3826 (1968):392.
[25] Erwin Schrdinger,What Is Life?,69.
[26] Norbert Wiener,Cybernetics: Or Control and Communication in the Animal and the Machine,2nd ed. (Cambridge, Mass.: MIT Press, 1961), 58.
[27] Erwin Schrdinger,What Is Life?,71.
[28] Ibid., 23.
[29] Ibid., 28.
[30] Ibid., 61.
[31] Ibid., 5.(强调为引者所加。)
[32] Léon Brillouin, “Life, Thermodynamics, and Cybernetics,” 84.
[33] Léon Brillouin, “Maxwell’s Demon Cannot Operate: Information and Entropy,” in Harvey S. Leff and Andrew F. Rex, eds.,Maxwell’s Demon2, 123.
[34] Peter T. Landsberg,The Enigma of Time(Bristol: Adam Hilger, 1982), 15.
第10章 生命的编码(关于生物体的完整描述都已写在了卵里)
处于所有生物核心的不是火,不是热气,也不是所谓的“生命火花”,而是信息、字词以及指令。如果你想为生命找个隐喻,那就别把它想象成火、火花或气息之类。相反,可以把它想象成数以亿计的离散数字字符刻在了一片片晶片上。
——理查德·道金斯(1986)[1]
科学家喜爱谈论基本粒子。如果某些性状能够代代相传,它们必然具有某种原始形态或某类载体。因此,有人设想了某种原生质的基本粒子。1875 年,《科普月刊》上的一篇文章就提到了这样一种假说:“就跟物理学家一样,生物学家也应该被允许同样充分地‘科学运用想象力’。如果前者必须用到他假想的原子和分子,那么后者也可以谈论他的生理学单位,也就是塑型性分子(plastic molecule),或简称‘塑子’(plasticule)。”[2]
“塑子”终究没能流传开来,不过在当时,人们对于遗传的认识几乎都是错误的。因此,到了1910年,丹麦植物学家威廉·约翰森特意提出了基因一词,试图借此纠正当时播散甚广的一种迷思,即认为“身体属性”是从父母传递给子女的。约翰森在美国博物学家学会上的一次演讲中就斥之为“关于遗传最幼稚、也最古老的思想”。[3]会出现这样的想法不难理解。如果父女两人都很胖,一般人或许都会认为是父亲的肥胖导致了女儿的肥胖,或是父亲将肥胖遗传给了女儿。但这种认识是完全错误的。约翰森指出:“任何个体生物体的‘身体属性’根本不会决定其后代的属性。相反,无论是祖先的属性,还是后裔的属性,都是以相同的方式,由‘生殖物质’(如雄配子和雌配子,生物体正是从它们发育而成)的本质所决定的。”生物体所传递的是某种更抽象、更潜藏于潜能的本质当中的东西。
为了消除错误思想,约翰森提出了一套新术语。*首先一个就是“基因”:“这不过是个适用性很强的小词,很容易与其他单词组合成新词。”——即便当时约翰森或其他人都不清楚基因到底是什么,这也完全不影响其使用——“因此,它或许适合用来表示配子里的‘遗传因子’、‘元素’或‘等位因子’等……至于‘基因’的本质,现在就提出假说还为时尚早。”但格雷戈尔·孟德尔针对绿色和黄色豌豆的多年研究已经表明,肯定存在基因这样的东西。对于子叶颜色和其他性状,杂交后的植株的不同表现,具体数目由于受到多种因素(如温度和土壤成分)的影响而略有差异,但之间的比例大致都为三比一,这说明其中有某种东西作为一个整体被传递。它们既不混合,也不扩散,因而必定是量子化的。[4]孟德尔事实上已经发现了基因,只是没有叫这个名字罢了(当时他将之称为“遗传因子”)。在他看来,遗传因子更多的是一种代数上的方便说法,而不是一种物理实体。
注释:*他解释道:“旧的那套术语由于与古老的或错误的理论和体系相联系而大打折扣,它们由此带上了种种不恰当的意义,而这对于得出正确的洞见不总是全无害处的。”
后来薛定谔在认真思考基因时,他不得不面对一个难题。这样“微小的一点物质”是如何包含进去控制着一个生物体各个发育阶段的全部编码脚本呢?为了解决这个难题,薛定谔从电报(而没有从波动力学或理论物理学)借用了一个例子:摩尔斯电码。他注意到,仅仅两个符号(点和划),以有序的方式组合起来,就能生成人类的所有语言。他因而提出,基因也一定采用了某种编码:“只要有了基因的分子图景,我们便不再无法设想,如此微型的编码如何既能对应一个高度复杂而又具体明确的发育计划,又能以某种方式包含执行计划所需的方法。”[5]
编码、指令、信号,所有这些带有浓厚的机械和工程学意味的术语很快侵入了生物学家的词汇当中,就如同当初诺曼法语侵入中世纪英语一般。20 世纪 40年代,在生物学中使用这些术语一开始还给人矫揉造作之感,但很快人们就习以为常了。新兴的分子生物学开始考察分子水平上的信息存储和信息转换,并用“比特”来计量。一些将研究转向生物学的物理学家发现,信息正是讨论和度量诸如复杂度与有序度、组织性与特异性等生物学属性时所需的概念。[6]其中之一就是亨利·夸斯特勒,这是位来自维也纳的放射学先驱,当时在美国伊利诺伊大学,从事将信息论应用于生物学和心理学的研究。他估算出一个氨基酸的信息量相当于一个书面单词,一个蛋白质分子的信息量则相当于一个段落。1950年,他的同事西德尼·丹科夫曾向他提出过一种设想,认为一条染色体就是“一条经过编码的线性的指令带”。
整条染色体构成了一条“讯息”。该讯息可以细分成亚单位,它们或可称为“段落”或“单词”等。最小的讯息单位可能是某种触发器,它们能作出或是或否的选择。[7]
1952年,夸斯特勒组织了一次专题研讨会,讨论信息论在生物学中的应用,比如将熵、噪声、信息传输和差异化等新概念应用到从细胞结构、酶催化到宏观的“生态系统”等领域。据一位与会者的估算,一个细菌所包含的比特数就高达1013。[8](不过,这是描述整个三维的分子结构时所需的数目——或许存在更经济的描述方法?)而细菌的生长则可以描述为自身熵的减少。夸斯特勒也想用信息量来度量更高级的生物体,但不是以原子计(“那样做未免太过浪费”),而是以“塑造生物体的假想的指令”计。[9]这让他自然想到了基因。
他设想,在“染色体的某处”隐藏着一整套指令集,也就是基因组。这是个“目录”,即使没有包含全部,至少也包含了“关于成年生物体的所有信息中的大部分”。不过他也强调,人们对基因还几近一无所知。基因是离散的物理实体,还是它们之间会有重叠?基因是“相互独立的信源”,还是它们之间会互相影响?基因的数量又有多少?尽管这些问题当时都还没有答案,他还是得出了一个初步的结论:
单个细胞或一整个人的基本复杂度都不会大于1012比特,也不会小于105比特。当然,这是个非常粗略的估算,但总算聊胜于无。[10]
当时这些粗略的工作并没有产生什么直接的后续影响。香农的信息论终究不能整体移植到生物学研究上去。但这已经不重要了。一个重大转变已然在进行:从考虑能量变成考虑信息。
1953 年春,在大西洋对岸的伦敦,《自然》杂志的办公室收到了一封奇怪的短信。[11]这是份联名信,牵头的是法国首位遗传学教授、巴黎大学的鲍里斯·埃弗吕西,联署的还有来自苏黎世大学、剑桥大学和日内瓦大学的学者。这些科学家抱怨说:“在我们看来,专业词汇近来的增长相当混乱。”比如,细菌的遗传重组就有诸如细菌“转化”、“诱导”、“转导”甚至“传染”等说法。对此,他们建议加以简化:
作为解决上述混乱局面的一个方案,我们建议采用“细菌间信息”(interbacterial information)这个术语来取代上述说法。该术语避免了给人留下重组过程必定涉及物质转移的暗示,同时也为将来控制论在细菌水平上的可能应用预留了空间。
这封信其实原是这些科学家在瑞士洛迦诺的一次湖畔午餐上,酒酣耳熟之后的产物——原本只是打算开个玩笑。[12]但《自然》杂志的编辑却认为言之有理,并随即将它刊登了出来。在当时参加了午餐并在信上署名的人当中,其中最年轻的是个二十五岁的美国人,名叫詹姆斯·沃森。
紧接着下一期的《自然》杂志又刊登了沃森及其合作者弗朗西斯·克里克的另一封信。这封信使两人一举成名,因为他们找到了基因。
在此之前,主流观点认为,无论基因是什么样,也无论它们是如何起作用,它们很有可能是蛋白质:由一长串氨基酸构成的巨型有机分子。但在 20世纪 40年代,一些遗传学家已经开始研究一种简单的病毒——噬菌体,并且之后的一系列遗传实验让包括沃森和克里克在内的许多研究人员相信,基因可能存在于另一种物质当中。[13]由于某种未知的原因,这种物质广泛存在于所有细胞的细胞核内,无论是植物、动物还是噬菌体都概莫能外。这种物质是一种核酸,更具体地,是脱氧核糖核酸(DNA)。之前对核酸进行研究的,主要是化学家,但他们对它一直以来也知之甚少,只知道它是由一种叫做核苷酸的更小单位构成。沃森和克里克当时都在剑桥大学的卡文迪什实验室。他们意识到,秘密可能就藏身于此,需要做的是搞清楚DNA的结构。他们无法看见这些分子,只能在DNA的X射线衍射图谱中寻找线索。所幸他们对 DNA 的亚单位更为了解,知道每个核苷酸含有一个碱基,碱基一共只有四种,分别记为A、C、G和T,并且各自的比例是严格可预测的。它们想必是遗传编码的字母,剩下的便是充分发挥想象力,不断进行试错了。
他们的发现,即DNA的双螺旋结构,很快成了一种象征符号,见于杂志封面甚至雕塑作品。DNA由两条长长的碱基序列构成(它就像使用一张四字母码表写成的密码),两者互补并相互缠绕。分离开后,每条序列都可以作为复制的模板。(DNA是不是薛定谔设想的“非周期性晶体”呢?从物理结构上看,X 射线衍射图谱显示,DNA的结构完全是有规律的。其非周期性存在于语言,即“字母”序列这个抽象水平上。)克里克是在一家当地酒吧里,激动万分地向所有愿意倾听的听众宣布,他们发现了“生命的秘密”。不过,两人在《自然》杂志上发表的仅有一页的论文中显得更为谨慎。其论文结尾中的一句话被有人称为“科学文献中最羞怯的表述之一”。[14]
我们不是没有注意到,我们设想的这种碱基配对模式直接预示了遗传物质一种可能的复制机制。[15]
在几周后他们的另一篇论文中,这种胆怯已经荡然无存。他们注意到,在每条长链上,碱基序列看上去都无规律可循——任何一种序列皆有可能出现。“这意味着,在一个长分子上,大量不同的排列方式都有可能。”[16]而大量不同的排列方式,也就意味着大量可能的讯息。他们接下去的一句话则让大西洋两岸的学者都为之一振:“因此很有可能,碱基的精确序列就是承载遗传信息的编码。”他们在这里使用信息、编码等术语时,已经用的不再是这些词的比喻意义了。
有机生命的高分子将信息嵌入高度复杂的结构当中。比如,一个人类的血红蛋白分子包含四条盘绕折叠的多肽链,其中两条各含141个氨基酸,另两条各含146 个,其上的所有氨基酸都以严格的线性顺序排列。要是让氢、氧、碳、铁原子随机混合,就算穷极宇宙一生的时间恐怕也不见得会组成一个血红蛋白分子,就像黑猩猩在有限的时间内几乎不可能敲出莎士比亚全集一样。高分子的生成离不开能量;它们由较简单、较无序的单位组合而成,熵的定律在这里同样适用。对地球上的生命而言,能量来自太阳的光子,信息则来自进化。
DNA分子有点不同,它的唯一功能就是携带信息。因此,微生物学家在意识到这点后,便将注意力转向了编码破解问题。克里克当初是由于读了薛定谔的《生命是什么?》才从物理转而研究生物,所以他特意寄了份论文给薛定谔,但没有得到回音。
另一方面,乔治·伽莫夫在一次访问加州大学伯克利分校的辐射实验室时,读到了沃森和克里克的报告。这位乌克兰裔宇宙学家,大爆炸理论的创立者之一,立马意识到了这是个伟大的思想。随后他发出了一封信:
亲爱的沃森博士和克里克博士:
我是名物理学家,而非生物学家……但你们发表在五月三十日的《自然》杂志上的文章着实令我兴奋不已。我认为,这篇文章让生物学得以跻身于众“精确”科学……如果你们的观点成立,那么每个生物体都能用四进制(?)系统的一个长长的数来表征,其中数字1、2、3、4分别代表四种不同碱基……这将为生物学开辟一个令人振奋的、基于组合论和数论的理论研究前景!……我感觉这能实现。你们觉得如何?[17]
在接下来的十年里,遗传编码的破解吸引了一大批来自各领域的杰出头脑,其中有很多人跟伽莫夫一样,对生物化学知之甚少。当初破解 DNA 的结构问题时,沃森和克里克需要涉及众多专业知识,诸如氢键、盐桥、联结脱氧呋喃核糖残基的磷酸二酯键等。他们需要弄清楚无机离子的三维空间构型,还要计算化学键间的精确角度。为此,他们还用纸板、锡片和铁丝制作了实体模型。但现在,问题变成了一个操弄符号的抽象游戏。虽然RNA(核糖核酸,与DNA有密切联系,但只有单股长链)在合成蛋白质的过程中似乎扮演着信使或翻译的角色,但伽莫夫明确表示,背后的化学过程无关紧要。他和其他很多人都把这视为一个数学难题,即找出采用了不同字母表的讯息之间的映射关系。如果这是一个编码问题,那么他们可以从组合论和信息论中寻找所需的工具。另外,他们不仅咨询了物理学家,还咨询了密码分析师。
伽莫夫说干就干,亲自开始设计一套组合编码。在他看来,目标是从 DNA的四种碱基出发,组合出用来合成蛋白质的二十种氨基酸——也就是说,一套包括四个字母和二十个单词的编码。*通过简单的组合论分析,他知道需要用连续三个核苷酸来标注一个氨基酸——也就是说,每个单词由三个字母构成。几个月后,他在《自然》杂志上发表了自己的编码方案,它很快被人们称为伽莫夫的“方块码”。又过了几个月,克里克证明方块码完全错了,它被蛋白质序列的实验数据所否定。不过,伽莫夫没有就此罢手,毕竟三联体编码的设想实在诱人。除了伽莫夫,遗传编码的破解还吸引了其他一些出人意料的科学家,包括原为物理学家、现在加州理工学院生物系的马克斯·德尔布吕克(Max Delbrück),德尔布吕克的朋友、量子物理学家理查德·费曼(Richard Feynman),理论物理学家、“氢弹之父”爱德华·特勒(Edward Teller),特勒在洛斯阿拉莫斯国家实验室的同事、数学家尼古拉斯·梅特罗波利斯(Nicholas Metropolis),以及克里克在卡文迪什实验室的同事西德尼·布伦纳(Sydney Brenner)等。
注释:*伽莫夫提出存在二十种氨基酸,这是个大胆的猜测,因为当时已知的数目还没有这么多。尽管这个数目后来被证明是正确的,但伽莫夫给出的氨基酸清单并不正确。
注释:根据伽莫夫的方案,四个碱基分居方块的四个顶点。其中相对的两个顶点上是一对碱基对(根据碱基互补配对原则,有两种可能);另两个顶点上的两个碱基则可以任意,共十种可能(同种碱基有四种可能,不同碱基有六种可能)。上下、左右翻转方块并不影响编码。参见:George Gamow, “Possible Relation between Deoxyribonucleic Acid and Protein Structure,”Nature 173 (1954): 318.——译者注
他们每个人都有自己的编码设想。从数学上看,这个问题连伽莫夫都不禁觉得十分艰巨。他在1954年写道:“就如在战争期间(热战或冷战!)解密敌方讯息,成功的胜算取决于截获的加密文本的长度。又如任何一位情报人员都会告诉你的,破解的难度很高,成功大部分只能靠运气。要知道,二十种氨基酸便有20!=1017种分配给碱基三联体的可能……我觉得,要是不借助电子计算机的帮助,恐怕是不可能解决这个问题了。”[18]伽莫夫和沃森还专门为此成立了一个俱乐部,取名“RNA领带俱乐部”,成员限为二十名。每名成员都会得到一条黑色羊毛领带,上面绣有绿色和黄色的RNA单链图案。伽莫夫设计了图案,沃森则跑腿将图案送到了洛杉矶的一家男装裁缝店进行定做。除了提供交际娱乐,伽莫夫还希望借此打造一条不依赖期刊论文的思想交流渠道。在这里,科学新闻的传播速度远快于以往。另一名成员冈特·斯滕特就提到:“许多基本概念都是在大西洋两岸的一些非正式讨论中首次提出的,然后它们通过私下的跨国流言网络,才迅速在专家当中传播开来。”[19]当然,有些编码方案胎死腹中,有些异想天开,还有些则落入了死胡同,并且当时的生物化学界也并不总是愿意接受这些方案。
“当时,人们并不都相信编码的思想,”克里克后来说道,“大多数生物化学家根本就没往这方面想。这是个全新的思想,并被他们认为是太过简化了。”[20]相反,他们认为,理解蛋白质的关键在于研究酶系统和肽合成。这在当时听上去似乎不无道理。
他们认为,蛋白质合成不可能是把一种东西编码成另一种这么简单,而且对他们而言,编码听起来太像是物理学的东西,一点也不像生物化学……因此,对于一些简单的思想,比如三个核苷酸编码一个氨基酸,人们就存在着一定程度的抵制,视之为弄虚作假。
伽莫夫则是站到了另一个极端,有意忽略生物化学的细节,而直接提出一种简单得骇人的思想,即任何活的生物体都是由“四进制系统的一个长长的数”所决定。[21]他将这称为“兽名数字”(取自《新约·启示录》)。如果两只兽具有相同的数,那么它们就是双胞所生。
到了后来,编码一词已经如此深入地渗透到日常话语当中,人们对之习以为常,就很少会意识到,用一种抽象符号任意地表示另外一种抽象符号,这样的事情竟然能够在化学的分子水平上进行,该是多么非同寻常。事实上,遗传编码与哥德尔为了哲学论证而发明的元数学编码,在功能上有着惊人的相似性。哥德尔的编码用普通的数来表示数学表达式和数学运算,而遗传编码则用核苷酸三联体来表示氨基酸。20世纪80年代,侯世达第一个明确地将两者联系了起来,“活细胞里得以让 DNA 复制自己的复杂机制,与数学系统里得以让一个公式描述自己的聪明机制”。[22]他意识到,两者都是在一个实体集与另一个实体集之间建立起了看似任意的映射关系。在外人看来,遗传编码联结的两个领域都涉及化学物质,似乎之间的关联不难看出。“但一直以来都没有人哪怕有过一丝闪念,设想一类化学物质竟能编码另一类。”
的确,这种思想本身就令人困惑:倘使存在一种编码,那它是谁发明的?它传递的是什么样的讯息?它是谁撰写的?又是写给谁看的?
RNA领带俱乐部的成员们意识到,问题不只包括信息存储,还包括信息转移。DNA要实现两种不同的功能。首先,它要能够保存信息。这是通过它的自我复制实现的,世代相承,绵延不绝——它就如同一座古亚历山大图书馆,可以进行数十亿次的自我复制而仍然保持数据的完整可靠。虽然 DNA 有着漂亮的双螺旋结构,但它的信息存储方式本质上是一维的:其构成元素线性排成一串。人类DNA中的核苷酸单位数量超过了十亿,而如此庞大的吉比特的讯息仍要求保存得非常完美,或几近完美。其次,DNA还要能够将所保存的信息发送出去,用以构成生物体。存储在一维 DNA 长链中的数据必须能够指导在三维空间里的展开。这种信息转移是通过 DNA转录成 RNA,并由 RNA翻译为蛋白质来实现的。因此, DNA不仅进行自我复制,分离开后,它还控制着另一种完全不同的物质的制造。而生成的这些极其复杂的蛋白质,是生物体的构成材料,有如砂浆和砖瓦;又是生物体的控制系统,有如调控生长的管道、线路和信号。
复制DNA,就是复制信息;制造蛋白质,就是转移信息,发送讯息。生物学家之所以现在能够清晰地认识到这一点,是因为讯息已经有了明确的定义,并脱离了任何特定的载体。如果讯息能够加载在声波或电脉冲上,那为什么不会是通过化学过程呢?
伽莫夫就精练地总结道:“一个活细胞的细胞核就是一座信息仓库。”[23]更不凡的是,它还是一台自动激活的信息发射机。所有生命的延续都依赖于细胞核中的这个“信息系统”,而遗传学所研究的正是“细胞的语言”。
在方块码失败后,伽莫夫又尝试过“三角码”及其他变体,但所有这些也被证明是错误的。即便如此,三联体密码子仍被认为是最有可能的形式,只是正确的编码方案看似就在眼前,却又总是鞭长莫及。其中一个问题是,自然如何为貌似连续的DNA和RNA长链加注标点呢?在摩尔斯电码中,通过停顿可以区分字符或字词,但人们不知道其生物学对应物在哪里。或许四个一组,第四个碱基就是逗号?又或者像克里克猜想的那样,其实不需要逗号,因为有些三联体“有意义”,而有些是“毫无意义”的?[24]这样的话,指令带的某种读取器只需从特定的点开始读起,三个一组地读取核苷酸即可。在被这个问题所吸引的众多数学家中,有三位来自加州帕萨迪纳的喷气推进实验室(实验室的主业是航天研究)。他们认为,这个问题看上去有点像信源编码理论中的一个经典问题:“核苷酸序列可被视作一条不带标点的无限长讯息,其中的任意有限长片断在加入适当的逗号后,都必须能够被译成一个氨基酸序列。”[25]他们提出了编码词典的概念,并考虑了编码误植问题。
然而,生物化学毕竟至关紧要。离开了培养皿和实验室,即便世界上所有密码分析师合起来,也不可能从无穷无尽的可能中猜到答案。到了20世纪60年代初,遗传编码最终被破解时*,人们才发现这种编码充满了冗余。核苷酸三联体与氨基酸之间的映射关系大多不是一一对应,不像伽莫夫先前所设想的那般井井有条。有些氨基酸只对应于一个密码子,而有些则对应着两个、四个甚至六个密码子。被称为核糖体的细胞器读取RNA上的遗传信息,每次三个碱基,并对其进行翻译。有些密码子是冗余的,有些则用作起始或终止信号。正如信息理论家所预想的,冗余提供了容错能力。生物学中的讯息同样会受到噪声影响,DNA中的错误(误植)就是所谓的突变。
注释: *1961年,马歇尔·尼伦伯格(Marshall Nirenberg)等人通过实验破解了第一个密码子。后来,哈尔·戈宾德·科拉纳(Har Gobind Khorana)破解了其余的密码子。罗伯特·威廉·霍利(Robert W. Holley)随后确定了转运RNA的结构。这三人共同分享了1968年的诺贝尔生理学或医学奖。——译者注
而在最终答案出现之前,克里克早已指明了遗传的基本原理,他称之为中心法则(该说法也一直沿用至今)。这是个关于进化方向和生命起源的假说,可以借助不同化学物质字母表的香农熵( DNA 字母表和 RNA 字母表的香农熵都为log 2 64 ,而氨基酸字母表的香农熵为log 2 20 )加以证实。
一旦“信息”传入了蛋白质,它就无法再传出。具体而言,信息可以从核酸传到核酸,或从核酸传到蛋白质,但不可能从蛋白质传到蛋白质,或从蛋白质传到核酸。这里的“信息”,是指序列的精确次序。[26]
因此,遗传讯息是独立、刺不透的:没有来自外部事件的信息可以改变它。
信息从未在如此微小的尺度上书写过。这是在埃米尺度上写成的文字,出版于无人可见的地方——一本针眼里的生命之书。
一切生命皆源于卵(Omne vivum ex ovo)。“关于生物体的完整描述都已写在了卵里,”1971 年冬,西德尼·布伦纳在剑桥大学对为撰写分子生物学的历史而前来采访的霍勒斯·弗里兰·贾德森说道,“每只动物体内都有关于该动物的描述。找出那个描述是个经验问题,但困难的是,要探明其中涉及的大量细节。对此,最经济有效的描述语言是借助分子和遗传的描述,这个我们已经有了。但我们还不知道的是,在那种语言里,其中具体用到的是些什么样的名字。生物体自己是怎样取名字的呢?我们不能断言,一个生物体会给,比如说,一根手指取个名字。因此无从保证,我们在制造一只手套时所用的术语能套用在解释生物体如何制造一只手上。”[27]
当时布伦纳邀请贾德森在国王学院共进晚餐。他喝了两杯雪利酒开胃,不禁思绪翻飞。在不到二十年前,他刚开始与克里克一起工作时,甚至还没有分子生物学这个名字。而二十年后,到了20世纪90年代,世界各地的科学家则已经开始合作进行绘制人类基因组图谱的计划,要涉及约两万个基因、三十亿个碱基对。但什么是其中最根本性的改变?是研究框架变了,从研究能量和物质转向了研究信息。
“直到20世纪50年代,生物化学主要关心的是,细胞活动所需的能量和物质从何而来。生物化学家考虑的只是能量流和物质流,而分子生物学家则开始讨论信息流。现在看来,正是双螺旋结构的发现让人们意识到,生物系统中的信息也能像物质和能量那样进行研究……
“我给你举个例子。二十年前,如果你去问一名生物学家,蛋白质是如何合成的,他会回答,这个问题太过复杂,我不知道。如果你去问一个生物化学家,他会说,关键的问题在于从哪得到制造肽键的能量。而分子生物学家对此则会说,关键不在那,关键在于组装氨基酸序列的指令从何而来;让能量见鬼去吧,它自己会想办法的。”
在20世纪70年代初,生物学家的技术术语中已经包含了诸如字母表、文库、编辑、校对、转录、翻译、无意义、同义词和冗余等词。遗传学和 DNA 不仅吸引了密码学家,还吸引了传统语言学家。人们发现,某些蛋白质能够在两种相对稳态之间翻转,就像继电器。它们接受加密指令并传递给相邻的蛋白质——如同三维通信网络中的交换站。布伦纳在展望未来时,认为将来的研究重点会转向计算机科学,并设想了一门研究混沌和复杂性的新科学。他说道:“我认为,在今后二十五年里,我们还将给生物学新引入另一种语言。我不知道这种语言叫什么名字,大家都不知道。但我想,这种语言要处理的是复杂系统理论的基本问题。”他提到,约翰·冯·诺伊曼早在信息论和控制论刚兴起时就曾建议,可以通过思考计算机器如何执行相应功能(比如视觉识别)来理解生物学过程和心理学过程。布伦纳继续说道:“换句话说,物理学讨论的是定律,分子生物学到现在为止讨论的是机制,或许我们现在应该开始讨论其算法。也就是,配方、程序。”
如果你想知道老鼠是什么,那不妨换个问法,考虑如何才能制造一只老鼠,或老鼠是怎样把自己制造出来的。老鼠的各个基因开开关关,一步一步地执行着计算步骤。“我觉得这种新的分子生物学必须要走这条路,去研究生物发育成长的各种高阶逻辑计算机、程序和算法……
“最终人们希望做到将两者合二为一,从而在分子硬件与描述其如何组织的逻辑软件之间可以自由转换,而不会感觉两者属于不同的科学。”
即便到了布伦纳的时代,或者说尤其到了那个时代,基因也不是它表面看上去的样子。基因最初源自一名植物学家的直觉,只是作为一种在代数上的方便说法。在过去一段时间,人们逐渐发现它存在于染色体上,认识到它是互相缠绕的螺旋长链,并对它进行了解码、分析和编目。然后在分子生物学处于巅峰的 20世纪70年代,人们对基因重新有了新的认识,基因再次摆脱了其物质载体。
人们对基因了解越多,就越难给它下定义。基因就是DNA吗?它是由DNA组成,还是以DNA为载体呢?把基因认定为一种物质,真的合适吗?
不过,并非所有人都觉得这其中有什么问题。1977年,冈特·斯滕特就宣称,将孟德尔的遗传因子或基因“最终明确确认为”一段特定长度的 DNA,这是 20世纪分子生物学领域所取得的伟大胜利之一。“正是在这个意义上,现在所有遗传学家使用了‘基因’一词。”[28]换用比较专业但简洁的话说就是:“基因,其实就是DNA核苷酸的一段线性排列,它决定了蛋白质氨基酸的一段线性排列。”斯滕特认为,是西摩·本泽明确地确立了这种认识。
但本泽本人并没有如此乐观。早在1957年,他就提出,传统的基因概念已经不再适合。这个概念试图同时承载三种目的(作为重组的单位、作为突变的单位,以及作为功能的单位),而他有充分的理由怀疑,这三者并不兼容。基因一直以来被认为是最小的不可再分的单位,但沃森和克里克的发现表明,一条 DNA 长链包含许多碱基对,它们就像一条线上串起的许多珠子或一个句子里包含的许多字母。显然,作为物理实体,基因不能再被称为不可再分的基本单位。为此,本泽提出了一批替换的新名称:“重组子”(recon),表示用于重组的最小单位;“突变子”(muton),表示发生突变的最小单位(单个碱基对);“顺反子”(cistron),表示执行功能的最小单位——不过他也承认,这要更难定义一些,因为“这取决于具体指的是哪种水平上的功能”,它可能具体指一个氨基酸,也可能指“达成某个具体生理结果的一整套步骤”。[29]“基因”一词究竟没有就此消失,但对于这么一个小词来说,它的确承载了太多重负。
当时发生的一件大事是,分子生物学与进化生物学的碰撞,后者的研究范围涉及从植物学到古生物学的广大领域。与科学史上的其他碰撞一样,这次碰撞同样带来了丰硕成果,不久后,双方都发现自己想要发展已离不开对方。在这个过程中,有些碰撞的火花尤为耀眼夺目,而其中相当一部分源自牛津大学的一名年轻动物学家理查德·道金斯。道金斯认为,他的许多同行对于生命的理解是完全弄错了方向。
随着分子生物学对DNA细节的了解日益完善,操纵这些分子奇观的水平日渐高超,人们自然而然会将 DNA 视为回答“生物体如何繁衍”这个重大问题的答案。有人或许会说,我们利用 DNA 来繁衍,就像利用肺来呼吸,利用眼睛来看一样。但道金斯却写道:“这种态度是极其错误的,与真理完全背道而驰。”[30]他指出,如果采取恰当的视角来看待生命,我们就会发现DNA在历史上和在重要性上都是占先的。从这个视角来看,基因才是焦点,才是核心,才是主角。在他的第一本著作中(这是本大众通俗读物,出版于1976年,起了个富有争议的书名,《自私的基因》),他提出了一个引发了后续几十年热议的观点:“我们不过是生存机器——某种机器人载具,被盲目地编程为用来保全一种称为基因的自私分子。”[31]据他称,这个真理他已经知道很多年了。
因此,自然选择的基本单位不是生物体,而是基因。它们的起源是“复制子”(replicator),某种在原生汤中意外结成的分子,拥有自我复制的特殊能力。
这些远古的复制子并没有灭绝,毕竟它们是生存艺术的大师。不过现在你不会找到它们在海洋中四处漂流,因为它们很早便已经放弃了这种随波逐流的自由。它们如今聚集在一块块巨大的殖民地当中,藏身于笨重的机器人内,与外部世界相隔离,只是通过复杂的间接途径与其沟通,并通过远程控制对其进行操控。它们就在你我体内。它们创造了我们,包括身体和心智,而我们存在的终极目的只是为保全它们。这些复制子不断在完善着自己。现在它们被称为基因,而我们不过是它们的生存机器。[32]
可以想见,这样的说法势必会激怒某些不认为自己不过是机器人的人。1977年,史蒂芬·杰伊·古尔德就写道:“最近英国生物学家理查德·道金斯的说法,称基因才是自然选择的基本单位,而个体不过是它们暂时容身的皮囊,这令我十分不快。”[33]古尔德的同道者甚众。冈特·斯滕特说出了许多分子生物学家想说的话,称这位“三十六岁的动物行为专业的学生”的说法当中暗含着“万物有灵的这种古老的、前科学的传统”。[34]
尽管如此,道金斯这本精彩的著作还是引发了重大的转变,确立了一种对于基因的全新的、多层次的理解。乍看上去,自私的基因的思想不过是变换了视角,或像是开玩笑。塞缪尔·巴特勒在一百年前就说过(并且他并未宣称自己是第一个说这话的人),母鸡不过是一只蛋用来制造另一只蛋的工具。对此,巴特勒自己是态度严肃的:
每种生物都有权以自己的方式“完成”自己的发育。蛋的做法可能看起来是绕了大弯,但那正是它自己的方式,我们人类没有多少理由对此说三道四。凭什么认为鸡比蛋更鲜活?又凭什么说是鸡生蛋而不是蛋生鸡?这些无法用哲学解释的问题,或许从另一个角度就可以解答,那就是考虑到人类的自负及其长久以来的、忽略一切不像自己的事物的习惯。[35]
他又补充道:“不过,也许说到底,真正的理由是,蛋生鸡时候没有咯咯叫。”后来,巴特勒的模板,“X不过是一个Y用来制造另一个Y的工具”,有了很多其他变化。比如,丹尼尔·丹尼特在1995年就曾说:“学者不过是一座图书馆用来制造另一座图书馆的工具。”[36]同样地,丹尼特这样说也不全是开玩笑。*
注释:*丹尼特以此作为文化演化的模因视角的口号。对模因的讨论,具体见本书下一章。——译者注
巴特勒在1878年对人类中心的生命观的嘲弄,可谓先知先觉,但事实上他读过达尔文的著作,明白万物的创造和设计并非是为了人类。正如爱德华·奥斯本·威尔森在一百年后所说的,“人类中心主义是人类智识的一大残疾”。[37]然而,道金斯提出的视角变换更为激进。他不只把人(和鸡),还有其他各具特色的生物体都挪到了一旁。但生物学不研究生物,那还叫生物学吗?道金斯理解这种变换并不容易:“这需要我们有意识地调整思维,以使生物学再次回归正确的轨道,并意识到复制子在历史上和在重要性上都是占先的。”[38]
道金斯的一个目的是解释个体违反自身最佳利益而实行的利他行为。自然界里到处可见动物为了后代、亲属或只是同类而不顾自身生死的例子。此外,动物还会分享食物、合作建造蜂巢或水坝、顽强地保护自己的卵。为了解释这类行为(同样,为了解释任何适应现象),我们就必须问一个法医侦探常问的问题:谁会因此得利?比如,当一只鸟发现了天敌时,它会大声鸣叫,这样做虽然警告了鸟群,但也吸引了天敌的注意,那么这时谁会得利呢?一种很自然的想法是,这是为了群体利益,比如家庭、部落或物种的利益,但大多数理论学者都同意,这并不符合进化规律。自然选择几乎从不在群体水平上进行。然而,如果转而从个体是为了将体内的各种基因延续下去的角度思考,那么许多解释便说得通了。同一物种的其他个体拥有这些基因中的大部分,而亲属拥有的相同基因就更多了。当然,个体对基因一事并不知情,它不是有意识地去做这样的事。同样地,也没有外力给基因灌输意图,它们毕竟只是没有大脑的微小实体而已。但正如道金斯所表明的,这种视角的变换以及假设基因的运作就是为了最大限度地复制自身,可以解释很多东西。比如,一个基因“可能通过让承载自己的各代身体拥有长腿,以帮助这些身体逃离掠食者,从而确保自己的生存”。[39]类似地,一个基因也可能会赋予生物体一种本能冲动,让它自我牺牲以拯救其后代,从而最大限度地保存自己的数量。这时,特定的这团 DNA 会随着生物的死去而消逝,但它的副本却因此得以延续。这个过程完全是盲目的,没有预见,没有意图,也没有知识。同样,基因也是盲目的:“它们不会事先做计划。基因只是存在着,其中有些基因比其他基因数量更多,仅此而已。”[40]
地球上的生命史始于复制子的偶然出现。复制子是一种信息载体,它通过自我复制而生存和传播。副本必须自洽且可靠,但无需完美。相反,为了实现进化,错误倒是必不可少。复制子可以先于 DNA 甚至蛋白质而存在。苏格兰生物学家亚历山大·凯恩斯史密斯(Alexander Cairns-Smith)就曾设想过一个场景,复制子可能出现在黏土矿物的黏性表面:某种脱胎于硅酸盐矿物的复杂分子。另一些生命起源模型的进化场所则是更传统的“原生汤”。但无论是哪种场景,在这些承载了信息的大分子当中,或者有些降解得比其他的要快,或者有些复制得比其他的要多或要好,又或者有些可以通过化学效应破坏对手的分子结构,如此这般,它们得以在竞争中延续下来。RNA通过像麦克斯韦妖那样吸收光子的能量,催化了体积更大、携带信息更丰富的分子的形成过程。DNA则除了比之前的复制子都要更稳定外,还具有自我复制以及制造另一类分子的双重功能,而这赋予了它独特的竞争优势。它能通过在自身周围制造一层蛋白质外壳来保护自己,这就是道金斯所谓的“生存机器”——一开始只是细胞,然后是越来越庞大的身体,其中具备越来越复杂的膜、组织、肢体、器官以及技能。它们是基因的精致载具,可以与其他载具竞争,转换能量,甚至处理信息。在这场生存竞赛中,有些载具跑得更快、操控更灵、传播更广,因而得以延续下去。
虽然费了一番周折,但基因中心的、基于信息的视角还是引导人们开始了新的一种探寻生命史的侦探工作。正如古生物学家试图在化石纪录中寻找翅膀和尾巴的骨骼前身,分子生物学家和生物物理学家则试图在血红蛋白、致癌基因以及酶和蛋白质库的其余部分中寻找可能透露信息的古 DNA 残遗。维尔纳·勒文施泰因就指出:“一门分子考古学正在兴起。”[41]生命史是用负熵写就的,他继续写道:“真正在进化的是以各种形态和载体存在的信息。如果有那么一本指导生物进化的手册的话,我想,里面第一句大概应该是这样的,它读起来像句圣经诫命:应使你的信息更丰富。”
单独一个基因无法制造一个生物体。昆虫、植物和动物是大量基因集体共用的载具,这些基因相互合作,在生物体的发育过程中各司其职。这是一种复杂的系综,其中每个基因都与成千上万的其他基因进行交互,产生的种种效应在时间和空间里延伸。生物体的身体是基因的殖民地。当然,身体是作为整体参与到交互、移动和繁殖等活动当中,并且至少对其中一个物种来说,它相当确信自己是个整体。基因中心的视角也促使生物学家意识到,构成人类基因组的基因只是人身体所携带基因的一部分,因为与别的物种一样,人类也携带了一整个微生物生态系统——尤其是细菌,它们广泛存在于皮肤、消化系统等当中。我们的“微生物基因组”一方面帮助我们消化食物、抵御疾病,另一方面同时也在为了自己的利益而迅速灵活地进化。所有这些基因参与到了共同进化的宏大进程当中,与基因池中的其他等位基因进行竞争,但已不再是单打独斗。它们的成败取决于相互之间的互动好坏。正如道金斯所说:“自然选择偏爱那些与其他基因一起能胜出,同时反过来其他基因与它们一起也能胜出的基因。”[42]
任何一个基因的效应可能取决于这种互动,也可能取决于环境影响或单纯的几率。的确,谈论单个基因的效应是个非常复杂的问题,只说某个基因的效应就是它所控制合成的蛋白质是不够的。有人可能会说,一只绵羊或一只乌鸦具有一个对应黑色的基因,因为该基因所控制合成的黑色蛋白质直接决定了羊毛或羽毛的颜色。然而,绵羊、乌鸦和所有看起来是黑色的生物,黑的样子和程度都有差异,而不是全黑或全白。即便是看起来如此简单的生物属性,其实也几乎不会直接对应着一种生物学“开关”。道金斯指出,假如另一个基因所控制合成的蛋白质,作为酶,会产生许多间接的效应,其中之一就是促进黑色蛋白质的合成,那么这个基因也应当被称为对应黑色的基因。[43]又假如黑色蛋白质只能借助阳光合成,而有一个基因控制着个体的趋光性,那么在这种更间接的情景中,这个基因也是对应黑色的基因。这样的基因虽然只是起着间接的作用,却可能是不可或缺的。但这时要具体确定某个基因对应黑色,无疑十分困难。而对于更复杂的生物属性,比如肥胖、侵略性、筑巢、智力或同性恋等,想要确定对应的基因就更难了。
但真有对应这些属性的基因吗?如果将一个基因视为表达某种蛋白质的特定一段DNA,那么答案是否定的。严格说来,我们不能说,某个基因对应某个属性,即便是简单如眼睛颜色这样的属性。正确的说法应该是,基因上的差异可能导致表现型(即生物体实际性状)上的差异。然而,从遗传学研究之初起,科学家就一直在更笼统地谈论基因。如果某个群体在某个性状(比如身高)上存在差异,并且这个差异要经受自然选择,那么根据定义,这个性状就至少部分与基因相关。虽然身高差异有基因因素的影响,但事实上并不存在对应长腿的基因,也不存在对应腿的基因。[44]制造一条腿需要涉及许许多多的基因,其中每个都会以合成蛋白质的方式下达指令,有的制造原材料,有的则制造定时器和开关。在所有制造腿的基因中,想定会有某些能够产生一些效应,使得腿比在没有这些效应时要长。对于这些基因,我们或许可以笼统地称之为对应长腿的基因,只要我们记得,长腿这个属性并没有直接由“这个”基因表示或编码。
因此,遗传学家、动物学家、动物行为学家和古生物学家长久以来都已经习惯于说“对应X的基因”,而非“影响X差异的基因因素”。[45]对此,道金斯进一步得出了一个引发争议的逻辑结论。如果某个性状(比如眼睛颜色或肥胖)的差异受到基因因素的影响,那么必定存在对应该性状的某个或某些基因,而不论实际性状可能还受到其他深层次因素(比如环境甚至偶然因素)的影响,也不论该性状实际是复杂的、后天习得的行为模式。道金斯有意举了一个极端的例子加以说明:对应阅读的基因。
这个说法看上去似乎荒诞不经,我们轻易可以举出很多反对理由。比如,阅读是一种后天习得的行为模式,没有人生下来就会。而如果要说有什么技能依赖于环境因素,比如教育,那么其中肯定包括阅读。此外,阅读是数千年前才出现的事物,因此在此之前从未经受过自然选择。又或者我们也可以说[就像遗传学家约翰·梅纳德·史密斯(John Maynard Smith)所嘲弄的],这样的话,系鞋带也有对应的基因?但道金斯并没有动摇。他指出,基因说到底是关于差异。因此,他首先提出了一个与之密切相关的问题:是否存在对应阅读障碍症的基因呢?
为了确认存在对应阅读的基因,我们所要做的只是发现对应不会阅读的基因,比如某个会造成大脑损伤、进而导致阅读障碍症的基因。这种阅读障碍症患者可能在一切方面都正常且聪颖,但就是不会阅读。如果这种阅读障碍症被证明会稳定遗传,大概遗传学家也不会感到特别惊讶。显然,在这个例子中,该基因只会在有着正规教育的环境中才会展现其效应。在史前环境中,该基因的效应可能就看不出来,或者会产生不同的效应,比如在原始人的遗传学家看来,该基因的效应就是无法辨别动物足迹……
那么遵照遗传学术语的常规,同一基因座上的野生型基因(这个群体中其余个体都携有两份剂量的该基因),就可以恰当地被称为对应阅读的基因了。如果你反对这种说法,那么你也势必要反对我们在谈论孟德尔的豌豆时所用的诸如对应高茎的基因等说法,毕竟在这两种情况中,使用术语的逻辑是一样的。我们感兴趣的都是差异,并且差异也都只在某些特定环境下才会体现。至于为什么简单如一个基因的差异竟能导致如此复杂的效应,比如一个人是否能阅读,或鞋带系得好坏,理由大致如下:无论这个世界某个给定状态有多么复杂,该状态与另一种可替代状态之间的差异则可能是由某些极其简单的东西所导致的。[46]
那么可能存在对应利他行为的基因吗?是的,道金斯说道,只要这指的是“任何影响到神经系统的发育,使得生物体可能实施利他行为的基因”。[47]当然,这样的基因(幸存的复制子)并不知道什么利他行为,什么阅读。无论它们产生的表现型效应如何,这只是为了帮助它们自己的传播。
分子生物学的标志性成就之一就是,把基因确定为一段包含蛋白质编码的DNA片断。但这只是基因的硬件定义,其软件定义则要更悠久也更含糊:遗传的基本单位,某种表现型差异的根源。当人们还在使用这两个定义时,道金斯则尝试超越它们。
如果把基因视为生存大师,那它们就不太可能是一些核酸片断,毕竟这些东西无法长久。而说一个复制子成功地延续了亿万年时间,也就意味是将其所有副本视而为一,以此定义这个复制子。因此,道金斯宣称,基因不会“衰老”。
它在一百万岁时死亡的概率,不会比只有一百岁时更大。它在一代代的身体当中迁徙,为自己的目的、以自己的方式操控着这一具具身体,并在这些终有一死的身体衰老和死亡前抛弃了它们。[48]
“我所做的正是强调,”道金斯接着说,“一个基因借助其大量副本具备了几近永生的可能,而这也是它的决定性特征。”也正是在这里,生命摆脱了其物质载体。(当然,除非你已经相信存在不朽的灵魂。)基因不是什么携带信息的高分子,基因就是信息。1949年,物理学家马克斯·德尔布吕克曾写道:“当今的趋势是,说‘基因只是分子,或遗传粒子’,而不再使用如基因型、基因等抽象概念。”[49]但现在,这些抽象概念又回来了。
那么这些特定的基因,比如人类中对应长腿的基因,到底又在哪里呢?这个问题有点像问贝多芬的E小调钢琴奏鸣曲到底在哪里。它是在原始乐稿里,还是在印刷乐谱里,又或是在任意一次演奏或所有演奏(已有的和可能的,真实的和想象的)里?
纸面上的那些四分音符和八分音符并不是音乐。音乐不是空气中的一系列声波,也不是唱片上的纹路或光盘上的凹坑,甚至也不是在听众脑中激活的神经元交响曲。音乐就是信息。同样地,DNA的碱基对也不是基因,它们只是编码了基因。基因本身是由比特构成的。
注释
[1] Richard Dawkins,The Blind Watchmaker (New York: Norton, 1986), 112.
[2] W. D. Gunning, “Progression and Retrogression,” The Popular Science Monthly 8 (December 1875): 189, n1.
[3] Wilhelm Johannsen, “The Genotype Conception of Heredity,”American Naturalist 45, no. 531 (1911): 130.
[4] “一对‘基因’在性状表现上的差异具有不连续性和稳定性,这是孟德尔理论不可少的每日面包。”Wilhelm Johannsen, “The Genotype Conception of Heredity,” 147.
[5] Erwin Schrdinger,What is Life?, reprint ed. (Cambridge: Cambridge University Press, 1967), 62.
[6] Henry Quastler, ed.,Essays on the Use of Information Theory in Biology (Urbana: University of Illinois Press, 1953).
[7] Sidney Dancoff to Henry Quastler, 31 July 1950, quoted in Lily E. Kay,Who Wrote the Book of Life: A History of the Genetic Code (Stanford, Calif.: Stanford University Press, 2000), 119.
[8] Henry Linschitz, “The Information Content of a Bacterial Cell,” in Henry Quastler, ed.,Essays on the Use of Information Theory in Biology, 252.
[9] Sidney Dancoff and Henry Quastler, “The Information Content and Error Rate of Living Things,” in Henry Quastler, ed.,Essays on the Use of Information Theory in Biology, 264.
[10] Ibid., 270.
[11] Boris Ephrussi, Urs Leopold, J. D. Watson, and J. J. Weigle, “Terminology in Bacterial Genetics,”Nature 171 (18 April 1953): 701.
[12] Cf. Sahotra Sarkar,Molecular Models of Life (Cambridge, Mass.: MIT Press, 2005); Lily E. Kay,Who Wrote the Book of Life?, 58; Harriett Ephrussi-Taylor to Joshua Lederberg, 3 September 1953, and Lederberg annotation 30 April 2004, in Lederberg papers, http://profi les.nlm.nih.gov/BB/A/J/R/R/ (accessed 22 January 2009); and James D. Watson,Genes, Girls, and Gamow: After the Double Helix (New York: Knopf, 2002), 12.
[13]事后看来,现在人们都知道,这一点在1944年已经被洛克菲勒大学医院的奥斯瓦尔德·埃弗里(Oswald Avery)等人的实验所证实。但在当时,并没有很多人接受这个结果。
[14] Gunther S. Stent, “DNA,”Daedalus 99 (1970): 924.
[15] James D. Watson and Francis Crick, “A Structure for Deoxyribose Nucleic Acid,” Nature 171 (1953): 737.
[16] James D. Watson and Francis Crick, “Genetical Implications of the Structure of Deoxyribonucleic Acid,”Nature 171 (1953): 965.
[17] George Gamow to James D. Watson and Francis Crick, 8 July 1953, quoted in Lily E. Kay,Who Wrote the Book of Life?, 131.
[18] George Gamow to E. Chargaff, 6 May 1954, Ibid., 141.
[19] Gunther S. Stent, “DNA,” 924.
[20] Francis Crick, interview with Horace Freeland Judson, 20 November 1975, in Horace Freeland Judson, The Eighth Day of Creation: Makers of the Revolution in Biology (New York: Simon & Schuster, 1979), 233.
[21] George Gamow, “Possible Relation Between Deoxyribonucleic Acid and Protein Structures,”Nature 173 (1954): 318.
[22] Douglas R. Hofstadter, “The Genetic Code: Arbitrary?” (March 1982), in Metamagical Themas: Questing for the Essence of Mind and Pattern (New York: Basic Books, 1985), 671.
[23] George Gamow, “Information Transfer in the Living Cell,” Scientific American 193, no. 10 (October 1955): 70.
[24] Francis Crick, “General Nature of the Genetic Code for Proteins,” Nature 192 (30 December 1961): 1227.
[25] Solomon W. Golomb, Basil Gordon, and Lloyd R. Welch, “Comma-Free Codes,”Canadian Journal of Mathematics 10 (1958): 202–209, quoted in Lily E. Kay,Who Wrote the Book of Life?,171.
[26] Francis Crick, “On Protein Synthesis,” Symposium of the Society for Experimental Biology 12 (1958): 152; Cf. Francis Crick, “Central Dogma of Molecular Biology,” Nature 227 (1970): 561–563; and Hubert P. Yockey, Information Theory, Evolution, and the Origin of Life (Cambridge: Cambridge University Press, 2005), 20–21.
[27] Horace Freeland Judson,The Eighth Day of Creation, 219–221.
[28] Gunther S. Stent, “You Can Take the Ethics Out of Altruism But You Can’t Take the Altruism Out of Ethics,”Hastings Center Report 7, no. 6 (1977): 34; and Gunther S. Stent, “DNA,” 925.
[29] Seymour Benzer, “The Elementary Units of Heredity,” in W. D. McElroy and B. Glass, eds.,The Chemical Basis of Heredity (Baltimore: Johns Hopkins University Press, 1957), 70.
[30] Richard Dawkins, The Selfish Gene, 30th anniversary edition (Oxford: Oxford University Press, 2006), 237.
[31] Ibid., xxi.
[32] Ibid., 19.
[33] Stephen Jay Gould, “Caring Groups and Selfish Genes,” in The Panda’s Thumb (New York: Norton, 1980), 86.
[34] Gunther S. Stent, “You Can Take the Ethics Out of Altruism But You Can’t Take the Altruism Out of Ethics,” 33, 34.
[35] Samuel Butler,Life and Habit (London: Trübner & Co, 1878), 134.
[36] Daniel C. Dennett,Darwin’s Dangerous Idea: Evolution and the Meanings of Life (New York: Simon & Schuster, 1995), 346.
[37] Edward O. Wilson, “Biology and the Social Sciences,”Daedalus 106, no. 4 (Fall 1977), 131.
[38] Richard Dawkins,The Selfish Gene, 265.
[39] Ibid., 36.
[40] Ibid., 25.
[41] Werner R. Loewenstein, The Touchstone of Life: Molecular Information, Cell Communication, and the Foundations of Life (New York: Oxford University Press, 1999), 93–94.
[42] Richard Dawkins,The Extended Phenotype, rev. ed. Oxford: Oxford University Press, 1999), 117.
[43] Ibid., 196–197.
[44] Richard Dawkins,The Selfish Gene, 37.
[45] Richard Dawkins,The Extended Phenotype, 21.
[46] Ibid., 23.
[47] Richard Dawkins,The Selfish Gene, 60.
[48] Ibid., 34.
[49] Max Delbrück, “A Physicist Looks At Biology,”Transactions of the Connecticut Academy of Arts and Sciences 38 (1949): 194.
第11章 跃入模因池(它其实就是寄生在了我的大脑里)
在我仔细思考模因(meme)时,我的脑海中常会浮现这样一番景象:一团闪烁的火花一边在一个个大脑间跳转,一边还尖叫着:“我!我!”(“Me, me!”)
——侯世达(1983)[1]
“整个生物圈,从其结构的普遍性(都基于遗传编码)看来,似乎是一个独一无二事件的产物。”法国生物学家雅克·莫诺在1970年写道,“如果一个事件是独一无二的,或许生命的出现就是如此,那么在这个事件确实出现之前,它出现的几率是无限小的。宇宙并非必然要孕育生命,生物圈也并非必然要孕育人类。我们人类不过是恰好在蒙特卡洛的赌场里押中了号码。意识到这点,就像一个人在赌场刚刚赢得了一百万,毫不奇怪我们人类也会略微有点奇怪、不真实之感。”[2]
莫诺曾因发现了信使RNA在传递遗传信息中的作用而共同分享了1965年的诺贝尔奖。与其他许多人一样,他在这里也不仅仅是把生物圈看作一个抽象概念:相反,生物圈是一个实体,它由地球上所有或简单或复杂的生命形态组成,其中充满了信息、复制和进化,以及将一种抽象转化为另一种抽象的编码等。这样的生命观远比达尔文当初所想象的更抽象、更数学化,但其中的基本原则却并没有改变——自然选择导演着整个演出。现在的生物学家,在消化吸收了通信科学的方法论和词汇后,也开始为理解信息作出自己的贡献了。莫诺提出了一个类比:正如在无生命世界之上有生物圈,在生物圈之上也有个“抽象王国”。那么这个王国的居民又是什么呢?是思想。
思想保留了生物体的某些属性。与生物体一样,思想也倾向于维持其结构并繁衍生息;它们也可以融合、重组或分离其内容;事实上,它们还可以进化,而在这个过程中,选择淘汰必定扮演着重要角色。[3]
莫诺注意到,思想有“传播力”(“或者说,感染力”),并且有些思想的传播力要强于其他。强传播力的例子之一是,某种影响了一大群人的宗教思想。比莫诺更早几年,美国神经生理学家罗杰·斯佩里也曾提出过类似的想法。他认为,思想与其所安身的神经元“一样真实”,并且思想拥有力量。
思想生发思想,并帮助进化出新思想。思想不仅彼此互动,也与其他心智力量互动,而不论这是来自同一大脑中的,还是附近大脑中的,又抑或是(所幸有全球通信的帮助)遥远距离外的外国大脑中的。思想还与外部环境互动,从而产生某种进化历程中前所未见的巨大进步。[4]
莫诺曾表示“不会冒昧提出一个思想的选择淘汰理论”,但有人愿意一试。
理查德·道金斯就在基因进化与思想进化之间建立起了他的联系。在他看来,主角是复制子,至于复制子是否由核酸组成则无关紧要。自然选择的规律是,“所有生命通过可自我复制的实体的生存差别[有的复制子存活,有的死亡]实现进化”。哪里有生命,哪里就一定有复制子。或许在其他世界里,复制子也能从硅基化学物质中产生——又或者完全与化学物质无关。
完全与化学物质无关的复制子,这是什么意思?“我认为,一种新的复制子最近已经在这个星球出现,”道金斯在他1976年的处女作结尾这样宣称,“它已经显露无遗。它虽然仍处于婴儿期,还在其原生汤里漂游,但它进化的速度已让古老的基因望尘莫及。”[5]这“汤”就是人类文化,传递载体就是语言,而产卵场就是大脑。
道金斯替这种无形的复制子起了个名字,叫做模因。这成为了道金斯最为人所记的发明,其影响远大过他的自私的基因,以及他后来对宗教信仰的批判。他写道:“模因通过一个广义上可称为模仿的过程在一个个大脑间跳转,从而在模因池里传播开来。”各个模因会相互竞争,以争夺有限的资源,如大脑的运算时间或带宽,或者说大脑的注意。以下是模因的一些例子。
思想。无论一个思想只是出现一次,或是多次出现,它可能在模因池中生存昌盛,也可能在其中消失湮灭。道金斯所举的一个例子是,信仰上帝——这是个古老的思想,不仅通过文字,也通过音乐和艺术自我复制。相信地球绕着太阳转,这也是一种模因,并在与其他模因的竞争中生存了下来。(符合真理也许是帮助模因生存的一项有益属性,但也只是其成功属性中的一个。)
旋律。下面这段旋律
流传了数个世纪,遍及各个大洲。而下面这段旋律
曾一度满大街都是,虽然流行时间短暂,却是以快得多的速度传给了大量人。*
注释:*前者是贝多芬《第五交响曲》第一乐章开头著名的“命运”主题。后者取自西班牙舞曲《马卡雷娜》(“Macarena”),该舞曲曾在20世纪90年代流行一时。——译者注
流行语。“上帝成就了何等的事啊!”这句取自《圣经》的话很早就在不止一种媒介上迅速传播开来。而“仔细听好了”(“read my lips”)这个说法则在 20世纪后期的美国经历了一番不寻常的历程。与其他模因一样,“适者生存”这个模因也有众多突变(诸如“胖者生存”、“病者生存”、“做假者生存”、“发推特者生存”等)。
注释:前者取自《旧约·民数记》第23章第23节,是摩尔斯在第一条商用电报线路上发出的第一条讯息的内容,也见于好几本图书的书名。后者可能指的是,老布什在1988年美国总统竞选时的政治口号“仔细听好了,不新增税”(不过,他上台后就食言),后来据此产生了许多戏仿。——译者注
图像。艾萨克·牛顿在世时,对他长什么样有概念的人不到数千,虽然他是当时英国名气最大的人物之一。而现如今,数以百万计的人对此有了相当清晰的概念,他们所凭借的正是牛顿众多(虽说画得不怎样的)肖像画的复制品。而流传更广的则是如《蒙娜丽莎》、爱德华·蒙克的《呐喊》,以及种种虚构的外星人样貌的复制品。这些图像也都是模因,它们有着自己的生命,独立于各种物质载体。有人曾无意听到一名导游在大都会艺术博物馆对吉尔伯特·斯图尔特(Gilbert Stuart)绘制的华盛顿肖像画所作的评论:“华盛顿当年或许不是这副样貌,但他现在就是长成这样了。”[6]的确如此。
模因在大脑中生成,然后就外出闯荡,在纸张、胶卷、硅片以及其他任何信息所及的地方建立滩头堡。模因不应被视为基本粒子,而应被视为生物体。数字三、蓝色不是模因,任何简单的想法也不是,就像单个核苷酸不是基因一样。模因是复杂的单元,与众不同又易于记忆——这样的单元要具有持久力。同样地,一个物件也不是模因。呼拉圈不是模因,构成它的是塑料,而不是比特。这种玩具在 1958 年发明后迅速风靡全球,但它其实是一个或数个模因的产物和实物化身。这些模因包括对于呼拉圈的热衷,以及玩呼拉圈的技能(晃动、摇摆、旋转)等。呼拉圈本身是这些模因的载具,同样地,玩呼拉圈的人也是——而且这是种相当高效的载具,哲学家丹尼尔·丹尼特曾有一番妙论:“一辆四轮马车不仅是在各个地方之间运送了谷物或货物,也是在各个心智之间传递着四轮马车的卓越思想。”[7]呼拉圈玩家就是为这些模因做了相同的工作——并且在 1958 年,它们还找到了一种新的传播载体,即电视,这样它们的讯息发送就远比任何四轮马车都快得多,也远得多。呼拉圈舞蹈的活动影像吸引了越来越多的心智,先是数以百计,然后是数以千计,再后来是数以百万计。不过,这里的模因不是舞蹈者,而是舞蹈本身。
我们人类是模因的载具和助手。在人类历史的大部分时间里,它们的存在稍纵即逝,主要是通过“口口相传”进行传播。但到了晚近,它们得以依附于实物之上,比如泥板、岩穴洞壁以及纸张等。它们借助我们的笔墨、印刷机、磁带和光盘等而经久不息,并经由广播塔和数字网络而传播开去。模因可以是故事、食谱、技能、传说或时尚等。我们在一个个人之间复制模因。不过,在道金斯的模因中心的视角看来,其实是模因在自我复制。一些道金斯的读者可能会在一开始感到疑惑,应该在多大程度上按字面意思来理解这种说法?难道道金斯的意思是要赋予模因像人一样的欲望、意图和目标吗?事实上,这就跟自私的基因一样。(典型的批评:“基因不存在什么自私或不自私,就如同原子不会嫉妒、大象不会抽象或饼干不会有什么目标。”[8]典型的回应:请注意,遗传学家定义的自私,指的是提升自身相对于竞争者的存活几率的倾向。)
道金斯的说法不是暗示说模因是有意识的行动者,而只是说它们是这样一种实体,其利益可以通过自然选择得到放大。但模因的利益并不是我们的利益。用丹尼特的话说:“一个模因就是一个自行其是的信息包。”[9]当我们说起“为原则而斗争”或“为理想而牺牲”时,或许这里的字面意思其实比我们自以为的要浓。H. L.门肯就曾写道:“为理想而牺牲固然可贵,但为了正确的理想而牺牲,则更为可贵!”[10]
“Tinker,tailor,soldier,sailor”(“锅匠,裁缝,士兵,水手”),在这首童谣中,韵和节奏帮助人们记住文本信息。或者说,韵和节奏帮助文本信息被人们记住。韵和节奏是帮助模因生存的属性之一,就如力量和速度有助于动物生存一样。借助韵、节奏、逻辑(reason)——逻辑也是一种模式,“昔时曾蒙允,赏我润笔资。只是久至今,无钱亦无诗”*。[11]——模式化的语言因而具有了进化优势。
注释:*典故:斯宾塞将长诗《仙后》献给英国女王伊丽莎白一世。女王命人赏赐一百英镑,但大臣回复金额未免过大。女王于是表示,给他适当的金额(give him what is reason)。但斯宾塞后来等了许久也未收到钱,因此借机给女王写了一首短诗:I was promis’d on a time/ To have reason for my rhyme; / From that time unto this season, / I receiv’d nor rhyme nor reason.女王见诗后,便下令按原来的金额赏赐。后来英语中有了“neither rhyme nor reason”的说法,表示不合逻辑,没有道理。——译者注
与基因一样,模因也会对广阔的外部世界产生影响,类似于表现型效应。在有些情况下(比如生火、穿衣或相信基督复活的模因),这种影响还相当巨大。而随着模因将其影响广泛传播,它们也影响到了左右自身存活几率的种种条件,比如编制摩尔斯编码的那个或那些模因就产生了强大的正反馈效应。道金斯写道:“我相信,只要条件合适,复制子就会自动抱团,以创造出能承载自己并帮助自己的持续复制的系统或机器。”[12]有些模因对其人类宿主有明显的益处(比如知道“三思而后行”、会做心肺复苏术、懂得做饭前洗手等),但模因的成功与基因的成功还是有所不同。有些模因在复制的同时可能会带来惊人的毒性,给宿主造成大量附带损害,比如虚假宣传的药物和徒手开刀的手术、占星术和撒旦崇拜、涉及种族歧视的迷思、迷信,以及计算机病毒(这是个特例)。不过在某种意义上,这种损人利己的模因也最有意思,比如相信自杀式炸弹袭击者能上天堂的思想。
在道金斯刚提出“模因”这个模因时,进化心理学家尼古拉斯·汉弗莱便随即提出,这些实体应该被视为“活着的结构,而这不仅是隐喻意义上的,也是技术意义上的”。
当你把一个会繁殖的模因植入我的心智时,它其实就是寄生在了我的大脑里,把我的大脑变成了传播自己的载具,这正和病毒寄生在宿主细胞里,利用其遗传机制复制自己一样。并且这并不只是一种说法而已——比如“相信后世”这个模因便是一次又一次地在数以百万计的人类个体当中具化为其神经系统里的一个实体结构。[13]
《自私的基因》的早期读者大都忽视了模因这个概念,以为这不过只是个富有想象力的延伸。但当时,动物行为学先驱W. D.汉密尔顿在《科学》杂志的书评中却大胆预言:
尽管这个词可能难以界定(基因已经很难界定了,而它比基因有过之而无不及),但我猜想,它很快会在生物学家以及其他如哲学家、语言学家等当中流行起来,并且它也可能最终会像“基因”一词那样深入人们的日常用语。[14]
模因能够不借助语言进行传播,因而在语言诞生之前也照样畅行无阻。简单的模仿就足以复制知识(比如如何磨制箭头或生火)。而在动物当中,我们已知黑猩猩和大猩猩能够通过模仿习得行为。有些鸣禽则能在听到附近其他鸟类(或近来是鸟类学家的音乐播放器)的叫声后学习这些叫声或至少是其变奏。可以说,鸟类发展出了各种叫声曲目和方言——一种远早于人类文化的鸟鸣文化。[15]不过除去这些特例,在人类历史的大部分时间里,模因和语言还是形影不离。(其实成语也是模因)。语言是人类文化的第一道催化剂,它取代了单纯的模仿,而借助抽象和编码来传播知识。
返回书籍页