必读网 - 人生必读的书

TXT下载此书 | 书籍信息


(双击鼠标开启屏幕滚动,鼠标上下控制速度) 返回首页
选择背景色:
浏览字体:[ ]  
字体颜色: 双击鼠标滚屏: (1最慢,10最快)

博弈论

_5 白波 (现代)
  暂时同盟
  你可能已经发现:乙和丙似乎达成了某种默契:在甲被干掉之前,他们相互不是敌人。
  这不难理解,毕竟人总要优先考虑对付最大的威胁,同时这个威胁还为他们找到了共同利益,联手打倒这个人,他们的生存机会都上升。而且,从悲观的角度看,他们恐怕也活不到需要相互拼个你死我活的时候。
  但这个"同盟"也是很不牢固的,两个人都在时时权衡利弊,一旦背叛的好处大于默契的好处,他们马上就会翻脸。
  在这个"同盟"里,最忠诚的是乙--只要甲不死,他就不会背叛;丙就要滑头多了,在前面轮流开枪的例子中,他不朝甲开枪,从同盟者的角度说,就是没有履行义务,而把盟友送上危险的境地,这不是因为道德水平不同,而是处境不同。乙是甲的头号目标,这个敌人一定要向他开枪的,完全没有回旋的余地;而丙不同,他随时愿意牺牲乙换取下次自己的先手之利。
  除了压力较小之外,而且还有一个动力驱使丙背叛,那就是一旦干掉甲后,乙的机会比他要大,他至少要保持先下手,才可能一争高下。
  三国博弈
  三国的曹、刘、孙三家关系,就是"枪手博弈"很典型、也很有趣的例子。
  "赤壁之战"中,曹操实力最强,孙权次之,刘备最弱。孙、刘都无法单独对抗曹操。为了抵挡最强大的曹操,孙刘必须联合起来。孙权拥有六个郡的地盘和数万军队,而刘备没有地盘,只有不足两万人马。用前面的例子来比,孙权是乙,刘备是丙。
  我们已经知道,乙是这个"暂时联盟"中较肯卖力的一方,所以孙权不但"火烧赤壁"打败曹操,更在此后还长期承担了对抗曹操的主要任务。而刘备虽在赤壁之战中也出了力,但此后几年未与曹操打过大仗(也就是没有尽联盟义务)。倒是趁此机会扫荡地方势力,扩充地盘,直至占据两川,将曹操赶出汉中,又派关羽北伐,水淹七军,不但取代了孙权原来的老二地位,甚至有可能击败曹操,成为新的老大。孙权地位跌落到老三,他的策略也随之改变。
  于是孙权趁关羽北伐后方空虚之机,与曹操合谋,夺取了荆州,杀死关羽。结果是同盟破裂,刘备兴兵报仇,又被孙权打败。蜀汉从此衰落,东吴也面临了两面作战的不利局面。
  如果分析一下孙权的心理,我们可能对他的背信弃义有更多同情。赤壁之战尽管符合他的利益,但到底是他出力挽救了刘备,此后他不但把荆州长期借给刘备,还把妹妹嫁给了这个老头子。他尽了同盟的义务,曾与曹操大战数次,不仅损兵折将(他的大将太史慈、董袭、陈武等都在战斗中阵亡),而且他自己也险些在逍遥津送命。可是从收益上说,他与刘备是"牛打江山马坐殿",感到不平衡是正常的。
  可是从对策论来看,孙权却犯了一个大错误,由于嫉妒,他过早和刘备翻脸,致使两败俱伤。这就好比枪手丙突然翻脸向乙开火。坐收渔利的当然是甲。虽然曹操的继任者曹丕没能抓住机会夹攻孙权,一举消灭这两个敌手,但蜀和吴此后已经没有可能打败魏国了。
  那么,孙权的最优策略是什么?回想上面的枪手决斗就明白了。既然已经落到丙的地位,就该以丙的策略行事。让刘备去和曹操恶斗,自己扩充势力,养精蓄锐,随机应变。无论两者胜负,自己都能从中渔利。
  这个问题是对策论中诸多问题中典型的一个。其基本前提是每位参赛者都是有理性的,而且都是力图为自身利益考虑。这个问题的一项教益在于,显而易见的策略--每位参赛者都试图除掉较强的对手--并不一定是好策略。这就是人们认为解法是反直觉的解释。当然,由于你更进一步地投身于对策论,那么你的直觉就会改变,而且如果它是完全意想不到的话,则意想不到的局面就会更加意想不到。枪战决斗的另一项教益是,在缺乏有关参赛者能否联络、共谋、进行威胁或达成有约束力并可以实施的协议等信息的情况下,对可能的解法是不能进行正确评估的。在对策论中,往往需要了解这样的社会学因素。
  无须试图进行严格的论证,我们就能很容易地理解,枪战决斗可能类似于政治或经济的竞争。按照纽约大学政治学教授斯蒂温·布拉姆斯的看法:枪战决斗的知识可以扩展到多位候选人的政治竞选上,布拉姆斯说道:"看来这些候选人的最佳战略,莫过于在他的部分政治势力范围内追随最强的对手。如果你是一个自由主义者,而且另外还有两位自由主义者,那么你就要追随最强的一位。于是所发生的情况将是两位最强的对手就会彼此攻击,而且最弱者就会存留下来了。"这时,如果所发生的情况全面出现,那么最弱的候选人就会在其政治势力范围内幸存下来。
  启示1:公元196年,曹操挟天子以令诸侯,东汉政权明存实亡;公元200元,官渡之战,曹操大败袁绍,羽翼渐丰;公元208年,曹操挥军南下,大治水军,想收取江东。但赤壁之战,曹军为孙权刘备联军所破。三分天下的形势从这时开始初步形成。
  启示2:几千年来,人类始终把一条黄金法则当成行为的准则。这项法则是:种什么因,收什么果,你如何对待别人,你种的善因或恶因,最后都会报应到你自己的身上。
  杂货铺与政党
  那么,现代西方民主政治中的党派之争,是如何避免"三个快枪手"无休无止的厮杀呢?答案是"两个杂货铺"。
  杂货铺定位问题最早是由美国经济学家霍特林提出来的(即霍特林模型)。这一模型常被运用来说明西方两党政治的若干现象。
  西方一些大国,都有相似的两党政治。在英国是保守党和工党轮流执政,在美国则是共和党和民主党轮流坐庄。民主党和工党一般被认为是"左派",倾向于标榜代表劳工阶层的利益,共和党和保守党则是"右派",站在企业主一边。在竞选的时候,人们可以发现,两党互相攻击越来越厉害,可是实际政治纲领却越来越靠近。等到一个政党获胜取代对手上台以后,选民发现,新政府较老政府并没有多少实质性的改变。
  为什么会这样呢?进一步,为什么这些西方大国都会出现两党政治呢?
  实际情况就和杂货铺定位博弈一样。工党一定要打出劳工代言人的旗帜,所以它是站在左边的,左边是它的地盘。但是只有左边一半的选民,还不足以保证胜出。为了在竞选中获胜,它要想办法把中间的在两党之间摇摆的选民争取过来。最好的办法就是使自己的竞选纲领向"右"的方向靠过去一点,即在竞选中宣布也要照顾中产阶级的利益,甚至兼顾企业主发财。移过去一点,地盘就可能大一点。同样,原来立党之本是在"右"边的保守党,在竞选的过程中也要往左边靠,以争取更多的选民。这样斗法的结果,在漫长的竞选过程中,虽然两党的攻击和谩骂不断升级,但是实际纲领却不断靠近,直到两个政党在中点紧挨在一起,才是稳定的纳什均衡。
  为什么第三个政党难成气候?这是因为在上述假定条件之下,如果三个政党的位置不相同,不在同一个点上,那么至少有一个政党单独位于一端,它就有向内挤压的动机,道理和前面论述的一样,所以这时候不是稳定的局面。如果三个党都位于中点,那么谁单独跳开一点点,谁就会取胜,所以也是不稳定的局面,这是因为从中心跳开一点(无论向左向右)的时候,至少那一边的选民都会投他的票,例如,向左一点,左边的选民就会选他;而另一边的选民要由留在中点的两个政党来瓜分,这两个党各自的得票,就都比不上跳开的那个党。同样,如果三个政党位于同一点,但是这一点不是中点,那么谁单独向中点稍微移动一点点,它就会占便宜,这是因为从旁边向中点移动一点的时候,多数选民都会投他的票,而另外两个政党则只能平分不到总数一半的选民。
  三个党不在一起不稳定,三个党全在中点也不稳定,三个党全在另外一点更不稳定,总起来一句话,就是三党政治不会稳定。或者换一个角度理解,即纲领变化无常的政党不会有较强的生命力。
  这个政党纲领向中点移动的机制,也说明西方两党政治的欺骗性,竞选的时候,怎样有利于拉票就怎样讲,当选以后可以忘得一干二净。从这个意义上说,不要以为哪个政党上台这些西方国家的政治态度就会根本改变,确实很有道理。
  当然,从另一个角度看,这种两党政治主张的趋同性其实也并不完全是坏事--甚或可以说是好事,因为所谓民主政治,就是要最大限度地照顾每个人的利益,尽管免不了有妥协和交易,但要把不同阶级、不同政治理想和利益要求的人组织成一个整体,这些代价也许是不得不付出的。
  启示:所谓杂货铺定位问题,简单说就是:在一条街道上有两家杂货铺,为了争取更多顾客,两家杂货铺都趋向于把店铺设在街道中心点,最后的均衡是,两家杂货铺都开设在整条街的中点,紧紧挨在一起。
  效能与民意
  在信息畅达迅捷的媒体时代,政治家很仰赖民意调查来了解选民的需求,以避免招惹潜在选民的不满。而民众选择政府的同时,也就决定政府的决策品质。
  社会学家发现:效率与民主或"社会公正"有时是矛盾的。比如像长城或金字塔那样的建筑,只能出现在专制的社会中。
  现代社会中,不论是哪个国家,都有太多方法可以阻断事务的进行,却没有足够的方法来推动事务的发展。古代的法老王有绝对权威,花上数十年,甚至更长的时间来建造金字塔;罗马教会的权势,使它可以用好几代的光阴去盖一座天主教堂;而一位皇帝想修一座宫殿,也就不须多费唇舌解释。大众决策绝不会有任何冒险性,因为在这个大众传播与民调盛行的年代,政治人物若想要保住饭碗(这可是人人梦寐以求的),就不能冒险作出任何不受欢迎的决策。
  民意有两个难题:首先,多数不一定正确,至少有时,真理是掌握在少数人手里的;其次,民意容易受到操纵和利用,不要忘了,希特勒正是通过鼓惑人心的本领被选举上台的。
  下面一段也是引自《是,首相》,以一个文官之口,讲述他的上司向他解释操纵民意的诀窍。
  我不懂选民怎么能同时赞成而又反对一件事。亲爱的汉弗莱告诉我怎么做。
  诀窍是,向一个普通老百姓提出一系列的问题--去接近他的是一个有吸引力的女士,手里拿着一个写字板。自然,这个普通老百姓要给人一个好印象,不愿使自己干蠢事。因此,市场调查者就会问他旨在引出一贯式答复的问题。
  汉弗莱在我身上作示范。"伍利先生,青少年犯罪率上升,你担心吗?"
  "是。"我说。
  "你是否认为在我们的学校里缺乏纪律和严格训练?"
  "是。"
  "你认为年青人欢迎在他们生活中搞一些组织和领导工作?"
  "是。"
  "对他们提出挑战性的要求,他们会有反响吗?"
  "会。"
  "也许你赞成重新恢复兵役?"
  "是。"
  嗯,我自然而然地说"是"。一个人为了不让别人看来缺乏一贯性,几乎不太可能回答其他的话。那么,所产生的事实是,民意调查光发表最后的一个问题及其答复。
  汉弗莱建议我们委托别人举行一次新的调查,我们就这样干了。他当时当场炮制了一连串问题:
  "伍利先生,你是不是担心爆发战争?"
  "是。"我说,十分真诚。
  "你对军备的增长很不高兴吧?"
  "是。"
  "你认为发给青年人枪支并教他们如何杀人,有危险吗?"
  "是。"
  "你认为违反人们的意志,强迫他们拿起武器是错误的吗?"
  "是。"
  "你会反对恢复兵役吗?"
  我不知不觉、不由自主地答"是"。
  汉弗莱成功了,他高兴得很。"你瞧,伯纳德,"他对我说,"你是一个完美的不偏不倚的样板。"
  至少在某些情况下,民意是一团可以捏来捏去的面。因此在面对声称"代表民意"的宣传高调时,不必过于在意。但是总的说来,各个阶层的民众还是懂得维护自身的利益的,并为此争吵不休。所以在选择政府官员或议员时,所面临的冲突就是目标设定:究竟要一个有效能的政府?它除了领导、远见外,还包括了一些必然不受欢迎的决策;还是选一个能反映大众期望、欲求的体制,只剥夺少数人民权利,却又能表达一般选民的不同意见。
  两个不同的目标,将会产生不同的选举制度。
  各种投票制度的利弊
  采用"多数为王"制的最大弊端,就是在选举后将使大部分民众不再具影响力,而少数人就像战败的军队般,只能为下次竞选作准备,影响力亦几乎为零,而他们扮演在野角色时,仍是以下次选举作为出发点。
  与"多数为王"相反的选举制度就是以投票比例决定各党代表的席次,以确保政府或民主制度中的立法单位在运作过程中,不会忽视所有人的意见。如果在1992年美国大选中,佩罗阵营组成政党,且总统候选人的政党比例是由各候选人的实际得票率来计算,则比例代表制的结果会造成国会有43%民主党、38%共和党及19%的佩罗党。而赛局理论的技术准则为结合各少数党击垮最大党,但随着组合的改变,就会产生混乱。许多欧洲国家都采用这样的制度,美国部分地区也尝试过,但世界各地的经验显示,有效能的政府需要在不同方案间决策,而高度分散化的团体则很难在影响深远的选择间作出决定。那些大声疾呼多元化可强化社会结构的论调,实在很难从历史上找到佐证。比如代表制虽不会蹂躏少数人的权益,却也不易实施多数人的愿望。不论选择为何,最后都会回归到原来追求的目标。
  即使所谈的是一个小范围选举,也没有不一致的现象发生,选举结果还是跟选举规则息息相关。举例来说,A、B、C3人竞选某一公职,而9位选民的偏好如下:有2位选民认为A是上选,B次佳,C为第三。4位首选C,A次之,B第三。3人首选B,A第二,C第三。
  在多数决的制度下,只有第一选择的票数有效,因此C获得4票为胜利者,B、A则各得3票及2票。在这个例子中,很明显多数的人并不喜欢C,但他却拥有忠贞选民。这种现象在日常生活中很常见,虽然C没有赢得绝对多数,但仍然胜选,这和1992年克林顿当选总统的情况相同。
  再看看其他的投票制度是怎么处理这个问题的。有一种常见的方法是加权计票,也就是名列二、三名的选择也予以加权计分。如第一名2分、第二名1分、第三名0分。这就是所谓的波达规则。在这样的规则之下,A得11分,反败为胜,而B与C皆得8分,打成平手。支持A优胜的原因是,有7个人将他排名在第二位,虽然认为A是最佳人选的人并不多,但他却比C得到更多的认同。
  另一个常用的制度为偏好投票,就是要求选民如上表一样,标示出第一、第二的名次。只要候选人拥有绝对多数的第一名选票,即可获胜。如果没有优胜者,就把得到第一名票数最少的人剔除,再将其得票依照选票上的次序,重新分配给其余的候选人。因此,A将会最先被淘汰出局,这与前一种制度比,他因认同度高,故脱颖而出的结果有很大的不同。再回到偏好投票下,两张选票就会分给B,使B得票超过C而胜选,但在原制度下却只得第二名。这种制度的好处就是考虑A的支持者在A落选后,他们的第二选择仍有机会胜出。这样不也挺公平吗?
  选民的选择不变,3种不同的投票制,产生3位不同的优胜者,这代表了3种选举制度目标的歧异。
  当然还有其他的计票法。其中的认可投票制即相当受专家的肯定。在这种制度下,每位选民皆不限票数,可以投给每一个他所喜欢的候选人,但对每一个候选人限投一票。这种制度乍听之下好像不怎么公平,因为在没有限制投票数的情况下,有人可能会投很多票。其实这种想法是错误的。如果你投给每一个候选人,那和没投是一样的。用这种方式就不需要对候选人排序,只要把认可的名单挑出来即可,所以称之为认可投票制,而胜选者就是获得最多认可票的那一位。
  这种制度应用到上述例子,因为资讯实在不多,故假设每个人都投给前二名候选人,也就是前二人当选都可以接受,但绝不可以让最后一名当选。如此一来,A将因没有人把他排在最后一位而以9票当选,另外两人则分获5票与4票。故在认可投票制下,其结果与加权投票制是一样的。不过,也不能将其过度的类化,毕竟在3位候选人、4种选举制度下,本来就有可能产生相同结果。
  启示1:在美国这样主政者任期较短的国家,人们可以期待下一次的选举;但在任期较长的国家,一次失利则代表着会有很长一段时间失去影响力,而胜选阵营常在任期结束后仍继续掌权。
  启示2:决策之思考应着眼于长远利益,着眼于未来。
  "英雄"为何成了失败者
  在这个例子里,多数决胜制选出了C;加权制由A胜选;偏好制在去掉了A后,B以高票当选;而认可投票制则仍是A获胜。那么,究竟谁才是"民众真正的期待"?
  在美国许多州和城市,及其他国家的国会选举中,在多位角逐者的情况下,经常采用的选举方式就是复选制。就是每个选民只投一票,当没有人得票过半时,则在最高票的两人中再行复选。这种做法是希望留下较强的两个候选人,再请选民从中作出选择,看起来很公平,且被广泛采用。
  但是这种制度也有暗藏的陷阱,现在就来看看其中一例。它也用类似前面提到的情况,共有17个投票人,但情况更混乱些。
  假定在全部选民中,最喜欢A、B的分别有6人,首选B和C的5人,而在首选B和C的选民中,又分别有2和3人把A作为第二选择,如果是这样的话,首轮选举的结果是A与B同得6票平手,C惨遭淘汰。由于没有人过半数,故进行复选。3位C的支持者转而投给次选A,2位投给B,使A以这1票取得绝对多数,胜过B。在A与B的决战里,复选发挥了功能,A是"民众真正的期待",应该担任这个职务。
  如果到此为止,复选制似乎不失为比较理想的方法。但是其中也有悖论:假设第一次选举前,A展示了一件英雄行为,如救起一个溺水的小孩,或爬到树上救下一只猫,使B的部分支持者(即对A也有好感的那2人)在最后一分钟决定改投给A。如此一来,在第一次投票中,A得到8票,可惜因为未过半数无法立刻取得胜利;B则因少了2票遭到淘汰。在复选里,A仍维持8票,而C则因获得B选民的4票后来居上,赢得最后胜利。
  这种情况确实令人讶异,也很难以接受,毕竟人们总是希望选举结果多少能反映选民的心声。而A如果没有那桩英雄事迹所多带来的几张选票,他早就赢了。
  如果制度让原来可以选上的候选人,因为做了某件吸引更多选票的事而败选,那就荒谬透了。当然,这种情况也许不多见,也根本不应该发生,偏偏这种复选制度无处不在。当然,精明的政客早就学会如何利用这种制度的弱点,而在初选时先支持较弱的对手,等他进入复选再一举歼灭。
  由此可知,不同选举制度满足的是不同的需求。"多数为王"制戕害少数人的意见,但有时亦可能戕害多数民意。在一些国家普遍实施的比例代表制对领先的候选人不利,且常产生无能、没有效率的政府。专制有利决策的进行,但制衡机制不足,特别是对可怕的决策缺乏防备功能。不过在碰到危机时,有效的领导可以处理攸关生死的决定,因为即使是无能的将领,都强过群龙无首的局面。
  虽然现代社会极度强调最大的个人自由和民主规范,亦相当重视全球各地所遭受的资源短缺等问题,但和生存问题一比,就成为次要的考虑。不过,这些问题的重要性超越时空,影响大于投票制度,更不可能在这本简单的决策书中找到解决之道。即使真正解决了投票制的难题,这种想要透过它来汲取选民的想法,其本身就必须十分清楚明确,而目前的各种投票制度偏偏就欠缺了这个基本条件。
  启示:加拿大雁有一种合作的本能,它们飞行时都呈V型。这些雁飞行时定期变换领导者,因为为首的雁在前面开路,能帮助后面的两支队伍形成局部的真空。科学家发现,雁以这种形式飞行,要比单独飞行多出12%的距离。合作,不仅是一种工作而已。事实上,合作是一切团体繁盛的根本,而要达成合作,惟有参与。
  绝对正确的决策是可能的吗
  我们不是因一贯正确而获得权威,而是因获得了权威而一贯正确。--美国联邦大法官杰克逊
  现在,人们普遍相信民主政治比独裁政治更能保证决策的正确性,那么,民主是绝对正确的吗?
  民主是什么?简单地说,就是少数服从多数。可为什么少数一定要服从多数?或者为什么这样就是好的?这问题其实并不好回答。
  人们通常给出以下三个理由:
  1.少数服从多数,因为胳膊反正拗不过大腿,真要打起来,少数势必打不过多数。以点人头的方式(即投票的方式)来确定何种意见得到了更大的支持,要比采取战斗的方式成本更低。民主乃是人类有史以来发现的惟一的和平变革的方法。(这有点像动物在求偶时比羽毛或块头的办法。)不服从,往轻了说是不明智;重了说,是敬酒不吃吃罚酒。
  2.多数人的决定比少数人的明智。这建立在一个假设前提下:人们是知道自己利益所在的。这至少在有时候不是事实。毕竟,雅典人也是通过民主投票的方式决定处死他们最伟大的哲学家苏格拉底的。
  3.多数人也可能犯错,可是不能剥夺他们表达意见的权利。而且,只有为自己做主,才能学会怎样为自己做主。
  哪个理由都不那么叫人放心。第一个告诉我们:所谓民主,不过是强权的另一张面孔;第二个是说:如果你是那掌握了真理的少数,你只能看着大家裹着你往火坑里跳;第三个呢?是说你有权保持愚蠢,如果你放弃这个权利,别人也会代替你愚蠢。当然,如果你运气好,可能从中学到点什么,如果运气再好,学到的东西可能用得上--当然,如果还来得及的话。
  既然民主并不能保证决策的正确性,为什么一定还要追求民主呢?
  著名哲学家哈耶克说:最为重要的是,民主是一种形成意见的过程。民主的主要优点,并不在于它是一种选举统治人员的方法,而是在于这样一个事实:由于大部分人都积极参与了形成意见的活动,所以有相应数量的人员可供遴选。我们可以承认,民主并未将权力置于那些最为明智最为智慧的人士的手中,而且在任何时候,政府的决策若由精英做出,或许能对全体大众更有助益;但是,上述问题的存在,并不能阻碍我们继续信奉民主,因为民主的价值是在动态的过程中而非静态的状况中得到证明的。与自由相同,民主的利益也只能在长时段中表现出来,尽管在短期中,民主的即时性成就可能不及其他政制(如一个贤明的独裁者)的成就那么凸显。
  启示:林肯曾说:"几乎没有什么事情是百分之百好或坏,特别是政府的每项决策都是好坏不可分割的结合,因此要求我们对哪方面占优势做出判断。"
  完美政治如何实现
  托马斯·潘恩写道:"社会产生于我们的欲望,政府产生于我们的邪恶。社会在各种情况下都是必需的,可政府即使在最好的情况下,也不过是一个无法避免的祸害;在最坏的情况下,就成了无法容忍的祸害。"他的意思是:人要生存,就必须组织一个社会;因为利益冲突导致邪恶行为,所以才不得不建立一个政府来规范。但是这个政府又可能成为产生邪恶的祸患,因此,政府不过是我们为自己无法克服的邪恶付出的代价。
  如此说来,"完美政治"难道只是一句空话?有没有可能在未来实现呢?下面的文字是爱因斯坦给巴西一位记者的回信,可以推测,这位记者曾向他提出了关于建立一个美好世界的个人设想。
  "你的主张我看在原则上是合理的。由少量的人来组织经济工作,这些人都已被证明有能力,热情而又无私地愿意投身改造生存环境。然而,我不相信你的通过'测试'而选择的方法,这是一种典型的工程师式的主意,它同你的'人不是机器'的主张不相吻合。"
  "此外,我想你会考虑这样一件事:光靠找到十个能人是不够的--你必须让世界上的人都服从他们的决定和命令。至于怎样才能达到这种状态我拿不出办法。这个问题要比选出能人来困难得多。在今天的条件下以及在过去存在过的条件下,甚至平庸的人都有可能以某种普遍认可的方式受选。迄今为止,领袖们得到权力主要不是靠他们的思想能力和作决定的能力,而是哗众取宠的本领以及靠追随者们的弱点。"
  "仍旧是老问题:怎样才能把权力交到有能力的人手中,交到善良人的手中。这个问题不能解决,一切都无从做起。不幸的是,在我看来,你也没找到能解决这个难题的途径。"
  启示:"民之所欲,常在我心"只是句口号吗?你放心把自己的未来交付到不相干的人手上吗?这和"民主"这个字眼未曾出现在美国宪法与独立宣言之中,似乎是有异曲同工之妙。
第15章 决策的艺术与科学
在人们的观念中,"零和"正在被"双赢"取代,但是"双赢"的北后却蕴藏着更大的危机。对此,我们还没有找到满意的应对策略。既然不知道该往何处去,所以要常怀谦逊谨慎之心。
  "零和游戏"与"双赢结局"
  当你看到两位对弈者时,你就可以说他们正在玩"零和游戏"。因为在大多数情况下,总会有一个赢,一个输,如果我们把获胜计算为得1分,而输棋为失1分,那么,这两人得分之和就是:1+(-1)=0
  这正是"零和游戏"的基本内容:游戏者有输有赢,但整个游戏的总成绩永远为零。
  "零和游戏"受到关注,是因为人们发现在社会的方方面面都存在与"零和游戏"类似的局面,胜利者的光荣背后隐藏着失败者的辛酸和苦涩。从个人到国家,从政治到经济,似乎无不验证了世界正是一个巨大的"零和游戏场"。这种理论认为,世界是一个封闭的系统,财富、资源、机遇都是有限的,个别人、个别地区和个别国家财富的增加必然意味着对其他人、其他地区和国家的掠夺,这是一个"邪恶进化论"式的弱肉强食的世界。
  进入20世纪,人类经历了两次世界大战、经济的高速增长、科技的进步、全球一体化以及日益严重的环境污染之后,"零和"观念正逐渐被"双赢"所取代,人们认识到"利己"不一定要建立在"损人"的基础上,通过有效合作,皆大欢喜的结局是可能出现的。"你扒我的口袋,我扒你的口袋"远不如"你搔我的背,我搔你的背"更可取。然而,在为人类"合作时代"欢呼的同时,我们应注意到,"零和游戏"在人类生活的许多领域依然适用,而且,当它可能对我们自身有利时,我们也乐于接受它。(股市就是一个很好的例子。人们投资股市,很少是为了获得投资的回报,而是渴望在炒买炒卖中赚取差额,这样,当一个人在股市上赚到钱时,意味着别人因此受了损失。)而且,如何在合作中找到各方满意的方法,并不是一件容易的事。我们距离真正的"合作时代",还有很长的一段路。
  启示:请记住,人是为别人而生存的。人们的精神生活和物质生活都依赖着别人的劳动,人们必须以同样的分量来报偿所领受了的和正在领受的东西。
  猎人博弈的帕累托优势
  设想在古代的一个村庄有两个猎人。为了简化问题,假设主要的猎物只有两种:鹿和兔子。在古代,人类的狩猎手段比较落后,弓箭的威力也有限。在这样的条件下,我们可以假设,两个猎人一起去猎鹿,才能猎获1只鹿。如果一个猎人单兵作战,他只能打到4只兔子。从填饱肚子的角度来说,4只兔子算管4天吧,1只鹿却差不多能够解决一个月的问题。这样,两个人的行为决策就可以写成以下的博弈形式:要么分别打兔子,每人得4;要么合作,每人得10(平分鹿之后的所得)。
  两个纳什均衡,就是两个可能的结局。那么,究竟哪一个会发生呢?是一起去猎鹿还是各自去打兔子呢?这就和情侣博弈一样,不能完全由纳什均衡本身来确定。
  比较(10,10)和(4,4)两个纳什均衡,明显的事实是,两人一起去猎鹿的赢利比各自去打兔子的赢利要大得多。按照长期合作研究的两位博弈论大师美国的哈萨尼教授和德国的泽尔腾教授的说法,甲乙一起去猎鹿得(10,10)的纳什均衡,比两人各自去打兔子得(4,4)的纳什均衡,具有帕累托优势。猎人博弈的结局,最大可能是具有帕累托优势的那个纳什均衡:甲乙一起去猎鹿得(10,10)。
  比起(4,4)来,(10,10)不仅是总额的改善,而且每个人都得到很大改善。这就是(10,10)对于(4,4)具有帕累托优势的意思。关键是每个人都得到改善。
  这里要解释一下何谓帕累托效率和帕累托优势。帕累托(意大利经济学家)效率准则是:经济的效率体现于配置社会资源以改善人们的境况,主要看资源是否已经被充分利用。如果资源已经被充分利用,要想再改善我就必须损害你或别的什么人,要想再改善你就必须损害另外某个人,一句话,要想再改善任何人都必须损害别的人了,这时候就说一个经济已经实现了帕累托效率。相反,如果还可以在不损害别人的情况下改善任何人,就认为经济资源尚未充分利用,就不能说已经达到帕累托效率。
  "大家好,才是真的好"
  在"猎人博弈"中,两人合作猎鹿的收益(10,l0)对于分别猎兔(4,4)具有帕累托优势。这是因为如果比较原来的境况(4,4),现在的(10,10)我们说境况得到了帕累托改善。作为定义,帕累托改善是各方的境况都不受损害的改善。
  可是上面的情况是假设双方平均分配猎物,也就是说,两个猎人的能力和贡献差不多,但是实际上并不一定如此。
  如果一个猎人能力强、贡献大,他就会要求得到较大的一份,这样分配的结果就可能是(14,6)或(15,5),但有一点是确定的,那就是能力较差的猎人的所得,至少要多于他独自打猎的收益,否则他就没有合作的动机。如果合作的结果是(17,3),相对于分别猎兔(4,4)就没有帕累托优势,这是因为3比4小,乙受到损害。这样,我们就不能说境况得到了帕累托改善。虽然17比4多,改善了很多,17+3也比4+4大很多,改善了很多,但是3比4小,乙没有改善反而恶化。所以站在乙的立场,(17,3)没有原来的(4,4)那么好(第一个数代表甲的满意程度或者得益,第二个数代表乙的满意程度或者得益)。如果合作的结果如此,那么,乙一定不愿合作。可见,帕累托改善是一种各方都认同的改善,不是要求任何一方作出牺牲的改善。
  "帕累托效率"很有现实意义,也是目前经济学家比较关注的问题。著名经济学家吴敬琏几年前曾出过一本书,名为《改革正在过大关》,他指的是中国的改革开放到了一个关乎成败的紧要关头。改革开放的成就世人共睹,为什么还要这样说呢?
  关于中国的成功有很多分析,有人认为中国的"渐进式"改革,避免了前苏联、东欧那样一步到位的"振荡疗法"或"休克疗法",社会损失较小。深刻一点的分析,则说中国的改革是从体制外的改革开始,向体制内的改革发展等等。
  人们比较一致的看法是,一直到前几年为止,中国的改革进程大致上是一种帕累托改善的过程。虽然有一小部分人发了大财,社会不平等程度在增加,但是广大人民的收人也多多少少在增加,生活基本上都在改善。可是这种改善总要被帕累托效率代替:有些人不可避免地要为社会的发展付出代价。
  例如目前的国企改革问题。国企效益不好,既有责权不分、经营不善的原因,也是因为计划经济下国有经济一直承担着"企业办社会"的重任。企业办社会,就一定会损失效率。兼办社会的国有经济,担负着为改革开放提供安全网的作用。国有经济不仅承担了国家财政收入的绝大部分,而且是亿万职工生计的保证。当私有企业、外资企业等"体制外"经济轻装上阵蓬勃发展的时候,国有经济承担了国家和政府的许多社会责任。
  现在,改革已经向纵深发展,突出的问题是国有经济如何适应市场竞争。当年,因为国有经济分担了国家和政府的重任,"摸着石头过河"的改革开放才得以进行下去。现在,很多"国企"已经在市场竞争中处于劣势,"办社会"更是难以为继。一方面是千万工人下岗失业,另一方面,社会保障制度又刚刚起步,无法承担大任。这就造成了尽管社会经济不断发展,同时有些人的生活水平却在下降的"帕累托效率"。显然,这对维护社会稳定和推动改革的深化是十分不利的。
  在这种情况下,如何审时度势进行改革,多种渠道化解社会困难,把非帕累托进程的负面效应控制在最小的范围,是今后几年关系中国未来发展走向的关键,也正是吴先生所说的"过大关"。
  启示:一个在金钱上富足的人,还有心关怀受困于窘境的穷人,才叫真正的富人。丰富的内心是惟一能够使我们获得供给的源泉,幸福存在于满足者的心中。
  再分配的局限性
  人们公认,平等是建设一个理想社会的目标之一。许多国家的政府都采用了某种形式的再分配税制,即富人多缴税,国家用税金提高社会福利,这是符合"边际效用"原则的。
  "笼中猪"博弈中,大猪所以宁愿让小猪多得益,正是因为它的得益大于成本,而小猪不愿这样做,也是因为成本大于其所得。既然富人从经济发展中获益更多,那么让他们多承担一些促进社会福利的事,也很公平。
  这表现在制度上,就是税率的差异,收入越高的人,税率也越高。比如20世纪60年代和70年代,美国所得税的最高税率超过70%,而瑞典等北欧"福利国家"就更高。不过,到了20世纪90年代,高税率的弊端逐渐显现,因此,许多国家将最高税率大幅度下调。
  降低税率的主要动机,源于高税收对工作的激励的损害作用,即努力工作的人并不比游手好闲的人幸福多少。
  现在,一方面存在更大的积累财富的激励,另一方面出现了更大的收入不平等。当然,不平等的背后有很多原因,所得税只是消除这种症状的一个生硬的工具,而不是原因。考虑一下,导致不平等的原因是什么,而这些原因对设计一个理想的税制又有什么影响?实施这一理想体系会有什么问题?这一体系与现有体系相比有什么区别?
  我们从研究导致经济不平等的一些原因着手。首先是运气。有两种运气。有些人生来就比别人多了某种天才或优势。即便在这些方面起步平等的人,运气也会青睐某些人,而不是所有人。许多人以为,运气产生了某种不平等,这是不公平的,用于平衡这类优势的税制得到了广泛支持。
  其次是努力。有些人就是比其他人工作更努力。当人们对税制损害工作的激励的说法表示同意的时候,他们通常是指提供努力的激励。假如政府决心抽取相当大一部分的劳动成果,谁还愿意努力工作呢?许多人还认为,人们应该有能力保留自己的劳动果实的说法在道义上也是正确的。
  我们现在假设政府希望做到既能从每一名公民的劳动果实中至少抽取一部分,又不会损害工作的激励。如果收税者分辨得出每一个人付出了多大努力,做到这一点当然毫无问题。每个人应该上缴的税款数目可以直接与他付出的努力挂钩,变成一个真正意义上的惩罚性的税制,目标针对那些努力程度未能达到理想水平的人。
  不过,实际上我们很难对成千上万工人的努力进行监控。他们可能每天按时上下班,但他们可能漫不经心,从而降低了他们的工作质量,哪怕是制定了非常严厉的惩罚措施。
  人们还发现,要在毫无物质激励的前提下提高工作质量,简直难于登天。它使人们陷入一个恶性循环,在前苏联,工人中有这样一句话描述自己和政府:"我们假装工作;他们假装支付我们的工资。"
  20世纪最重要的思想家之一哈耶克指出:绝对的平等是不可能的,一定程度的不平等,不但是应当的,而且是必须的。无论是科技进步、商品生产和生活提高,都不可能是齐头并进,而是由少数人向多数人的不断扩展。如果不允许少数人提前享受进步成果,多数人的共同进步也就无从谈起。
  启示:一位富人曾经这样说过:即使现在把我全部的财产散尽,我相信过几年它们还会重新回来。黄金总是闪闪发光--即使在泥土中也是这样。
  为什么"重农抑商"
  经济学思想史上,人们对于一个经济如何才算是有效率的,一直有很不相同的看法。例如孔子的"不患寡,患不均",就很有代表性,但是大家都知道,只讲求平均,很难作为效率的标准。可以说,效率是经济学中最富争议的一个概念。
  古代中国人不知"帕累托效率"为何物,但却似乎早就将这一法则烂熟于心。一般认为,"重农抑商"思想是阻碍中国社会发展的重要原因之一,可是这一思想中居然也有"帕累托效率"的影子。古人认为:商业只是"五马换六羊"的交换,商业活动本身不创造任何价值,一些人因商业致富,必然有一些人因商业"致穷",这也就是为什么商人在中国总是和"为富不仁"、"巧取豪夺"之类的负面形象联系在一起,中国人的"仇富"心理如此普遍的原因。
  当然,我们现在知道商业活动是能够创造价值的:增加就业机会、促进生产和消费(如一个猎人在没有商业活动的情况下,他每天打猎的成果只要够果腹就行了,打得多了也只能白白烂掉,如果有一个市场,他就可以把多余的猎物卖掉,换成钱再买别的东西)、有助实现资源的优化配置等。但是这些只说明我们的社会还有发展空间,还没有达到"帕累托效率"。所以说,古人的担忧不是没有道理,只是担忧得早了一点。
  启示:"杞人忧天"为人所笑,但是我们或许笑得也太早了一点。现代社会建立在不断发展上,是不是必需?是不是应该?是不是该在某个时候停下来?谁也不知道。
  哈丁公用地悲剧
  既然"公平"难免损害效率,为了避免帕累托效率的影响,似乎惟一的出路就是"开源":通过经济发展、技术进步"把蛋糕做大"实现帕累托改善,可是一方面,这只是缓解了、而不是解决了帕累托效率问题,另一方面,它又把我们带进了一个更大的麻烦--公用地悲剧。
  美国学者哈丁在一篇重要而具有影响力的文章里提到,不加限制的个人选择可能给社会带来灾难。哈丁举了这样一个具体事例:一群牧民面对向他们开放的草地,每一个牧民都想多养一头牛,因为多养一头牛增加的收益大于其购养成本,是合算的,尽管因平均草量下降,增加一头牛可能使整个牧区的牛的单位收益下降。每个牧民都可能多增加几头牛,草地将可能被过度放牧,从而不能满足牛的食量,致使所有牧民的牛均饿死。这就是公共资源的悲剧。
  悲剧在于每一个人都陷入了一个体系而不能自拔,这个体系迫使他在一个有限的世界里无限地增加自己的牲畜。在一个信仰平民自由的社会,每一个人都在追求自己的最大利益,从而毁灭将成为大家不能逃脱的命运。
  他按照这一思路讨论了人口爆炸、污染、过度捕捞和不可再生资源的消耗等问题。他的结论是,世界各地的人民必须意识到有必要限制个人作出这些选择的自由,接受某种"一致赞成的共同约束"。
  对公共资源的悲剧有许多解决办法,哈丁说,我们可以将之卖掉,使之成为私有财产,可以作为公共财产保留,但准许进入,这种准许可以以多种方式来进行。
  哈丁说,这些意见均合理,也均有可反驳的地方,"但是我们必须选择,否则我们就等于认同了公共地的毁灭,只能在国家公园里回忆它们了。"哈丁说,像公共草地、人口过度增长、武器竞赛这样的困境"没有技术的解决途径",所谓技术的解决途径,指"仅在自然科学中的技术的变化,而很少要求或不要求人类价值或道德观念的转变"。
  对公用地悲剧的防止有两种办法:一是制度上的,即建立中心化的权力机构,无论这种权力机构是公共的还是私人的--私人对公用地的拥有即处置便是在使用权力;第二种便是道德约束,道德约束与非中心化的奖惩联系在一起。
  "看不见的手"有多长
  现在,请你确定这个问题的本质。试试把这个问题跟我们在前面提到的一个或多个例子挂钩,然后你就能找出几个可供选择的解决方案,再对这些解决方案作一个评价。
  不同情况下,公用地悲剧可能成为一个多人囚徒困境(每一个人都养了太多的牛)或一个超出负荷问题(太多人都想做畜牧者)。
  经济学家最喜欢的解决方案是确立产权。这也是十五六世纪在英格兰真实出现的事情:公有土地被围起来,落入当地贵族或地主手里。一旦土地成为私有财产,那只"看不见的手"就会恰到好处地关上大门。
  主人可以收取放牧费,使其租金收入最大化,而减少对土地的使用。此举改善了整体经济效率,却同时也改变了收入的分配:放牧费使主人更富有,使牧人更贫穷。
  这一规定在其他场合并不适用。公海的产权很难在缺少一个国际政府的前提下确定和执行,控制携带污染物的空气从一个国家飘向另一个国家也是一个难题。基于同样的理由,捕鲸和酸雨问题都要借助更直接的控制才能处理,但建立一个必要的国际协议却很不容易。
  有时候,假如集团规模足够小,自愿合作可以解决这个问题。若有两家石油或天然气生产商的油井钻到了同一片地下油田,两家都有提高自己的开采速度、抢先夺取更大份额的激励。假如两家都这么做,过度的开采实际上可能降低它们可以从这片油田收获的数量。钻探者意识到了这个问题,看上去也有办法达成分享产量的协议。但是,在一个规模较大的集团里,达成这样的协议不但非常困难,而且也很难得到完全的遵守。
  启示:正如哈丁提到的那样,人口是一个甚至更加艰巨的难题。决定要几个孩子,似乎是做父母的个人自由,但是如果人们都倾向于多生小孩,就会造成人口爆炸的危机。现在很多人已经认识到:生育不是一种自由,而是有限的权利。
  公共品供给的"囚徒困境"
  公共品和私人品的性质很不一样。私人品是私有私用,除了像他穿得整齐你看着也舒坦那样十分间接的效应以外,别人很难沾什么光。公共品则不一样,一旦不管是谁提供出来,许多人都可以享用。比如路灯,只要有人装了,路人都将得到好处,哪怕他没有为此贡献过一分钱。
  设想农村某地有一个只有两户人家的小居民点,由于道路情况不好,与外界的交通比较困难。如果修一条路出去,每家都能得到"3"那么多好处,但是修路的成本相当于"4"。要是没有人协调,张三、李四各自打是否修路的小算盘,那么两家博弈的形势如下:如果两家联合修路,每家分摊成本"2",各得好处"3",两家的纯"赢利"都是"l";如果一家修另一家坐享其成,修路的一家付出"4"而得到"3","赢利"是"-1",坐享其成的一家可以白白赢利"3"(假设修路的并没有路的地权,他总不能因为修了路就不让邻居走);如果两家都不修路,结果两家的赢利都是"0"。
  在这个博弈中,修路是张三的严格劣势策略,我们应该把它消去;修路也是李四的严格劣势策略,所以也应该把它消去。这样运用严格劣势策略消去法,我们就得到这个博弈的严格优势策略均衡:两家都不动手,大家都得零。
  一般来说,乡下地方如果张三只有李四一家邻居,李四只有张三一家邻居,他们多半会守望相助,关系比较好。这样的两家自然会好好商量修路的问题,一起把路修好,大家都得到好处。
  相反,两家有仇也是可能的,那就麻烦了,不是什么修路不修路的问题,迟早要出事。但是,博弈论讨论所牵涉的局中人,都是经济学上所讲的"理性人",他们只为己,但是并不刻意害人。现在城市公寓里面的不少居民在邻居关系上,有时候差不多就是这种理性人的关系。
  对于他们来说,都市化进程的一个副产品,就是即使是近邻也形同陌路。如果没有公寓物业管理方面的制度安排的话,新公寓家家装修一流,可是楼道就杂乱无章,常常还阴暗得很。路灯坏了,往往长久没有人修理。修路灯也和修道路一样,是一个大家都袖手旁观才是"严格优势策略均衡"的博弈。
  这就是公共品供给的囚徒困境:如果大家都只从自己得益多少考虑问题,大家都只打自己的小算盘,结果就谁也不作为,对局锁定在"三个和尚没水吃"的局面,排除了合作双赢的前景。
  所以,公共品问题一定要有人协调和管理。就一个国家来说,最重要的公共品是国防、教育、基础设施和其他政府部门。
  政府责无旁贷,要用好来自纳税人的钱,把文化教育、社会保障、基础设施和国防公安等事情做好。机关大院、居民小区要有专人协调管理,把身边看起来很琐碎但是弄不好有损工作条件和生活环境的事情做好。
  启示:古人讲究"修身齐家治国平天下",似乎是从小到大一样的逻辑。其实,人们对待"家事"和"国事"的逻辑并不一样,原因很简单:"修身齐家"的好处是可见的,而"治国平天下"的好处就不那么清晰可见了。
  "好人好报"
  前面我们讲过帕累托效率的概念:如果资源已经被充分利用,要想再改善某些人的处境就必须损害其他人了,就说这个经济已经实现了帕累托效率,或者说已经达到了帕累托最优。
  博弈说明,非合作博弈的结局常常不是帕累托最优的。这种情况的博弈虽然只有两个局中人,但是它的结局其实就是"三个和尚没水喝"的结局。事实上,两人博弈也能说明不少"多人博弈"的前景。三个和尚没水喝的局面是可以作帕累托改善的:设想有人协调一下,安排一个轮流挑水或抬水的制度,三个和尚的处境都会得到改善。
  如果用"帕累托改善"来看社会公德(这也是一种"公共资源")建设,我们会发现一些值得深思的问题。
  做好事该不该要报偿?在我们的印象里,传统文化是耻于谈钱的,一个行善的人,就是品德高尚的人,这样的人就应该是重义轻利的。
  但是经济学家不这么看。他们认为:做好事就是促进人群福利的行为(经济学称之为"有效率的"行为),这种行为不但应该鼓励,而且必须鼓励。只有这样,才会不断促进社会福利的提高。怎么鼓励呢?人都是自私的,总要追求自身的利益,所以给予报偿是最有效的。
  这听起来好像叫人不太舒服,其实,中国人的"道德宗师"孔子在两千年前,就提出过这一问题。
  春秋时期,鲁国有这样一条法律:如果鲁国人在其他国家中遇见沦为奴隶的鲁国人,可以垫钱把这个奴隶赎出来,回国后再到国库去报销。孔子的弟子子贡曾花钱赎出一个已沦为奴隶的鲁国人,但事后并不到国库去报账,以显示自己追求仁义的决心与真诚。
  孔子知道此事后,对子贡说:我知道你追求高尚,也不缺钱花,可是这个补偿你一定要去领。因为你自己掏钱救人,会受到社会的赞扬,但今后,当别人在国外再遇见沦为奴隶的鲁国人时,他就会想垫不垫钱去赎人?如果垫钱赎了人,回国后去不去报账?不去报账,岂不是白白丢掉一大笔钱;如果去报账,岂不是在行为上会遭旁人讥笑,显得自己的品格不高?于是就会装做没有看见,这样一来,你的高尚行为岂不是阻碍了对至今仍沦为奴隶的鲁国人的解救?
  如果德行善举得不到报偿,那么它就只能是少数人的"专利"而不会成为社会公德。以职业道德为例:改革开放以前,尽管舆论大力宣传一些各行各业的劳模、先进人物的事迹,但整个社会的职业道德水平却很低,营业员申斥顾客、工人消极怠工之类的现象很普遍。随着市场经济的建立,尽管有人感叹拜金主义对传统道德造成了冲击,但不可否认,社会职业道德水平在不断提高,作为消费者,我们可以享受微笑服务而不必到处生气了。
  不要小看这些,更不要因为这些微笑"只是为了赚钱"而斥之为虚伪,消费者和商家都能获益,这才是真实、稳定的"双赢"。相反,如果肯对你微笑的只有"毫不利己,专门利人"的圣贤才是值得忧虑的,天下攘攘,能有几个圣贤呢?
  启示:传说孔子的另一位弟子有一次见到有人掉在水里,他跳下水去,把遇难者救上岸来,被救者酬谢这位弟子一头牛,他收下了。孔子对这个学生的行为大加赞赏。就是因为这会激励更多的人去救人,将会使今后有更多的溺水者受到营救。
  用什么减少垃圾
  垃圾已经成了令人头疼的问题。这世界上的大多数城市,都处于垃圾的包围中。这些垃圾都是城市制造的,要说自作自受,那是一点也不错。可是我们不是消极厌世者,不是愤世嫉俗者,我们希望找到一个对付垃圾的好办法。
  这个问题可以分为两个方面:开源和节流。一是如何处理已有的垃圾,二是如何减少垃圾的生产。前者可以通过技术手段完成,后者呢?
  容易想到的办法是:加强环保教育,使人民认识到垃圾的危害性;同时逐渐减少不可回收物品(如塑料袋、发泡餐盒等)的使用,代之以可回收和降解的产品。
  可是这两个措施的收效并不理想。正如我们前面讨论过的,如果没有其他手段作为保证,思想教育很难改变人们的固有生活方式。而可回收和降解的产品因为成本较高,也难以替代不可回收的产品。
  较为明智的固体废弃物减量方式,最好是通过简单的市场力量来运作:采用污染者付费的原则,让制造垃圾较多的民众付出较高的代价。
  美国西雅图市在减少居民的固体废弃物丢弃量方面提供了成功的经验。在西雅图,居民可自行决定每星期使用的是19、32或60加仑容量的垃圾桶。每种垃圾桶的月费,以及增加任何一种垃圾桶的费用,都是随着容量呈几何级数增加,以便于杜绝随意浪费。同时,西雅图还另备有可再生物品专用容器,而且不收处理费用。
  当西雅图在1981年刚启用这套系统之时,平均每户一星期的垃圾都会装满三个半32加仑的垃圾桶,目前则已降低到每星期平均只有稍多于一个32加仑垃圾桶的垃圾量。
  西雅图的计划之所以能奏效,是因为这套计划不但简明扼要,而且借用了经济诱因的力量来推广垃圾减量及再生。他们并没有直接告诉民众该如何改变生活方式,换言之,他们并没试图去颠覆民众的生活方式,或是对他们采取一视同仁的平头处理方式;相反的,这项计划提供了改变生活方式的原因,允许民众自行决定该不该改变、该做多大改变。换言之,它等于是说:这是我们的规则,你们自己看着办吧。
  启示:在这里要提醒大家:"可降解"可能只是一个理想,根据两个美国记者的调查,被埋在垃圾场里的多数物品实际上都"不可降解":埋了十几年的报纸、衣物甚至热狗,大体上还是原来的模样。
  沙尘暴的警示
  我们有时在电视中看到沙尘暴,那种难分昼夜、日月无光的情景很让人心寒。特别是当这种景象发生在像北京这样重要的城市时,总能听到人们的惊呼:生态警钟敲响了!
  河北境内的沙漠直逼北京,据说最近的沙漠离北京只有60公里。专家预测,如不想出有效办法对沙漠进行治理,几十年后,北京将像消失的楼兰古城一样,被沙漠掩盖。
  土地荒漠化是中国重大的生态问题,而且荒漠化的速度还在呈上升趋势。上世纪50年代至70年代中期年均扩大1560平方公里,而在70年代中期到80年代中期年均扩大面积为2100平方公里,而目前的扩大速度为每年2460平方公里。这个速度还在增加。
  中国土地的荒漠化集中在中国的西部和北部,即内蒙、新疆、黑龙江、宁夏等省份。在北方,雨水量小,土地上的生态系统脆弱,为了维持过度增长的人口对粮食等的需求,人们对土地的索取呈加速趋势。对土地的"滥垦"、"滥牧"、"滥伐"、"滥采"是土地沙漠化的原因。据调查,在牧区,草原上的牲畜严重超载已成普遍现象,牧区一般超载50%~120%,有的地区达到300%。
  那么是不是这些地方的人民都愚昧无知或贪得无厌呢?我们可以看到,荒漠化最严重的地区,恰恰是中国最贫困的地区。人民脱贫致富的要求是合理的,同时他们所生产的原料(羊毛、牛奶等)大部分是供应东南部较富裕的地区的。所以说,土地荒漠化不是某个地区的问题,而是整个国家的问题。
  在世界环境危机中也有同样的问题,由于环境破坏的情况主要集中在发展中国家,富国就把矛头指向穷国,要求它们保护环境,不要为了自己的私利而损害公共利益。可是发展中国家指出,环境破坏的最大收益者正是发达国家,它们理应为环境问题"埋单"。
  启示:现在普遍同意的观点是,荒漠化的原因,是由于人类对土地资源的过度利用--对土地的利用超过了它的承受能力。
  丧钟为谁而鸣
  现在各国都在发展经济,GDP(国民收入)是一国富裕程度的指标,或者说是国力强弱的指标,各个国家都在制定促使GDP增长的政策。然而,某些国家的GDP的增长在一定程度上建立在对自然的破坏之上,可以这么说,在某些国家和地区,GDP是对自然破坏的指标。
  当然,有很多人会问:为什么美国那么富裕,而对自然破坏得较少?的确,美国的环境是保护得最好的。其实,这有三个原因:第一,美国生产或消耗的原料有很大一部分来自于别国,如石油来自中东,美国GDP的增长建立在他国对自然的破坏之上;第二,美国的产品许多是高科技产品,高科技产品对自然的破坏较轻,但它会加大人类对自然的破坏力量;第三,美国生产的高科技产品往往难以被自然消解,自然对加工粗糙的产品的消解是容易的,而对用高科技制造出来的精巧的物品消解起来是缓慢的,所以这种对自然的破坏不是那样直观,因此常被我们忽略。
  可以这么认为,人类文明的发展是不可拒绝的。当周边国家进入工业社会,发展机器工业,可以在较短的时间生产出比农业社会较多的物资,并且可以生产出以前没有的东西,有哪个国家看到这种情形还会无动于衷?即使你情愿做"小国寡民",周边国家的强盛也必然会使你的安全受到威胁,因此,除了被动地跟进,你没有其他选择。17世纪工业革命首先发生在英国,西方国家相继进入工业社会。而远东的中国,在距离上离发生工业革命的西欧较远,因而在时间上也直到19世纪中叶才感受到工业革命的冲击--在列强枪炮的攻击下被动地接受工业化。20世纪的中国其实是被动地接受现代化。在社会发展史上人们在很大程度上是没有多少选择余地的。
  我们这里要说的不是历史的发展规律问题,而是要表明:当前世界各国竞相发展经济、对自然进行破坏,是一个集体行动的悲剧。
  发展经济对人类确实是好事,但问题是,经济的发展空间不可能是无限的,不妨说,市场经济是促进人类发展的火车头,但是这个车头却没有一个有效的刹车系统。
  市场经济是竞争经济,在这样一个优胜劣汰的格局下,拼命地向自然索取或者说掠夺是现时代的特征。每个竞争者--可以小到个人,大到国家--都这样想:我不发展就有可能被淘汰出局。而经济的发展就是对自然的利用--无论这种利用是对自然中原始物的加工还是对中间产品的再加工,其结果都是自然被加速地破坏。这就是自然的生态状态愈来愈恶化的原因,其结果是人类的生存环境越来越恶劣。
  这就是悲剧:大家都意识到问题所在,但大家都无能为力。
  启示:许多人清楚人类目前的这种状况,但谁也没有良药,因为"破坏--发展"是优势策略,每个参与者采取"破坏--发展"成为集体行动的纳什均衡。
  目光短浅,或在劫难逃
  现在很多人已经承认:人类的发展不是无限的,越来越严重的环境问题就是证明。换言之,"帕累托改善"(所有人受益)总要达到"帕累托效率"(有些人受益,有些人吃亏)。
  人们都希望生活改善,而没有人希望生活水平下降,这是人之常情。但这似乎是不可能的。发展中国家以发达国家为目标,发达国家也不希望停步不前(更不要说倒退了),有没有"发展的极限"?如果有,它在哪里?
  美国人口将近3亿,占世界人口的5%,却消耗世界30%以上的资源。这当然不公平,但是如何实现公平,确实令人头疼。
  每个国家、每个人都有权追求更快的发展、更高的生活品质,但是如果再增加几亿人达到美国人的生活水平,这个世界就无法承担。结果是环境遭到毁灭性破坏,资源枯竭,人类的生存都要面临问题,谈何发展?
  看来,惟一的解决办法是富国降低生活水平,给穷国让出部分"蛋糕"。正如"笼中猪"博弈所演示的那样,富国一方面在环境保护和治理方面承担更多的义务,一方面遏制发展的欲望,给穷国让路。可是,即使真有政治家看到了这一点,他也无法赢得大选,实现这一理想。谁会选一个许诺"明天会更糟"的人呢?
  "帕累托改善"不可能,"帕累托效率"又会遭到既得利益者的反对,人类的未来的确值得忧虑。莫非只有等到"天塌砸众人"?惟一的希望在于在危机到来之前,人们找到一个合理的、各方认可的妥协方法,可问题是:还有多少时间?还有多少机会?
  启示:美国拒绝在《京都议定书》上签字,就是这个道理。尽管签署这一协定,长久而言对大家(包括美国自己)都有好处。这也是"囚徒困境":每个人的最佳选择,导致最坏的结果。
  世界政府
  既然各自为政的国家无法就这类全球性问题达成一致,那么一个"世界政府"(联合国不是一个权力机构,只是一个协调机构)能否解决这个难题?
  这里有两个问题,一是能不能,二是好不好。先看第一个:一个凌驾于国家之上的"世界政府"可能建立吗?
  今日的世界着实叫人眼花缭乱,一方面,很多国家分崩离析,如前苏联、南斯拉夫等国家的分裂,在另外一些国家,分离主义也在抬头;另一方面却是全球经济、政治的一体化进程。欧洲议会已经成立,并将产生欧洲宪法,可以想像,未来欧洲将以一个类似国家的统一面目发挥作用。同时北美、东亚、南亚和非洲都开始成立或谋求成立自由贸易区,而经济的一体化肯定会对政治一体化起到推动作用。
  不妨这样说,分裂是"清算过去",而统一是"面向未来","过去"总有清算完结的一天,而未来的巨大利益,必将成为"天下一家"的推动力。即使各方文化、利益的冲突不可调和,一时无法成立一个天下一统的政体,至少出现几大国家集团的前景是可以预见的。
  再看第二个问题:"世界政府"应该建立吗?
  一个世界政府可能给人类带来诸多好处,如可以在整体上解决核威胁、资源调配和环境危机等全球性问题,大大降低交易成本,人们有更多的自由和选择。可是它也有很多问题:它对各国的领导权是建立在暴力手段上吗?如何调节各地区、国家间的矛盾?用什么手段保证这个集权政体避免独裁?
  集权导致腐败,这是人类历史已经证明的"定理"。一个独立国家的独裁者要面对国际竞争的压力--如果他做得太过分,就可能导致国弱民穷,国家失去竞争力。可是假如没有外星人入侵之类的外部威胁,一个全球政府的外部压力又在哪里呢?如果希望通过"内部压力"--民主防止独裁,又如何解决内部权力斗争导致的效率低下?
  也许比较可能的前景,还是若干"超级大国"并存,相互既合作又斗争的博弈局面,这当然不能从根本上解决问题,但有助于简化问题,找到比较可能为各方接受的办法。可是这会不会又导致新的问题出现?一个答案往往是下一个问题,也许我们只能走一步看一步。
  你也许已经发现一个悖论:解决公用地悲剧的方法(通过私有化使人们从保护中获得利益)却是更大的公用地悲剧的根源(个人和国家追逐利益,破坏地球环境)。这其实也并不奇怪,"人类社会学三定律"其中有这样一条:一个系统内的解决之道,将成为更大系统的难题。
  这不仅是对博弈论的考验,更是对人类智慧的考验。
  启示:你也许已经发现一个悖论:解决公用地悲剧的方法(通过私有化使人们从保护中获得利益)却是更大的公用地悲剧的根源(个人和国家追逐利益,破坏地球环境)。这其实也并不奇怪,"人类社会学三定律"其中有这样一条:一个系统内的解决之道,将成为更大系统的难题。
尾声
什么是最佳策略
  故此,尔等须知晓自身宿命,故此,尔等须把稳船只......置欲求于动机之后,尔须奋力以搏。
  故此,且容好奇心为尔等指南。追寻天上真理,如同在大地寻觅。
  所不敢为者,为之;所不敢至者,往之。
  道路千万条,宜选阳光道。聪明择路,正派为人,公平行事。
  故此,尔须多有智识,勤于创造。
  --《爱因斯坦的圣经》
  很抱歉,这本谈策略的书要以布道告终。但是正如我们看到的:好多人失败,不是因为他们傻,而是太聪明。
  一个聪明人的麻烦是他总希望比别人多得一些,或者说,他总面临这样做的诱惑。因为他比别人聪明,他是有能力这样做的,按照我们对人性的了解,人普遍追求利益的最大化,聪明人这样做,也是很自然的。
  然而,这种自然的行为却引起了一系列无法控制的变化,其中最关键的就是:生活越来越复杂了。
  比如,你要做成一件事情,希望达到某种目的,但是你不能仅仅考虑这件事本身,还要考虑它可能造成的各种影响。要不要与人合作?利益如何分配?它会不会得罪某些人?等等。你不得不考虑它们,因为这些问题确实存在。这样你就不得不花费大量的精力和智慧去处理它们,而这些花费对你本来想做的那件事并无多大益处。也就是说,它们大大提高了你做事的成本。这种多余的花费似乎是我们的宿命。
  如果大家都考虑得少一点,都傻一点,不是对每个人都好吗?所有美好的东西都是傻子创造的:埋头苦干的是傻子,助人为乐的是傻子,推己及人的是傻子,满怀希望的还是傻子,傻子创造了世界,傻子享有世界。
  很遗憾,我们已经懂得,世界不会因愿望(不管多么良好,多么合理)而改变,"傻子"在这个世界一定是无法生存的,因为在一个资源稀缺的世界,可以说"利他"的机会成本就是"损己",而"损己"的极至便是让出你的生存空间给别人。但是,我们还是有可能改变一些东西的,只要你懂得:聪明可能并不像看起来那样聪明,傻也不像看起来那样傻。
  "囚徒困境"中,人们越聪明,结果越糟糕。而打破这一困境的办法很简单:一报还一报。也就是所谓"人不犯我,我不犯人;人若犯我,我必犯人"。它能够清晰表明我们的立场,用最明了的方式告诉对方:为了自己的利益,他该怎样去做。
  从"一报还一报"的胜利中,我们可以得到以下结论:你的策略越简单,越清晰,也就越有效。相反,如果你的策略无原则的复杂,将永远面临考验。
  书店里有很多书指导你如何生活、如何与人相处、如何应付这样那样的问题,杂志上也连篇累牍地告诉你如何说话、如何察言观色、如何八面玲珑。不用说,这些人生指南常常是相互矛盾,甚至是自相矛盾的。你应该诚实,但又不能太老实;你应该友善,但也要偶尔发发脾气;你应该能干,但又不要弄到被别人嫉妒的地步;你应该聪明,但要装得傻一点;你要讨领导的欢心,但不要被认为是个马屁精;你要多交朋友,但未可全抛一片心......即使你没让这些东西弄糊涂,也不免感到,想好好活下来真是不容易,你得学会踩钢丝才行。
  人生有无数答案,我们很难确知哪个最标准。如果你想把答案弄得很复杂,那是你的权利,但不是惟一的解决之道,其实你也完全可以用简单的方法对付它,那就是:不管周围如何,你为自己制定几条原则,并照此行事。
  这很愚蠢吗?其实未必。环境是无法选择的,也是无法完全控制的,你在上面花费的心思,就不一定划算。
  因此,我们再次重复强调一些通则,不过这么做有点儿冒险,因为人们倾向于过度简化生活,尤其是在这个头条标题取代新闻、记录片取代真实故事、书摘取代书籍的年代里更是如此。所以别忘了另外两句没有列入这些通则中的话:怀疑是权利的保证;要"拿来",不要"接受"。
  策略的优劣,取决于游戏规则。个人的最佳策略是尽可能利用规则,社会的最佳策略是通过规则引导人们的行为趋向群体福利的提高。
  对合作或冒犯,都要给予回报。"以德报德,以直报怨"。如果你惩罚对方的报复,这种反应就会一直延续下去。如果你宽恕了对方,你就得冒被欺负的风险。
  不要把赢作为惟一目标,也不要总是追求最好结果。在许多类似"囚徒困境"的博弈中,双方的关系并不是简单的"你赢我输"的对抗关系。双方可以都做得很好,也可能都做得很糟。制胜不是靠打击对方、压倒对方,而是靠引导对方采取对双方都有利的行为,即合作的行为。
  如果有几种选择,选择最直的路。清晰、简单、有连续性、让合作方明白易懂的策略往往是最优的。公开声明自己所持的态度,并在任何时间、任何利益诱惑下都始终如一地坚持下去,才会使自己立于不败之地。朝令夕改会令对方无所适从。复杂的规则并不比简单的规则做得更好。
  你不可能永远控制局面,也不必永远控制局面,人类最理智的时候,往往是别无选择的时候。
  知识就是力量。至少在某些情况下,拥有一定程度的知识对理性决策助益匪浅,而且知道得越多,你的决策就越可能接近正确。在博弈中,你的地位常常取决于你是否拥有信息并在此基础上作出理性决策。各种层次、领域的决策都可以通过知识的增长而改善。
  除非能在一开始就很清楚自己的既定目标,或想要避免的事,不然永远无法作出理性决策。这适用于个人与团体决策,只是对后者而言,显然困难得多。如果能同时设定可能后果的价值,不论正负,再加上发生的机率,就更能帮你做不理智的抉择。
  即使是全然理性的决策也可能是错的,反之亦然。因此,若结果出乎意外地糟,也没有必要自责或自暴自弃;同样地,如果运气好,结果也不错,更不必沾沾自喜。如果是不确定的,那就是不确定,你只能与机运斗法,但若能以智慧来与机运抗衡,则获胜的机会就会比失败大出许多。
  无论你想做什么,不管是赌博、运动、投资股市、择偶,甚或发动战争,之前你最好弄清楚自己在做什么。
  合作与双赢并不意味着完全的公平。所有好的策略,都不过是在公平与效率之间找平衡。
  注定会产生坏决策的一个方法,就是把决策者和受益者分离,决定人和被决定人分开;虽然一般人大谈对社会福利的关切,但这种关切只有在和个人利益没有切身关系时才看得到;一旦社会福利造成个人损失,利他主义就消失了。
  团体决策基本上比个人决策更难保持理性,在团体决策过程中有很大的操弄和使诈的空间。目前已知的各种选举制度都无法避免这个现象,只不过有些制度的表现比较好而已。
  至今仍找不到令人满意的方法,能在不产生不良结果的情形下,同时顺利地把各人偏好转换成团体偏好。阿罗不可能原理告诉我们:任何制度都有缺陷,而最好的制度就是造成损害最少的制度。内耗不可避免,明智的人把内耗控制在可接受的限度内。
  据此推论,"若每个人的行为都以理性的自利为出发点,则其结果仍会对社会有利",这个乐观想法仍旧是个误区。更不幸的是,它反而掩饰了无知自利的影响。
  再以此推论,至今人类仍未发明出一种政府形态,完全令人满意、可以作出造福社会的团体决策。我们真的不知道该往何处去,所以要常怀谦逊之心。
评论
博弈论"不是"大力丸"
 "博弈论"不是"大力丸"
  作者:摸鱼儿
  现在,"博弈论"正在成为一门"显学",坊间这类著作颇多。对于普通读者来说,《博弈游戏》似乎是个不错的选择。
  "博弈"这个词听起来高深莫测,其实它就是"游戏"的意思。如果直译就是"游戏理论"。更准确点说,是可以分出胜负的游戏。
  我们生活在这个世界上,就不可避免地要与他人打交道,这是一个利益交换的过程,也就无可避免地要面对各种矛盾和冲突。所谓博弈论,简单说来就是研究在这种背景下,人们如何进行决策、以及这种决策的如何达到均衡问题。每个对弈者在决定采取何种行动时,都必须考虑到他的决策行为对其他人的可能影响,以及其他人的反应行为的可能后果,通过选择最佳行动计划,来寻求收益或效用的最大化。
  可以说,只要你是一个"社会人",你就离不开博弈论。
  关于"生活智慧"的著作大致可分两种:一是"照方抓药"式的,告诉你在某种情况下应该怎么做;二是"思想教育"式,从林林总总的生活现象总结一般规律,并以此指导生活中的种种选择。前者之弊在于浅陋,后者之弊在于空泛。这本书比较好地避免了这两种陷阱:它介绍了许多特定情况下的决策原则,但并不是什么"策略大全";它告诉读者:人们在进行选择时遵循的一般规律,但都言之有物。
  "深入浅出"也是本书的一个特点:它摈弃了同类作品中常见的(同时也是令读者望而却步的)图表、公式等"专业"模式,而是通过一些有趣的例子和谜题(如"囚犯困境"、"约会游戏"、"枪手决斗"、"强盗分金"等)解释生活中的种种现象,告诉你为什么有时我们会在优势情况下输掉比赛;为什么群体理性决策如此困难;为什么社会公德难以提高,为什么"聪明人"不象他看起来那样聪明......这些揭示都不是流于表面的、情绪化的和止于道德判断的,而是通过清晰、客观的分析,让我们理解人们思想和行动的逻辑。
  如同许多理性而诚实的著作一样,本书并没有给我们一个"包治一切"的现成的"答案"(尽管它提供了许多很有启发性的思考方式和选择原则),而是指出我们理性的并不完美。在这个问题成堆的世界上,单纯地"予智自雄"或"以力压人"都终非坦途,我们只有怀着谦逊、合作的态度,才可能取得比较理想的结果。
纳什与博弈论
1950年和1951年纳什的两篇关于非合作博弈论的重要论文,彻底改变了人们对竞争和市场的看法。他证明了非合作博弈及其均衡解,并证明了均衡解的存在性,即著名的纳什均衡。从而揭示了博弈均衡与经济均衡的内在联系。纳什的研究奠定了现代非合作博弈论的基石,后来的博弈论研究基本上都沿着这条主线展开的。然而,纳什天才的发现却遭到冯·诺依曼的断然否定,在此之前他还受到爱因斯坦的冷遇。但是骨子里挑战权威、藐视权威的本性,使纳什坚持了自己的观点,终成一代大师。要不是30多年的严重精神病折磨,恐怕他早已站在诺贝尔奖的领奖台上了,而且也绝不会与其他人分享这一殊荣。
  纳什是一个非常天才的数学家,他的主要贡献是1950至1951年在普林斯顿读博士学位时做出的。然而,他的天才发现--非合作博弈的均衡,即"纳什均衡"并不是一帆顺的。
  1948年纳什到普林斯顿大学读数学系的博士。那一年他还不到20岁。当时普林斯顿可谓人杰地灵,大师如云。爱因斯坦、冯·诺依曼、列夫谢茨(数学系主任)、阿尔伯特·塔克、阿伦佐·切奇、哈罗德·库恩、诺尔曼·斯蒂恩罗德、埃尔夫·福克斯......等全都在这里。博弈论主要是由冯·诺依曼(1903-1957)创所立的。他是一位出生于匈牙利的天才的数学家。他不仅创立了经济博弈论,而且发明了计算机。早在20世纪初,塞梅鲁(Zermelo)、鲍罗(Borel)和冯·诺伊曼已经开始研究博弈的准确的数学表达,直到1939年,冯·诺依曼遇到经济学
  家奥斯卡·摩根斯特恩(Oskar Morgenstern),并与其合作才使博弈论进入经济学的广阔领域。
  1944年他与奥斯卡·摩根斯特恩合著的巨作《博弈论与经济行为》出版,标志着现代系统博弈理论的的初步形成。尽管对具有博弈性质的问题的研究可以追溯到19世纪甚至更早。例如,1838年古诺(Cournot)简单双寡头垄断博弈;1883年伯特兰和1925年艾奇沃奇思研究了两个寡头的产量与价格垄断;2000多年前中国著名军事家孙武的后代孙膑利用博弈论方法帮助田忌赛马取胜等等都属于早期博弈论的萌芽,其特点是零星的,片断的研究,带有很大的偶然性,很不系统。
  冯·诺依曼和摩根斯特恩的《博弈论与经济行为》一书中提出的标准型、扩展型和合作型博弈模型解的概念和分析方法,奠定了这门学科的理论基础。合作型博弈在20世纪50年代达到了巅峰期。然而,诺依曼的博弈论的局限性也日益暴露出来,由于它过于抽象,使应用范围受到很大限制,在很长时间里,人们对博弈论的研究知之甚少,只是少数数学家的专利,所以,影响力很有限。正是在这个时候,非合作博弈--"纳什均衡"应运而生了,它标志着博弈论的新时代的开始!
  纳什不是一个按部就班的学生,他经常旷课。据他的同学们回忆,他们根本想不起来曾经什么时候和纳什一起完完整整地上过一门必修课,但纳什争辩说,至少上过斯蒂恩罗德的代数拓扑学。斯蒂恩罗德恰恰是这门学科的创立者,可是,没上几次课,纳什就认定这门课不符合他的口味。于是,又走人了。然而,纳什毕竟是一位英才天纵的非凡人物,他广泛涉猎数学王国的每一个分支,如拓扑学、代数几何学、逻辑学、博弈论等等,深深地为之着迷。纳什经常显示出他与众不同的自信和自负,充满咄咄逼人的学术野心。
  1950年整个夏天纳什都忙于应付紧张的考试,他的博弈论研究工作被迫中断,他感到这是莫大的浪费。殊不知这种暂时的"放弃",使原来模糊、杂乱和无绪的若干念头,在潜意识的持续思考下,逐步形成一条清晰的脉络,突然来了灵感!这一年的10月,他骤感才思潮涌,梦笔生花。其中一个最耀眼的亮点就是日后被称之为"纳什均衡"的非合作博弈均衡的概念。
  纳什的主要学术贡献体现在1950年和1951年的两篇论文之中(包括一篇博士论文)。1950年他才把自己的研究成果写成题为"非合作博弈"的长篇博士论文,1950年11月刊登在美国全国科学院每月公报上,立即引起轰动。说起来这全靠师兄戴维·盖尔之功,就在遭到冯·诺依曼贬低几天之后,他遇到盖尔,告诉他自己已经将冯·诺依曼的"最小最大原理"(minimax solution)推到非合作博弈领域,找到了普遍化的方法和均衡点。盖尔听得很认真,他终于意识到纳什的思路比冯·诺伊曼的合作博弈的理论更能反映现实的情况,而对其严密优美的数学证明极为赞叹。盖尔建议他马上整理出来发表,以免被别人捷足先登。
  纳什这个初出茅庐的小子,根本不知道竞争的险恶,从未想过要这么做。结果还是盖尔充当了他的"经纪人",代为起草致科学院的短信,系主任列夫谢茨则亲自将文稿递交给科学院。纳什写的文章不多,就那么几篇,但已经足够了,因为都是精品中的精品。这一点也是值得我们深思的。国内提一个教授,要求在"核心的刊物"上发表多少篇文章。按照这个标准可能纳什还不一定够资格。1996年诺贝尔经济学奖得主莫尔里斯当牛津大学艾奇沃思经济学讲座教授时也没有发表过什么文章,特殊的人才,必须有特殊的选拔办法。
  纳什在上大学时就开始从事纯数学的博弈论研究,1948年进入普林斯顿大学后更是如鱼得水。20岁出头已成为闻名世界的数学家。特别是在经济博弈论领域,他做出了划时代的贡献,是继冯·诺依曼之后最伟大的博弈论大师之一。他提出的著名的纳什均衡的概念在非合作博弈理论中起着核心的作用。后续的研究者对博弈论的贡献,都是建立在这一概念之上的。由于纳什均衡的提出和不断完善为博弈论广泛应用于经济学、管理学、社会学、政治学、军事科学等领域奠定了坚实的理论基础。
大原理的普遍应用
 大原理的普遍应用
  孙健
  从"纳什均衡"的普遍意义中我们可以深刻领悟司空见惯的经济、社会、政治、国防、管理和日常生活中的博弈现象。我们将例举出许多类似于"囚徒的两难处境"这样的例子。如价格战、军奋竞赛、污染等等。一般的博弈问题由三个要素所构成:即局中人(players)又称当事人、参与者、策略等等的集合,策略(strategies)集合以及每一对局中人所做的选择和赢得(payoffs)集合。其中所谓赢得是指如果一个特定的策略关系被选择,每一局中人所得到的效用。所有的博弈问题都会遇到这三个要素。
  价格战博弈:
  现在我们经常会遇到各种各样的家电价格大战,彩电大战、冰箱大战、空调大战、微波炉大战......这些大战的受益者首先是消费者。每当看到一种家电产品的价格大战,百姓都会"没事儿偷着乐"。在这里,我们可以解释厂家价格大战的结局也是一个"纳什均衡",而且价格战的结果是谁都没钱赚。因为博弈双方的利润正好是零。竞争的结果是稳定的,即是一个"纳什均衡"。这个结果可能对消费者是有利的,但对厂商而言是灾难性的。所以,价格战对厂商而言意味着自杀。从这个案例中我们可以引伸出两个问题,一是竞争削价的结果或"纳什均衡"可能导致一个有效率的零利润结局。二是如果不采取价格战,作为一种敌对
  博弈论(vivalry game)其结果会如何呢?每一个企业,都会考虑采取正常价格策略,还是采取高价格策略形成垄断价格,并尽力获取垄断利润。如果垄断可以形成,则博弈双方的共同利润最大。这种情况就是垄断经营所做的,通常会抬高价格。另一个极端的情况是厂商用正常的价格,双方都可以获得利润。从这一点,我们又引出一条基本准则:"把你自己的战略建立在假定对手会按其最佳利益行动的基础上"。事实上,完全竞争的均衡就是"纳什均衡"或"非合作博弈均衡"。在这种状态下,每一个厂商或消费者都是按照所有的别人已定的价格来进行决策。在这种均衡中,每一企业要使利润最大化,消费者要使效用最大化,结果导致了零利润,也就是说价格等于边际成本。在完全竞争的情况下,非合作行为导致了社会所期望的经济效率状态。如果厂商采取合作行动并决定转向垄断价格,那么社会的经济效率就会遭到破坏。这就是为什么WTO和各国政府要加强反垄断的意义所在。
  污染博弈:
  假如市场经济中存在着污染,但政府并没有管制的环境,企业为了追求利润的最大化,宁愿以牺牲环境为代价,也绝不会主动增加环保设备投资。按照看不见的手的原理,所有企业都会从利己的目的出发,采取不顾环境的策略,从而进入"纳什均衡"状态。如果一个企业从利他的目的出发,投资治理污染,而其他企业仍然不顾环境污染,那么这个企业的生产成本就会增加,价格就要提高,它的产品就没有竞争力,甚至企业还要破产。这是一个"看不见的手的有效的完全竞争机制"失败的例证。直到20世纪90年代中期,中国乡镇企业的盲目发展造成严重污染的情况就是如此。只有在政府加强污染管制时,企业才会采取低污染的策略组合。企业在这种情况下,获得与高污染同样的利润,但环境将更好。
  贸易自由与壁垒:
  这个问题对于加入WTO不久的中国而言尤为重要。任何一个国家在国际贸易中都面临着保持贸易自由与实行贸易保护主义的两难选择。贸易自由与壁垒问题,也是一个"纳什均衡",这个均衡是贸易双方采取不合作博弈的策略,结果使双方因贸易战受到损害。X国试图对Y国进行进口贸易限制,比如提高关税,则Y国必然会进行反击,也提高关税,结果谁也没有捞到好处。反之,如X和Y能达成合作性均衡,即从互惠互利的原则出发,双方都减少关税限制,结果大家都从贸易自由中获得了最大利益,而且全球贸易的总收益也增加了。
博弈论中的"囚徒困境"问题
分 类:社科
 博弈论中的"囚徒困境"问题
  莉香叶子
  学习管理学或经济学的人一定都了解一些博弈论方面的知识。在博弈论中有一个经典案例--囚徒困境,非常耐人回味。
  "囚徒困境"说的是两个囚犯的故事。这两个囚徒一起做坏事,结果被警察发现抓了起来,分别关在两个独立的不能互通信息的牢房里进行审讯。在这种情形下,两个囚犯都可以做出自己的选择:或者供出他的同伙(即与警察合作,从而背叛他的同伙),或者保持沉默(也就是与他的同伙合作,而不是与警察合作)。这两个囚犯都知道,如果他俩都能保持沉默的话,就都会被释放,因为只要他们拒不承认,警方无法给他们定罪。但警方也明白这一点,所以他们就给了这两个囚犯一点儿刺激:如果他们中的一个人背叛,即告发他的同伙,那么他就可以被无罪释放,同时还可以得到一笔奖金。而他的同伙就会被按照最重的罪来判决,并且为了加重惩罚,还要对他施以罚款,作为对告发者的奖赏。当然,如果这两个囚犯互相背叛的话,两个人都会被按照最重的罪来判决,谁也不会得到奖赏。
  那么,这两个囚犯该怎么办呢?是选择互相合作还是互相背叛?从表面上看,他们应该互相合作,保持沉默,因为这样他们俩都能得到最好的结果:自由。但他们不得不仔细考虑对方可能采取什么选择。A犯不是个傻子,他马上意识到,他根本无法相信他的同伙不会向警方提供对他不利的证据,然后带着一笔丰厚的奖赏出狱而去,让他独自坐牢。这种想法的诱惑力实在太大了。但他也意识到,他的同伙也不是傻子,也会这样来设想他。所以A犯的结论是,唯一理性的选择就是背叛同伙,把一切都告诉警方,因为如果他的同伙笨得只会保持沉默,那么他就会是那个带奖出狱的幸运者了。而如果他的同伙也根据这个逻辑向警方交代了,那么,A犯反正也得服刑,起码他不必在这之上再被罚款。所以其结果就是,这两个囚犯按照不顾一切的逻辑得到了最糟糕的报应:坐牢。
  当然,在现实世界里,信任与合作很少达到如此两难的境地。谈判、人际关系、强制性的合同和其他许多因素左右了当事人的决定。但囚徒的两难境地确实抓住了不信任和需要相互防范背叛这种真实的一面。
促使生物体和人类相互合作的策略
促使生物体和人类相互合作的策略
  莉香叶子
  尽管合作与信任是如此难得统一,但是,无论在自然界还是在人类社会,"合作"都是一种随处可见的现象。那么,问题就出现了:到底是何种机制促使生物体或者人类进行相互合作呢?
  这个问题的答案大部分归功于美国密西根大学一位叫做罗伯特·爱克斯罗德的人。爱克斯罗德是一个政治科学家,对合作的问题久有研究兴趣。为了进行关于合作的研究,他组织了一场计算机竞赛。这个竞赛的思路非常简单:任何想参加这个计算机竞赛的人都扮演"囚徒困境"案例中一个囚犯的角色。他们把自己的策略编入计算机程序,然后他们的程序会被成双成对地融入不同的组合。分好组以后,参与者就开始玩"囚徒困境"的游戏。他们每个人都要在合作与背叛之间做出选择。
  但这里与"囚徒困境"案例中有个不同之处:他们不只玩一遍这个游戏,而是一遍一遍地玩上200次。这就是博弈论专家所谓的"重复的囚徒困境",它更逼真地反映了具有经常而长期性的人际关系。而且,这种重复的游戏允许程序在做出合作或背叛的抉择时参考对手程序前几次的选择。如果两个程序只玩过一个回合,则背叛显然就是唯一理性的选择。但如果两个程序已经交手过多次,则双方就建立了各自的历史档案,用以记录与对手的交往情况。同时,它们各自也通过多次的交手树立了或好或差的声誉。虽然如此,对方的程序下一步将会如何举动却仍然极难确定。实际上,这也是该竞赛的组织者爱克斯罗德希望从这个竞赛中了解的事情之一。一个程序总是不管对手作何种举动都采取合作的态度吗?或者,它能总是采取背叛行动吗?它是否应该对对手的举动回之以更为复杂的举措?如果是,那会是怎么样的举措呢?
  事实上,竞赛的第一个回合交上来的14个程序中包含了各种复杂的策略。但使爱克斯罗德和其他人深为吃惊的是,竞赛的桂冠属于其中最简单的策略:一报还一报(TIT FOR TAT)。这是多伦多大学心理学家阿纳托·拉帕波特提交上来的策略。一报还一报的策略是这样的:它总是以合作开局,但从此以后就采取以其人之道还治其人之身的策略。也就是说,一报还一报的策略实行了胡萝卜加大棒的原则。它永远不先背叛对方,从这个意义上来说它是"善意的"。它会在下一轮中对对手的前一次合作给予回报(哪怕以前这个对手曾经背叛过它),从这个意义上来说它是"宽容的"。但它会采取背叛的行动来惩罚对手前一次的背叛,从这个意义上来说它又是"强硬的"。而且,它的策略极为简单,对手程序一望便知其用意何在,从这个意义来说它又是"简单明了的"。
  当然,因为只有为数不多程序参与了竞赛,一报还一报策略的胜利也许只是一种侥幸。但是,在上交的14个程序中,有8个是"善意的",它们永远不会首先背叛。而且这些善意的程序都轻易就赢了6个非善意的程序。为了决出一个结果来,爱克斯罗德又举行了第二轮竞赛,特别邀请了更多的人,看看能否从一报还一报策略那儿将桂冠夺过来。这次有62个程序参加了竞赛,结果是一报还一报又一次夺魁。竞赛的结论是无可争议的。好人,或更确切地说,具备以下特点的人,将总会是赢家。
  1.善意的;
  2.宽容的;
  3.强硬的;
  4.简单明了的。
  一报还一报策略的胜利对人类和其他生物的合作行为的形成所具有的深刻含义是显而易见的。爱克斯罗德在《合作进化》一书中指出,一报还一报策略能导致社会各个领域的合作,包括在最无指望的环境中的合作。他最喜欢举的例子就是第一次世界大战中自发产生的"自己活,也让他人活"的原则。当时前线战壕里的军队约束自己不开枪杀伤人,只要对方也这么做。使这个原则能够实行的原因是,双方军队都已陷入困境数月,这给了他们相互适应的机会。
  一报还一报的相互作用使得自然界即使没有智能也能产生合作关系。这样的例子很多:真菌从地下的石头中汲取养分,为海藻提供了食物,而海藻反过来又为真菌提供了光合作用;金蚁合欢树为一种蚂蚁提供了食物,而这种蚂蚁反过来又保护了该树;无花果树的花是黄蜂的食物,而黄蜂反过来又为无花果树传授花粉,将树种撒向四处。
  更广泛地说,共同演化会使一报还一报的合作风格在这个充满背信弃义劣行的世界上蔚然成风。假设少数采取一报还一报策略的个人在这个世界上通过突变而产生了。那么,只要这些个体能互相遇见,足够在今后的相逢中形成利害关系,他们就会开始形成小型的合作关系。一旦发生了这种情况,他们就能远胜于他们周围的那些背后藏刀的类型。这样,参与合作的人数就会增多。很快,一报还一报式的合作就会最终占上风。而一旦建立了这种机制,相互合作的个体就能生存下去。如果不太合作的类型想侵犯和利用他们的善意,一报还一报政策强硬的一面就会狠狠地惩罚他们,让他们无法扩散影响。
  现在,对博弈论的研究是如此地广泛,以致于有些人说最新的经济学和管理科学都已经利用博弈论的理论和工具重写过了。博弈论中有很多有趣而富于哲理的案例,善意、宽容、强硬、简单明了的合作策略无论对个人还是对组织的行为方式都有很大的指导意义。
首页 上一页 共5页
返回书籍页