博弈生存-3_在线阅读

　　背叛背叛背叛背叛
　　（1，1）（0，3）（2，2）（99，99）（98，101）
　　现在的问题是：A、B是如何进行策略选择的？
　　这个博弈因形状像一只蜈蚣,而被命名成蜈蚣博弈。
　　这个博弈的奇特之处是：当A决策时，他考虑博弈的最后一步即第100步；B在“合作”和“背叛”之间作出选择时，因“合作”给B带来100的收益，而“不合作”带来101的收益，根据理性人的假定，B会选择“背叛”。但是，要经过第99步才到第100步，在99步，A考虑到B在100步时会选择“背叛”——此时A的收益是98，小于B合作时的100，那么在第99步时，他的最优策略是“背叛”——因为“背叛”的收益99大于“合作”的收益98……如此推论下去，最后的结论是：在第一步A将选择“不合作”，此时各自的收益为1，远远小于大家都采取“合作”策略时的收益：A：100，B：100-99。
　　根据倒推法，结果是令人悲伤的。从逻辑推理来看，倒推法是严密的，但结论是违反直觉的。直觉告诉我们，一开始就采取不合作的策略获取的收益只能为1，而采取合作性策略有可能获取的收益为100。当然，A一开始采取合作性策略的收益有可能为0，但1或者0与100相比实在是太小了。直觉告诉我们采取合作策略是好的。而从逻辑的角度看，一开始A应取不合作的策略。我们不禁要问：是倒推法错了，还是直觉错了？
　　这就是蜈蚣博弈的悖论。
　　什么是悖论？悖论(paradox)来源于希腊语，para意即“超越”，doxos的意思是“相信”。Paradox的意思是：本来可以相信的东西不能相信，而有的东西看起来不可信但是反而是正确的。悖论指由肯定它真，就推出它假，由肯定它假，就推出它真的一类命题。在历史上有许多悖论。如“阿基里斯赶不上乌龟”的芝诺悖论，“一个克里特人说‘所有克里特人都说谎’”的说谎者悖论，“一个理发师说：‘我给所有不给自己理发的人理发’”的理发师悖论或罗素悖论，等等。这些悖论在历史上对于逻辑和数学的发展起了巨大的作用。
　　对于蜈蚣悖论，许多博弈专家都在寻求它的解答。在西方有研究博弈论的专家做过实验［目前通过实验验证集体的交互行为已成时尚，正如博弈论专家英国的宾莫（Ken Binmore）所言，诺贝尔奖也无疑在考虑这方面的先驱者］，实验发现，不会出现一开始选择“不合作”策略而双方获得收益1的情况。双方会自动选择合作性策略，从而走向合作。这种做法违反倒推法，但实际上双方这样做，要好于一开始A就采取不合作的策略。
　　倒推法似乎是不正确的。然而，我们会发现，即使双方开始能走向合作，即双方均采取合作策略，这种合作也不会坚持到最后一步。理性的人出于自身利益的考虑，肯定在某一步采取不合作策略。倒推法肯定在某一步要起作用。只要倒推法在起作用，合作便不能进行下去。
　　这个悖论在现实中的对应情形是，参与者不会在开始时确定他的策略为“不合作”，但他难以确定在何处采取“不合作”策略。
最后通牒博弈中理性的困境
有这样一个博弈：
　　两人分一笔总量固定的钱，比如100元。方法是：一人提出方案，另外一人表决。如果表决的人同意，那么就按提出的方案来分；如果不同意的话，两人将一无所得。比如A提方案，B表决。如果A提的方案是70∶30，即A得70元，B得30元。如果B接受，则A得70元，B得30元；如果B不同意，则两人将什么都得不到。
　　A提方案时要猜测B的反应，A会这样想：根据理性人的假定，A无论提出什么方案给B——除了将所有100元留给自己而一点不给B留这样极端的情况，B只有接受，因为B接受了还有所得，而不接受将一无所获——当然此时A也将一无所获。此时理性的A的方案可以是：留给B一点点比如1分钱，而将99.99元归为己有，即方案是：99.99∶0.01。B接受了还会有0.01元，而不接受，将什么也没有。
　　这是根据理性人的假定的结果，而实际则不是这个结果。英国博弈论专家宾莫做了实验，发现提方案者倾向于提50∶50，而接受者会倾向于：如果给他的少于30%，他将拒绝；多于30%，则不拒绝。
　　这个博弈反映的是“人是理性的”这样的假定在某些时候存在着与实际不符的情况。
　　理论的假定与实际不符的另外一个例子是“彩票问题”。
　　我们说理性的人是使自己的效益最大，如果在信息不完全的情况下则是使自己的期望效益最大。但是这难以解释现实中人们购买彩票的现象。
　　人们愿意掏少量的钱去买彩票，如买福利彩票、体育彩票等，以博取高额的回报。在这样的过程中，人们自己的选择理性发挥不出来，而惟有靠运气。在这个博弈中，人们要在决定购买彩票还是决定不买彩票之间进行选择，根据理性人的假定，选择不买彩票是理性的，而选择买彩票是不理性的。
　　彩票的命中率肯定低，并且命中率与命中所得相乘肯定低于购买的付出，因为彩票的发行者早已计算过了，他们通过发行彩票将获得高额回报，他们肯定赢。在这样的博弈中，彩票购买者是不理性的：他未使自己的期望效益最大。但在社会上有各种各样的彩票存在，也有大量的人来购买。可见，理性人的假定是不符合实际情况的。
　　当然我们可以给出这样一个解释：现实中人的理性的计算能力往往用在不符合实际情况的“高效用”问题上，而在“低效用”问题上，理性往往失去作用，对于人来说，存在着“低效用的区决策陷阱”。在购买彩票问题上，付出少量的金钱给购买者带来的损失不大，损失的效用几乎为零，而所能命中的期望也几乎是零，这时候，影响人抉择的是非理性的因素。比如，考虑到如果自己运气好的话，可以获得高回报，这样可以给自己带来更大的效用，等等。彩票发行者正是利用人存在着“低效用区的决策陷阱”而寻求保证赚钱的获利途径。
陈水扁上台与民主选举的
不可根除的缺陷蜈蚣博弈的悖论反映了单个参与者博弈的困难，个体难以在“利己”和“利他”之间找到一个合理的策略。蜈蚣博弈悖论是单个决策者的决策悖论，它反映了个体理性的局限。
　　在集体进行决策时同样也面临着理性的局限。2000年台湾所谓“总统”选举可以说是中国发生的一件大事。对于中国大陆来说，谁来做台湾新的领导人意味着台湾的未来走向，即
：独立还是统一。而对于台湾人民，新的领导人的未来政策意味着给他们带来灾难还是福祉。
　　选举的结果是民进党的陈水扁上台，陈水扁成了台湾第一任“民选总统”，国民党自1949年逃到台湾51年后，终于交出了政权。现在大家不禁要问：作为台湾第一大党的国民党为什么输给了弱小的民进党？陈水扁上台真的意味着台湾的“民意”吗？
　　大家知道，这次选举的结果是李登辉“弃连保扁”的阴谋得逞。李登辉是国民党主席，国民党跑到台湾，其政治主张是一个中国，长期抱着反攻大陆的思想。随着共产党在大陆的渐渐强大，国民党认识到反攻大陆是不可能的，然而有大陆情结的国民党虽然与共产党势不两立，一山不能容纳二虎，但因其坚持“一个中国”的立场，所以国民党执政期间，不存在台独泛滥问题。
　　然而到了李登辉时代，情形发生了变化，在国民党内部分裂成主张统一的“统一派”和主张独立的“独派”。骨子里主张台独的李登辉，由于是国民党主席，无法施展他内心的政治主张。他只能从所谓理论上“论证”台湾与大陆的不同、台湾独立的合理性，这就是臭名昭著的“两国论”、“七国论”。在理论上他要阐述他的“政治思想”，以成为台湾所谓的“国父”；在行动上他找到了与他内心政治主张一致的人，这就是主张台湾独立的民进党主席陈水扁。因而作为国民党主席的李登辉，在实际行动上支持陈水扁。
　　可以说，国民党被李登辉“玩残”，他真独立的主张使国民党发生分裂。主张统一的宋楚瑜被李登辉开除出党。宋楚瑜原来是李登辉政治上坚强的合作伙伴，因为他的资历，他得到大批的国民党党员的拥护。李登辉与宋楚瑜分道扬镳使得宋楚瑜另立山头，成立了新党。国民党被李登辉肢解。
　　此次台湾选举是所谓的“民主选举”，各党派“平等竞争”。从理论上讲，弱小的党派获得选举胜利可能吗？我们将在下一节从理论上简单地阐述这是可能的，但是需要一定的条件。我们先来看一下陈水扁是如何上台的。
　　李登辉推出连战作为国民党的“总统”候选人，但是身为国民党主席却在不同场合下支持陈水扁，使得民进党得以快速发展。“总统”的竞争最后在宋楚瑜、陈水扁、连战以及独立候选人李敖四者之间角逐。最后，陈水扁以微弱优势获胜，而宋楚瑜和连战均告失败。
　　大家想一想，如果李登辉不耍“弃连保扁”的政治伎俩，或者维护国民党的统一而不使其分裂，使得国民党只有一人参加竞选，那么支持宋楚瑜加上连战的总票数肯定超过陈水扁。
　　另外一种情况是，假如台湾选举不是直选，选举规则是先角逐出两个而不是多个候选人，然后再在这两个候选人之间进行竞选，会出现什么结果呢？我们可以看一下，假定陈水扁能顺利过第一关而成为两个候选人之一，而宋楚瑜、连战有一个成为候选人，假定是连战，在连战与陈水扁之间的最后角逐中，支持宋楚瑜的选民这次会支持连战——因他们的政治主张相近，那么连战获胜的机会肯定大于陈水扁。但是事实上不是这样，选举中各候选人同时竞选，国民党因分裂而使陈水扁得以上台。
　　现在我们来看一下中国申办2000年奥运会失败的例子。北京1992年开始大张旗鼓地申请主办2000年奥运会的工作。申办奥运会的投票规则是逐步淘汰制，具有投票权的委员在参加申请的城市里进行投票，得票最少的城市便被淘汰。前两轮投票中北京一直领先。经过两轮投票，最后剩下3家：德国的柏林、澳大利亚的悉尼以及中国的北京。在第三轮投票时，北京获得最多的票，悉尼第二，柏林第三。
　　这一轮投票结束后，柏林被淘汰掉。如果就这一次投票，北京就获胜。但问题是还得再投一次票。当在北京与悉尼之间角逐时，北京肯定会再次获得胜利吗？
　　事实是，北京输了，悉尼获得了举办2000年奥运会的主办权。为什么会这样？原来支持柏林的投票人大多数转而支持悉尼。这就是悉尼获胜的原因。
　　由此看来，民主投票不能得出惟一的结果，其选举结果取决于民主投票的程序安排以及每次确定的候选人的多少，即投票规则。不同的投票规则将得出不同的选举结果。这就是说，民主投票有内在的缺陷。我们将用著名经济学家阿罗提出的“不可能性定理”来说明，民主制度存在着缺陷。四、通过民主的方式能使少数人
　　支持的候选人赢吗？读者会问，能不能通过所谓民主选举而得出任意结果呢？
　　可以这样说：假定一次性选举时所有人都选某一个人，那么在任何的选举规则下，即通过任何的选举（无论独裁的还是不同民主规则下的选举），这个人肯定当选。在这种极端情况下，无论什么制度对选举人都一样，独裁制度也会得出这个结果。当然如果所有人都不选某一个人，什么制度的设计也都一样，无论是民主的还是独裁的都会得出同样的结果，并且无论设计什么样的规则，结果都一样。这就是为什么历史上的独裁者认为，他是人民的代表，他的决定代表着民意，因为代表着民意意味着你们对所有的决定不要再表达自己的意见了，我的意见就是你们的意见，即使通过民主的方式，也是同样的结果。这就是独裁者经常强奸民意的理论根据。
而当人们的偏好不同时，民主选举程序的规则设计就极大地影响着选举结果。
　　我们举一个例子。一由n人组成的社会，假定n取300，对候选人A、B进行选举，并假定进行一次性投票，此时有2/3的人反对A而选举B，1/3的人选A而不选B。我们有没有办法设计一个结构，通过“民主的”投票规则使A能够当选呢？我们说这是可能的。
　　假定大家都同意服从大多数原则，但程序可以商量。我们把这300人构成3组——这3组既可以天然地形成，也可以设计。每组中候选人获得该组的大多数选票，他就赢得这组的选举，3组中赢得2组即赢得大多数，就算赢了。我想，在实际中这些是任何候选人都能同意的，并且也认为是公平的。我们假定每组的人数不是一样的：第一组是50人，第二组是100人，第三组是150人——我们这里人数的确定完全是随意的。假定第一组中有30人赞成A而反对B，第二组中有60人赞成A而反对B，第三组中10人赞成A而反对B。即：第一组A与B的比例是：30∶20；第二组A与B的比例是：60∶40；第三组A与B的比例是：10∶140。
　　在这样一种规则下进行投票，A获得了3组中2组的赞成票。A获胜。
　　在这个例子中，如果不分组就选一次，那么B肯定获胜。
　　这个例子中，使B获胜的是直选机制，使A获胜的是间接选举机制。台湾采取的是前者，美国采取的是后者。
　　布坎南在《同意的计算》布坎南，塔洛克：《同意的计算》，中国社会科学出版社，2000年版，第242页。中举了另外一个例子。一个25个人组成的社会，只需要9个人同意某个议案就可使得它通过。具体地说，可以将这25个人分成5个区，每个区5个人，这样，只要有3个区（5个区中的多数）中的多数同意，即每个区有3个人同意就能使一项议案通过。
　　具体地，我们可将25个人分成A、B、C、D、E共5个区。同意者分在A、B、C三区，见下表。
　　ABCDE***************
　　这完全可以在“大多数”原则下使一项议案得到通过，尽管可以有16人不同意。如果是36961人（199×199）的一个社会，只需10000人就可使一项议案获得通过，只比总数的1/4多一些，而无须多于1/2的人同意。即用此方法对两个候选人或候选议案进行选举或进行表决，可以使其中本来获得少数人同意的当选。
　　这说明民主选举有其局限性，但并不是说民主选举是虚伪的和带欺骗性的，当然更不能构成不进行民主选举的理由。正如有一篇讨论民主与丑闻的文章里说的那样，民主选举不是绝对好的，但反民主绝对是坏的。在民主社会里，罪恶被最大限度地暴露出来，并受到谴责，因此抑制了更多的罪恶；而在反民主的社会里，罪恶被最大限度地掩盖起来，于是往往导致更大的罪恶。斯塔尔法官对克林顿与莱温斯基的性丑闻穷追不舍，克林顿为此不得不在电视上公开道歉。总统没有绝对的权力，他也有服软的时候。
　　选举是揭示群体偏好的一种方法，我们这里要说的是，一群体进行的所谓民主选举并不能客观地揭示一群体成员的偏好。
革命：另外一种投票方式
投票是加总社会中各个人偏好的一种方式。我们已说明，无论哪种投票制度都是不完善的，之所以采用是因为对所有的候选人来说是公平的。对于群体选择，或者表达群体偏好，还存在另外的方法——革命，或者如毛泽东所说的“枪杆子里面出政权”。革命是极端的投票方式。
　　一个合理的社会将不断地调整社会财富的分配，如所得税率实行低收入低征乃至于不征
，高收入按高比率征收的方法。当财富集中在少数人手里时，两极分化严重，社会出现极度的不公正，对一社会来说隐藏着巨大的社会危机。危机意味着革命的发生。
　　什么是革命？革命是政治学范畴，如果从经济学范畴来说，革命就是社会财富的再分配。在经济学里有边际效用递减规律。所谓效用是指物品对人的需要或欲望的满足程度，而边际效用指的是消费者在消费物品时所消费的每一单位物品给他的满足程度。比如：某人一顿吃了3碗饭，每一碗饭给他一个效用；一富豪买了一辆奔驰车后又买了第二辆奔驰车，他买第一辆奔驰车和第二辆奔驰车时的满足程度是不同的。这就是边际效用的概念。
　　边际效用递减规律说的是，消费者在消费物品时，每一单位物品对消费者的效用是不同的，它们呈递减关系。无论是饿着肚子的人还是饱食终日的人，第一碗饭给他的效用最大，第二碗饭则没有那么大的效用了，吃到一定程度后，再吃的话，饭给他的效用是负的，即不仅不能给他好处，反而是负担。对买车的人也一样，当他买了第一辆奔驰车时，他感到方便很多，同时有巨大的心理满足感。当他买第二辆奔驰车时，他不能同时用两辆车，这第二辆车给他的方便及满足感会没有第一辆车大。当然第二辆车会体现他的成功，从而增加他的炫耀资本，此时总的效用是增加的，但增加的幅度没有他买第一辆车时增加的幅度大。如果他继续购买车，他想，买了车后，既要雇司机，又要准备停车的车库，同时要防范窃贼的光顾，等等，会感觉到得不偿失。这第三辆车给他带来的效用更低了。
　　可以这么认为，边际效用递减规律是关于人的规律，正如诺贝尔奖获得者H.西蒙提出的关于人的理性是有限的看法，它们均为关于人的假设。
　　人的边际效用是递减的，那么将财富从富人那里部分地转移到穷人那里似乎是合理的，此时富人的效用减少了，但减少得不多，但穷人增加的效用则很大。如果一个社会贫富悬殊过大，政府又没有调节好贫富之间的关系，那么革命就有可能发生。
　　劫富济贫从来就是不合法但被颂扬的行为，因为它增进了大多数人的效用，在政府无力的时候，这是惟一的增进社会总的效用的方式。抢夺富人接济穷人，或者因生活潦倒、无法生存而去抢夺富人的东西以活命，同样增进社会的效用。当然，抢劫穷人的物品来为自己享用是土匪行径，这种行为是可耻的。
　　从这个意义上说，革命就是多数人通过暴力对少数人的财富进行剥夺和再分配，因此它是一种偏好的表达方式，是非和平的方式，而不像投票那样的和平方式。之所以要采取暴力的方式，是因为，一般情况下，理性的财富拥有者是不会自动地将财富分给穷人的，慈善者除外。
　　革命：另外一种投票方式革命不同于民主的选举方式和民主化的决策方式，革命是非理性的。如果一个社会有合理地表达人民意愿（或偏好）的程序或方法，那么革命就不会发生。但是正如我们上面说的那样，由于不可能有一种绝对合理的民主决策方式，任何决策方式本身都只是一种在某种程度上揭示偏好的方法而已。因此，任何社会都不能排除革命的可能。
　　在民主社会里人民的偏好得到一定程度的表达，发生革命的概率较低。一般情况下，革命不是发生在专制社会里，就是发生在前民主的社会里，前者完全没有表达人民意愿的机会，后者表达人民意愿的机制尚不完善。一个完善的社会制度存在一个渐进完善的机制，可以在某种程度上化解革命的发生，这样才能避免社会震荡。
　　中国古代的朝代更替就是震荡式的。专制社会没有人民表达意愿的机会，再加上“家天下”的政治机制不存在“退出”机制，人民只能以激烈的方式来表达自己的意愿。
　　因此，对于社会来说，关键不在于它现在的体制多么不完善、政治架构多么不合理，而在于它是否有一个合理改进的机制，从而使得制度渐进合理。
哈定悲剧
在人类社会中存在群体行动的悲剧。这种悲剧是群体的而非个人的，不是个人命运遭受的不公平对待，而是群体在行动过程中所遭受的不可避免的集体性灾难。
　　什么是悲剧？著名哲学家怀特海在《科学与近代世界》一书中描述希腊戏剧时说：“悲剧的本质并不是不幸，而是事物无情活动的严肃性。但这种命运的必然性，只有通过人生中真实的不幸遭遇才能说明。因为只有通过这些剧情才能说明逃避是无用的。”群体行动的悲
剧也是这样：它不是群体偶然性的不幸，而是具有必然性，每个人都意识到这种悲剧，但无法摆脱。
　　说群体悲剧是群体遭受的难以抗拒的灾难，一定程度上指群体受一个无情法则的支配。一定意义上，这种悲剧是社会的规律造成的——当然我们这里使用规律一词是比较危险的，因为规律意味着与人的自由相对抗，人绝对不可避免，然而我们在第9章将分析，人类的文化或文明正是对不可抗拒的悲剧的抵抗。
　　让我们看一下著名的公共资源悲剧问题，即哈定悲剧。该问题是经济学中的经典问题，也是博弈论教科书中必定要讨论的问题。
　　公共资源悲剧最初由哈定提出。哈定（Garrit Hadin）1968年在《科学》杂志上发表了一篇文章，题为The Tragedy of the Commons。北京大学的张维迎教授将之译成《公共地悲剧》，但哈定那里的the commons不仅仅指公共的土地，而且指公共的水域、空间等等；武汉大学的朱志方教授将The Tragedy of the Commons译成《大锅饭悲剧》，有一定的道理，但也不完全切合哈定所表达的意思。将the commons译成“公共资源”似乎更确切些。哈定描述的The Tragedy of the Commons，我们可称为哈定悲剧。
　　哈定举了这样一个具体事例：一群牧民面对向他们开放的草地，每一个牧民都想多养一头牛，因为多养一头牛增加的收益大于其购养成本，是合算的，尽管因平均草量下降，可能使整个牧区的牛的单位收益下降。每个牧民都可能多增加一头牛，草地将可能被过度放牧，从而不能满足牛的食量，致使所有牧民的牛均饿死。这就是公共资源的悲剧。
　　对公共资源的悲剧有许多解决办法，哈定说，我们可以将之卖掉，使之成为私有财产；可以作为公共财产保留，但准许进入，这种准许可以以多种方式来进行。哈定说，这些意见均合理，也均有可反驳的地方，“但是我们必须选择，否则我们就等于认同了公共地的毁灭，我们只能在国家公园里回忆它们。”
　　哈定说，像公共草地、人口过度增长、武器竞赛这样的困境“没有技术的解决途径”，所谓技术解决途径，是指“仅在自然科学中的技术的变化，而很少要求或不要求人类价值或道德观念的转变”。
　　对公共资源悲剧的防止有两种办法：一是制度上的，即建立中心化的权力机构，无论这种权力机构是公共的还是私人的——私人对公共地的拥有即处置便是在使用权力；第二种便是道德约束，道德约束与非中心化的奖惩联系在一起。
　　在实际中也许可以避免这种悲剧。当悲剧未发生时，如果建立起来一套价值观或者一个中心化的权力机构，这种权力机构可以通过牧牛成本控制数量或采取其他办法控制数量。
中国北方草原荒漠化的问题
据中央电视台的新闻报道，2001年新年的第一天，北京市和银川市发生沙尘现象，沙尘像雾一样笼罩在这两个城市的上空。生态警钟再次敲响。
　　河北境内的沙漠直逼北京，河北的怀来县离北京只有60公里！专家预测，如不想出有效办法对沙漠进行治理，过不了多长时间，北京将消失，被沙漠掩盖，像消失的楼兰文明。
　　土地荒漠化是中国重大的生态问题。中国土地的荒漠化集中在中国的北部，即内蒙、新疆、黑龙江、宁夏等省份。来自北面的风沙侵袭着北京，以至于北京的风沙一年比一年大，1999年发生了两次沙尘暴！
　　荒漠化的速度呈上升趋势。20世纪50年代至70年代中期，土地荒漠化年均扩大1560平方公里；而在70年代中期到80年代中期，年均扩大面积为2100平方公里。目前的扩大速度为每年2460平方公里。这个速度还在增加。
　　现在普遍的观点是，荒漠化的原因，是由于人类对土地资源的过度利用，对土地的利用超过了它的承受能力。在北方，雨水量小，土地上的生态系统脆弱，为了维持人口的过度增长对粮食等的需求，人们对土地的索取呈加速趋势。对土地的“滥垦”、“滥牧”、“滥樵”、“滥采”是土地沙漠化的主要原因。
　　据调查，在牧区，草原上的牲畜严重超载已成普遍现象，牧区一般超载50%～120%，有的地区达到300%！
　　发菜是宁夏“四宝”之一的“黑”宝，宁夏的农民为了多赚钱，大规模地采集发菜，以销往南方，以至于当地政府不得不明令禁止这种行为，并将发菜从宁夏“四宝”中去除。而在甘肃挖甘草已成致富之路，据估计每挖10公斤甘草要破坏5.3公顷～7.3公顷的草地。
　　这与哈定的公共资源悲剧何其相同，其原因就在于环境资源是大家的。
发展经济与对自然的破坏
现在各国都在发展经济，GNP（国民生产总值）或人均GNP是一国富裕程度的指标，或者说是国力强弱的指标，各个国家都在制订促使GNP增长的政策。然而，GNP的增长完全建立在对自然的破坏之上，可以这么说，GNP是对自然破坏的指标。
　　当然，有很多人不同意我这里的观点。为什么美国那么富裕，而对自然破坏得较少？美国的环境是保护得最好的。其实，这有三个原因：第一，美国的生产或消耗的原料有很大一
部分来自于别国，如石油来自中东，美国GNP的增长建立在他国对自然的破坏之上；第二，美国的产品许多是高科技产品，高科技产品对自然的破坏较轻，但它会加大人类的破坏力量；第三，像美国生产的高科技产品往往难以被自然消解，自然对加工粗糙的产品的消解是容易的，而对用高科技制造出来的精巧的物品消解起来是缓慢的，但这种对自然的破坏不是那样直观，因此常被我们忽略。
　　可以这么认为，人类社会的发展对个人来说是没有选择的自由的。当周边国家进入工业社会，发展机器工业，可以在较短的时间生产出比农业社会更多的物资，并且可以生产出以前没有的东西，试想一想，有哪个国家看到这种情形还会无动于衷？并且重要的是，没有选择发展工业的国家面对周边国家的强盛，它的安全受到威胁，它除了被动地选择进入工业社会，别无其他选择。18世纪工业革命首先发生在英国，西方国家相继进入工业社会。而远东的中国，在距离上离发生工业革命的西欧较远，直到19世纪中叶才感受到工业革命的冲击——在列强枪炮的攻击下被动地接受工业化。20世纪的中国其实是被动地接受现代化的。在社会发展史上人们在很大程度上是没有多少选择余地的，这一点正如马克思所认为的，生产力是最具革命性的力量，它促进生产关系的发展。
　　我们这里要说的不是历史的发展规律问题，而是要表明：当前世界各国竞相发展经济、对自然进行破坏，是一个集体行动的悲剧。有读者可能无法理解：发展经济是好事，为什么能和哈定悲剧联系在一起？
　　发展经济对人类确实是好事，人类总不能生活得与动物世界一样。但问题是，当今经济的发展已经进入过渡时期，经济的发展造成了环境的破坏。
　　市场经济是竞争经济，在这样一个优胜劣汰的格局下，拼命地向自然索取或者说掠夺是现时代的特征。每个竞争者——可以小到个人，大到国家——都这样想：我不发展就有可能被淘汰出局。而经济的发展就是对自然的利用——无论这种利用是对自然中原始物的加工还是对中间产品的再加工，其结果都是自然被加速地破坏。这就是自然的生态状况愈来愈恶化的原因，其结果是人类的生存环境越来越恶劣。这也是囚徒困境。
　　许多人清楚人类目前的这种状况，但谁也没有良药，因为“破坏—发展”是占优策略，每个参与者采取“破坏—发展”成为集体行动的纳什均衡。这就是悲剧：大家都意识到问题所在，但大家都无能为力。
光天化日之下的违法
行为为什么总能成功？人类有许多关于猴子的故事，比如朝三暮四，杀鸡给猴看。其实猴子是没有思维的，它们有一定的群体意识，但没有社会意识，人们关于它们的故事其实是说人自己的。我们这里也讲一个猴子的故事。
　　在一个笼子里关了一群猴子，主人每过一天就打开笼子抓一只猴子去杀掉。每天主人来时，每个猴子都紧张，它们不敢有任何举动，怕引起主人的注意而被主人选中。当主人把目
光落在其中一只猴子身上时，其余的猴子就希望主人赶快决定。当主人最终作出决定时，没有被选中的猴子非常高兴。那个被选中的猴子拼命反抗，其余猴子在一旁幸灾乐祸地观看，这只猴子被杀掉了。这样的过程日复一日地进行着，最终猴子全部被宰杀掉了。
　　如果这群猴子群起而攻之，有可能会逃掉。但每只猴子不知道其余的猴子是否会和它一起反抗，它怕自己的反抗会引起主人的注意而被主人选中宰杀掉。
　　在现实社会中，窃贼在公共场所比如公共汽车上偷东西时，车上的乘客看到了，但不敢吭声。没有被偷的人想，反正被偷的待宰猴群的结局人不是我，我反抗了，我得不到任何好处，反而遭到伤害；而不反抗虽不得益，但也不受损，我何必要反抗呢？这就是光天化日之下的偷窃行为为什么总能成功的原因。
　　窃贼在偷东西时发出这样的信号：如果谁反抗，将殴打谁。乘客想，窃贼的威胁是可信的：因为如果个别乘客反抗，而窃贼不殴打该乘客的话，就会有更多的乘客抓窃贼，窃贼将有可能被抓，因此窃贼必然欧打反抗的乘客。乘客的策略及可能的支付为：反抗，有可能被殴打甚至受伤；不反抗，无所得也无所失。这一博弈过程为：
　　对于乘客来说，窃贼的威胁是可信的，因而乘客的最优策略是“不反抗”；而对于窃贼来说，乘客“不反抗”下的“不殴打”策略为最忧。
　　这一博弈的结果是，窃贼偷东西时“乘客不反抗，窃贼不敢打”，这是一“子精炼纳什均衡”。
　　这样一种群体不反抗的结果将使社会风气恶化，偷窃之风盛行。对个体来说，虽然这一次被偷的不是你，但下次你被偷的几率增加了。这使得我们都如同待宰的猴子，我们不知道什么时候轮到我们自己。这样，我们每个人的处境比以前更差。
　　如何从这种困境中摆脱出来？
　　我们看到，使乘客采取“反抗”策略，而非“不反抗”策略在于加大采取“反抗”策略的获益，而减少不反抗的获益。当“反抗”策略下的获益大于“不反抗”策略下的获益时，乘客就会采取“反抗”的策略。
　　加大道德宣传，培养人的道德感可以解决这个囚徒困境。增强人的道德观念就是加大“反抗”策略的获益，即：当反抗时，尽管有受伤的可能，但是道德荣誉感或道德满足感将使得乘客的心理有所补偿；而在窃贼行窃时，乘客如果不反抗，他的道德感将使得他为他的行为感到羞耻。上述博弈过程为这样，当小偷偷东西时，尽管乘客认为窃贼的威胁是可信的，但是如果乘客是道德感强的人，那么博弈结果是“乘客反抗，小偷殴打”，从而小偷有可能被抓住，这也是一“子精炼纳什均衡”。从全社会的角度来说，如果每个公民都有这样高的道德感，小偷成为过街老鼠，社会将从偷窃之风盛行的困境中解脱出来。并且小偷如果偷窃的话，他知道将会受到道德感强的公民的反抗，即支付函数成为公共知识，他偷窃的收益将很低，他很难再从事偷窃活动了。这使我们看到，此处道德是消除集体行动悲剧的一个良方。
　　这里，道德的人并不是不理性的，理性的人是计算的人，是对得与失作出充分计算后行动的人。这也是道德存在的科学解释，对此将在下一章作出分析。
　　博弈论对不合作的博弈结果的预测是令人悲哀的。但是，从这个例子我们看到，道德就是由群体实施的对所谓“非道德”的行为进行非强制性的惩罚机制，而法律及实施法律的国家的形成与改进就是建立一个对所谓“违法行为”实施的中心惩罚机制。这正是下一章要讨论的内容。
囚徒困境的消解与文明
文明和文化是什么，一直是思想家思考的问题。我们无法给文明和文化下一个明确的定义，但我们可以认为，文明及文化均是人类独有的现象。当然我们也在寻找地球外的文明，但是否有天外文明仍然是个谜。
　　20世纪80年代弗洛伊德的精神分析理论开始在中国流行，他对人类文明的独特见解曾迷倒许多莘莘学子。
　　他认为，文明是对人的本能的压抑，人的历史就是人的本能被压抑的历史。在他看来，人有“生的本能”和“死的本能”，前者称“性本能”或“爱的本能”，后者称“死亡本能”或“破坏本能”。本能的目的是满足，但是如果本能得到完全的满足，则没有了文明。人所追求的目标是各种需要的满足，而文明则是要人彻底抛弃这个目标的。因此在他看来，文明就是对本能的压抑与利用。
　　而在社会学大师韦伯看来，文明是对人的贪欲的压抑，社会的各种组织理性化就是为了压制和利用人的贪欲。
　　由此可见，要解释文明就是要解释利己的个体是如何得到约束的。下面将从博弈论的角度提出一个新的文明观：文明其实就是对集体行动悲剧的克服。
　　在囚徒困境中，每个参与者选择的占优策略是“招认”即“不合作”，如果对囚徒博弈在参与者之间进行重复博弈呢？试考虑这样一个非合作博弈：甲、乙两人博弈，两人各有两个策略。各策略下的支付矩阵为：
　　文明是对人的贪欲的压抑
　　甲乙不合作合作不合作(1，1)(5，0)合作(0，5)(4，4)
　　但是如果此时，两者的纳什均衡为（不合作，不合作）。
　　在第二阶段假设支付情况是这样的：当在第一阶段采取的是“合作”策略时，将有额外的收益3；如果采取“不合作”策略，则没有任何额外收益。即：在第二阶段额外的支付矩阵为：
　　甲乙不合作合作不合作(0，0)(0，3)合作(3，0)(3，3)
　　假设在第一阶段博弈双方知道这个两阶段博弈在各种策略下的结果，于是这个博弈可由上述两个矩阵相加得出：
　　甲乙不合作合作不合作(1，1)(5，3)合作(3，5)(7，7)
　　这两个阶段博弈其实是一阶段博弈。在这个博弈中（合作，合作）是纳什均衡，而这个结果就解开了囚徒困境。
　　这个例子的社会意义是什么？这里关键是对上面第二阶段的支付矩阵的解释。
　　一种解释是：如果第一阶段双方只要有人采取不合作的策略，那么以后双方便不能合作，以后的收益为0。这相当于在生意场上如果一方欺骗了一方，那么以后双方便不能合作。如果第一阶段采取了合作，那么双方在第二阶段没有理由不采取合作，这就等于说，第二阶段是第一阶段的自然结果。
　　其实，第二阶段的支付矩阵是赏罚矩阵，是对参与者第一阶段采取某种行动的“赏罚”。即：如果第一阶段双方采取了“合作”，那么将对双方奖励3；如果第一阶段有一方采取不合作，则收益变为0。
　　在这个例子中，奖惩矩阵是在参与者之间建立起来的。而一般来说，存在两种情况：一是参与者在博弈过程中自动建立起来的，这就是演进博弈研究的内容；第二种情况是非博弈第三方强加于参与者之上的赏罚矩阵，从而调节博弈结果。
　　摆脱囚徒困境的这个方法或者说模型对于社会有什么解释力呢？我们说，文明就是这个赏罚机制的建立，而道德与国家的目的就是建立这样的机制。
一个关于猴子的故事
这里再讲一个关于猴子的故事：
　　有一群猴子被关在笼子里，在笼子里的上方有一条绳子，绳子拴着一个香蕉，绳子连着一个机关，机关又与一个水源相连。猴子们发现了香蕉，有猴子跳上去够这个香蕉，当猴子够到时，与香蕉相连的绳子带动了机关，于是一盆水倒了下来，尽管够到香蕉的猴子吃到了香蕉，但其他猴子被淋湿了，这个过程重复着，猴子们发现，尽管有猴子吃到香蕉，但吃到
香蕉的猴子是少数，而其余的大多数猴子都被淋湿。经过一段时间，有一伙猴子自觉地行动起来，当有猴子去抓香蕉时，它们便揍那个猴子。每当有猴子去取香蕉，就有其他的猴子因愤怒而自动地去撕咬那个猴子，久而久之，猴子们产生了合作，再也没有猴子敢去取香蕉了。
　　在这个故事里，猴子间产生了“道德”。如果这群猴子构成一个社会，它们也繁衍下一代，它们会将它们的经历告诉下一代，渐渐地猴子们便认为取香蕉的后果对其他猴子不利，从而认为去取这个香蕉是“不道德的”，它们也会自动地惩罚“不道德的”猴子。
　　当然这只是一个故事，这个故事反映了人类的道德的产生过程。
　　人天生是自私的，他努力使自己的利益最大。当然这不是对现实的人的看法，而是一个抽象的假定。但现实中的人为什么有道德呢？从自私的假定中怎么推出道德的人？
　　上述猴子的“道德”产生的故事可以用来解释博弈论专家对道德的阐述。
人类原初的状态就是囚徒困境
人类的天性是驱利避害的，从动物状态走出来时人是自私的。自私的人在交往中每个人为了自己的利益而产生的结果正是一种囚徒困境。
　　英国哲学家霍布斯假设了人类的原初状态，用他的话说，自然状态中人与人之间像狼与狼一样，是“每个人对每个人的战争”。在这种状态中，每个人都力图保护自己的利益，并企图占有别人的东西，此时，每个人是每个人的敌人。此时没有任何规则，没有财产，没有
正义或不正义，只有战争。武力与欺诈是战争中的两大基本德性。
　　在自然状态下，霍布斯说，是没有工业、知识、艺术、社会的一点余地的。
　　霍布斯对自然状态的假定，目的是要引申出他的政治主张。他认为，在这种状态下人的生活是悲惨的。为了摆脱这种状态，人们便汇聚起来，建立契约，同意确立一个权力者或权力团体，这就是利维坦，这个拥有巨大权力的利维坦对人们使用权力，以结束每个人对每个人之间的混战。这就是霍布斯的社会契约论的思想。
　　在“霍布斯模型”中，国家以法律条文规定对某种行为如“战争”采取惩罚措施，但是如果惩罚措施不力，即使扣除惩罚的成本，行动者从“战争”行动中获取的好处大于他采取“和平”策略所带来的好处，那么国家的法律措施是无效率的或者说是低效率的。因此国家法律的制定应以抑制对他人的危害行动为原则。这就是法律制定的第一条原则：效率原则。
　　效率原则是从对社会的整体考虑分析得出的，从这个意义上讲，法律越严格越好，越严格越有效率。但是，严格的法律对犯法者公平吗？这就涉及法律制定的第二条原则。
　　第二条原则是，法律对犯法者的惩罚应以与犯法者给社会或他人造成的危害相等为原则，这就是公平原则。从这个意义上讲，法律惩罚太重，对犯法者不公平；而太轻，对社会或他人不公平。
　　效率原则与公平原则是很难统一的，法律的制定既要考虑效率原则，又要考虑公平原则，但往往两者难以兼顾。在不同的国家以及在同一个国家的不同时期，对这两个原则的侧重点是不同的。
更为基本的道德调节
与国家一样，道德也是对某些不合作行动的惩罚机制。这种机制的出现（当然还有国家）使得人类从囚徒困境中走出来。
　　道德调节的第一个特点是，道德是先于国家产生的。根据历史记载，国家的出现在人类历史上是很晚的事情，而在国家出现以前，人类已经经过很长一段历史。
　　在国家出现以前，以某种权力组织来调节群体是可能的，如部落的存在。然而更为基本的是道德的调节作用。道德先于国家而存在，在上面的例子中，非洲的努埃尔人没有国家，但也调节得很好，这便是道德的作用。
　　人的正义和非正义的概念与财产权的概念分不开，没有明确的财产权的地方是不可能有正义的，因而在人类的早期，正义的观念与财产权的观念几乎是同时产生的。
　　人的正义与非正义的观念产生了道德感，无论是霍布斯还是休谟都这么认为。道德的产生先于国家，而它们的作用都是区分或调节正义与非正义的行为的。
　　英国著名哲学家休谟在《人性论》中认为，人存在着先天的不足。狮子勇猛、敏捷，羊、牛虽不具备这些条件，但它们食量也不大，而人身体软弱但需求很大，为了弥补这个不足，只有依赖于社会。在社会中人有了力量、能力和安全。但是社会是如何合作的？休谟叙述了从两性的吸引到亲情关系，再到道德感的产生。道德感自然地使得人们对不道德的或不正义的行为谴责或者对不道德的人不采取合作，从而使得不道德的人遭受损失。这样，社会上不道德的行为就会受到抑制。
　　因此只要社会形成了道德或不道德，或者正义或非正义的观念，就自动地产生了调节作用。我们说，这种调节机制是非中心化的，即它不是通过某个建立起来的中心化的组织来实施的。
　　道德调节无须成本，这是道德调节的第二个特点。道德感是存在于每个人心中的，它无须成本维持。对不道德行为的谴责也是不花成本的。
　　道德调节的第三个特点是，道德的调节存在着局限。它对不道德的行为的抑制是有限度的，当不道德的行为带来的利益大于道德的满足时，道德的作用便失效。捡到别人掉的东西还给失主是道德行为，一方面捡到者有道德满足感，另一方面会受到社会的表扬；如果不送回失主并被发现的话，则会受到谴责。但是如果捡到的是一大笔钱，捡到者对是否还回给失主将有所疑虑，因为他道德的满足感或可能承受的谴责小于他捡到这笔钱的获利。另外一个例子是，自古有杀人者死，伤人者刑，然而这与法律的实施相联系，在没有国家、没有组织的原始社会，我们假定这时是单个人的社会，如果有力量的人杀了人，有谁对其惩罚呢？人们可以谴责这种行为，认为它是不道德的，但没有力量对之惩罚。因此从社会发展的角度来看，社会发展到一定程度，便需要强有力的政府产生，以弥补道德调节的不足。
哪种策略更能赢?
假定我们的社会已经形成约束行动者的道德规范。如果对不道德的行为不能产生即时的惩罚，不道德的行为在社会中往往能给行为者带来好处。这表现在一次性的非合作的博弈中，行为者理性地选取对自己有利的行动。但是，如果存在重复博弈，参与者之间对不合作行为就会形成惩罚机制。
　　对囚徒困境进行无限次的重复博弈，什么样的策略会赢?
　　甲乙不合作合作不合作(1，1)(4，0)合作(0，4)(2，2)
　　假定第一步双方均采取合作的策略，第二步有人采取不合作策略，而对方采取合作策略，采取不合作策略的人将有支付4，采取合作策略的人将有支付0。采取合作策略的人感觉自己不合算，他在第三步也会采取不合作策略。此时双方有可能进入均采取不合作策略的重复性的囚徒困境。因此，在第二步，采取不合作策略的人会考虑这样的结果。
　　这里涉及参与者以什么样的态度对待对方的不合作策略。在博弈论里，有两个著名的策略。
　　如果一方采取不合作的策略另一方随即也采取不合作策略并且永远采取不合作策略，在博弈论里面称之为触发策略，或称冷酷策略，英文叫trigger strategy。
　　如果对方知道你的策略是触发策略，那么对方将不敢采取不合作策略，因为一旦他采取了不合作策略，双方便永远进入不合作的困境。因此，只要有人采取触发策略，那么双方均愿意采取合作策略。但是这个策略面临着这样一个问题：如果双方存在误解，或者由于一方发生选择性的错误，这个错误是无意的，那么结果将是双方均采取不合作的策略。也就是说，这种策略不给对方一个改正错误或解释错误的机会。
　　第二种策略是，若你采取不合作策略，我也采取不合作策略，但是如果你采取了合作策略，我也采取合作策略。这叫“一报还一报”策略，或者称之为“针锋相对”，英文叫tit-for-tat。美国密执安大学的罗伯特·埃克斯罗德(Robert Axerold)主持了一次计算机比赛，看谁写出来的程序能够赢。参加者有政治学家、数学家、经济学家、社会学家，他们都详细研究过囚徒困境。获胜者是加拿大多伦多大学的拉波波特写出的tit-for-tat策略。这个程序非常简单：第一步采取合作，接着对方采取什么策略，他便跟着做什么。
　　当然有多种策略，如对方采取了不合作，但自己永远采取合作策略，这个策略可以叫做“以德报怨”策略。这个策略对行动者最为不利，因为对方知道你采取这种策略，他会永远采取不合作的策略，因而理性的人是不会采取这种“以德报怨”策略的。然而，极端道德的人是超越理性的限制的，此时他会采取“以德报怨”策略。佛说：“我不入地狱，谁入地狱？”基督说：“爱你的敌人。”他们爱一切人而不会计算他爱的行动会给他带来利益或灾难，而是希望他的行动感化众生。
　　如果是有限次的囚徒困境，那么情况就不同于上述无限次的囚徒困境的重复博弈。当临近博弈的终点时，采取不合作策略的可能性加大，如果参与人以前的所有策略均为合作策略，并且被告知下一次博弈是最后一次，那么双方肯定采取不合作的策略。
　　这可以解释许多商业行为。一次性的买卖往往发生在双方以后不再有买卖机会的时候，尽量谋取高利并且带欺骗性是其特点。而靠“熟客”、“回头客”便是通过薄利行为使得双方能继续合作下去。
道德作为“文化基因”的遗传与变异
道德产生之后，它成了“文化基因”，它与基因一样可以遗传。学者达维肯斯(R. Dawkins)发明了一个词meme，它与gene(基因)相对应，指某一群体的文化上的特质，或者说是文化基因。武汉大学的朱志方博士在《社会决策论》中将之翻译成模因，以与基因相对。文化基因(meme)有记忆和模仿的特征。
　　说道德是文化基因，因为它与遗传物质的基因有许多相同之处，它可以复制、遗传及变
异。
　　首先，道德可以遗传。道德的遗传通过“教—学”的关系来完成的。父母及周边的人通过其行为不自觉地将道德传给了子女，各种教育机构通过不同的教育方式传递德道规范。一代又一代，在学习过程中继承了前辈形成的道德。
　　其次，道德可以变异。变异意味着进化，惟有变异才能进化。道德是人类集体行动时面临集体行动的悲剧而产生的，当人类产生新的集体行动的悲剧时便会产生新的道德意识。从这个意义上讲，人类和生物的进化不是变异在先，而是环境的变化在先，能够产生适应环境的变异，才能得以生存。人类的道德也是一样，当新的生存悲剧产生时，产生新的克服它们的道德，群体才能生存下去，否则便灭亡。真正的悲剧不是不能克服，而是来不及克服。
　　第三，存在不同的道德，道德之间是相互竞争的。严格说来，道德是一个群体区别于其他群体的文化，不同的群体因道德的不同而相互不同，在历史上道德根植于宗教。大的范围里，我们用“文明”称呼不同的道德群体。美国著名学者、美国国际事务顾问亨廷顿认为当今世界存在着八大主要文明，它们是：中华文明、西方文明、东正教文明、印度文明、日本文明、伊斯兰文明、拉丁美洲文明以及非洲文明。有时我们用“民族”来称呼具有独特文化的群体。我们说道德与国家是两种调节社会的工具，道德存在于宗教之中，而宗教比国家的起源更早。这也是为什么西方历史上世俗政权（国家）和神权（宗教）相互争夺权力的原因。
　　亨廷顿在《文明的冲突》、《文明的冲突与世界秩序的重建》中表明他的观点，他认为，当前的冲突表现出文明的冲突，目前最严重的冲突是在文明的交接点上，比如最近几年来在巴尔干半岛上的冲突和战争。相同的文化及相同的道德意识，把人们团结在一起，“我们相同”、“我与你不同”将人们分成群体，相同的道德群体内部尽管有冲突，但是遇到不同的外来文化的侵略
　　蚂蚁分工时，相同文化的人就团结在一起。中东六次战争是信奉伊斯兰教的阿拉伯国家和信奉犹太教的以色列之间的战争。第四，基因载体努力复制自身，文化基因也力图发展自己。在生物学家看来，基因有很强的复制自身的动力。在蜜蜂和蚂蚁王国，蜂后和蚁后专司生殖，而工蜂和工蚁专门寻找食物。这有一个问题，对于工蜂和工蚁来说，怎么解释它们不繁殖自身呢？生物学家解释说：工蜂和工蚁自己繁殖的话，下一代的基因与自己相似的程度是50%，而由蜂后和蚁后来繁殖的工蜂和工蚁的“弟弟”、“妹妹”与自己基因的相似程度是75%。于是，工蜂和工蚁它们宁愿自己不繁殖。当然这只是一个解释。
　　对于文化基因似乎也是这样，一群体总是努力使自己的文化基因发展壮大。不同文化的扩张必然带来冲突。基督教2000年来的发展，是与传教士的努力分不开的。基督教在自身的扩展过程中，是排斥异教的，基督教的十字军东征就是为了消灭异教徒。今天西方世界与伊斯兰国家之间的冲突就是文化基因在拓展自身过程中的冲突。儒家文明与西方基督教文明冲突剧烈的时候是在19世纪。西方基督教文明在向四周扩张的时候，努力压制其他文明。儒家文明为了不至于消亡，在外部世界的压力下，发生了变异以适应新的环境。
　　当今全球化过程中人们对自身文明的认同越来越强烈，亨廷顿认为，通讯的发展并不会使得人们价值观发生趋同，而不同的文化对这些信息将产生不同的解释。
国家的作用及其局限
国家与道德均是一套赏罚机制，它们的建立是为了调整人们的行为，使人摆脱囚徒困境，走向合作。
　　笔者写了一篇论文，题为《赏罚机制的建立与博弈结构的调整》，中心意思是，人类的个体理性与集体理性存在着冲突，这个冲突就是集体行动的悲剧，但是人类可以通过“自动”地建立一赏罚机制来克服这样的悲剧。就数学形式而言，赏罚机制的建立就是在支付矩阵
上加一个赏罚矩阵，或者在支付函数上加一个赏罚函数；从实际意义上说，就是通过改变规则来对人的某些行动给以奖赏，而对某些行动给以惩罚。
　　这种规则的改变有三种方式。
　　第一，如果参与者之间没有一个组织调节，那么参与者之间可以通过协议形成组织，以调节人类的行动。国家是其中的典型，竞争的企业之间为了避免相互恶性竞争建立的某些行业协会也是其中的一种。
　　第二，如果原来存在着协调组织，但是，它的规则导致囚徒困境，这时，该组织可以通过改变规则，来改变博弈结果。像中国北方草原问题，在一定程度上起因于草地财产权的界定。
　　第三，参与者之间形成道德调节过程。道德谴责与道德赞赏是非中心化的，而道德的作用一样可改变博弈规则，使违反道德的行为得以降低，遵从道德的行为得以升高。
　　这三种方式是都是对“悲剧”的克服的方式，它们都可以说是人类自动形成的。并且可以这么认为，它们就是文明！
　　对于这种对人类集体行动的悲剧的解决方式的解释，华南师范大学的陈友芳先生提出这样一个问题：从原始社会开始，为什么有的地方形成了国家?为什么有的地方没有形成国家而只有道德的调节机制？
　　这个问题涉及一个深刻的问题，即实际的机制形成的问题。为什么有些地方形成一中心化的国家，而有些地方没有形成国家，只有道德调节，这可能是成本问题，当然我这里只是一种猜测。中心化的组织的形成及其运行是要花成本的，而道德存在于每个人的心中，它是非中心化的，其实施是通过每个人的行为表现出来的。在人类社会形成之初，由于人口稀少、生产力低下及行动能力的局限，道德是主要的调节因素，此时人类没有能力形成控制力强的组织即国家。只有到社会发展到一定程度，人口到一定的规模，生产力达到一定水平，中心化的组织才能产生。正如马克思所认为，原始社会是没有国家的，到了奴隶社会，才形成了一个阶级压迫另一个阶级的国家。
　　其实可以这样认为，国家是在其带来的利益大于其成本时才得以形成的，即国家是人们为了摆脱“集体行动的悲剧”而形成的，此时好处大于坏处。当然国家形成之后往往是一个集团通过它得到更多的利益，而许多人因国家的存在而遭遇不幸，成为国家的牺牲品，但在自然状态或原始社会中，是没有一群人实施对另一群人“合法性”的屠杀的。
　　国家的运作成本太大，如果每个人不能从中得到更多的额外的好处，那么国家便不能形成，或者严格地说不能自愿形成，此时人们不可能有去形成这样一个权力中心的动机。当然，形成的国家对统治者来说是有好处的，往往有足够武力的少数人或集团有统一的动机，他们通过武力来征服其他人以形成一中心化的国家。然而，当人民在这样一个国家下得到的好处没有他们在自然状态下获得的好处大时，从长期来看，这个国家便不能存在下去。这也可以解释古希腊马其顿国王亚力山大统治的横跨欧亚的国家，成吉思汗建立的世界上最大的横跨欧亚非的国家以及前苏联国家，它们为什么不能长久的原因。它们可以短时间通过武力建立起来，但是不能长时间存在下去，因为它们存在的成本太高，而给人民的好处不大。
　　因此可以说，国家的存在是有条件的，而道德的存在是没有条件的。在非洲地区，或者古代，因生产力低下，人们所在的地域广大，国家存在的管理成本太高，因此只可能有小而灵活性的部落性组织存在，而不可能有庞大的制度化运作的国家。
　　国家和道德均有调节机制，是为了使人类摆脱“集体行动的悲剧”而自动产生出来的机制。这里所谓的自动产生是指，它的产生是由行动者本身的内部力量产生出来的，而非由该集体之外的力量为它设计的。因而，国家和道德是人类集体进化的产物，从这个意义上讲不是上帝强加于人类的。
　　这里只说明了什么时候产生国家，什么时候产生道德，但为什么在有国家的地方仍有道德呢？可以这么认为，国家通过规则化的机制对人的行动进行规范，然而它对人的行动的监督是有成本的，它对社会危害大同时道德无法进行监管的行为进行管制，而把对社会危害小同时难以监督的行为留给了道德。如抢劫、杀人对社会的危害不言而喻，道德虽然可以在一定程度上制约这种行为，但对这些行为的真正有效的惩罚只有通过合法的暴力来进行。至于吐痰、在公共场所吸烟这类行为，对于吐痰者或吸烟者是有利的，因为有吐痰的需求时立即吐掉是愉快的，而对于吸烟者来说，在公共场所烟瘾上来时吸上几口烟也是很愉悦的。但无论是随地吐痰还是在公共场所吸烟，对他人是有害的，因而这些是不道德的行为，对它们只有通过人们内心的道德感以及他人的谴责来进行抑制。如果没有道德调节，而由国家实行的外部的强制力量来管制，那么其成本太高，实际上效果不大。
文明新解
那么在博弈论中，文明是什么呢？在博弈论中，人是经济人或理性人，然而理性的人往往导致谁都不愿意见到的结果，这就是集体行动的悲剧。当然，并不是所有的集体行动都造成悲剧。
　　这里得出与弗洛伊德及韦伯不同的看法：文明就是对集体行动悲剧的克服。正如休谟认为，人的天生能力不如其他动物，而惟有形成社会并相互依赖才能克服自身的弱点。但是，
群体的行动往往导致没有技术解决办法的悲剧。国家及其相应的法律、道德都是为了克服集体行动的悲剧。
　　文明的发展是对集体行动的悲剧不断克服的历史。集体行动的悲剧具有相同的结构，都是囚徒困境的形式，即：自私的人或理性的个体从自身利益出发，造成群体受到损害。这在现实中往往以不同的方式表现出来，如我们在第7章中举出的例子。同时，在人类的发展中不断产生新的集体性的悲剧，而人类就是在不断地调整自己的行动——通过建立法律、形成新的道德意识，从而不断克服这种悲剧的。
　　历史上存在着这样一个现象：对社会均衡的打破开始于殉道者。先知看到常人没有看到的东西，他们预测到集体行动的灾难，然而社会没有意识到问题之所在，没有形成克服悲剧的集体的道德意识，当然更没有建立某种克服悲剧的组织形式。社会不能理解先知的呼喊，因而先知因违背众人的意志而被社会所不容，甚至被处以极刑。
　　鸦片战争后，中国面临被列强瓜分的危机，清政府软弱无能。固守传统还是学习西方，成了人们论战的主题。康有为、谭嗣同等人力主维新变法，然而开明并支持维新的光绪皇帝其权力受到以慈禧为代表的保守势力的多方挟制。当袁世凯出卖光绪，慈禧开始对维新派进行大规模搜捕屠杀时，力主变法的谭嗣同没有逃走。他拒绝到日本躲避，而慷慨赴难。他说：“各国变法，无不从流血而成，今中国未闻有因变法而流血者，此国所以不昌也。有之，请自嗣同始。”维新运动被保守的清政府镇压了。维新在某种程度上是在清政府原来的体制上的改革，而非彻底的革命，维新运动的失败意味着清政府丧失掉了克服集体行动悲剧的机会，因而导致清政府的腐朽和灭亡。经过辛亥革命以及毛泽东等人领导的中国共产党的革命，强大的共和国终于在维新运动失败的半个世纪之后建立起来。
　　谭嗣同从容就义，鲁迅大声呐喊，都是为了唤醒民众。他们要告诉人们：不要再昏睡下去，要行动起来！否则中国要亡了。他们力图打破由自私而形成的社会的均衡，克服集体行动的悲剧。
　　因此，人是自由的，他不受必然性的支配。当人没有认识到集体行动的悲剧的时候，人可能无法克服这样的悲剧。而一旦人认识到集体面临的悲剧，人的道德感便可能使人超越人的经济理性而走向道德理性，集体面临的悲剧就可能被克服。黑格尔说得好：“自由是对必然性的认识。”这就是人，也正是人才有文明。
当前的悲剧与解决途经：
世界政府的可能性和可行性分析
　　当前的悲剧是竞争的悲剧。无论是前苏联和美国核竞赛(当然两个超级大国的核竞赛随着前苏联的解体而结束)，还是全球性的对环境的破坏，都源于竞争。

返回书籍页

TXT下载此书 | 书籍信息

博弈生存