必读网 - 人生必读的书

TXT下载此书 | 书籍信息


(双击鼠标开启屏幕滚动,鼠标上下控制速度) 返回首页
选择背景色:
浏览字体:[ ]  
字体颜色: 双击鼠标滚屏: (1最慢,10最快)

博弈生存

_2 潘天群(现代)
  所罗门王所用的策略是不可重复的,这只有在特殊情况下才能得到:那两个妇人均是在不知道所罗门王的真正意图的情况下表达出自己的偏好的:真母亲首先希望孩子活着,其次才是孩子回到自己的身边;假母亲首先关心的是不要输掉官司,孩子的归属是次要的。
  我们看到,这里的公平的分配不是指平均的分配,也不是双方均满意的分配,而是合理的分配。
  分小孩——公平不是平均
从分蛋糕到财产分割与边界争端的解决:
双赢的分配两人分一个蛋糕,用什么方法才能分配得公平?一个公平的分法是:由其中一人持刀来分,分者后取。这样,分的人因担心后取而吃亏,他所能采用的最好办法是尽量将蛋糕分平均,即使他后拿,也不会吃亏。
  分蛋糕只是对同质的东西所进行的一个简单的分配,对不同质的东西能否建立一个像“你分我先取”分蛋糕那样的一个程序,从而做到公平分配吗?美国纽约大学政治系的勃拉姆
兹(S. Brams)教授给出了肯定的回答。他提出了一个“双赢”的分配办法。
  我们来看一下一个离婚的财产分割的例子。假定一对夫妇,安娜和汤姆,感情破裂,不想在一起过日子了。他们到法院进行财产分割。
  法官看了他们的财产:冰箱、电脑、缝纫机、烟斗、自行车、书桌。一共有6件。法官叫他们对这6件物品进行轮流选择,所选择的归其所有。当然是女士先选。选择顺序是:安娜,汤姆,安娜,汤姆,安娜,汤姆。
  选择的结果是什么呢?我们假定安娜与汤姆对不同物品的偏好不同,比如,安娜作为家庭主妇最喜欢冰箱,认为它也最值钱;而汤姆由于工作的关系更喜欢电脑,认为它更有用。他们对物品的“评价”见表4-1。
  离婚分东西表4-1
  排序安娜汤姆1冰箱电脑2缝纫机烟斗3自行车书桌4书桌自行车5电脑冰箱6烟斗缝纫机
  于是,选择的结果是:安娜选了冰箱、缝纫机和自行车,而汤姆选了电脑、烟斗和书桌。
  安娜得到了6件物品中她认为价值最高的3件物品,汤姆同样得到了他希望得到的价值在前3位的物品。两人对分配均满意。
  这是一个双赢分配。
  这里所实现的“双赢”分配,其基础是:我们假定了他们对不同的物品的估价“差别较大”,或者说不同物品在不同的人那里其“效用”是不同的。为了分析这里的分配是双赢的结果,我们设定他们对每件物品进行打分,假定满分为100分,安娜和汤姆分别将这100分分配给不同的物品。见表4-2:
  表4-2
  排序安娜汤姆1冰箱28电脑302缝纫机22烟斗253自行车20书桌204书桌15自行车155电脑10冰箱56烟斗5缝纫机5
  这样,安娜总共得到了70分,而汤姆得到了75分。两人分配得到的结果大大超过了50分。 勃拉姆兹在《双赢解》一书中还提出了分配的“无嫉妒原则”。这里,安娜的所得为70分,汤姆的所得为75分。安娜嫉妒汤姆,认为他的所得超过自己。勃拉姆兹提出,可以让汤姆补给安娜2.5分值的东西,这样,安娜的心理就平衡了。此时双方都不会产生嫉妒心理。如此看来,这样的分配确实是双赢的。
  在上述的分配中,我们假定了安娜和汤姆对不同物品的估价或者排序是不同的。如果他们的估价差不多,情形又将如何?
  假定安娜和汤姆对不同物品估价后进行的排序为表4-3。与前面一样,同样是安娜先选择,然后是汤姆,接着是安娜……
  在这样的选择中,如果每个人进行的选择是诚实的,即每个人进行选择时,都是从剩下的物品中选择自己认为价值最高的物品,那么结果是:安娜选择了冰箱、自行车和缝纫机;而汤姆选择了电脑、烟斗和书桌。
  表4-3 诚实的选择
  排序安娜汤姆1冰箱电脑2电脑烟斗3自行车书桌4书桌自行车5缝纫机冰箱6烟斗缝纫机
  在这个分配中,安娜获得了她认为的价值“第一”,“第三”和“第四”的物品,而汤姆获得了他认为价值“第一”、“第二”和“第六”的物品。
  这样的分配对双方来说,虽然不是最好的结果,但是双方应该对这个分配结果感到满意的。
  在这个例子中,聪明的读者会想到:安娜第一次不选择冰箱,而先选择电脑,情形会怎样呢?即:安娜的选择是策略性的,而不是诚实的。因为,安娜知道在汤姆那里电脑排第一,而冰箱排倒数第二。安娜第一次选择了电脑,轮到汤姆选择时,汤姆不会选择冰箱,而选择了烟斗。结果见表4-4。
  在表4-4中,安娜得到了她认为的最值钱的前三位东西。汤姆得到了他认为的第二、第三及第六位价值的物品。
  表4-4 策略选择
  排序安娜汤姆1冰箱电脑2电脑烟斗3自行车书桌4书桌自行车5缝纫机冰箱6烟斗缝纫机
  在这个例子中,如果汤姆对自己的分配所得的结果不满意,他同样可以采取策略行为。当他看到安娜采取策略性行为而选择了电脑时,论到他选择时,他先选择冰箱!尽管冰箱在他看来价值最低,但他知道冰箱在安娜那里价值最高,当他选择了冰箱后,他可以用它与安娜交换电脑!这样一来,情形就较复杂。读者不妨自己分析此时的结果。
  如果双方对物品的估价一样,此时的分配便无法做到双赢了。这样的分配问题演变成一个“常和博弈”:双方所得之和为一个常数,一方如果分配所得多了,另外一方的所得便少了。我们这里不对这个问题进行探讨。
  有意思的是,勃拉姆兹教授认为,他的这种方法可以用于解决南沙群岛争端问题。勃拉姆兹首先将南沙争端各方分成两方:以中国(包括中国台湾)为一方,以声称拥有主权的东盟四国(越南、菲律宾、马来西亚、文莱)为一方。然后将超过230个小岛和暗礁分成“南部”、“西南部”、“中南部”、“东部”和“中北部”五部分,让双方就“政治利益”、“军事重要性”和“经济利益”给出分值,然后进行分配,这样可以实现双赢。本人在纽约大学做访问学者时,他问:“你看这个方法能够解决南沙争端吗?”我说:“不可能!” 他问: “为什么?”我说:“每个国家都希望得到更多!”他说:“只要各方理性地坐下来谈,这便是一个双赢的分配方案。” 对勃拉姆兹的解决有兴趣的读者请参见勃拉姆兹1999年出版的《双赢解》(The WinWin Solution)。
知识与博弈
对一博弈来说,肯定存在着某些公共知识,均衡的产生依赖于这些公共知识的条件,只不过不同博弈的公共知识是不同的。如:“参与者是理性的”是公共知识,“博弈结构或支付函数”是公共知识。
  新的公共知识的出现会使原来的均衡打破,而形成新的均衡,如“村庄里的大屠杀”中的“至少有一个男人是不忠的”,“皇帝的新装”中的“皇帝没有穿衣服”,成为公共知识
后,原来的均衡便打破了。
  然而在一博弈中,公共知识不是参与者知道的惟一知识,也就是说,对参与者来说,存在着非公共知识。即:有些知识不是公共知识。
  这里有两种情况,一是有些知识,博弈双方知道,但不知道对方知道不知道,当然也不知道对方是否知道自己知道不知道,最明显的例子是小孩说出真相之前每个人都知道“皇帝没有穿衣服”。这时也形成均衡。
  第二种情况是,有些知识是博弈的一方知道的,而另外一方不知道,即一方拥有的知识多一些,而另外一方拥有的知识少一些。现在的问题是,拥有知识多的一方更有利还是拥有知识少的一方有利?
  惯常的想法是知识越多越好,事实是不是这样呢?让我们看一个例子。
  假定同一种商品只有两个商家生产,它们构成寡头垄断。
  商家博弈它们之间面对同一个市场,它们要决定生产多少。有很多经济学家在研究这个问题,而且有很多模型,如库若模型、斯坦伯格模型,等等。这个问题是西方经济学家关心的问题。
  我们这里不用模型来分析(有兴趣的读者可找有关文献),只是定性地给予解释。
  在双方互相不了解对方的情况下,每个商家力图调整自己的产量以使得自己的利润最大,在调整的过程中我们会发现对方也在调整,当对方调整时自己还得调整……这是一个动态的过程。理性的厂商会这样想:我何不预测对方在我调整时将得出的产量?双方都这样想,这就是博弈过程。或者碰巧猜测对了对方的产量,或者真的了解了在自己产量给定的情况下对方的最优产量。这时,纳什均衡产量就达到了。这时双方对对方的支付结构都不了解。这里,“无知”是对称的。
  在这个调整过程中假定一方通过某种方法了解到对方的调整策略,这个方法或者是从调整中得来的,或者通过商业间谍获悉的,或者两种并用。此时,我们可以说,知识是非对称的,一方比另外一方拥有更多的知识。拥有更多的知识将处于有利的局面:它因为准确预测对方的产量而可以确定使自己利润最大的产量。这也可以解释企业为什么尽量获取对方内部的信息,而尽量不让对方了解自己内部的信息。这也就是商业间谍存在的原因。由此可见,商战的双方感兴趣的不仅仅是对方的技术机密,企业产量与利润、成本之间的关系均是战略决策的决定因素。商业间谍侦查和反侦查是商场上竞争的手段,它决定着商战的成功。
信息与战争博弈
国际上国与国之间外交上的较量何尝不是这样呢?国与国之间的外交行为是地地道道的博弈行为,而战争是一种特殊的博弈。为了达到本国的利益,其策略选择要使自己的目的最大化,然而任何国家在决定自己的策略时要充分考虑对方的行为,间谍的目的之一就是弄清对方变动的可能性。因此,信息在博弈中发挥着重要的作用。
  我们可以用一个例子来说明。
  二战结束后,朝鲜沿三八线被划分为南北朝鲜。1951年南北朝鲜发生战争,美国介入。对于美国来说,它预计中国不会介入到朝鲜战争中去。因为,在美国看来,新生的共和国刚刚成立,内战消耗太大,经济百废待兴,不可能卷入战争。并且美国认为,美国武器装备优良,军费充足,即使中国参战,也无力与之抗衡。因此美国得出结论:朝鲜战争因美国的介入很快就会结束,而中国不会介入。当时美国有一家叫德林的咨询公司,在美国未出兵之前,深入地研究了中国的情况、朝鲜与中国的关系,研究的结论是:如果美国介入到朝鲜战争中去,中国将出兵。他们想将研究报告以500万美元卖给政府,而美国政府未予理睬。最终,美国这个军事大国在朝鲜战场上丢了脸面,损失的财产以几百亿美元计,伤亡数十万人,
  各国均有派往他国的间谍,间谍的信息可供本国的决策者作出利己的决策。而为了自己在决策中的胜利,反间谍是一国安全的主要内容。因此间谍与反间谍是国与国之间永久的话题。
  冷战时期,美国与苏联的间谍战已众所周知,驱逐间谍和交换间谍也是常有的事情。苏联解体后,俄罗斯与美国之间的敌对关系不存在了,取而代之的是战略伙伴关系。然而间谍战并没有因此而消失。
  那么,他国间谍的存在对自己本国的战略全是坏事情吗?
  未必。为什么这样说?获取情报是间谍的任务,而足够的情报是战争胜利的保证,因此间谍的存在是胜利的条件。但是一场战争只能有一方胜利,如果了解到对方足够的情况而知道自己肯定会输的话,该国还能打吗?此时战争还能打得起来吗?
  战争胜败大体上取决于实力、信息、战略与人心。如果其中一方各方面均优于另外一方,并且弱的一方知道的话,理性的弱者是不会参与战争的,此时战争便打不起来。间谍就具有传递这个信息的作用。
  应当说,双方之间若要进行战争,足够理性的双方应当知道谁会胜利,谁会失败。这是惟一确定的。因此很多情况下,国与国之间的战争往往是由于不完全了解局势造成的。如果不考虑战争的所谓正义与非正义——因为这个问题是伦理学的内容,而不是科学的考虑对象,应当看到,有足够理性的双方之间是不可能发生战争的。
  一般来说,战争是两败俱伤的,尤其是双方力量对比差不多的时候。战争往往是双方没有足够的信息造成的。当然现实中很难做到信息充分,因而战争也不可能未打之前就能定胜负。弱者可以胜强者,以弱胜强的例子太多了,中国共产党的军队在解放战争期间打败无论是军队的装备上还是军队的数量上均居于优势的国民党军队。尽管毛泽东对自己的才能及自己的军队有足够的自信,然而在1945年重庆谈判时未必能预知他的军队能这么快就胜利。而蒋介石更不知道他会失败,否则他在谈判桌上不会毫无谈判诚意,不让共产党有生存空间,并且边谈判边开战。
  从理论上讲,具有足够理性和具有足够知识与信息的人能预知战争的结果。但现实中的人或者因为没有足够的知识和信息,或者不具有足够的理性(或算计)的能力,而往往不能做到这一点。战争的结果不能预知,这也是战争的魅力所在。
  一般来说,获取对方的信息而不让对方知道己方的情况是合理的。然而这不是绝对的。
  如果一方要将虚假信息传递出去,对方间谍的存在是最好的。另一方面,如果弱小的一方因不了解对方的情况而开战,则对双方都是不利的。强国也不愿意发生战争,它通过媒体表达自己的态度,然而弱小的一方会以为对方是因弱而害怕,更加大了开战的决心。此时,强国最好的办法是将自己的情况让对方的间谍知道。当弱势方知道对方的真实情况时,一场对谁都不利的战争便避免了。
  其实,早在2000多年前我国著名的《孙子兵法》中就强调了间谍的作用。在第13篇《用间篇》中讨论了间谍的种类、作用及用法。
  “先知者不可取于鬼神,不可象于事,不可验于度,必取于人,知敌情者也。”了解敌情不能求神问鬼,不能类推,不能臆测,只能从知道敌情的人那里获得。孙子提出五间:乡间——利用敌方的本地人做间谍;内间——用地方的官吏做间谍;反间——迫使敌方的间谍为我所用;死间——散布假情报并通过我方的间谍告诉敌方;生间——让我方的间谍回来报告情报。而五间中,孙子认为,关键是反间。
  孙子说:“故三军之事,莫亲于间,赏莫厚于间,事莫密于间。”军队的各种事务中,最亲信的是间谍,赏赐最多的是间谍,行动最机密的还是间谍。由此可见,信息在战争博弈中的作用。
声称的策略与实际的策略:言语博弈问题
有些博弈是“无声的”,而有些博弈是“有声的”。这有声的博弈可称之为言语博弈。如各国的外交声明,战争中或战争之前各方发布的真假策略(如在海湾战争中,伊拉克对美国说:如果你打我们的话,我们将向以色列发射导弹),都是言语博弈。在博弈论中有学者称之为信号博弈。
  言语博弈涉及实际的策略决定和声称的策略决定。
  如:当有人说“人不犯我,我不犯人;人若犯我,我必犯人”时,这含有什么意思呢?
  如果“别人犯我,我不犯别人”的话,别人会不断地犯我,我将不断地受到侵犯——这是我所不希望的;如果“别人不犯我,我犯别人”的话,我不犯人的时候别人也会来犯我——这也不是我所期望的。因此,“人不犯我,我不犯人;人若犯我,我必犯人”的策略是我的好的策略。其价值是由理性的我出于利己的动机来规定的。这是策略决定。
  同时,这个策略的说出本身有“传达”的功能:你不要犯我,否则我肯定犯你;你不犯我,我也不会犯你。语言哲学中有人认为,语言本身就是行动(speech act)。这里行动者就是将行动的可能策略告诉对方,目的是使双方避免出现不希望的结果,而首先是为了自己的目的。
  如美国声称,如果中国武力攻打台湾的话,美国将介入。这是美国声称的策略。美国通过这言语上的声明,目的是为了恐吓中国政府。而中国政府同样以言语回击:是否以武力收复台湾是中国的内政,美国无权干预。言下之意,如果美国干预的话,美国和中国将发生战争。如果中国政府真的武力攻打台湾以实现国土统一,美国真的会介入吗?这是中国政府所要考虑的问题,即要弄清美国届时实际的策略是什么。而美国也要考虑,一旦战争打起来,美国如果干预的话,中国会向美国开战吗?
  因此要分清行动者真正的策略决定与声称的策略决定。真正的策略决定,我们说是规定真的,因为它是行动者从利己的角度确定的,行动者没有理由确定对自己不利的策略决定。而声称的策略决定本身也是一种策略,或者说本身是一种决定了的行动。行动者通过这个行动来达到某种目的。
  可以这么认为:“人不犯我,我不犯人;人若犯我,我必犯人”是一种声称的策略决定。而“如果天下雨,我将带伞”则是真正的策略决定。
  怎么区分这两种决定呢?
  声称的策略决定首先是一种语言行动,而真正的策略决定不是一种语言行动。声称的策略决定是行动者向其他行动者说出去的一种行为,它是行动者的一种行动。而真正的策略决定是不是需表达出来的,其他行动者有可能知道也有可能不知道,并且有时这种真正的策略决定是保密的。
  其次,声称的策略决定与真正的策略决定可以相同也可以不同。行动者的真正的策略决定是利益最大化得来的,只要社会的逻辑结构或博弈结构给定,行动者就会有自己的策略决定。囚徒困境中,被警察抓到的囚徒——行动者或博弈方,在警察给了他们的支付矩阵后,他们就会分析出自己的策略决定,即:无论对方招认还是不招认,他的最优策略是招认。
言语博弈中的“威胁”与“承诺”
在现实中,我们经常看到声称的策略决定,但是这些声称的策略可信吗?
  声称的策略包括“威胁”与“承诺”。美国和中国在台湾问题上的言语博弈就是威胁的。而在国际核武器问题上,我国及其他一些国家承诺“不首先使用核武器”就是一种言语承诺。
  博弈论中,经常用“可置信”和“不可置信”的“威胁”或“承诺”来区分行动者说出来的策略,我们在对动态博弈的分析中会分析什么样的策略是可置信的,什么样的策略是不可置信的。而分析“威胁”或“承诺”是可置信的还是不可置信的方法是倒推法。
  倒推法(backward induction)也叫逆向归纳法。那么什么是倒推法?
  要理解什么是倒推法,先来看一下商界里经常见到的博弈。
  在某个城市假定只有一家房地产开发商A,我们知道任何没有竞争下的垄断利润是很高的,假定A此时每年的垄断利润是10亿元。
  现在假定有另外一个企业B,准备从事房地产开发。面对着B要进入其垄断的行业,A想:一旦B进入,A的利润将受损很多,B最好不要进入。所以A向B表示,你进入的话,我将阻挠你进入。假定当B进入时A阻挠的话,A的利润降低到2,B的利润是-1。而如果A不阻挠的话,A的利润是4,B的利润也是4。
  现在让我们回到房地产开发商之间的博弈问题。A的最好结局是“B不进入”,而B的最好结局是“进入”而A“不阻挠”。这两个最好的结局不能构成均衡。那么结果是什么呢?
  A向B发出威胁:如果你进入,我将阻挠。而对B来说,如果进入,A真的阻挠的话,它将受损失-1(假定-1是它的机会成本),当然此时A也有损失。对于B来说,问题是:A的威胁可置信吗?
  B通过分析得出:A的威胁是不可置信的。原因是:当B进入的时候,A阻挠的收益是2,而不阻挠的收益是4。4>2,理性人是不会选择做非理性的事情的。也就是说,一旦B进入,A的最好策略是合作,而不是阻挠。因此,通过分析,B选择了进入,而A选择了合作。双方的收益各为4。
  在这个博弈中,B采用的方法为倒推法,或者说逆向归纳法,即:当参与者作出决策时,他要通过对最后阶段的分析,准确预测对方的行为,从而确定自己的行为。
  在这里,双方必须都是理性的。如果不满足这个条件,就无法进行分析了。
  这个例子只是简单的两阶段博弈,而三阶段或更多阶段的博弈,可用同样方法加以分析。
  在动态博弈中,涉及“威胁”与“承诺”是不是可信的问题。静态地看,一博弈存在许多均衡。
  因此,阻挠,不进入的纳什均衡点得以淘汰,在动态博弈中一个新的均衡——子博弈精练纳什均衡——得以实现。子博弈精练纳什均衡的定义及分析,归功于另一位诺贝尔经济学奖获得者塞尔屯(Selton)。
  这里分析的是完全且完美信息下的动态博弈。所谓完全信息是指:博弈的支付函数是“公共知识”(我们在第一部分叙述了公共知识的含义)。本书中未涉及不完全信息的博弈问题,如囚徒困境这样的静态博弈也是完全信息博弈。完美信息是针对动态博弈而言的,指参与者知道博弈的所有历史。
  倒推法是动态博弈中有用的工具,它可以说是理性的人自然的推理方式。然而倒推法面临着一个困难,这就是蜈蚣博弈的悖论。(参见第六章)
  上面我们分析了“威胁”是否可信,下面我们可分析“承诺”是否可信。“不首先使用核武器”的承诺可信吗?这个承诺是针对常规战争而言的,即:只要大家都运用常规武器进行战争,那么承诺者将不首先使用核武器。在常规战争下不涉及国家生死存亡的时候,这个承诺是可信的。因为如果承诺者首先使用核武器,将使他国也对它使用核武器,这样一来,它会因首先使用核武器而带来更大的灾祸。但是,如果在常规战争中某国面临着被消灭的危险时,它还不首先使用核武器吗?在这种情况下,使用核武器有可能挽救这个国家,而不使用,则该国肯定灭亡,即使用的好处大于不使用的好处。因此,这个承诺在一个国家面临灭亡的时候将是不可信的。
空口声明博弈
在博弈论中存在另外一种言语博弈,英文叫cheep talk。cheep talk 可翻译成“空口声明”,它是一口头表态,发话者说出某些话语无需某些成本,也无须承担某些责任,它不是“威胁”也不是“承诺”,但发话者说出它是有目的的。听者要分析他话中的含义,即要分析cheep talk是真还是假。
  如:某人应聘某职位时,他会说“我的能力很高”,这就是cheep talk。他的目的是为
了能应聘得上或者说是为了获取高工资,他说出这样的话是无需成本的,每个应聘者都可以这么说。而雇主则要弄清这些应聘者的cheep talk中哪个是真的哪个是假。
明天太阳必然能升起吗?
——归纳推理的合理性问题人有两种推理方式:一是演绎的,二是归纳的。
  由前提真必然地推出结论真就是演绎推理。这是逻辑或传统逻辑研究的对象。古希腊哲学家亚里士多德确定了三段论推理形式如:
  大前提:所有人皆要死;
  小前提:张三是人;
  结论:张三要死。
  再比如:
  大前提:所有的爬行动物是用肺呼吸的。
  小前提:蛇是爬行动物。
  结论:所以蛇是用肺呼吸的。
  只要前提真,推理过程无误,演绎推理的结论就是真的。演绎推理是由某个普遍性的原理推出某种特殊的结论。这个结论其内容不会超过前提蕴含的内容。数学就是演绎性的。
  不仅有演绎推理,同时还有归纳推理。如:
  前提1:张三要死;
  前提2:李四要死;
  结论:所有人都要死。
  又如:
  前提1:蛇是用肺呼吸的;博弈生存博弈生存博弈生存博弈生存归纳推理的合理性问题前提2:鳄鱼是用肺呼吸的;
  结论:所有的爬行动物都是用肺呼吸的。
  这种由个别性的真的现象或前提推导出普遍性的结论就是归纳推理。
  归纳出来的普遍性的结论不是必然真的,而是归纳真的,或者说是“或然真的”,即:结论可能是真的,也可能是假的。
  归纳推理是跳跃的,结论的内容超出前提的内容。当然,这种跳跃性的过程是可质疑的。大哲学家休谟批判人们的归纳没有合理性,只是人的习惯联想而已。因为没有逻辑的理由来证明归纳法。
  演绎与归纳在人的认识与行动中起着重要作用,哲学家在研究它们的作用。
  人的行动很大一部分建立在归纳推理之上。那么什么是归纳推理呢?
  我们每天看到太阳从东方升起而得出结论说“太阳每天从东方升起”,我们看到了几只天鹅是白色的,我们说“所有的天鹅是白色的”。
  归纳推理就是从少数的观测的事例中概括出普遍性的命题。如果用逻辑学的话语说,就是从特称命题得出全称命题。所谓全称命题是指这样的命题形式:“所有的……具有某种性质”,而特称命题是指“某某具有什么性质”。当然这是一种不严格的说法。今天非经典逻辑的归纳逻辑就是研究证据与全称命题之间的支撑关系的。
  从特称命题到全称命题的过程是归纳过程,这个过程中存在着跳跃。这样的跳跃合理吗?
  归纳法是科学家的常用工具,而对归纳法的合理性哲学家一直在探讨。培根说过“知识就是力量”,他竭力倡导归纳法,认为知识的来源是经验。
  知识来源于经验,这不容怀疑。然而人们通过经验得出知识的方法令人怀疑。18世纪英国哲学家休谟认为,归纳法其实是人的习惯联想。
  我们怎么从过去每天观测的太阳从东方升起得出“太阳将每天从东方升起”的结论?根据休谟的看法,答案只能是习惯联想。我们以前观测到甲现象出现时,乙现象也出现,当我们以后看待甲现象时,我们便期待着乙现象出现,并且我们把甲现象称之为原因,把乙现象称之为结果。然而我们的结论合理吗?甲与乙之间的所谓因果联系是必然的吗?休谟的回答是否定的。
  我们可设想一下:主人每天给猪喂食,当猪看到主人来时,意味着食物送来了,然而猪不能必然性地得出,主人来必然给它喂食物。因为,很可能的是,一天主人拎着刀杀它来了。这就是归纳法的困难。
  哲学家无法证明归纳法的绝对合理性,如果要证明,肯定要引入其他的假定,假定自然是有规律的,但是这样的假设是无法证明的。
  虽然归纳法的合理性存在疑问,但归纳法在科学中的作用则不可低估——当然这不是我们上面所举的例子中的简单的枚举归纳法,以至于有人说,归纳法是科学家的荣耀,哲学家的耻辱。
  尽管如此,人们在日常生活中也是用归纳法来生活、工作的,归纳法是很有用的工具。如当我们看到有乌云时,我们会想到要下雨了,因为以前有这样的现象,然而是否肯定下雨,则难说,但下雨的概然性大,对我们来说,这就足够了。因此,归纳法是我们思维工具箱中的一个非常有用的工具,尽管不能时时有效。
  归纳法在人的互动行动中作用如何呢?这是我们下面要讨论的问题。
归纳的暴力:偷东西的人应该叫小偷吗?
对事物规则性的归纳得出的结论叫规律,规律以所谓命题的形式出现——所谓命题即是有真假的句子。命题与事实的关系是上世纪哲学研究的一个重要内容,上面对归纳法的怀疑是对得出真命题的方法的怀疑。这里我们不讨论这个问题。我们来分析人们是如何用归纳法对人的行动进行归纳从而决定自己的行动的。
  在现实中人们经常用归纳法来对人下结论。如果我们看到某人几次做出同样的错事,我
们肯定会认为他的能力有问题;如果我们看到某人做出几件不好的事情,我们很容易怀疑他的道德。对他人归纳性的看法会得出对方在同样的情形下会做出同样的事情的结论,因而我们会制定出自己的策略。但是,我们这样做往往陷入误区。
  不能说偷过东西的人永远会偷东西,因而叫他们是小偷或贼是不正确的,犯了错误的人不一定永远犯错误。但我们往往这么思维。我们把偷了东西的人叫小偷的话,那么这种称呼本身就将他们归类,他们成为另类,这样称呼本身就等于我们用语言在他们与我们之间划了一条横沟,因而,此时语言成了一种不道德的暴力。从这一点来讲,我们的语言是不宽容的,或者说我们的语言存在着问题。
  我们这里的讨论带有思辨的特点,然而我们在社会中确实是这样使用语言和思维的。我们正是通过对认识的人的几次接触而对他们得出一个结论的,这个结论构成我们对之采取“回应行动”的基础。这个回应行动包括“友好相处”、“防范对方的侵犯”、“追求从而成为恋人”、“冷漠”,等等,并根据不同情况将周边的人分类成:可以成为朋友的、有可能成为敌人的、可以成为恋人或情人的、没有任何交往的,等等。这样的归纳会发生错误,随着交往的深入,归纳会发生改变。当然有些归纳因某种现实的或偶然的原因而永远得不到改变。
  一个群体在长时间的交往接触中,分化出各种固定的关系来,有些成为固定的朋友,有些成为一般的朋友,有些成为永远的敌人,当然也会出现恋人或爱人,还有一些形同陌路。即一均衡态出现了:周边的人基本上被定了位,形成了固定的关系。而这一切从归纳开始,并且在不断的交往中对所归纳的看法给以改正。这是一个博弈,在这个博弈中存在着一个对周边的人不断认识的过程,在博弈中称之为学习过程。
行动中的两种推理:归纳与演绎
博弈论是研究人的行为的,在博弈论中参与者一方面猜测其他参与者的策略,同时计算各种策略可能性下的支付(得益)。然而在实际中,一般情况下,人们是很难计算得益的。此时人们往往准备了各种备选策略,当其他参与者采取一确定策略时,自己将决定采取某种策略。
  “人不犯我,我不犯人;人若犯我,我必犯人”。这是毛泽东的外交方针。一旦别人采
取某种策略,如敌人采取侵犯的策略,根据这个方针,可以推理出“我”将采取“犯”的策略。这就是逻辑推理与行动之间的关系。
  我们经常用逻辑推理的方法来确定自己的行动。
  “如果天下雨,我将带伞”,这是我们日常的行动决定;“如果上证指数跌破1500点,我将大量买进股票”,这是股民的决定,当然具体的股民的方案是不同的;而外交方面更是靠逻辑推理来确定自己的行为,如:我国在台湾问题上采取“如果其他国家和台湾建交,中国政府将强烈抗议并与之断交”的策略。因此,逻辑推理在社会行动中是确定策略的工具。
  其实参与者在计算支付时,也是一样确定自己的策略,即确定:一旦别人采取什么策略,我将采取什么策略更好——支付更大。
  “如果天下雨,我将带伞”,“人不犯我,我不犯人;人若犯我,我必犯人”,这些是行动者制定的行动规则,它们构成行动推论的大前提。如:
  前提1:如果天下雨,我将带伞;
  前提2:今天下雨;
  结论:我要带伞。
  又比如:
  前提1:人不犯我,我不犯人;人若犯我,我必犯人。
  前提2:张三犯我。
  结论:我犯张三。
  这两个推理是演绎的。
  通过分析,我们看到,在人的行动中演绎推理发挥着重要作用。因此我们可以认为,逻辑是社会行动的基础。这也是我们为什么分析社会行动主题的原因。
  然而,行动中逻辑推理与认识中的逻辑推理的关系如何?行动中的演绎推理的结论肯定是真的吗?
  在上一部分中我们说了,演绎性推理只要前提是真的,推理形式正确,结论肯定是真的。我们并没有说,演绎推理分行动的和认识的两种。所以这个看法在行动的推理中同样正确。
  然而人们的行动中的推理前提其正确性如何呢?这是问题所在。我们认为,人的认识中普遍性的命题是真的,逻辑就是揭示这些普遍性的命题与个别性结论之间的关系。而人的行动中的前提是“某种条件下的策略决定”,它为真吗?如果为真的话,是什么意义上的真?
  这就涉及社会行动的本质问题。
  首先,决定行动者的行动的前提是真的吗?如:“如果天下雨,我将带伞”是真的吗?对于这个命题,其真值取决于“天下雨”与“我带伞”两个命题的值的组合,当“天下雨,我没有带伞”,此时命题就假了。然而天下雨与我带伞之间的联系是由行动者“我”来规定的。因此我们可以说,前提真是“规定真的”。
  当然,这里的“规定的真”不是没有理由的,它是由行动者的理性与行动结构所决定的,如果是博弈的话,这个结构就是博弈的结构。一旦行动者的结构给定了,理性的行动者的策略决定就确定了。
  对于日常非博弈的情况,理性的行动者总是最大化自己的利益而制定策略的。试想一下,下雨时在不带雨伞与带雨伞之间,行动者会选择后者,如果没有其他方便的避雨的手段的话。因为,不带雨伞会使自己淋湿——被淋湿是任何人所不希望的。
酒吧问题与“百花奖”的评选(1)
酒吧问题(bar problem),是美国人阿瑟(W.B.Arthur)1994年在《美国经济评论》发表的《归纳论证和有界理性》一文中提出的,后来在1999年的著名的《科学》杂志上发表的《复杂性和经济学》一文中阐述了这个博弈。
  阿瑟是斯坦福大学经济学系教授,同时是美国著名的圣塔菲研究所(Santa Fe Institute)研究人员。他不满意经济学中认为的,经济主体或行动者(agent)的行动是建立在演绎
推理的基础之上的,而认为其行动是基于归纳的基础之上的。酒吧问题就是他为了说明这个问题而提出的。
  该博弈是说:有一群人,比如总共有100人,每个周末,均要决定是去一酒吧活动还是呆在家里。酒吧的容量是有限的,比如空间是有限的或者座位是有限的,如果人去多了,去酒吧的人会感到不舒服,此时,他们留在家里比去酒吧更舒服。我们假定酒吧容量是60人,或者说座位是60个,如果某人预测去酒吧的人数超过60人,他的决定是不去,反之则去。这100人如何做出去还是不去的决策呢?
  假定每个参与者或决策者面临的信息只是以前去酒吧的人数,每个参与者只能根据以前去的人数的信息归纳出策略来。没有其他信息,他们之间更没有信息交流。
  这是一个典型的动态博弈问题,这是一群人之间的博弈。如果许多人预测去酒吧的人数多于60,而决定不去,那么,酒吧的人数将很少,这时候作出这些预测则错了。如果有很大一部分人预测去酒吧的人数少于60,因而去了酒吧,则去的人很多,多过60,此时他们的预测也错了。因此一个作出正确的预测的人应该能知道其他人如何作出预测的。但是在这个问题中每个人的预测的信息来源是一样的,即都是过去的历史,而每个人不知道别人如何作出预测,因此,所谓正确预测是没有的。每个人只能根据以往历史“归纳地”作出预测,而无其他办法。阿瑟教授提出这个问题也是强调在实际中归纳推理与行动之间的重要性。
  因此,对于这样的博弈的参与者来说,问题是他如何才能归纳出合理的行动策略。
  例如,如果前面几周去酒吧的人数如下:
  44,76,23,77,45,66,78,22
  不同的行动者可作出不同的预测,例如预测:下次的人数将是前4周的平均数(53),两点的周期环(78),与前面隔一周的相同(78)。
  这样的预测种类会很多。在2000年9月中国科技大学主办的一个“经济物理学”国际讨论会上,香港中文大学物理系的许伯铭博士说,他讲了这个问题后,叫研究生回去写出能想到的策略,研究生写出了400多条策略!
  行动者根据这些预测来行动,然而这些预测是归纳性的。
  通过计算机的模型实验,阿瑟得出一个有意思的结果:不同的行动者是根据自己的归纳来行动的,并且,去酒吧人数的数字没有一个固定的规律,然而,经过一段时间以后,去酒吧的平均人数很快达到60。即经过一段时间,这个系统中去与不去的人数之比是60∶40,尽管每个人不会固定地属于去酒吧或不去酒吧的人群,但这个系统的这个比例是不变的。阿瑟说,预测者自组织地形成一个生态稳定系统。
  这就是酒吧问题。对于下次去酒吧的确定的人数,我们是无法作出肯定的预测,这是一混沌现象。
  首先,混沌系统的行为,是不可预测的。对于酒吧问题,由于人们根据以往的历史来预测以后去酒吧的人数——我们假定这个过程是这么进行的,过去的人数历史就很重要,然而过去的历史可以说是“任意的”,未来就不可能得到一个确定的值。
  其次,这是一个非线性过程。所谓非线性的过程是说,系统未来对初始值有强烈的敏感性。这就是人们常常说的“蝴蝶效应”:在北京的一只蝴蝶煽动了一下翅膀,美国的华盛顿下了一场大暴雨。
  在酒吧问题中,同样有这样的情况。假如其中一个人对未来的人数作出了一个预测而决定第n天去还是不去酒吧,他的行为反映在下次去酒吧的人数上,这个数目对其他人的预测及第n+1天去和不去的决策造成影响,即第n+1天中去酒吧的人数中含有他第n天的决策的影响。而他对第n+2天人数的预测要根据n+1的人数,这样,他第n天的预测及行为给其他人造成的影响反过来又对他第n+2天的行为造成影响。随着时间的推移,他的第n天的决策的效应会越积越多,从而使得整个过程是不可预测的。
  人们总是根据过去的经验来归纳从而得出策略,这没有错,因为人们没有其他办法,在实际生活中人们确实是这样的。我们在第一节分析过,归纳法在认识中是没有绝对合理性的,即没有任何办法来证明它。在人们的行动中归纳法又是怎么样的呢?
  归纳法在对人的行动的预测中更是没有合理性可言。尽管有很多预测办法,但没有理由认定其预测是在合理的基础之上的。现在问题还没有结束。如果说,预测的办法没有合理的基础,那么存在一个合理的学习机制吗?也就是说,错误的预测不要紧,但有没有办法改进这个预测,以至于下次能作出更好的预测?在酒吧问题上,可以说没有这样的一个改进机制。
  酒吧问题所反映的是这样一个社会现象,正像阿瑟教授说的那样,我们在许多行动中,要猜测别人的行动,然而我们没有更多关于他人的信息,我们只有通过分析过去的历史来预测未来。
生活中有很多例子与这个模型是相同的。比如社会上经常举行的所谓大众评选活动,如全社会进行的“十佳运动员”评选活动,电影爱好者的“百花奖”的评选活动。在这些投票过程中,对于每个投票者的激励是:他如果“正确地”选中某些人,比如“十佳运动员”的评选,不仅要选中10个人,而且顺序也要正确,那么投票者将获得某种奖励。但是如何才能选中“正确的”人选呢?有“正确的”人选吗?得票多的就是“正确的”吗?严格地说:得票最多的是第一名(比如“十佳运动员”中的第一),得票次之的是第二名(如“十佳”运动
员中的第二名),等等。因此,投票者能够选中的话,或者说被他提名的能够当选的话,关键是猜测到别人的想法。猜测对了,你就能获奖;猜测错了,你则不能获奖。在这里,我们可以看到没有正确与否,或者谁应该选上、谁不应该选上的问题,而是投票的人相互猜测的结果(在这个过程中当然舆论的导向作用是很大的,它似乎告诉人们某某人是其他许多人所要选的)。这个例子与酒吧问题的结构是大众评选活动一样的,只不过在评选上是一次性的,没有过去的历史让我们来归纳而已。这明显是博弈问题。另外一个例子是,每年高校招生或研究生报名都呈现出混沌现象,考生通过各种渠道弄清以往专业的报名情况,因为一个简单的道理是:如果报名的人太多,竞争太强,被录取的可能性就低。考生一般根据以往几年的情况来推测当年报名的情况,然而这会造成不准确预测。当考生看到以往几年报名的人很多时,他会想下次人还很多,因而他不敢报名。一旦大多数考生这么想,下次报名的人反而少了;反之,则又多。这与酒吧问题有一致的结构。
少数者博弈及其应用:
股票买卖与交通拥挤问题在本书的导言中我们给出了少数者博弈(Minority Game)的简单模型:失火时面对两个门,你将如何选择。现在我们来介绍这个模型。
  少数者博弈是改变了形式的酒吧问题,是由一位定居瑞士的名叫张翼成的中国人在1997年提出的。张教授祖籍河南,科大毕业后80年代初去了瑞士,现在瑞士的弗莱堡大学(University of Fribourg)任教。他提出的少数者博弈影响很大,现在很多物理学家、博弈论专
家研究这个问题。比如,2000年9月在中国科技大学召开的“经济物理学高级研讨班及金融复杂性国际学术讨论会”上许多学者作的报告就是围绕这个问题的。
  少数者博弈可以运用于股票市场。每个股民都在猜测其他股民的行为而努力与大多数股民不同。如果多数股民处于“卖”股票的位置,而你处于“买”的位置,股票价格低,你就是赢家;而当你处于少数的“卖”股票的位置,多数人想“买”股票,那么你持有的股票价格将上涨,你将获利。而股民采取什么样的策略则多种多样,而策略的得出完全是根据他们以往的经验归纳出来的,因而类似于这里的少数者博弈的情况。但是物理学家对少数者博弈研究的结论能否用来指导股民在股票市场上搏杀,本人不得而知。
  不过本人认为,少数者博弈中一个特殊的结论不具有普遍意义,即:记忆长度长的人未必一定具有优势,因为,如果确实有这样的方法的话,在股票市场上,人们利用计算机存储的大量的股票的历史数据就肯定能够赚到钱了。但是,这样一来,人们将争抢着去购买存储量大即硬盘空间大以及计算速度快的计算机了,在实际中人们还没有发现这是一个炒股票必定赢的方法。
  交通拥挤问题的模型也是一个少数者博弈的问题。城市的交通越来越拥挤,选择行车路线也是不断的博弈过程。在交通高峰期间,司机面临两条路的选择时,往往要选择没有太多车的路线行走,此时他宁愿多开一段路程而不愿意在塞车的地段焦急地等待。司机只能根据以往的经验来判断哪条路更好走,而所有司机都不愿意在塞车的道路上行走。因此每一个司机的选择必须考虑其他司机的选择。这也是一个少数者博弈问题。
  当然在司机行车的少数者博弈问题中,司机经过多次的选择和学习,许多司机往往能找到规则性,这是以往成功和失败的经验教训给他的指引,但这不是必然有效的规则性。在这个过程中,司机的经验和司机个人的性格起作用。有的司机因有更多的经验而更能躲开塞车的路段;有的司机经验不足,往往不能有效避开高峰路段;有的司机喜欢冒险,宁愿选择短距离的路线;而有的司机因为保守而宁愿选择有较少堵车的较远的路线,等等。最终的路线的拥挤程度就由不同特点和不同经验的司机的选择所构成。
对称的人群为什么会出现破缺性的行动?
——盲目的学习人们拥有的知识是其行动的基础。在上面的酒吧问题中,每个行动者面对的信息是一样的,但每个人所用的预测方法是不同的,即他们所归纳出的预测公式是不同的(这也就是为什么我们说这种归纳没有合理的基础的原因)。然而,尽管如此,对整体人群来说,平均去酒吧的人数占总人数的60%。对每个人来讲,他的预测与行动独立于其他人将要作出的选择——因为假定他们之间没有信息交流。可以这么说,60%两边是对称的。
  还有另外一种非对称的情况。我们假定,人们没有足够的知识以支撑自己的行动。如果对可选择的策略或行动没有任何知识,此时行动者的行为就会出现盲目性。但是由于人本身具有学习的天性,快速的学习过程就发生了。让我们看一个例子。
  这是一个心理学上的例子:有一群人鱼贯进入一个房间,拿一瓶饮料喝。在他们面前有多种饮料,假定是3种,房间很黑,每个人无法通过视觉判定饮料的质量,当然更无法看清品牌,也就是说,3种饮料给他们呈现的是同样的视觉图像。此时的选择会是怎样的结果呢?
  通过实验发现,人们会将特别“偏爱”一种饮料,即几乎所有人都选择一种饮料,而不是3种饮料平均被选取。这里他们所“偏爱”的并非是特定的,在不同的人群中做同样的实验,出现的情况是一样的,只不过每一次被大多数人选取的饮料会不同。此时被选取的饮料具有非对称性。
  按通常的情况,假定饮料给每个人呈现同样的视觉图像,人群会出现对称性选择,即每个人会在所给定的几种饮料中随机选取。而由于群体的存在,即使不同的人对某种颜色有偏爱——我们假定人们可看到颜色,每个人的偏爱也会被抵消掉。对群体来说,每种饮料被选取的可能性是一样的。
  出现选择的非对称性完全是由于人们的选择行动之间的相互作用。其实这是微妙的,同时是不合理的学习过程。第一个人选取饮料可以说是随机的,在备选的几种饮料中选取完全是任意的,但是接着的人对饮料的选取则不是任意的。由于看到第一个人选择了某种饮料,他会认为第一个人的选取是有根据的,从而也会选择第一个人所选取的饮料。后面的人也会这样想。于是第一个人对某种饮料的选取会传递下去,并且这个过程中越到后面的人越有理由相信选择该种饮料是有根据的。这就是为什么所有的人都倾向于选择一种饮料。
  这就是为什么出现非对称的选择结果了。这种传递不是通过语言,而是通过对前面人的选择行动的观察。这是一个学习目的学习过程,并且是一个没有理由的学习过程,也就是说这样的学习过程是没有根据的。
  这个心理学上的实验。反映了人们之间互动的情况。这个盲目的跟随现象或者说盲目的学习现象在现实生活中处处可见。
蜈蚣博弈的悖论
倒推法是分析完全且完美信息下的动态博弈的有用工具,在第四章我们分析言语博弈中“威胁”或“承诺”是否可信时,已给出了一个倒推法例子。我们看到,倒推法符合我们的直觉。然而,通过下面的蜈蚣博弈的悖论,我们将看到倒推法存在致命的缺陷。
  蜈蚣博弈是由罗森塞尔(Rosenthal)提出的。它是这样一个博弈:两个参与者A、B轮流进行策略选择,可供选择的策略有“合作”和“背叛”(“不合作”)两种。假定A先选,然后
是B,接着是A,如此交替进行。A、B之间的博弈次数为有限次,比如100次。假定这个博弈各自的支付给定如下:
  合作合作合作合作
  A B A …… A B (100,100)
返回书籍页