必读网 - 人生必读的书

TXT下载此书 | 书籍信息


(双击鼠标开启屏幕滚动,鼠标上下控制速度) 返回首页
选择背景色:
浏览字体:[ ]  
字体颜色: 双击鼠标滚屏: (1最慢,10最快)

策略思维

_3 阿维纳什·K(美)
警告的用意在于告知其他人,他们的行动将会产生什么影响。父母警告孩子说炉子顶部很热,这只是一个事实陈述,不是策略。
如果实践一个“许诺”对你有利,我们称之为保证。孩子不理会关于炉子顶部很热的警告,结果烫伤了,这使父母得到某种保证,知道孩子以后再也不会这么干了。
我们强调这两对概念的区别是有理由的。威胁与许诺是真正的策略行动,而警告与保证更多的是起一个告知的作用。警告或者保证不会改变你为影响对方而设立的回应规则。实际上,你只不过告知他们,针对他们的行动,你打算采取怎样的措施作为回应。与此截然相反,威胁或者许诺一旦时机来临,就会改变你的回应规则,使之不再成为最佳选择。这么做不是为了告知,而是为了操纵。由于威胁和许诺表明你可能选择与自身利益冲突的行动,这就出现了一个可信度的问题。等到别人出招之后,你就有动机打破自己的威胁或者许诺。为确保可信度必须做出一个承诺。
我们用图5-3总结策略行动可能的选择。无条件的行动是你先行且行动一成不变的回应规则。威胁与许诺则在你第二个出招时出现。两者都是有条件的行动,因为这个回应是由取决于对方怎样做的规则所确定的。
一种策略行动总是抢占先机的行动。回应规则必须在对方行动之前实施。这意味着无论策略行动是什么,整个博弈都必须当做相继出招的博弈进行分析。如果你永不妥协,那么其他人就会针对你的无条件的行
动做出回应。借助威胁与许诺,你首先设立了一个回应规则,然后,其他人出招,而你按照自己的回应规则采取相应的行动。
策略行动
无条件的 有条件的
起初的 威胁 许诺
强迫性的阻吓性的 强迫性的阻吓性的
图5-3
结果是,对行动或者回应规则作出的承诺使原本同时出招的博弈变成相继出招的博弈。虽然得失情况不会改变,同一个博弈若是按照同时出招或者相继出招方式进行,有可能产生完全不同的结果。结果的差异来源于不同的博弈规则。我们通过美日争霸故事的一个无条件的行动说明了这一影响;现在,让我们来看一看美苏对峙以及民主党与共和党较量当中出现的威胁与许诺。
4 .核阻吓
曾经有超过40年的时间,北大西洋公约组织(简称北约)一直在努力寻求一种管用的阻吓手段,遏制苏联人侵西欧。北约军队的常规防御不大可能奏效。北约的阻吓手段的一个基本要素在于美国的核力量。不过,动用核武器进行回应意味着给整个世界带来毁灭性的打击。这可怎么办?
我们用一棵树表示这个博弈(如图5-4所示)。苏联拥有先行之便。假如它不发动攻击,结果是保持现状,双方各得0分。假如它进攻北约,而北约以常规防御回应,那么,苏联得1分,美国得-1分。假如动用核武器进行回应,那么双方各得-100分。
在这个博弈中,苏联向前展望,预计自己的进攻不会促使对方动用核力量反击。这样做的结果对美国不利。因此,进攻意味着它能得到1分,不进攻则什么也得不到,是0分。结果是它一定会进攻。
常规防御(l,-l)
北约
进攻 核武器(-100,-100)
苏联
保持现状(0,0)
图5-4 相继出招的博弈树及其得益(括号内第一个数字为苏联的得益,第二个数字为美国的得益)
假如你认为这种情况不可能出现,但北约在欧洲的成员国却一致觉得美国很有可能按照上述思路在它们需要援助的时候丢弃不管。它们希望美国作出一个可信的承诺,表明自己将在盟国遭到攻击的时候动用核武器。
我们暂时放下可信度的问题,首先考察这么一个威胁产生作用的机制。现在,美国拥有先行之便,也就是说它率先提出自己的回应规则。这个相关规则就是如下威胁:“假如苏联进攻西欧,我们的回应就是动用核武器。”假如美国不做这个威胁,这个博弈就会按照前面提到的方式进行。一旦实施威胁,进行常规防御的选择也就不复存在。完整的博弈树将如图5-5所示。
北约
进攻 核武器(-100,-100)
苏联
保持现状(0,0)
图5-5 存在威胁时相继出招博弈的得益(括号内第一个数字为苏联的得益,第二个数字为美国的得益)
一旦美国实施威胁,苏联向前展望,意识到进攻将会引发对方动用核武器,苏联的结局将是-100分。它宁可保持现状,也不会发动攻击。现在,拥有先行之便的美国向前一直展望到底,就会发现自己若是实施这个威胁,得分是0,若不实施这个威胁,得分是-1。可见,正是美国自身的利益,决定它要不要实施威胁。
再次提醒各位注意,美国的回应规则要求采取某种行动,而这一行动在从事之后判断显然不是最佳选择。其中的策略意图在于,以令人信服的方式改变苏联对美国事后采取什么回应的认识,可以使美国改变“这件事”——确切地说就是苏联要不要进攻西欧的决定。
这个规则必须在对方采取你打算加以影响的行动之前生效。一旦被人占了先机,不管是无条件的行动,抑或威胁与许诺,都将无济于事。
第一招一定要让对手观察得到或者推断得到,否则你就不能达到预期的策略效果。在影片《奇爱博士》(Dr.Strangelove )中,苏联在星期五就安装好了它的万无一失的阻吓装置——“末日毁灭机”,却非推迟到下星期一才告诉美国。偏偏就在这个周末,美国空军将领杰克·D·里泊(]ack D.Ripper)下令他的飞行中队发动了一场核攻击。就这样,苏联的阻吓装置由于对方毫不知晓而未起到任何作用。
能够观察到这一点并不像表面看来那么直截了当。假如一个行动本身可从结果推断出来,我们就不一定要观察到对方的这个行动。举个例子,假如我对有壳的水产品过敏,我不必真的看到你在厨房,照样可以觉察到你正在煮一盆虾。①
① 秘密投票的目的就是让投票者免受这样的影响。不过,我们再次发现,阻吓不必真要对方看到才起作用。我能看到你出招是不足够的,我还要有能力看懂你使的究竟是什么招数。虽然我的投票一定是秘密投入票箱的,最后的投票结果却不是秘密的。假如一个候选人贿赂了100个人,最后却只得到47票,他一定知道某些人(确切地说是53个人)欺骗了他。假如他决定惩罚他贿赂过的全部100个人,他这么做的时候一定可以找到他应该惩罚的人。这一方式虽然有点莽撞,却可以在每个选区只有少数投票者的情况下破解票箱的保密措施。
你的无条件行动若是打算用来影响对方,就一定要让对方看到,同样,假如你打算通过威胁或许诺影响他的行动,那么他的行动也应该可以让你看到。否则你不可能知道他是不是选择顺从,而他也明白这一点。
现在,既然你已经知道可信的无条件行动和威胁是怎样起作用的,你不必借助一棵非常具体细致的博弈树也可以分析这一类型的最简单情况。通常只要口头阐述就足够了。假如这真的不够,而你又怀疑单凭文字能不能正确讨论全部案例,那么你总是可以通过画博弈树检查自己的推理过程。
5 .时报的策略
1981年,罗纳德·里根初登总统宝座,广受欢迎。不过,他能不能实现自己的使命,让国会通过税收改革法案呢?在他提出第一份预算案的时候,战线就已经划分出来。民主党希望里根妥协,牺牲一部分税收改革法案,以换取一个较小的赤字。共和党则要求全面实行供方经济*。最后的结果取决于两党怎么进行这场博弈。
*促成有利于产品与服务生产者的条件的经济。——译者注
在参议院,民主党人附和里根的预算案,希望以此促成一些共和党人的妥协,使其支持自己的主张,从而达成两党合作。但共和党人并不领情,坚守原来的方案。现在,这一情形转移到众议院。民主党人有没有更好的策略呢?
《纽约时报》上两篇由伦纳德·西尔克撰写的专栏文章非常漂亮地说明了当时的策略可能性。[4]他在描述这些谈判的时候指出,两党各有两个选择,因此可能出现四种结果。以下我们再现了西尔克的博弈图表(如图5-6所示)。
图5-6民主党和共和党的结果排序
民主党人认为最佳结果是他们攻击里根的方案,而共和党人妥协,因为这样民主党人可以宣称自己已对预算尽心尽力,与此同时还能实施符合他们理想的预算案。而在共和党人这边,最佳结果出现在左上角,这种情况下,里根的预算案得到两党支持。假如民主党人发起进攻,而共和党人坚守原定方案,结果就会出现僵局,两党同时遭到失败。假如共和党人愿意妥协,那么民主党人也愿意缓和自己的进攻力度;两党都会得到各自的次佳结果。
民主党人的主要问题是:共和党人拥有一个优势策略——全力支持里根。假如民主党人大体支持里根,那么共和党人就应该全力支持里根,从而达成己方的最佳结果。假如民主党人攻击里根,共和党人就应该全力支持里根,以避免出现己方的最坏结果。不管民主党人怎么做,共和党人全力支持里根总能得到较好的结果。①
因此,共和党人的策略变得易于预测。民主党人应该料到共和党人会全力支持里根,而这时民主党人的最佳策略就是照办,即大体支持里根。而这正是参议院发生的事情。
到目前为止,结果仍然对共和党人有利。民主党人为了改善自身处境,必须实施某种策略行动。他们必须将整个局面转为相继出招的博弈,以抢占先机,让共和党人针对他们的策略做出回应。② 于是,我们就要考虑什么样的威胁、许诺或者其他行动可以扭转局面,使其有利于民主党人。
看上去没有一个基本策略帮得了民主党人的忙。无条件的行动、许诺乃至威胁统统不管用。只有同时实施威胁和许诺才能促使共和党人妥协。
① 此外,西尔克还指出,不管民主党人选择什么策略,全力支持里根的做法都会使共和党人处于一个比民主党人更有利的地位。在左上角的方格,共和党人的第一位置比民主党人的第三位置更有利,而在左下角的方格,共和党人的第三位置又比民主党人的第四位置更有利。因此共和党人总是压倒对方,处于上风。不过,正如我们在第2章讨论过的那样,博弈的每一个参与者应该尽可能使自己的地位达到最佳水平,不应理会最后谁将处于上风。对于优势策路的正确理解在于,一个策略比其他策略对你更有利,而不是这一策略会使你得到比对手更好的结果。博弈的参与者在考虑各自的相对地位时,这些问题应该永远包含在内,成为这个表格里列出的排名或者得失的一部分。
② 由于共和党人已经得到他们最理想的结果,他们也就没有什么办法可以继续加以改善自己的地位。他们的目标只不过是维持现状。阻止民主党人,不让他们实施任何可能改变这个博弈的结果的策略行动,这是符合共和党人利益的做法。
无条件行动的问题在于,它不能影响共和党人的地位。现在大家都认为民主党人应该支持里根。民主党人立下契约这么做并不能改变共和党人的预计,因此也只能得到同样的结果。惟一的策略可能性是民主党人无条件地攻击里根。若是这样,他们可以向前展望,推理得知共和党人的回应仍然是全力支持里根。(共和党人总是倾向于全力支持里根,这是他们的优势策略。)不过,假如民主党人发起攻击,共和党人全力支持里根,那么,民主党人得到的结果还比不上两党同时支持里根的结果。
民主党人想诱使共和党人从全力支持里根转向妥协。因此,他们也许可以许诺说假如共和党人妥协,他们就会支持里根。① 不过,这个许诺也帮不了他们。共和党人知道,假如他们完全不理会妥协这一选择,而是全力支持里根,那么民主党人的最佳回应就是支持里根。民主党人的许诺反而会换来他们最后无条件支持里根的结果。共和党人当然喜欢这个前景,并下定决心全力支持里根,力求得到他们的最佳结果。民主党人的许诺毫无意义。共和党人大可不必放在心上。
① 假如共和党人同意做这笔交易,民主党人就会有一个反悔的动机。因此,要想使这个许诺产生作用,其本身必须是不可逆转的。
民主党人只有一个威胁可以用来阻止共和党人支持里根。他们可以威胁说假如共和党人全力支持里根,他们就要攻击他。但这个威胁是不够的。这个威胁的效果是民主党人有了一个无条件的契约,就是攻击里根。假如共和党人支持里根,民主党人就会实践他们的威胁,攻击里根;假如共和党人妥协,从最有利于民主党人的角度来看,他们还是应该攻击里根。既然无论共和党人采取什么行动,民主党人还是要攻击里根,那么共和党人就应该支持里根,以取得两种可能性当中的最佳结果。
许诺最后变成民主党人无条件支持里根,而威胁则变成民主党人无条件攻击里根。两者都不能有效改变共和党人的行动。
假如民主党人同时运用许诺和威胁,他们就可以为自己赢得较好的结果。他们应该许诺说,假如共和党人妥协,他们就会支持里根;同时威胁说,假如共和党人全力支持里根,他们就会攻击他。这一策略可以达成民主党人的目标。一旦实施这一组威胁和许诺,共和党人必须选择是妥协,从而赢得民主党人大体支持里根,还是全力支持里根,结果激起民主党人攻击他。在这两个选择当中,他们更愿意妥协。
真实的情况是,共和党人在参议院和众议院都是全力支持里根。民主党参议员跟随共和党参议员而与其达成一致。在众议院,民主党人最初的抵抗很快让位给一个第三策略:他们在减税的博弈中比里根还要里根。结果达成了一个两党都同意的“圣诞树”大优惠式的减税法案。眼看这一经济法案就要到期,摆脱这一难题的谈判正在演变成为新的策略博弈。
6 .更多的策略行动
除了前面提到的三种基本的策略行动,还有更多更加复杂的选择。你不一定直接建立一个回应规则,相反,你可以故意让别人利用这些策略当中的一个。这些选择包括:
·你可以任由别人在你做出回应之前采取一个无条件行动。
·你可以等待别人发出一个威胁,然后再采取行动。
·你可以等待别人提出一个许诺,然后再采取行动。
有些时候,本来可以先行的一方放弃这一便利,让对方做出一个无条件的行动,反而能取得更好的结果,这样的例子我们已经探讨过了。若是在跟随比带头更好的关头,这么做当然是明智选择,比如我们前面讲过的美洲杯帆船赛以及剑桥学生舞会的故事。不过,虽然放弃先行之便可能更加有利,但这么做却并非一个基本规则。有时候你的目的可能是阻止你的对手作出一个无条件的承诺。中国古代战略家孙子曾经给过这样的提示:“围师遗阙” [5]。只要留下出口,敌人就会认定还有逃生机会。假如敌人看不到任何逃跑的出口,就会迸发破釜沉舟般的勇气,顽抗到底。孙子的目的就是不给敌人对自己作出一个拼死战斗的非常可信的承诺的机会。
让别人有机会对你发出一个威胁永远不是好事。你大可以选择按照对方的希望行动,却没有必要等到听见一个威胁。不错,你若不听话,别人就不会给你好果子吃,但这一事实并不能作为你坐等对方发出一个威胁的借口。注意,这句格言只限于允许对方发出威胁而已。假如对方同时作出威胁和许诺,那么双方都会得到更好的结果。
7 .杀鸡焉用牛刀?
显而易见,在你作出一个许诺的时候,你不应让自己的许诺超过必要的范围。假如这个许诺成功地影响了对方的行为,你就要准备实践自己的诺言。这件事做起来应该是代价越小越好,因此也意味着许诺的时候只要达到必要的最低限度就行了。
不那么容易看到的是,适度原则其实同样适用于威胁。你不应让自己的威胁超过必要的范围。这么做的理由相当微妙。
为什么美国不会威胁日本说,假如日本不同意进口更多的美国大米、牛肉和柑橘,美国就要动武呢?① 虽然动武的想法有可能博得美国一些农场主和政治家的欢心,但同时却存在几个很好的理由,说明不能这么做。
① 实际上,这么一个威胁曾在1853年使用过。美国海军上将马修·C·佩里(Matthew C.Perry)的黑漆漆的庞大战舰编队成功地说服了日本幕府时代的将军,使后者同意向美国商界开放日本市场。今天,日本把美国由于要求开放日本市场而施加的过分压力称为“黑色舰队再次到访”。
(1)没有人会相信这么一个威胁,因此这个威胁不会奏效。
(2)哪怕这个威胁真的管用,日本也不傻,一定会重新揣摩美国究竟是不是它的盟友。
(3)假如日本不肯进口更多柑橘,美国说到做到,当真实践自己的威胁,其他国家就会谴责美国选择了一个很不恰当的惩罚方式,日本更会怒不可遏。不过,假如美国不实践自己的威胁,又会让自己日后的信誉大打折扣。无论是不是实践自己的威胁,美国都将遭到失败。
(4)这个威胁由于引入了一个本来毫不相干的因素——武力——而使原来的问题变得模糊不清。
上述各点的核心在于,这个威胁大而不当,对方难以置信,而自己又不能说到做到,更别说进一步确立自己的信誉了。
博弈的参与者发出威胁的时候,首先考虑的问题可能恰恰相反,认为威胁必须足够大,大到足以阻吓或者强迫对方的地步。接下来要考虑的则是可信度,即能不能让对方相信,假如他不肯从命,一定逃脱不了已经明说的下场。若是在理想状况下,再没有别的需要考虑的相关因素了。假如受到威胁的参与者知道反抗的下场,并且感到害怕,他就会乖乖就范。那么,我们为什么还要担心若实践这个威胁,会有多么可怕的情况发生呢?
问题在于,在这个方面,我们永远不会遇到理想状况。只要我们仔细考察美国不能威胁动武的理由,我们就会看得更清楚,现实与理想状况究竟有什么区别。
首先,发出威胁的行动本身就可能代价不菲。国家、企业乃至个人都参加着许多不同的博弈,他们在一个博弈中的行动会对所有其他博弈产生影响。比如美国若是威胁对日本动武,就会影响到美国日后与日本的关系、目前和日后与其他国家的关系,而美国用过这么一个大而不当威胁的事情也会留在别人的记忆里。别人在和美国打交道时就会犹豫不决,美国则会失去许多其他贸易和伙伴关系带来的好处。
其次,一个大而不当的威胁即便当真实践了,也可能产生相反的作用。日本会惊慌失措地高举双手投降,请求世界舆论声援,谴责美国人民,从而将大大推迟有关谈判的进度;美国本来希望迫使它尽快开放国内市场,结果却适得其反。
第三,所谓一个成功的威胁完全不必实践的理论,只在我们绝对有把握不会发生不可预见的错误的前提下成立。假设美国错误地判断了日本农场主的势力,而他们宁可让国家投人战争也不愿失去自己受到保护的市场。又或者,假设日本同意美国的条件,可是美军某指挥官想起自己当初不幸沦为战俘的惨痛经历,咬牙切齿要进行报复,就会抓住这个机会贸然发动攻击。面对发生诸如此类错误的可能性,美国应该三思而后行,在考虑作出一个很大的威胁的时候更应如此。
最后,在讨论过以上几点后,我们可以看到,一个威胁可能由于过大而丧失可信度。假如日本不相信美国当真愿意实践这个威胁,这个威胁就不可能影响它的行动。
结论是,能奏效的最小而又最恰当的威胁应该成为美国的首要选择,务必使惩罚与罪行相适应。如果美国希望刺激日本多买柑橘,就应该选择一个更具互惠性质的威胁,使惩罚与不肯多买柑橘的做法更加匹配。比如,美国可以威胁说要削减日本汽车或者电器的进口配额。
有些时候,一个合适的威胁简直得来全不费工夫。而在其他时候,我们眼前只存在大而不当的威胁,必须缩小其范围才能考虑加以采纳。边缘政策可能是这类用于缩小范围的机制当中最管用的一个,我们会在第9章进行讨论。
8 .案例分析之五:波音、波音,完蛋了?
开发一种新型商用飞机简直可以说是一场豪赌。单是设计一个新引擎的成本就可能高达20亿美元。我们可以毫不夸张地说,开发一种新更好的飞机实际上等于“把公司作为赌注押上去”, [6]。难怪政府会被牵涉进去,竭力要为本国企业谋求更大的市场。
这里我们研究一下可以承载150位乘客的中程喷气式客机市场,这两种客机分别是波音727和空中客车320。波音首先开发出波音727。这时,空中客车闯入这个市场是不是明智呢?
这类客机的主要市场是美国及欧共体各成员国。我们假设,对于一个垄断企业,美国和欧共体市场各值9亿美元。假如出现两个企业发生正面竞争,总利润就会从9亿美元跌到6亿美元,且由两家平分。竞争虽然导致利润下跌了,却带来了更廉价的飞机和更便宜的机票,于是消费者得益不浅。两个市场的消费者分别得到7亿美元的好处。
空中客车公司估计,开发空中客车320的成本是10亿美元。假如它没有得到政府支持而独立实施这一开发计划,它将在美国和欧共体市场分别创造3亿美元利润,总值6亿美元,这还不够弥补开发的成本。
欧共体各国政府没有能力以提供补贴的方式直接支持这一计划,因为它们的预算早已承诺要用来补贴农民。在传统的“要大炮还是要黄油”的抉择面前,欧共体早就选择了要黄油,没给大炮或者空中客车留下什么位置。
现在,布鲁塞尔要召见你,就欧共体是不是应该通过建立一个受到保护的市场的方式支持空中客车的问题征询你的意见,其中保护的意思是要求欧洲航空公司购买空中客车320,不要购买波音727。你会怎么说呢?你预计美国政府又会怎样回应呢?
案例讨论
假如欧共体选择保护本土市场,而美国市场继续保持开放,空中客车就能作为欧洲市场的惟一垄断企业以及美国市场的双寡头垄断企业之一,分别在欧洲和美国赚到9亿美元和3亿美元。这就足以弥补10亿美元的开发成本。
这一政策是不是符合作为一个整体的欧共体的利益呢?我们必须同时比较空中客车之得与欧洲消费者之失。假如没有受到保护的市场,空中客车就不会实施开发计划,加入竞争。波音将在欧洲取得垄断地位。消费者不会得到什么好处。因此,消费者本身不会有什么损失。然而,欧共体作为一个整体,其经济得益与空中客车的利润是挂钩的。看起来,欧共体应该通过许诺造就一个受到保护的市场,支持空中客车投资开发新型客机。
欧共体承诺采取保护主义政策这一点非常重要。假设它还没有拿定主意,空中客车就进人这个市场。在这个当口,欧共体没有保护空中客车的动机。保持市场开放将使空中客车的预计利润减少6亿美元(从净赚2亿美元变成亏损4亿美元),但是,来自波音的竞争将使欧共体消费者的得益增加7亿美元。一旦意识到这一点,空中客车就不会进人这个市场,因为它没能得到欧共体各国政府的承诺,答应继续保护本土市场。
那么,美国方面又会怎样回应呢?假如美国人迅速采取措施,他们同样可以抢在空中客车开始生产之前承诺保护本国市场。现在就让我们向前展望,倒后推理。假如美国市场继续开放,情形就和前面讨论过的一样。波音被挡在欧洲市场之外,在美国又要与空中客车竞争,只能得到3亿美元利润。美国消费者则从竞争当中得益7亿美元。因此,对于美国经济而言,市场继续开放意味着总得益达到10 亿美元。
假设美国进行针锋相对的反击,同样要求美国航空公司购买波音727,而不能购买空中客车320。若是这样,即便空中客车在欧洲取得垄断地位,其利润9亿美元还是不够弥补开发的成本。因此,空中客车320也就永远不会开工制造。波音将在两个市场取得垄断地位,总利润达到18亿美元。这一经济得益远远高于市场继续开放时的数字。[7]
可见,美国可以通过采取针锋相对的保护主义措施,击败欧共体对空中客车的支持。这么做符合美国自身的利益。
第6章可信的承诺
大多数情况下,只有口头许诺是不能当真的。正如制片人萨姆·戈尔德温(Sam Goldwyn)形容的那样,“口头合同还比不上把它记录下来用的白纸值钱呢。”[l]在由戈尔德温的竞争对手华纳兄弟公司拍摄的影片《马耳他之鹰》(The Maltese Falcon)里,汉弗莱·博加特(HUrnphrey Bogart)扮演萨姆·斯佩德(Sam Spade) ,悉尼·格林斯特里特(Sydney Greenstreet)扮演古特曼(Gutman) ,其中有一幕同样生动地描绘了这一点。古特曼递给萨姆·斯佩德一个信封,里头装着10000美元。
斯佩德抬起头来,微微一笑。他平静地说:“我们原先说好的数目可比这多得多呢。”“是的,先生,”古德曼表示同意,“不过,那时我们只是说说而已。这可是货真价实的钞票,如假包换的银子。只要这样的1块钱,你就能买到比说说而已的10块钱更多的东西。[2]
这一教训可以一直追溯到托马斯·霍布斯*(Thomas Hobbes)的名言:“言语的束缚实在软弱无力,根本抑制不了人们(男人)的贪婪。”[3] 李尔王(King Lear)则发现,其实女人也一样。
*英国政治哲学家、机械唯物主义者。——译者注
对于所有策略行动,可信度都是一个问题。假如你的无条件行动、威胁或许诺只停留在口头上,而采取行动加以实践其实并不符合你的利益,你为什么要这么做呢?不过话说回来,别人可以向前展望、倒后推理,预测到你根本没有动机加以实践,那么你的策略行动就不会取得理想效果。
第5章描述的全部策略的根本目的在于,改变对手对你就他的行动可能做出什么回应的预计。假如他相信你不会实践你作出的威胁或许诺,这一目的就会落空。假如你不能影响他的预期,你就不能影响他的行动。
一项可能改变的行动在一个懂得策略思维的对手面前根本起不了任何策略作用。他知道你的言行未必一致,因而会特别警惕战术诈骗。
罗思柴尔德家族(the Rothschilds)在滑铁卢战役之后有过一个著名的表里不一的例子。据说罗思柴尔德家族懂得用信鸽报信,因此可以首先得知战役胜负的结果。当他们发现英国取胜,就马上公开抛售英国债券,好让其他人以为英国输了,纷纷仿效,抛售英国债券。结果导致英国政府债券价格直线下跌。不过,在大众得知真相之前,他们却悄悄地用跌到最低的价格购人了远比抛售数目更大的英国债券。①
① 关于这个故事里的信鸽通讯是不是后世杜撰的细节,还有一定争议。弗雷德里克·莫顿(Frederic Morton)在他的著作(罗思柴尔德家族》(The Rothschilds)中指出:" 1815年6月19日,傍晚时分,罗思柴尔德家族一位名叫罗思沃斯(Rothworth)的经纪人跳上奥斯坦德河的一条小船。他的手里握着一份还带着印刷机湿气的荷兰报纸。6月20日黎明,内森·罗思柴尔德(Nathan Rothschild)站在福克斯通港,以一目十行的速度飞快地浏览这份报纸。不一会儿他就起程直奔伦敦,比威灵顿(Wellington)的信使早到了好几个小时,并抢先向英国政府报告说拿破仑已被击溃。接下来他才去了伦敦股票交易市场。”
假如伦敦证券交易所的其他投资者早已认识到罗思柴尔德家族可能这样全盘扭转自己的行动,他们一定会料到这是战术诈骗,这一招也就不会奏效。一个保持清醒的策略头脑的对手应该预计你可能有意误导他,因此,对那些他认为专门做出来显得对他有利的行动也就不会为之所动。
建立策略意义上的可信度意味着你必须让别人相信你确实会实践你的无条件行动,你会信守许诺,也会实践你的威胁。你和罗思柴尔德家族不同,你没有办法可以愚弄大家。人们不会按照表面意思领会一个承诺的内容。你的承诺可能遭受检验。可信度需要努力争取。
可信度要求找到一个办法,有效阻止你反悔。假如没有明天,今天的承诺就不能反悔。临终证词之所以会被法庭高度重视,就是因为这样的证词没有反悔推翻的机会。更常见的情况却是,明天(以及后天)仍会来临,因此,我们必须彻底考察长期而言怎样才能使承诺可信的问题。“今天饱餐一顿,因为明天我们要绝食斋戒”,这是将明天可能失去的东西抢在今天享受的借口。
1 .建立可信度的八正道
要让你的策略行动显得很可信,其实并不容易,却也不是完全没有可能。我们在第5 章第一次提到这个问题的时候曾经说过,要想使一个策略行动显得很可信,你必须同时采取一个附加或从属的行动。我们把后一种行动称为承诺。
现在,我们提供八种手段,以助于建立可信的承诺。正如佛教开出的涅槃指示,建立可信度同样也有“八正道”。在不同情况下,这些手段中会有一种或多种能够证明对你是有帮助的。而在这套手段后面,有三个重要原则。
第一个原则是改变博弈的结果,意思是说,务必使遵守你的承诺成为符合你自身利益的选择:把威胁变成警告,把许诺变成保证。要做到这一点,有多种方法。
(1)建立和利用一种信誉。
(2)写下合同。
这两种手段都能使破坏承诺的代价高于遵守承诺的代价。
第二个原则是改变博弈,使你背弃承诺的能力大受限制。在这方面,我们考察三种可能性。最极端的做法莫过于剥夺自己反悔的机会,比如禁止自己走到反悔的地步,或断绝一切反悔的后路。甚至还有一种可能性,就是离开决策位置,听天由命。
(3)切断沟通。
(4)破釜沉舟。
(5)让后果超出你的控制。
以上两个原则合并起来就是:可能的行动及其结果都有可能改变。假如一个大的承诺被分割为许多小的承诺,那么,违背其中一个小的承诺的得益很可能并不足以抵消失去余下承诺的损失。因此我们说
(6)小步前进。
第三个原则是充分利用别人,帮助自己遵守承诺。一个团队也许会比单独一个人更容易建立可信度。又或者,你可以考虑雇用其他人来做你的代表。
(7)通过团队合作建立可信度。
(8)雇用谈判代理人。
信誉
假如你在博弈当中尝试了一个策略行动,然后反悔,你可能就会丧失可信度方面的信誉。若是遇到百年一遇、千载难逢的情况,信誉有可能显得不那么重要,因此也没有多大的承诺价值。不过,一般情况下,你都会在同一时间跟不同对手进行多个博弈。因此你就有建立信誉的动机,而这就相当于作出一个承诺,以使自己的策略行动显得可信。
1961年柏林危机期间,约翰·F·肯尼迪(John F·Kennedy)曾这样解释美国的信誉的重要性:
假如我们不能遵守我们对柏林的承诺,日后我们怎能有立足之地?假如我们不能言出必行,那么,我们在共同安全方面已经取得的成果,那些完全依赖于这些言语的成果,也就变得毫无意义。[4]
另一个例子是以色列的一贯原则:坚决不跟恐怖分子谈判。这是一个威胁,意在阻吓恐怖分子,打消他们企图劫持人质,以此索取赎金或者要求释放犯人的念头。假如这个决不谈判的威胁是可信的,那么,恐怖分子就会意识到他们的行动注定徒劳无功。与此同时,以色列的决心也会经受考验。每一次,一旦这个威胁必须实践,以色列总会吃苦头;拒绝妥协可能使以色列人质命丧黄泉。每一次只要遭遇恐怖分子,以色列的信誉和可信度就会面临考验。屈服一次的意义绝不仅仅是满足眼下这批恐怖分子的要求那么简单,还会给以后的恐怖行动增添诱人的魅力。①
① 甚至以色列本身态度强硬的信誉也会遭受损失。他们愿意释放3000名阿拉伯犯人以换取3名本国空军飞行员的做法已经暗示,例外情况确实有可能出现。
对于承诺而言,信誉的影响是一把双刃剑。有时候,破坏信誉可能为达成一个承诺铺设道路。破坏你的信誉这一行动会使你跟你自己达成一个承诺,决心以后不再采取任何在你预计当中并不符合自己最佳利益的行动。
要不要跟劫机者谈判的问题有助于说明这个观点。在任何具体劫机事件发生前,政府可以做出决定,通过威胁说决不谈判,对劫机行动进行阻吓。不过,劫机者预计到,一旦他们夺取飞机,政府就会发现它根本不可能坚守绝不谈判的立场。政府怎样才能剥夺自己跟劫机者谈判的能力呢?
一个答案是破坏其许诺的可信度。设想一下,在双方谈判达成协议后,政府却突然背弃自己的承诺,向劫机者发动攻击。这么做的结果是,政府对劫机者的处理方式值得信赖的信誉将会丧失殆尽。政府失去了作出一个可信的许诺的能力,同时不可逆转地断绝了自己对劫机者发出的威胁进行回应的后路。这种破坏许诺的可信度的做法将使决不谈判的威胁变得非常可信。
美国国会在税收特赦计划方面也遇到了类似的保持前后一致性的问题。这种计划允许以前欠缴税款者补足差额而不必支付罚金。表面看来,这是一个不费分毫即可增加国库收人的办法。那些想过要在报税单上做手脚的人都会乖乖地向政府补缴他们欠下的数目。不过,实际情况是,只有在国会用一种非常可信的方式告诉大家,再也不会有下次特赦,国会才能不费分毫地增加国库收人。但是,假如特赦真是一个如此好的主意,为什么不在几年后再试一次呢?什么也阻止不了国会会相当定期地提出一次特赦。于是问题就出来了:在报税单上做手脚的做法变得很有吸引力,因为日后你总有可能获得特赦。
国会必须找到一个办法,阻止自己反复使用这个特赦计划。在《华尔街日报》的一篇文章里,罗伯特·巴罗和艾伦·斯托克曼(Robert and Alan Stockman)提议说,政府不妨宣布进行一次税收特赦,然后反过来,起诉那些乖乖补缴税款的人。[5]这会比单纯实行一次特赦更能增加国库收人。一旦政府在自己的特赦计划里做手脚,下次政府再实行特赦计划的时候,还有谁会相信呢?政府通过破坏自己的可信度,可以作出一个非常可信的承诺,表明再也不会有下次特赦。
你大概会想,这是一个荒谬的主意,而且你的理由也很充足。首先,这么做不会对具有策略头脑的人起作用。他们可以预计到,政府一定会出尔反尔,所以他们根本不会上这个特赦计划的当。第二,也是更重要的一点,逮住在报税单上做手脚的人并不是惟一一场正在进行的博弈。对这些人出尔反尔可能得到的好处,并不足以抵消政府在其他领域丧失信誉带来的损失。
关于如何建立信誉最引人注目的例子之一是五月花家具公司(Mayflower Furniture Company)。在马萨诸塞州收费公路上有一个巨大的广告牌,该公司在上面自豪地宣称自己创建127年来从未有过减价促销活动。(他们是不是还在等待自己的第一个顾客?)这种无条件的每日低价承诺可吸引一批稳定的客流。举办一场减价促销活动可能暂时提高利润,但是,你要等127年才能再次做出那样富于吸引力的广告。明年,我们将等着上面的数字从127变成128。随着这一信誉越来越有价值,它本身就能维持自己永生不朽。①
① 遗憾的是,我们不得不告诉各位,五月花家具公司最近举办了一次减价促销活动,是清仓结业那种减价促销。
在上述这些例子里,:博弈参与者是怀着非常直接而有意识的目标来培植信誉的,他一心想为自己日后的无条件行动、威胁和许诺创造可信度。不过,信誉也有可能出自非策略的理由,却同样有助于树立可信度。从不食言的自豪感就是一个例子。托马斯· 霍布斯写道,对言语的约束可以通过两种途径得到强化:一是对食言后果的恐惧,二是不食言的荣耀或自豪。这样的自豪感通常借助教育或者一般社会影响灌输到一个人的价值观中。其中甚至包含改善我们多方面日常人际关系可信度的愿望。不过,没有人告诉过我们,之所以要为自己拥有正直荣耀而感到自豪,原因在于这将带来策略上的好处,使我们的威胁或许诺变得可信;人们只是告诉我们,荣耀本事就是一件好事。
一个有着举止疯狂名声的人可以成功地发出威胁,但若是换了一个头脑正常、沉着冷静的人,当他作出同样的威胁时,人们就会觉得难以置信。从这个意义上讲,明显的不合理性可以变成良好的策略上的合理性。你甚至可以有意培育这么一种名声。由此说来,一个看起来疯狂的人也有可能是一个超级策略家,因为他的威胁总是更容易就使别人信以为真。卡扎菲(Ghadafi)上校和霍梅尼(Ayatollah Khomeini)会不会真的比跟他们打交道的西方国家的冷静而理性的首脑更明白这一点呢?我们不知道。不过,我们愿意打赌说,你的孩子若是由于太缺乏理性而毫不俱怕你的威胁,那么,你的孩子会是一个比你更出色的天生的策略家。
合同
要使你的承诺显得可信,一个直截了当的办法就是同意在你不能遵守承诺的时候接受某种惩罚。假如负责重新装修你的厨房的工人事先得到一大笔订金,他就会有动机减慢工程进度。不过,一份具体说明了酬金与工程进度有关,同时附有延误工期的惩罚条款的合同能使他意识到,严格遵守商定的时间表才是最符合自己利益的决定。这份合同就是确保承诺得以遵守的手段。
实际情况并不会像这个例子这么简单。设想一名正在节食减肥的男子悬赏500美元,谁若是发现他吃高热量食品,谁就能得到这笔赏金。于是,以后只要这名男子想起一道甜品,他就可以轻易判断出这东西不值500美元。不要以为这个例子不可信而嗤之以鼻;实际上,一份类似的合同已经由尼克·拉索(Nick Russo)先生提出,惟一的区别在于赏金高达25000 美元而已。根据《华尔街日报》的报道:
于是,受够了各种减肥计划的罪的拉索先生决定将自己的问题公布于天下。除了继续坚持每天1000卡路里的食谱,他还会为任何一个发现他在餐厅吃饭的人士提供一笔赏金,高达25000美元,这笔钱将捐献给对方指定的慈善机构。他已经告知附近的饮食店……张贴了他自己的照片,上面注明“悬赏缉拿”。[6]
不过,这份合同有一个致命的缺陷:没有防止再谈判的机制。拉索先生眼瞅着精致的法式小甜饼,嘴上却会争辩说,按照目前合同的承诺,没有人可以得到25000美元赏金,因为他永远不会违反这份合同的规定。因此,这份合同也就一文不值了。再谈判符合双方的共同利益。比如,拉索先生可能说他愿意请客,支付一轮酒水费用,以此换取在座各位放他一马。在饭店吃饭的人一定愿意免费享用一杯饮料,这无论如何总比一无所获更好,因此也就乐意让他暂时丢开那份合同。[7]
为使合同方式奏效,负责强迫执行承诺或者收取罚金的一方必须具 备某种独立的动机完成自己的任务。在减肥的问题上,拉索先生的家人大概也希望他变得苗条一点,因此,他们不会为区区一杯免费饮料就动了心。
合同方式更加适用于商业交易。违反合同一般都会造成破坏,因此,受害方一定不愿意善罢甘休。比如,一个制造商就可能要求一个没能按时送货的供应商支付罚金。这个制造商不会对供应商究竟有没有送货漠不关心。他更愿意得到的是自己订购的货物,而不是罚金。在这种情况下,对这份合同进行再谈判将不再是双方都觉得有意思的选择。
假如供应商使出那个正在减肥的先生的理论,又会怎么样?假设他打算再谈判,理由是罚金数目实在太大,因此人人都会遵守这份合同,那么制造商也就永远得不到罚金。不过,这正是制造商希望看到的结果,因此他不会有兴趣进行再谈判。合同奏效了,因为制造商并不单单对罚金有兴趣;他在乎的是人们在合同里许诺的行动。
立下合同的时候,也有可能加人中立方,负责强迫各方遵照合同行事。中立方的身份在于,合同能不能得到遵守并不牵涉他的个人利益。为使中立方的强迫执行作用显得可信,必须要求他通过建立一种信誉影响,让大家知道他确实关心这项承诺是否得到遵守。在某些例子里,假如合同监管人任凭别人重写合同,他就可能丢了自己的饭碗。托马斯·谢林为如何实施这些想法提供了一个绝妙的例子。[8 ]在丹佛,一家康复中心治疗富有的可卡因瘾君子的办法是,让他们写一份自首书,假如他们不能通过随机尿检,这份自首书就会被公告天下。许多人在自愿陷人这样的境况之后都会反悔,想方设法要赎回这份合同。不过,假如监管这些合同的人让他们重写合同,就会被炒鱿鱼;进而,假如该中心不能及时炒掉这个同意瘾君子们重写合同的员工,它的信誉也会大打折扣。
这个故事的窝意在于,单有合同并不能解决可信度的问题。若想奏效,还需要另外一些可信度工具,比如雇用对强迫执行或者他人信誉面临考验间题具有独立兴趣的人士。实际上,假如信誉影响足够大,可能根本没必要正式签订一份合同。这就是“一言既出,驯马难追”的意义。①
① 另一方面,在大学教授中间曾经有过这么一个说法:“商人之间握一握手已经足够。不过,若是你的大学教务长许诺你什么东西,最好还是请他写下来。”
切断沟通
切断沟通之所以可以成为一种管用的确保承诺可信的工具,原因在于它可使一个行动真正变得不可逆转。这一做法的一个极端形式是一份最后的遗嘱或者证词中的条款。一旦这一方死亡,再也没有进行再谈判的机会。(举个例子,英国国会就不得不专门通过一个法案,才得以修改塞西尔·罗兹(CecilR Rhodes)的遗嘱,从而为女性成为罗兹奖学金获得者打开了大门。)一般而言,只要有心,总有办法使你的策略变得可信。
比如,多数大学都会为捐赠教席定出一个价码。现行价码大约是150万美元。这些价码不会刻在石头上公告天下(当然也没有用常春藤遮掩起来)。人人都知道,为了接受已经去世的捐赠人的条件和捐款,假如其并未达到目前的价码要求,大学就会修改自己的规矩。
我们没有必要通过死亡的方法使自己的承诺显得可信。不可逆转性其实就站在每个邮箱旁担任警戒。谁没有寄过一封信,然后又觉得后悔,想把它拿回来?反过来也一样:谁没有接过一封信,然后又觉得后侮,但愿自己从来没有接到过?不过,一旦你打开这封信,你就不能把信寄回去,假装自己从来没有读过。
在这种邮政做法普遍推行之前,实现承诺的一个成功的工具就是,在用支票付款的时候,选择没贴邮票也没写回信地址的信封寄出自己的支票。寄出一封没有回信地址的信本身就是一个不可逆转的承诺。邮局1 朋过去常常投递这类信件,收信人只要支付邮资就能收到这封信。公共设施公司或者电话公司知道,这么一封信很可能装了一张支票。他们宁可支付邮资,也不愿再等一个收费周期才收到付款(或者另一封没贴邮票也没有回信地址的信)。
这些公司的代付邮资问题终于在邮局修改自身政策之后得到解决。邮局宣布,没贴邮票的信件不再投给收信人;若有回信地址就退回发信人处,若没有回信地址就不再发送。这样,这些公司可以宣布不再接收任何没有贴足邮票的信件了。
不过,假如你在回信人和收信人处都写上该公司的地址,又会怎样?这么一来,邮局就知道应该把信退给谁了。记住,你不是第一个听说这个主意的人。而且,假如这个做法开始流传开,可以肯定的是,邮局的政策还会进行修改,以后没贴邮票的信件甚至不会退回发信人处。
将切断沟通用做一个确保承诺遵守的工具,其中存在一个严重的问题。假如你被单独囚禁,与外界隔绝,那么,你要想确定对手是不是真的按照你的愿望行事,就算还不至于完全没可能,也是非常不容易的。你必须雇用其他人,确保合同得到遵守。比如,遗嘱就是由受托人而不是死者本人负责执行的。父母立下的禁止吸烟的规矩虽然在父母外出的时候仍然可能具有毋庸置疑的地位,却也不能强迫执行。
破釜沉舟
军队通常借助断绝自己后路的做法而达成遵守承诺的目标。这个策略至少可以回溯到1066年,当时,征服者威廉(William)的侵略大军
烧毁了自己的船只,从而立下了一个许战不许退的无条件承诺。西班牙殖民者科尔特斯(Cortes)在征服墨西哥的时候沿用了同一策略。他刚刚抵达墨西哥的坎波拉(Cempoalla)就下令烧毁和捣毁自己的全部船153只,只留下一条船。虽然他的士兵面对着数目大大超过自己的敌人,但他们已经别无选择,只有战而胜之。“假如(科尔特斯)输了,那么他的做法很可能被视为疯狂…… 不过,这是深思熟虑的结果……在他的心里除了取胜就是灭亡,再也没有其他选择。”[9]
破坏自己的船只使科尔特斯得到两个有利之处:首先,他自己的士兵团结起来了,每一个人都知道他们全体都会战斗到底,因为他们已经没有可能中途放弃(甚至逃跑);其次,也是更重要的一点,这一承诺对敌人产生了影响。他们知道科尔特斯要么取胜,要么灭亡,而他们自己则有撤退到后方的选择。他们选择了撤退,而不是跟这么一个已经横下一条心的敌人较量。要使这类承诺产生预期效果,光有作战室里的策略家们达成一致还不够,你必须让(你的以及敌人的)士兵们都有透彻的了解。因此,这个例子当中特别有意思的一点在于,“捣毁舰队虽然是科尔特斯的提议,但士兵们不仅知道,而且表示支持”[10]。
这个破釜沉舟的想法显示了策略思维随着时间流逝而不断发展的历程。特洛伊人似乎早在希腊人乘船前往特洛伊抢夺海伦(Helen)的时候已经通过倒推法了解了这一策略。① 当时的情况是,希腊人企图征服特洛伊,而特洛伊人打算烧毁希腊人的船只。不过,假如特洛伊人当真成功地烧毁了希腊人的船只,他们大约只会使希腊人变成更加坚定不移的敌人。实际上,特洛伊人没能烧毁希腊船只,而是眼看着希腊人败退回家。当然了,希腊人留下了一匹木马作为礼物,这一次轮到特洛伊人在接受这份礼物的时候显得匆忙草率了一些。[ll]
① 虽然特洛伊人很可能通过倒推法了解了这一策略,但希腊人却走在了这场博弈的前面。谢林将希腊将军色诺芬(Xenophon)当做这种策略思维的一个早期例子。虽然色诺芬没有当真切断自己的退路,他却在自己的著作里提到了破釜沉舟的优势。参见Schelling 眼的“Strategic Analysis and Social Problems” ,收录在他的论文选集。Choice and Consequence(Cambridge,Mass.:Harvard University Press,1984)中。
到了现代,这一策略不仅用于海路攻击,还用于陆路攻击。多年以来,埃德温·兰德(Edwin Land)的宝丽来公司一直有意拒绝关闭自己的快速成像业务。随着该公司渐渐将自己的全部筹码押在快速成像技术之上,它等于给自己立下承诺,必须竭尽全力打击闯入这个市场的侵略者。
1976年4月20日,在宝丽来公司独霸快速成像市场长达28年之后,柯达公司闯了进来:它推出了一款新的快速成像胶片和相机。宝丽来的反应咄咄逼人:它起诉柯达,说它侵犯了自己的专利权。埃德温·兰德作为该公司的创办人和主席,已经做好准备,决心捍卫自己的领地:
这是我们全心全意投入的领域。这是我们的整个生命所在。而在他们看来,这只不过是另一个领域罢了…… 我们一定要坚守我们的阵地,保卫这个阵地。[12]
马克·吐温在《傻瓜威尔逊》(Pudd’nhead Wilson)这篇小说里解释了这一哲学:
听好了…… ,傻瓜会说:“不要把你的鸡蛋全放在一个篮子里。”但是,智者会说:“把你的鸡蛋全放在一个篮子里,同时切记
看好那个篮子。’, [l3]
快速成像市场的战争于1990年10月12日结束,当时法庭判决柯达向宝丽来赔偿9.094亿美元。① 柯达被迫从市场上收回自己的快速成像胶片和相机。虽然宝丽来重新夺回了快速成像市场的垄断地位,却面临便携式摄影机以及只要1小时就能冲印普通胶卷的微型实验室的竞争而不得不步步退让。早已破釜沉舟的宝丽来终于开始意识到,自己陷人了一个下沉的岛屿,却没有办法逃跑。该公司果断改变经营哲学,尝试多元化经营,开始涉足录像胶片甚至普通胶片市场。
① 宝丽来的股价实际上由于法庭宣布这一赔款数字而下跌,因为市场原本指望它能得到15亿美元赔偿。
人们没有必要按照字面意思当真烧毁桥梁或者连接各大洋的船只。人们可以通过采取一种可能惹恼某些选民的政治立场,从而象征性地切断自己的后路。沃尔特·蒙代尔在宣布接受民主党提名,成为该党1984年总统候选人的时候,曾经声称他一旦当选就会加税,这实际上就是立下了一个承诺。尽管信奉供方经济学的选民是无可挽回地失去了,却使蒙代尔的立场在那些支持加税减少赤字的选民看来更加可信。(对于蒙代尔来说)不幸的是,结果被惹恼的选民的数目实在太大了。
最后,建设而非烧毁桥梁也可能成为立下一个可信的承诺的办法。在1989年12月的东欧改革中,建桥意味着推倒隔离之墙。民主德国总理埃贡·克伦茨(Egon Krenz)面对大规模的示威抗议和移民潮,很想许诺改革,却又拿不出一个具体的计划。人民当然疑虑重重。凭什么他们应该相信改革的含糊许诺确实发自内心,并且影响深远?即便克伦茨真心支持改革,他也会失去人民的支持。拆除部分柏林墙有助于民主德国政府立下一个可信的立志改革的承诺,而不必提供什么具体细节。通过(重新)开放这一通向西方的桥梁,政府迫使自己一定要改革,否则就要冒人民大规模逃亡的风险。既然人们以后仍然可以逃亡国外,政府的改革许诺就会显得既可信,又值得等待。反正两德统一不到一年时间就要实现了。
让后果超出你的控制
在影片《奇爱博士》里,那台“末日毁灭机”是由埋藏在地下的巨大的原子弹组成的,一旦引爆就会释放巨量辐射,足以消灭地球上的所有生物。一旦苏联遭到入侵,这台机器就会自动引爆。当美国总统米尔顿·莫弗利(Milton* Muffley )询问这么一个自动引爆开关究竟有没有可能制造出来时,奇爱博士答道:“不仅有可能,而且不可缺少。”
这台机器是一个绝妙的阻吓手段,它会使一切入侵变成自杀。①本来,假如苏联遇到美国入侵,其总理迪米特里·基索夫(Dimitri Kissov) 很有可能犹豫,不愿意实施报复或者冒同归于尽的风险。只要苏联总理还有不作反应的自由,美国就有可能冒险发动进攻。现在有了这台“末日毁灭机”,苏联的反应将由这台机器自动做出,其阻吓的威胁也就变得可信了。
*影片中为Merkin,但原文如此。——译者注
①显然,赫鲁晓夫曾经打算使用这种策略,他威胁说苏联的导弹会在柏林发生武装冲突的时候自动发射。参见Tom Schelling的Arms and Influence, p.39。
不过,这一策略并非毫无代价。比如,很有可能发生一个小事故或者未经政府授权的小规模人侵,而苏联人其实也不愿实施报复,但他们毫无选择,因为采取行动的权力已经不在他们的手里。这也正是《奇爱博士》里发生的事情。
要想减小出错的后果,你一定希望找到一个刚好足够阻吓对手而又不会过火的威胁。假如行动不可分割,比如一场核爆炸,你该怎么办?你可以使你的威胁变得缓和一点,办法是创造一种风险,而不是一种确定性,表明可怕的事情有可能发生。这就是托马斯·谢林的边缘政策想法。在其著作《冲突策略》里,他有这样的解释:
边缘政策是…… 故意创造一种可以辨认的风险,一种人们不能完全控制的风险。这一策略在于有意将形势变得多少有点难以把握,其原因只是这种难以把握的形势在对方看来可能难以承受,因而被迫忍耐下来。这等于将敌人置于一个双方共担的风险之下对他进行干拢和威胁,又相当于是告诉他,假如他采取敌对行动,我们可能大为不安,以至于不管我们是不是愿意,我们都会越过边缘界线,采取行动与他同归于尽,从而对他进行阻吓。[l4]
运用边缘政策成了美国核阻吓政策的基础。冷战期间,美国没有必要保证在苏联入侵欧洲的时候实施核报复。哪怕爆发核战争的可能性只有那么一点点,比如10% ,已经足以阻吓苏联不要轻举妄动。10%的可能性意味着十分之一的威胁,结果是只要一个相当微小的承诺就能建立可信度。即便苏联人不相信美国一定会报复,他们却没办法确定美国是不是一定不会报复。苏联因进攻而启动一个愈演愈烈的循环,最终闹得不可收拾的可能性总是存在。
这一简短介绍并不足以解释边缘政策。为了更好地认识边缘政策后面隐含的可能的威胁这一概念,我们将先在第7章阐明混合策略的作用,而在接下来的第8章,则会给边缘政策留出应有的篇幅予以充分解释。
小步前进
信任对方有时候意味着要冒很大的风险,在这种情况下,双方未必愿意互相信任对方。不过,假如承诺的问题可以减小到一个足够小的范围,那么,可信度的问题就能自动解决。威胁或许诺可以分解为许多小问题,每一个问题可单独解决。
假如江洋大盗每次只要信任对方一点点,相互之间的信誉就能继续存在。考察下面两种情况的区别:一是一次性用100万美元向另一个人购买1公斤可卡因,二是做同样数量的买卖,但分为1000次进行交易,每次交易不超过1000美元价值的可卡因。前一种情况可能使你觉得,假如可以赚取100万美元,那么,艇而走险欺骗你的“同伴”也是值得的,但在后一种情况下,欺骗你的“同伴”只能得到区区1000美元,显然不足以弥补由此导致的破坏一种有利可图关系的损失。
若是大的承诺不可行,我们应该选择一个小的承诺,并经常重复使用。住宅的主人与承建商之间相互怀疑。房主担心提前付款只会换来对方偷工减料或者粗制滥造。而承建商则担心一旦工程竣工,房主可能拒绝付款。因此,承建商是在每天(或者每周)结束之际按照工程进度领取报酬。双方面临的最大损失不过是一天(或者一周)的劳动而已。
就像边缘政策一样,小步前进缩小了威胁或许诺的规模,相应地缩小了承诺的规模。只有一点需要特别小心:深谙策略思维者懂得瞻前顾后,他们最担心最后一步。假如你预计自己会在最后一轮遭到欺骗,你应该提前一轮中止这一关系。不过,这么一来,倒数第二轮就会变成最后一轮,你还是没法摆脱上当受骗的问题。要想避免信任瓦解,千万不能出现任何确定无疑的最后一轮。只要仍然存在继续合作的机会,欺骗就不可取。因此,假如有一个可疑的家伙对你说,这是他在退休之前的最后一笔交易,你可得打起十二万分精神。
团队合作
其他人常常可以帮助我们立下可信的承诺。虽然每个人在独立行事的时候都有可能显得弱不禁风,但是大家团结起来就可以形成坚定的意志。成功运用同伴压力而立下承诺的著名例子来自匿名戒酒组织(Alcoholics Anonymous,AA)(以及节食减肥中心)。AA采用的办法改变了反悔食言的后果。它建立了一个社会组织,谁要是反悔食言,荣誉和自尊就会付诸东流。
有时候,团队合作可以超出社会压力的范畴,通过运用一个强有力的策略,迫使我们遵守自己的许诺。考察一支行进中的军队的前锋部队,它遇到的问题是,假如其他人全都勇往直前,那么,某个士兵只要稍稍落后一点就能大大增加他保住小命的机会,同时又不会显著降低部队进攻得手的可能性。但是,假如每一个士兵都这么想,那么进攻就会变成撤退。
这样的事情当然不会发生。这是因为,士兵早就受过训练,要为祖国增光、对同胞忠诚,并且相信一个严重到足以将他遣送回家、不能继续参与行动,却又没有严重到永远不能复原的创伤才是千金难买的光荣。[l5]对于那些缺乏意志与勇气的士兵,可以通过惩罚临阵脱逃者来激发他们的斗志。假如临阵脱逃终将遭受惩罚,并且意味着是一种无耻的死亡,那么,选择勇往直前就会显得更具吸引力。可惜,士兵们没有兴趣杀死自己的同胞,哪怕对方临阵脱逃。假如士兵们已经觉得立下一个进攻敌人的承诺相当困难,他们又怎能立下一个可信的承诺,杀死临阵脱逃的同胞呢?
古罗马军队曾对进攻当中的落后者判处死刑。按照这个规定,军队排成直线向前推进的时候,任何士兵,只要发现自己身边的士兵开始落后,就要立即处死这个临阵脱逃者。为使这个规定显得可信,未能处死临阵脱逃者的士兵同样会被判处死刑。这么一来,哪怕一个士兵本来宁可向前冲锋陷阵,也不愿意回头捉拿一个临阵脱逃者,现在他也不得不那么做,否则就有可能赔上自己的性命。①
罗马军队这一策略的精神直到今天仍然存在于西点军校的荣誉准则之中。该校的考试无人监考,作弊属于重大过失,作弊者会被立即开除。不过,由于学生们不愿意“告发”自己的同学,学校规定,发现作弊而未能及时告发同样违反荣誉准则。这一违规行为同样会导致开除。一旦发现有人违反荣誉准则,学生们就会举报,因为他们不想由于自己保持缄默而成为同样违规的同伙。与此相仿,刑法也将未能举报罪行者作为罪犯同谋予以处罚。
受托谈判代理人
假如一名工人声称自己不能接受任何低于5%的工资涨幅,凭什么老板应该相信他一定不肯退让而接受4%的工资涨幅呢?摆在桌面上的银子完全可以引诱人们回头再作一次谈判。
如果这名工人有别人代为谈判,他的地位就会有所改善。工会领袖担任谈判者的时候,其地位可能不够灵活。他可能被迫坚守自己的许诺,否则就会失去工会会员的支持。这名工会领袖要么从其会员那里得到一份有条件的委托,要么公开宣布自己的强硬立场而使自己的声望面临考验。实际上,工会领袖变成了一个受托谈判代理人。他作为一个谈判者的权威建立在他的地位之上。有时候他根本无权妥协,批准合同的必须是工人们,而非这名工会领袖。有时候,这名工会领袖若是作出妥协,可能导致他下台走人。
① 假如临阵脱逃者得到授权,可以杀死那些站在他的身边却未能及时惩罚他的士兵,那么,惩罚临阵脱逃者的动机就会变得更加强烈。这么一来,假如一个士兵未能及时杀死一名临阵脱逃者,就有两个人有权对他实施惩罚:站在他身边的士兵以及临阵脱逃者,后者可以通过惩罚未能惩罚自己的士兵捡回一条小命。
在实践中,我们不仅关注承诺实现后的结果,同样关注其实现方法。假如一名工会领袖自愿用其声望换取某种地位,你应不应该(会不会)把他的这种屈辱行为当做受到外界压力而不得已为之的行为对待呢?将自己绑在铁轨上企图阻止列车前进的人,他能得到的同情可能比不上并非出于自愿而被别人绑在铁轨上的人得到的同情。
第二种受托谈判代理人是机器。没有多少人会跟一台自动售货机讨论价格问题;讨价还价成功者更是寥寥无几。①
① 据美国国防部统计,过去5 年中有7名军人或军人家属由于摇晃自动售货机,希望它吐出饮料或硬币,结果被倒塌下来的自动售货机砸死,另有39人由于同样的行为而受伤。——The International Herald Tribune,June 15,1988。
这就结束了我们关于建立成功承诺的八种方法的讨论。在实践中,任何特殊情况都有可能需要不止一种方法。以下是两个例子。
2 .只有一次生命可以献给你的祖国
怎样才能使敌人相信,你的士兵一旦听到召唤就会毫不犹豫地为祖国献身?假如战场上的每一个士兵都会对献身之举的得失进行一番理性的考虑,那么,世界上大多数军队早就完蛋了。我们必须找到其他办法,其中包括上面说过的许多例子中的办法。我们已经提到破釜沉舟的策略,以及在阻止临阵脱逃行为的过程里惩罚与团队合作所起的作用。现在我们集中讨论激励单个士兵的办法。
这个过程从新兵训练营开始。世界各地的武装部队的基本训练其实都是一次伤痕累累的历程。新兵遭到虐待、羞辱,同时面临巨大的体力与精神压力,这些压力如此巨大,以至于要不了几个星期,他的个性就会发生改变。在这一历程当中学会的一个重要习惯是自动自觉而不问是非地服从。为什么袜子必须叠好或者床铺必须整理,而且要按照一个特定方式完成,完全没有理由可言,惟一理由就是军官下了这样的命令。这么做的目的是,将来听到更加重要的命令时,士兵也会照样服从。一旦训练出不问是非的士兵,这支军队就会变成一台战斗机器;承诺就会自动形成。
这么一来,每一个士兵似乎都缺乏理性的表面现象就能会聚成一种策略的理性。莎士比亚深明此道。在阿金库尔(Agincourt)战役打响的前夜,亨利五世(Henry V)这样祈祷:
噢,战神!请让我的士兵之心坚硬如钢;
使他们不再恐惧;现在就拿走他们
思量的本领,假如敌人的数量
使他们心惊胆战… … (斜体为笔者所加)
接下来是将自豪感灌输到每一个士兵的头脑中去:为祖国自豪,为当兵而自豪,还有,可能是最重要的一点,为自己所在部队的传统而自豪。美国海军陆战队、英国军队的著名军团以及法国外籍军团就是这一做法的范例。部队在过去的重大战役中做出的重大贡献代代相传;英勇献身的事迹人人传颂。部队之所以不断重复自己的历史,目的就是让新兵对这一传统产生一种自豪感,下定决心在相似的重要关头无所畏惧,勇往直前。
部队指挥官同样需要对他的士兵有一种更加个人化的自豪感。按照莎士比亚的说法,亨利五世在哈佛洛尔(Harfleur)这样激励他的部队:“不要让你们的母亲蒙羞;现在就向你们称为父亲的人证明他没有白生了你。”自豪感通常是一种精英主义情感;它表现为从事大多数人做不到的事情或拥有大多数人不具备的东西。这么一来,我们再次听见亨利五世在阿金库尔战役爆发之前对他的部队发表讲话:
我们虽然人数很少,却是快乐的少数,我们情同手足;
因为今天跟我一起浴血奋战者
就是我的兄弟… …
此刻躺在床上的英格兰绅士们
会感到自己受到诅咒,所以不能赶到这里
而且他们也会感到英雄气短,一旦听见别人说起
在圣克里斯平(Saint Crispin)的日子与我们并肩作战。
要实现承诺还可以把团队合作、签订合同以及破釜沉舟的方法混合起来运用。让我们再次回到莎士比亚笔下的亨利五世在阿金库尔战役爆发之前的讲话:
那些无心打仗者,
请他离开;他的通行证应该签发,
连同其护送的王冠,一起放进他的背包;
我们不会在他的陪伴下死去
他却要担心他的情谊随我们而亡。
当然,没有人愿意公开接受这一临阵豁免的提议,因为这么做实在太丢人了。不过,即便如此,这些士兵通过拒绝这一提议,在心理上已经破釜沉舟,切断了回家的退路。他们已经签订了一份毫无疑问的合同,宣布谁也不能苟且偷生。亨利五世非常清楚应该怎样激励他的部队以及怎样将他们投入到战役中去,而他的远见卓识换来了战场上的胜利,虽然当时他的士兵数量远远少于敌人的数量。
3 .你难以拒绝的提议
我们听见“一个你难以拒绝的提议”的机会不仅仅限于影片《教父》中。只要稍作变化,我们就会发现,这种机会经常出现,其出现的频率令人吃惊。
我们的朋友拉里(Larry)参加过一次求职面试。整个过程看上去相当成功。接近尾声的时候,他听见对方问道,在他打算求职的公司当中,这一家排在第几位。在回答之前,他被告知该公司只录取将其排在第一位的求职者。假如该公司是他的第一选择,该公司人员希望他在得到该公司安排的某个职位之前就答应接受这个职位。① 遇到这么一个“你难以拒绝的提议”(这是因为,假如你拒绝,他们就不会给你安排一个职位),拉里应该怎么办?
① 对于初级职位,各大公司确定的起薪标准其实非常接近。因此,他可以在公司提出一个职位之前预计自己将会得到什么。
借助博弈论如X射线一般精准的洞察力,我们可以窥破个中奥妙。该公司宣称它只会雇用那些将它排在第一位的求职者。不过,这一压力策略产生的效果与其宣称的说法恰恰相反。假如该公司真的想雇用将它排在第一位的求职者,那么,它就不应该把能不能给予一个职位与求职者将它排在第几位挂起钩来。假如在一场面试结束之际,该公司确实成为拉里的首选,那么它就可以指望拉里会接受它安排的职位。没有一家公司需要担心一个最想在它那里工作的求职者会拒绝它安排的职位。另一方面,假如该公司是拉里的第二选择,但拉里的首选公司尚未提供任何职位,那么,他大约还是会愿意接受第二选择的公司提供的职位,以免最后一无所获。假如该公司声称自己只会雇用那些首先接受它安排的职位的求职者,其效果等同于雇用那些实际上没有把它排在第一位的求职者。
更加符合实际的情况以及该公司的真实意思是:“我们希望你可以为我们工作。假如你把我们排在第一位,我们知道我们一定可以得到你。不过,假如你把我们排在第二位,我们就可能失去你。为了在你没把我们当成首选的情况下也能得到你,我们希望你预先同意接受我们的职位提议,否则你什么也得不到。”认识到了这一点,我们就会发现,这不像是一个可信的威胁。该公司如此希望雇用拉里,以至于不论拉里把它排在第几位,它也要得到他。与此同时,它却宣称,若是拉里拒绝预先接受它安排的职位而只愿以后再接受这个职位,它就不会再给他职位。这种情况是可能的,却不大会发生。
我们的朋友拉里解释说,他刚刚开始找工作,手头资料太少,没法排出一个先后次序。该公司人员提醒他说,除非他预先接受这个职位,否则他们不会给他安排任何职位。面试是在星期三进行的,他走的时候没有得到任何职位。星期五,他从他的电话录音里得到了一个职位。到了下星期一,又来了一个口信,重申了这个职位。星期三,来了一封电报,其中还提到只要签约就能得到一笔奖金。面对一个你很想雇用的人,你想立下一个可信的承诺,说你不会给他安排一个职位,其实是很困难的。
该公司若想使其威胁变得更加可信,应该怎样做?这里,团队合作大有帮助,不过我们说的不是通常意义上的团队合作。假如存在几个有权决定雇用与否的人,那么,你若是没能立即接受他们提出的职位,原来同意选你的联盟就有可能破裂,转而青睐另一个求职者。正如我们将在关于投票的第10章看到的那样,候选人的先后次序可能影响最终决定。这么一来,一个委员会的决定就有很大的偶然性,因为它不能许诺,若是条件相同,得出的结果也会一样。正是委员会不能确保自己“理性”决策的事实,使这个“接受或者放弃”的威胁显得可信。
一个现在有效而将来未必继续有效的提议,可以阻止人们在买东西的时候到处比较。立体声音响商店和汽车经纪人用这一策略取得了很好的效果。不过,这些销售员怎样才能使自己的威胁,即一定会在明天拒绝一个他们今天愿意接受的价码变得可信呢?答案在于销售量可能上升,现金流的问题可能缓解。就像他们喜欢挂在嘴边的,这是千载难逢的好机会。
4 .案例分析之六:你会不会宁可向IBM 租一台电脑?
经过一场超过12年的漫长战斗,美国政府对IBM一案成了反托拉斯法一颗拔不掉的眼中钉。其中一个议题是围绕IBM出租而非出售其大型计算机的政策展开的。
美国政府认为,IBM把重心放在短期租赁的做法设置了一道进入屏障,使其独享了垄断的好处。IBM辩解说这一做法完全是为消费者利益着想。它认为,签订一份短期租赁合同后,消费者就不必担心自己使用的机器可能过时,从而享有灵活性,并且可以在有需要的时候改变合同,同时还可在合同中规定由IBM负责保养出租的机器(因为它负责确保出租的机器正常运转),而这家财力雄厚的公司还提供贷款融资服务。[16]
许多人认为这番辩护相当令人信服。不过,租赁做法还有一个策略优势,双方似乎都没有注意到。假如IBM对其大型计算机只是出售而绝不出租,你认为大型计算机的价格会有怎样的变化?
案例讨论
即便是一个没有外部对手的公司,也不得不担心怎样跟以后的自己竞争。每次推出一款新的计算机,IBM都能以非常高的价格把首批产品卖给那些迫不及待想尝试最新技术成果的消费者。一旦这款计算机的大批量生产可行,就会出现一种诱惑,促使公司降价,从而吸引更多消费者。生产这款计算机的主要成本在开发阶段已经发生了,此后每多卖一台,其所得基本上就是利润。
这里有一个问题:假如消费者估计IBM差不多要降价了,他们就会稍等一下再购买。一旦大多数消费者都在观望,IBM就有动机加速减价进程,希望早日俘获消费者。这个想法首先是由芝加哥大学法学教授罗纳德·科斯(Ronald Coase)提出的。他认为,对于耐用产品,一个垄断者实际上是在跟以后的自己竞争,从而使市场变得富有竞争性。[l7]
租赁做法作为一个承诺机制,使IBM得以维持较高的价格。租赁合同使IBM的降价成本大大增加。一旦它的机器短期出租,任何一次降价就都要告知全体消费者,而不仅仅限于那些尚未购买其机器的消费者。从现有消费者群体损失的收入,可能超过新的租赁合同带来的收入。相反,假如现有消费者群体拥有IBM的机器,这个结果就不会出现,因为已经花大价钱买下这台机器的消费者不会得到现金返还。
这么一来,租赁做法变成一个小步前进的例子。前进的步幅等于租赁时间。租赁时间越短,步幅也越短。假如步幅太大,消费者就不相信IBM会把价格维持在较高水平;他们会等待降价,等一段时间就能以较低价格购买同样的机器。不过,假如IBM只在短期可续约租赁合同的基础上出租它的机器,它就能以相当可信的方式将价格维持在较高的水平,这时,消费者没有理由观望,IBM就能赚取较高的利润。
作为大学教授和作者,我们在教科书市场上也遇到了同样的问题。假如承诺有可能存在,出版商一定会通过每五年推出一部新版教科书的方式提高利润,而不是沿用现在通行的三年周期。周期越长,这部教科书在二手教科书市场上的价值就越高,相应地,新版推出之际学生的购买积极性也会越高。问题在于,一旦出现二手教科书,出版商就有很强的动机想通过推出新版削弱二手教科书的竞争。由于人人都知道这样的事情一定会发生,因此,学生们可以用较低的价格买到二手教科书,因而也就不那么愿意花钱购买新版了。出版商的解决办法与IBM的解决办法一样:应该出租教科书,而不是出售教科书。
第7章不可预测性
1986年的全国棒球联赛冠军争夺战在纽约大都会队与休斯敦星象队之间展开,依靠击球手莱恩·戴克斯特拉(Len Dykstra)在第九局面对投手戴夫·史密斯(Dave Smith)的第二投击出的一个本垒打,纽约大都会队赢得了关键的一仗。赛后,两位球员都被问到究竟发生了什么事。[1]戴克斯特拉说:“他在第一投投了一个快球,我击球出界。当时我有一种奇怪的想法,觉得他接下来会投一个下坠球*,他确实那样做了。这个球的路线我看得非常准确,我的出手也非常准确。”而史密斯的说法则是:“只能归结为一点,即这是一个糟糕的投球选择。”换言之,他也认为戴克斯特拉可能猜到,因为第一投是一个快球,接下来史密斯可能改变投球速度。“如果我再投一次会怎么样?当然是(又)一个快球。”
*用中指与无名指夹住而投出的球,通常会在飞行过程中急速下坠。——译者注
假如日后出现同样的情形,史密斯是不是应该采取再投一个快球的策略呢?当然不是。击球手可以看穿史密斯这一层次的思考方式,早就等着迎接一个快球。这个时候,史密斯应该转向另一个层次的思考方式,投出一个下坠球。击球手可以看穿并利用投手的一切有规则的思考与行动方式,反过来也一样。对双方而言,惟一合理的行动方针是力求做到不可预测。①
遇到这些情况,策略思维的一个经典错误在于,认为只要将自己摆在对手的位置,就能预测对手的行动。在戴维·哈伯斯塔姆(David Halberstam)的著作《1949年夏天》(The Summer of' 49)里,当作者描述17岁的特德· 威廉斯(Ted Williams)初次体会策略思维的重要意义的时候,我们就看到这样的错误。[2]
和其他许多年轻球员一样,威廉斯也对变化球感到一筹莫展。他一直应付不来。有一次,一名投手用一个曲线球使他出局。威廉斯对自己的表现极为恼火,一路小跑回到外场休息区自己的座位上。圣迭戈的一名投手曾是大联盟球员,他向威廉斯大喊了一声:“嘿,小伙子,他究竟是怎么把你打出去的?" “一个该死的慢曲线球。”威廉斯答道。“你能不能击中他的快球?”投手问。“没问题。”威廉斯答道。“你觉得下一次他会怎样对付你?”投手问。出现了一个短暂的沉默。特德·威廉斯从没想过应该怎样对付他自己——那是投手们思考的问题。“一个曲线球。”他答道。“嘿,小伙子,”投手说,“为什么你不回到场边等待下一次机会呢?”威廉斯照办了,结果击出了一个漂亮的本垒打。由此展开了一项针对投手思维的长达25年的研究。
显然,这个投手没有认识到不可预测的必要性,当然,威廉斯也没有认识到,这是因为,假如威廉斯想过应该怎样向自己投球,他就不会在他意识到自己早有准备的时候仍然投出一个曲线球!本章将阐述在双方都想压倒对方的时候会出现什么情况。即便你的猜测不能始终正确,至少也可以看出其中的概率。
① 要想做到不可预测,投手必须随机选择一系列精确的投球。他不能投出不精确的球。一个不精确的投手当然不可预测,因为他自己都不晓得球会飞向何处。若是缺少精确性,投手就没办法决定什么时候应该投什么类型的球,以及不同类型的球应该保持怎样的相对频率。精确而不可预测的投球的一个绝妙例子是不旋转球。由于这种球几乎不会旋转,球面上的缝合线会在空中飞行过程中引发相当突然的路线变化,结果没有人可以很有把握地预测它的落点。不过,话又说回来,没有几个投手可以投出好的不旋转球。
正确估计并回应不可预测性不仅在棒球场上非常有用,在其他领域也是一样。只要一方喜欢准确地预料将发生的事情,而另一方却竭力避免被预测,不可预测性就会变成策略的一个关键因素。美国国税局想要审查那些逃税者,而逃税者竭力想避免遭到审查。在孩子们中间,大孩子通常不喜欢小孩子当自己的“跟屁虫”,小孩子却喜欢跟在大孩子后面。入侵的军队想方设法企图选出一个绝妙的攻击点,发动一场出其不意的袭击,守军则想方设法企图确定进攻发生的地点,并在那里布下重兵,严阵以待。
在夜总会、饭店、服装和艺术方面的引领时尚者希望保持与众不同的地位,普通大众却期盼能跟他们呆在一起。最终,所谓“人时”的场所会被发现。不过,到了那时,明星们早就有了新的聚会处。这有助于解释夜总会的生命周期为什么这样短暂。一家夜总会一旦取得成功,就会引来无数好奇的捧场客。这会把引领时尚者赶跑,使他们不得不另找一个新的消遣去处。正如约吉·贝拉*(Yogi Berra)所说:“那地方实在太挤了,谁也不想去。”
*美国著名棒球选手兼球队经理。——译者注
尽管棒球投手的投球选择或者国税局确定谁该接受审核也许不可预测,却还是有一些规则可以指导这类选择。一定数量的不可预测性不应该完全听天由命。实际上,选择投这种球而非那种球的概率,或者选择这人而非那人进行审核的概率,可以通过整个博弈的细节精确地确定下来。“虽然这实在疯狂,却也不是毫无办法。”下面我们就来解释这个办法。
1 .怎样使输赢机会相等?
你们当中有许多人一定还记得小学时玩过的一个游戏,叫做“一、二、三射击”或者“手指配对”。在这个比赛中,其中一个选手选择“偶数”,另外一个选手则得到“奇数”。数到三的时候,两个选手必须同时伸出一个或者两个手指。假如手指的总数是偶数,就算“偶数”选手赢;假如手指的总数是奇数,就算“奇数”选手赢。假设输者给赢者1美元。我们可以通过计算得出与策略选择相关的输赢图表(如图7-1 所示)。
图7-1 偶数者和奇数者的得益
假如两位选手的行动不是随机的,这个博弈就没有均衡点。设想一下,假如“奇数”选手一定出一个指头,“偶数”选手就一定会用一个指头奉陪到底。现在,逻辑开始逆转。既然“奇数”选手确信他的对手一定会出一个指头,他就会改出两个指头。这将使“偶数”选手转而报以两个指头。这么一来,“奇数”选手就会出一个指头。于是我们又回到了开始的地方,这种循环推理看来简直是没完没了。
检验随机性是不是必要的一个简单办法,是考察让对手在出招之前看到你的行动究竟有没有害处。假如随机性必不可少,先行者就会处于不利地位。设想一下,在“一、二、三射击”的游戏里,你若是先行会出现什么情况?你将永远是输家。
并非任何随机性都会奏效。假设“奇数”选手有75%的时间选择出一个指头,另外25%的时间选择出两个指头。那么,“偶数”选手若是一直选择出一个指头,就能在75%的时间取胜,平均每场游戏赢得0.75xl+0.25x(-1)=0.50 美元。类似地,“偶数”选手若是选择出两个指头,平均每场游戏就会输掉0.50 美元。因此,“偶数”选手会选择一直出一个指头。不过,“奇数”选手应该选择出两个指头,而不是前面提到的75:25 的混合策略。在双方不断揣摩对方策略的连续多轮的较量中,这种混合策略将会一败涂地。
换言之,随机性存在一种均衡模式,必须加以计算。在这个例子中,整个局面是如此对称,以至于各个选手的均衡混合策略应该都是50:50 。我们这就验证一下:假如“奇数”选手出一个指头和两个指头的机会是各一半,那么,“偶数”选手无论选择出一个还是两个指头,平均每场游戏将会赢得0.50xl+0.50x(-1)=0美元。因此,假如他的策略也是50:50,那么他的平均所得就是0美元。同样的证明反过来也适用。因此,两个50:50混合策略对彼此都是最佳选择,它们合起来就是一个均衡。这一解决方案的名称叫做“混合策略”均衡,反映了个人随机混合自己的策略的必要性。
若是换了其他更一般的情况,这个均衡混合的对称性就不会显得如此明显,但仍有一些简单规则可以用来计算。我们以网球比赛为例子说明这些规则。
2 .有人要打网球吗?
网球的首要策略教训之一,就是不到最后一瞬不要选定一个方向。否则,对手可以利用对你的猜测,将球击向另一方。不过,哪怕你看不出对手的移动,预测一下也是大有好处的。假如发球者总是瞄准接球者的反手,接球者就会早有准备,开始向那个方向移动,从而可以更好地将球打回去。因此,发球者应该努力使自己的发球变得不可预测,不让接球者准确预计他的目标。相反,接球者启动的时候不能完全倾向于奔向这一方或者那一方。与手指配对游戏不同,网球选手不应该将不可预测性等同为输赢机会相等。参与者可以通过系统地偏向一边而改善自己的表现,只不过这样做的时候应该确保对方不能预见。
为了具体阐述这个问题,我们设想有这么一对具备特殊技巧的网球选手。接球者的正手稍微强一些。假如他的预计正确,他的正手回球有90%的机会获得成功,而反手回球的成功率只有60%。当然,假如他跑向一方而对方发出的球飞向另一方,那么,回球的质量就会大打折扣:假如他跑向反手一方,而对方发出的球飞向他的正手一方,他能及时转向而成功回球的概率只有30% ;反过来,他的成功率只有20%。我们可以用图7-2 显示上述情况。
发球者一心要使对方回球成功的概率越低越好;接球者的目标恰恰相反。比赛开始前,两位选手要选择自己的作战计划。他们各自的最佳策略是什么?
假如发球者永远瞄准对手的正手,接球者就会预计到球会朝自己的正手而来,从而有90%的概率回球成功。假如发球者永远瞄准对手的反手,接球者也能预计到球会朝自己的反手而来,从而有60%的概率回球成功。
图7-2 接球者成功回球的概率
发球者只有打乱自己的瞄准目标才能降低接球者回球成功的概率。这么一来,他会让接球者永远处于猜测之中,也就没有办法尽享准确预测的优势了。
假设发球者在每次发球前都会在自己的脑子里投掷一枚假想的硬币,根据硬币出现正面或者反面决定自己的发球应该瞄准对手的正手还是反手。现在我们考察接球者若是向正手方移动会出现什么情况。这一猜测准确的概率只有50%。猜测准确的时候,正手回球的成功概率是90% ;而猜测出错的时候,接球者及时转向而成功回球的概率只有20%。因此,他的整体成功概率是1/2*90% +1/2*20%=55 %。通过类似的计算可以知道,若是向反手方移动,他的整体成功概率是1/2*60%+1/2*30%=45%。
在发球者采取50:50 混合策略的前提下,接球者若是从自己的角度出发,就能选出最佳回应策略。他应该向正手方向移动,这么做,成功回球的概率达到55%。而在发球者看来,这个成绩与他永远将球发向一方得到的结果相比已经有所改善。对比一下,假如发球者永远将球发向一方,分别是接球者的正手方和反手方,那么,接球者的成功回球概率分别为90%和60%。
另一个显而易见的问题是,发球者的最佳混合策略是什么?要回答这个间题,我们可将不同的混合策略的结果列成一个图表(如图7 -3所示)。发球者瞄准对方正手方向的概率是一条从O 到100%的水平线。对于所有这些混合策略,图中有两条线,一条显示接球者准备向正手方移动的成功回球概率,另一条则显示他准备向反手方移动的成功回球概率。举个例子:假如接球者准备向正手方移动,概率为0的向正手发球的策略(即100%地向反手发球的策略)就能使接球者的成功回球概率维持在20%的低水平,而100%地向正手发球的策略则会使接球者的成功回球概率达到90%。接球者的成功回球概率从一端直线上升到另一端。
图7-3
两条直线交于一点,在这一点上发球者只有40%的时间将球发向对方正手方。在交点的左边,接球者若是预计对方会将球发向反手方,那么他的成功回球概率就会提高;而在右边,他若是预计对方会将球发向正手方,成功回球概率也会提高。①
① 注意,一旦发球者选择向接球者正手方向发球的概率超过40% (不是50% ) ,接球者如果将赌注押在正手方向,就能取得更好的成绩。哪怕发球者选择向接球者反手方向发球的概率还是较大,但他向两个方向发球的技巧却不相等。
向正手和向反手发球维持在40:60的混合策略,是惟一一个不会让接球者用上述方法占便宜的选择。只有选择这种混合策略,接球者无论选择防守正手还是反手,其成功回球概率都是一样的。两种情况都会留给接球者48%的成功回球概率。发球者若是采取其他任何一种混合策略,只要接球者善加利用,就能使自己的成功回球概率沿着图中的两条直线上升到交点之上,也就是超过48%。因此,40%的时间瞄准对方的正手就是发球者的最佳策略。
混合策略的确切比例是由基本行动配对而成的4种情况确定的。对于拥有不同的绝对优势和相对优势的选手,这里的数字90、60、30 和20会相应发生变化,而他们的最佳混合策略也会随之不同。我们很快就会发现,这样一些变化可能导致一些令人惊讶的结果。这里的关键在于,你必须通过估计你真正参加的博弈的4种基本情况,确定自己的最佳混合策略。
这里有一条捷径,使你不必画出前面提到的图表也可以计算出均衡策略。这个简单的算术方法归功于J.D.威廉斯。[3]回到基本情况的表格。对于发球者,如果选择瞄准对方正手的策略,就要观察对方选择两种不同的回应方式之一会使结果发生什么变化;我们得到90-30=60 。假设他瞄准对方反手发球,再做同样的计算,可得60-20=40 。将上述数字倒过来排列,就能得到最佳混合策略中采用这两种策略的概率。① 因此,发球者应该按照40:60的比例瞄准对方的正手和反手。
现在我们改从接球者的角度考察同一场比赛。图7-4显示了他的不同选择会有什么不同的结果。假如发球者瞄准他的反手,那么,他回
① 我们可以用一点代数知识验证这个结果。假如纵列选手的得失情况如下图所示,左列对右列的均衡比例为(D-B):( A-C)。纵列选手选择左列的概率是p,那么,无论横行选手选择上或者下都没有关系;pA+(1-p)B=pC十1-P)D 意味着p /( 1-p )=(D-B )/(A-C) ,如前所述。由于横行选手的得失是纵列选手的得失的负数,他的均衡混合策略就是上行对下行,即(D-C):(A-B)。
球的时候向反手方移动就能得到60%的成功回球概率,而向正手方移动的成功回球概率只有20%。从O到100%改变向正手方移动的概率,就得到一条和上述两点相交的直线。与前面的分析类似,若是发球者瞄准对手的正手,我们就得到一条从30%上升到90%的直线。这两条直线交于一点,在这一点,接球者向正手方移动的概率为30% ,无论发球者选择瞄准哪一方,他的成功回球概率始终维持在48%。任何其他混合策略都会让发球者占便宜,使他得以选择更好的策略,将接球者的成功回球概率进一步降低到48%以下。
图7-4 接球手向正手移动的概率(% )
此外,我们也可以采用威廉斯的方法。表格显示了接球者两种不同选择可能导致什么不同结果。若向正手方移动,我们得到90-20=70 ; 向反手方移动,我们得到60-30=30。将这两个数字倒过来排列就得到最佳混合策略的比例:30%的时间准备向正手方移动,70%的时间准备向反手方移动。
你可能已经注意到,从两位选手的不同角度计算最佳混合策略,会得到一个有趣的共同点:两次计算会得到同样的成功回球概率,即48%。接球者若采用自己的最佳混合策略,就能将发球者的成功概率拉低到发球者采用自己的最佳混合策略所能达到的成功概率。这并非巧合,而是两个选手的利益严格对立的所有博弈的一个共同点。这个结果称为最小最大定理,由前普林斯顿数学家约翰·冯·诺伊曼(John von Nrumann)与奥斯卡·摩根斯顿(Oscar Morgenstern)创立。这一定理指出,在零和博弈里,参与者的利益严格相反(一人所得等于另一人所失),每个参与者尽量使对手的最大收益最小化,而他的对手则努力使自己的最小收益最大化。他们这样做的时候,会出现一个令人惊讶的结果,即最大收益的最小值(最小最大收益)等于最小收益的最大值(最大最小收益)。双方都没办法改善自己的地位,因此这些策略形成这个博弈的一个均衡。
我们以网球比赛为例,并假设每个选手只有两种策略,以此证明这一定理。假如发球者想努力使接球者的最大成功率最小化,他应该在假设接球者已经正确预计到他的混合策略且会做出最优回应的基础上确定自己的行动。也就是说,接球者的成功率将是图7-5中两条直线的最大值。这个最大值的最小值出现在两条直线的相交处,该点的成功率为48%。
图7-5发球手攻正手的概率(% )
现在我们从接球者的角度考察这个问题:他要努力使自己的最小收益最大化。如图7-6所示,假如接球者一半时间向正手方移动,一半时间向反手方移动,他的新的收益曲线就是原来两条直线的平均值,以点线显示。由于这条直线是向上延伸的,其最小值永远出现在左端,该点的成功率为40%。无论接球者向两方移动的比例是多少,这条直线一定经过成功率为48%的那一点,这是因为发球者可以选择采用40:60的混合策略。假如这条直线出现任何倾斜,那么,它的一端一定落在48%以下。只有在接球者的混合策略为30:70的时候,这条直线才会变成一条水平直线,最小值变成48%。因此,最大值的最小值等于最小值的最大值——48%。
图7-6发球手攻正手的概率(%)
最小——最大定理的普遍证明相当复杂,不过,其结论却很有用,应该记住。假如你想知道的只不过是一个选手之得或者另一个选手之失,你只要计算其中一个选手的最佳混合策略并得出结果就行了。
我们的其他工具,比如威廉斯的方法和上述图表,能够很好地解决一切只有两个选手参加且他们各有两个策略的零和博弈。不幸的是,这些工具并不适用于任何非零和博弈,也不适用于选手数目超过两个或者他们拥有的策略数目超过两个的零和博弈。经济学家和数学家发明了更加普遍的技巧,比如线性规划方法,可以找出最复杂的零和博弈的均衡策略。虽然这些技巧超出了本书的范围,我们还是可以利用其中得出的结果。
所有混合策略的均衡具有一个共同点:每个参与者并不在意自己在均衡点的任何具体策略。一旦有必要采取混合策略,找出你自己的均衡混合策略的途径就在于使别人对他们自己的具体行动无所谓。虽然这听上去像是一种倒退,其实不然,因为它正好符合零和博弈的随机化动机:你想阻止别人利用你的有规则的行为占你的便宜。假如他们确实倾向于采取某一种特别的行动,从你的角度观察,这只能表示他们选择了最糟糕的方针。
说到这里,我们已经解释了采取混合或者随机策略的好处,以及这么做的策略必要性。基本要点在于,运用偶然性防止别人利用你的有规则的行为占你的便宜。将这一原理用于实践则是一个更微妙的间题。下面五个部分可以看做是运用混合策略的迷你指南。
3 .为什么你应该选择正确的混合策略?
假如真能发现某个参与者打算采取一种行动方针,而这种行动方针并非其均衡随机混合策略,另一个参与者就可以利用这一点占他的便宜。在网球比赛的例子中,当发球者采取自己的均衡策略,按照40:60的比例选择攻击对方正手方和反手方时,接球者的成功率为48%。如果发球者采取其他比例,接球者的成功率就会上升。举个例子:假如发球者很傻,决定把所有的球都发向对方较弱的反手方,接球者由于早有预料,其成功率将会增至60%。一般来说,假如接球者认识发球者,确切了解他有什么癖好,他就能相应采取行动。不过,这么做永远存在一种危险,即发球者可能是一个更出色的策略家,好比台球桌旁的骗子,懂得在无关紧要的时候装出只会采用糟糕策略的傻样,引诱对方上当,然后在关键时刻发挥本色,打接球者一个措手不及。一旦接球者以为看穿了对方的惯用手法,而放弃自己的均衡混合策略,一心要占对方便宜,就会上发球者的当。发球者乍看起来很傻的混合策略可能只是一个陷阱。只有采取自己的均衡混合策略才能避免这一危险。
与正确的混合比例一样重要的是随机性的本质。假如发球者向接球者正手方发出4个球,然后转向反手方发出6个球,接着又向正手方发4个球,再向反手方发6个球,如此循环,确实可以达到正确的混合比例。不过,这是一种有规则的行为,接球者很快就能洞察其中奥妙。他可以相应做出正确的移动,成功率因此上升为(4/10)90%+(6/10)60%=72%。发球者若想取得最大效果,必须使每一次发球都不可预测。前面故事里提到的棒球选手戴克斯特拉与史密斯,似乎没意识到这个原则。
4 .为什么不能依赖对手的随机化?
假如一个参与者选择的是他的最佳混合策略,那么,无论对手采取什么样的策略,他的成功率都是一样的。假设你是网球比赛例子里的接球者,而发球者已经选择了他的最佳混合策略,即40:60的混合策略。那么,无论你向正手方还是反手方移动,又或是时而正手方,时而反手方,你的成功回球率都是48%。意识到这一点,你可能打算免掉计算自己的最佳混合策略的麻烦,只随便选定一种行动,并指望对手选择他的最佳混合策略。问题在于,除非你选择自己的最佳混合策略,否则你的对手就没有动机选择他自己的最佳混合策略。举个例子:假如你选择向正手方移动,他会转向攻击你的反手方。为什么你应该选择自己的最佳混合策略?理由就是迫使对方继续使用他的最佳混合策略。
5 .你的技巧变化了,你的最佳混合策略怎样变化?
假设接球者努力改进自己的反手回球技巧,反手方的成功回球率从60%上升为65%。我们可以相应修改用于计算他的最佳混合策略的图表。请看图7-7。我们注意到,接球者向正手方移动的比例从30%上升为33.3% ,而整体成功回球率也从48%上升为50%。
图7-7 接球手向正手移动的概率(% )
随着接球者的技巧不断改进,他的成功率自然也会提高。不过,出人意料的是,这一提高了的成功率是由减少使用改进了的反手技巧取得的。在第1章的妙手传说中,我们说过这样的事情有可能发生;现在我们就来解释一下。
原因在于两位参与者的策略的相互影响。当接球者更善于反手回球,发球者就会多向他的正手方发球(向正手发球的比率达到43%, 而不是原来的40%)。为了适应这个变化,接球者也会多向正手方移动。反手技巧改进了,正手技巧的威力也因此释放出来。好比拉里·伯德的例子,随着他的左手投篮得分率上升,对方防守他的策略不得不发生同样的改变,结果反而给了他更多机会右手投篮。
同样的情况还有一个例子:假设接球者刻苦训练,提高自己的灵活性,从而他在向正手方移动后迅速转向接住反手球的准确度提高了。他对付反手球的成功率从20%上升为25%。和前面提到的情况一样,他向正手方移动的机会也从30%上升到31.6% (若用威廉斯的方法,向正手方和反手方移动的比例从原来的30:70上升为35:65)。接球者多向正手方移动的原因在于他在这边的技巧改善了。相应地,发球者将会减少攻击对方的反手方的次数,以此减少对方的得益。
6 .怎样随机行动?
假如有人告诉你,你应该以相等的比例随机投出下坠球和快球,你该怎么办?一个办法是从1到10中随机挑选出一个数字。假如这个数字是5或在5以下,你就投快球;假如这个数字是6或在6以上,你就投下坠球。当然了,这在简化你的问题的方向上只走了一步而已。你怎样才能从1到10的十个数字里随机挑选出一个呢?
我们从一个更简单的问题开始,即写下连续投掷一枚硬币可能得出的结果。假如这个序列的确是一个随机序列,谁要是打算猜测你究竟写的是正面还是反面,他猜中的机会平均不会超过50%。不过,写下这么一个“随机”序列比你想像的要困难得多。
心理学家已经发现,人们往往会忘记这样一个事实,即投掷硬币翻出正面之后再投掷一次,这时翻出正面的可能性与翻出反面的可能性相等;这么一来,他们连续猜测的时候就会不停地从正面跳到反面,很少出现连续把宝押在正面的情况。假如一次公平的硬币投掷连续30次翻出正面,第31次投掷翻出正面的机会还是跟翻出反面的机会相等。根本没有“正面已经翻完”这回事。同样,在六合彩中,上周的号码在本周再次成为得奖号码的机会,跟其他任何号码相等。为避免一不小心在随机性里加人规律因素,我们需要一个更加客观或者更加独立的机制。
一个诀窍在于选择某种固定的规则,一但要是一个秘密的而且足够复杂的规则,人们很难破解。举个例子:看看我们的句子的长度。假如一个句子包含奇数个单词,把它当做硬币的正面;假如一个句子包含偶数个单词,把它当做反面。这就变成一个很好的随机数字发生器。回过头来计算前面的10个句子,我们得到反、正、正、反、正、反、正、正、正、反。假如我们这本书不够轻便,没关系,其实我们随时随地都带着一些随机序列。比如朋友和亲属的出生日期的序列。若出生日期是偶数,当做正面;若是奇数,当做反面。也可以看你的手表的秒针。假如你的手表不准,别人没办法知道现在秒针究竟处于什么位置。对于必须使自己的混合策略比例维持在50:50的棒球投手,我们的建议是,每投一个球,先瞅一眼自己的手表。假如秒针指向一个偶数,投一个快球;假如指向奇数,投一个下坠球。实际上,秒针可以帮助你获得任何混合策略比例。比如,现在你要用40%的时间投快球而用另外60%的时间投下坠球,那么,请选择在秒针落在1-24之间的时候投快球,落在25-60之间的时候投下坠球。
7 .独一无二的情况
至此为此,上述所有推理过程都适用于橄榄球、篮球或者网球这样的比赛,在这些比赛中,相同的情况多次出现,而且每场比赛对垒的都是相同的参与者。于是,我们就有时间和机会看出任何有规则的行为,并相应采取行动。反过来,很重要的一点,在于避免一切会被对方占便宜的模式,坚持自己的最佳混合策略。不过,若是遇到只比一次的比赛,又该怎么办?
考察一场战役攻守双方的选择。这种情况通常都是独一无二的,彼此都不能从对方以前的行动中得出任何规律。但是,派出间谍侦察的可能性会引出一个随机选择的案例。假如你选择了一个具体的行动方针,却被敌人发现了你的打算,他就能选择对你最不利的行动方针。你希望让他大吃一惊;最稳妥的办法就是让你自己大吃一惊。你应该留出尽可能长的时间考虑各种可能的方案,直到最后一刻才通过一种不可预测的从而也是不可侦察的方法做出你的选择。这个方法包含的相对比例应该符合这样的要求:敌人就算发现了这个比例,也不能以此占据上风。不过,这其实就是我们前面已经讲过的最佳混合策略。
最后给你一个警告。即便在你采用了自己的最佳混合策略的时候,你还是有可能得到相当糟糕的结果。即便棒球投手戴夫· 史密斯真的不可预测,有时候莱恩· 戴克斯特拉还是可以碰巧猜中他会投什么球,将球击出场外。而在橄榄球比赛中,第三次死球且距离底线只剩一码的时候,稳扎稳打的选择是中路推进;不过,重要的是投出一个出其不意的球,迫使守方不敢轻举妄动。一且这样的传球得逞,球迷和体育解说员们会为选择这一策略而欢呼雀跃,赞扬教练是一个天才。假如传球失败,教练就会遭到众人批评:他怎么可以把宝押在一记长传之上,而不是选择稳扎稳打的中路推进?
评判这名教练的策略的时机,是在他将这个策略用于任何特定情况之前。教练应该公告天下,说混合策略至关重要;中路推进仍然是一个稳扎稳打的选择,其原因恰恰在于部分防守力量一定会被那个代价巨大的长传吸引过去。不过,我们怀疑,哪怕这名教练真会在比赛之前将这番理论通过所有的报纸和电视频道公告天下,只要他仍会在比赛里选择一个长传且不幸落败,他还是免不了遭到众人批评,就跟他此前根本没费心教给公众有关博弈论的知识差不多。
8 .谎言的安全措施
假如你采用了自己的最佳混合策略,那么,另一个参与者能不能发现这一点无关紧要,只要他不能提前发现你通过自己的随机机制为某个具体情况确定的具体行动方针。对于你的随机策略,他无计可施,占不了你的便宜。均衡策略恰恰就是用来防止对方通过这样的方式占你的便宜。不过,假如出于某种原因,你没有采取自己的最佳混合策略,这时,保密就是关键。泄露这一信息会让你付出巨大代价。与此同时,你也有同样的机会使对手误解你的计划。
1944年6月,盟军筹备诺曼底登陆的时候,想方设法让敌人相信攻击点会在法国北部的港口加来。最具创意的一招,是把一个德国间谍变成一个双重间谍,却又不是一般的双重间谍。英国人费尽心机让德国人听说自己的间谍叛变了,却又不让他们知道这个消息是有意泄露的。为了使德国人知道自己作为一个双重间谍多么(不)可信,这个家伙向德国发回了一些最整脚的信息。德国人发现这些信息只要按照字面意思反过来理解就对了。这是关键的一步。当这名双重间谍报告说盟军将在诺曼底登陆时,他说的是实话,偏偏德国.人反过来理解,认为这进一步确认了加来才是攻击点。这个策略还有一个优点,即盟军登陆之后,德国人再也摸不透他们的间谍是不是一个真正的双重间谍。他一直是德国仅有的正确信息来源。随着他在德国人那边的可信度逐步恢复,英国人可以通过他发出错误信息,引诱德国人上钩。[4]
这个故事的问题在于,德国人本来应该可以预计到英国人的策略,并分析得知他们的间谍有可能叛变。硬用混合或者随机策略的时候,你不是每一次都能愚弄对手,也不是任何一个特定时候都能让他上当。你能得到的最好结果是让他们不断猜测,且有时候可以引诱他们上当。在这方面,当你知道正在和你交谈的人出于自己的利益会有误导你的想法的时候,最佳选择可能是忽略他所说的一切,而不是按照字面意思理解或者断定应该反过来理解。
以下是关于商界两名竞争对手在华沙火车站狭路相逢的故事。
“你去哪儿?”一个人问。
“明斯克。”另一个人答。
“明斯克?你还真有种!我知道,你之所以告诉我说你要去明斯克,是因为你想让我相信你要去平斯克。可你没想到我当真知道你其实是要去明斯克。那么,你为什么要对我说谎呢?" [5]
行动确实胜过言语一筹。通过观察你的对手的行动,你就能判断他想跟你说的事情究竟有几分可以相信。从我们列举的例子中可以看到,' 你不能单单按照字面意思理解对手所说的事情。但这并不表示在你努力识破他的真实意图时,应该忽略他的行动。一方按照怎样的比例混合其均衡策略,关键取决于他的得益。因此,观察一个参与者的行动可以提供一些有关正在使用的混合比例的信息,同时这种观察也是一个很有价值的证据,有助于推断对手的得益。扑克游戏的叫牌过程就是一个很好的例子。
扑克玩家都知道采用混合策略的必要性。约翰·麦克唐纳(John McDonald)有这样的建议:“扑克玩家应该隐蔽在自相矛盾的面具后面。好的扑克玩家必须避免一成不变的策略,随机行动,偶尔还要走过头,违反正确策略的基本原则。”[6]一个“谨小慎微”的玩家难得大胜一回;没有人会跟他加码。他可能赢得许多小赌注,最后却不可避免会成为一个输家。一个经常虚张声势的“大大咧咧”的玩家,总会有人向他摊牌,于是也免不了失败的下场。最佳策略是将这两种策略混合使用。
假设你已经知道,一个经常遇到的扑克对手遇到手风顺的时候,会有2/3的机会加码,1/3的机会摊牌。假如手风不顺,则会有2/3的机会退出,1/3的机会加码。(一般而言,你在虚张声势的时候摊牌并不明智,因为你没有取胜的牌面。)于是,你可以画出图7-8,显示他采取各种行动的概率。
在他出牌之前,你相信他拿到一手好牌和一手坏牌的可能性是相等的。由于他的混合概率取决于他拿到什么牌,你就能从他的叫牌方式中得到更多信息。假如你看见他退出,你可以肯定他拿到了一手坏牌。假如他摊牌,你就知道他拿到了一手好牌。但是这两种情形下,赌博的过程已经结束。假如他加码,他拿到一手好牌的概率就是2:1 。虽然他的叫牌不一定精确反映他拿到了什么牌,但你得到的信息还是会比刚刚开始玩牌的时候多。假如听到对方加码,你就可以将他拿到一手好牌的概率从1/2提高为2/3。①
① 在听见对方叫牌的条件下,估算概率采用了一种称为贝叶斯法则的数学技巧。在听到对方叫“X”,的条件下,对方有一手好牌的概率等于对方拿到一手好牌而又叫X的概率除以他叫“X”的总概率所得的商。于是,听见对方叫“退出”就表示他必然拿到一手坏牌,因为一个拿到一手好牌的人绝对不会“退出”。听见对方叫“摊牌”则表示他拿到一手好牌,因为玩家只会在拿到一手好牌的时候这么做。若是听见对方叫“加码”,计算就会稍微复杂一点:玩家拿到一手好牌且加码的概率等于(1/2)(2/3)=1/3,而玩家拿到一手坏牌且加码,即虚张声势的概率为(1/2)(1/3)=1/6。由此可知,听到对方叫“加码”的总概率等于1/3+1/6=1/2。根据贝叶斯法则,在听见对方叫“加码”的条件下,对方拿到一手好牌的概率等于对方拿到一手好牌且叫“加码”的概率除以他叫“加码”的总概率所得的商,即(1/3)/(1/2)=2/3。
图7-8
9 .出人意料
到目前为止,我们还只是将随机策略的应用集中在参与者利益严格对立的博弈上。在某种程度上显得更出人意料的还是找出随机行动的均衡的可能性,即便博弈的参与者存在共同利益。遇到这种情况,混合自己的策略可能导致各方得到更差的结果。不过,仅仅是结果更差并不表示这些策略就不是一个均衡:均衡是一种描述,不是一项指示。
混合自己的策略的原因来自合作失败。这个问题只出现在缺乏一个独一无二的均衡的时候。举个例子:两个人打电话聊天,说到一半线路中断,他们并不总是清楚谁应该再拨过去。由于缺乏沟通的能力,两个参与者不知道将会出现怎样的均衡。用不那么精确的话来说,随机化的均衡是在合作均衡之间寻求一种妥协的方式之一。下面的故事将会解释这种妥协的本质。
德拉(Della)与吉姆(Jim)属于大家会在小说里看到的那种夫妻;确切地说就是在欧·亨利(O.Henry)小说《麦琪的礼物》(The Gift of the Magi)里的那对夫妻。“谁也不会计算”他们彼此的爱情。他们彼此都愿意——甚至迫切希望——为对方作出任何牺牲,换取一件真正配得起对方的圣诞礼物。德拉愿意卖掉自己的头发,给吉姆买一条表链,配他从祖先那儿继承下来的怀表,而吉姆则愿意卖掉这块怀表,买一把梳子,配德拉的漂亮长发。
假如他们真的非常了解对方,他们就该意识到,为了给对方买一份礼物,两人都有可能卖掉他或者她的心爱之物,结果将是一个悲剧性的错误。德拉应该三思而行,好好想想留下自己的长发等待吉姆的礼物会不会更好。同样,吉姆也不要考虑卖掉自己的怀表。当然,假如他们两人都能克制自己,谁也不送礼物,又会变成另外一种错误。这个故事可以用一个博弈表示(如图7-9 所示)。
图7-9德拉与吉姆的得失1
尽管这对夫妻的利益在很大程度上是一致的,但他们的策略还是会相互影响。对于任何一方,两种错误都会得到坏的结果。为了具体说明这一点,我们给这个坏结果打0分。而在一个送礼物而另一个收礼物的两种结果中,假设各方均认为献出(2分)胜过接受(1分)。
德拉保住自己的头发而吉姆卖掉他的怀表是一种可能的均衡;各人的策略都是对对方策略的最佳回应。不过,若情况是德拉卖掉她的头发而吉姆保住自己的怀表,这也是一个可能的均衡。会不会存在一种彼此了解的共识,从而可在两种均衡中做出取舍呢?由于“出人意料”是礼物的一个重要特点,因此他们不会提前商量以达成共识。
混合策略有助于保住这个“出人意料”的特点,可要付出代价。不难发现,各人都用2/3的机会选择献出而以1/3的机会选择接受,也能达到一个均衡。假设德拉选择了这么一个混合策略。如果吉姆卖掉了他的怀表,德拉有1/3的机会保住自己的头发(2分),2/3的机会卖掉自己的头发(0分)。平均结果为2/3 分。同样可以算出,如果吉姆保住自己的怀表,平均结果也是2/3 分。因此,吉姆没有任何明确的理由,要在原来的两种均衡中做出取舍,或者采取任何混合策略。再次提醒一下,德拉的最佳混合策略的作用,是使吉姆愿意继续混合自己的策略,反之亦然。
出错的概率相当大:9次里面有4次,这对夫妻会发现对方卖掉了自己买礼物回来相配的心爱之物(正如欧·亨利的小说提到的那样),有1次大家都得不到礼物。由于存在这些错误,平均得分(两人各得2/3分)还比不上原来两种均衡得到的结果,在这两种均衡当中,各有一方送礼物而另一方收礼物(施者得2分,受者得1分)。这和网球比赛的例子不同,在网球比赛的例子里,各方确实可以通过混合自己的策略提高成功率。
为什么会有这种区别?网球是一个零和博弈,选手们的利益严格相悖。他们在独立选择混合策略的比例时会取得较好的结果。而在《麦琪的礼物》里,两夫妻的利益在很大程度上是结合在一起的。因此,他们必须协调他们混合策略的比例。他们应该投掷一枚硬币,按照硬币翻出的结果决定谁该送礼物,谁该收礼物。这对夫妻有一个小小的利益矛盾:吉姆喜欢左上角的结果,而德拉喜欢右下角的结果。经过协调的混合策略可以使他们达成一个妥协,化解这个矛盾。若用一枚硬币决定谁送礼物而谁收礼物,那么各人的平均结果就都会变成1.5分。当然,“出人意料”这一元素也不存在了。
10 .得势不饶人
到目前为止,我们提到的混合策略的例子几乎全都来自体育竞技场。为什么现实世界里见不到几个将随机行为应用到商界里去的例子呢?首先,假如企业文化说的是努力保持对结果的控制权,就不大可能推广让概率决定结果的主张。出了问题之后更是如此,因为随机选择行动的时候总会出现偶然间题。有些人认为,一名橄榄球教练应该不时假装踢一个悬空球,以此迫使守方不敢轻举妄动;但在商界,类似的冒险策略一旦遭到失败,你就可能被炒了鱿鱼。不过,关键并不在于冒险策略总能成功,而在于冒险策略可以避免出现固定模式,并防止别人轻易预测自己的行动。
折扣券是运用混合策略改善企业业绩的一个例子。公司使用折扣券来建立自己的市场份额,想法是为了吸引新的消费者,而不仅仅是向现有消费者提供折扣。假如几个竞争者同时提供折扣券,消费者就没有特别的动机转投其他牌子。相反,他们满足于自己现在使用的牌子,并接受该公司提供的折扣。只有在一家公司提供折扣券而其他公司不提供的时候,消费者才会被提供折扣券的公司吸引过去,尝试这个新牌子。
诸如可口可乐与百事可乐这样的竞争对手之间的折扣券策略博弈,其实就跟吉姆和德拉的合作问题极为类似。两家公司都想成为提供折扣券的公司。但是,假如他们同时这么做,折扣券就不能发挥原来设想的作用,两家的结局甚至会比原来更糟。一个解决方案是遵守一种可预测的模式,每隔半年提供一次折扣券,几个竞争者轮流提供折扣券。这个方案的问题在于,当可口可乐预计到百事可乐快要提供折扣券的时候,它就应该抢先一步提供折扣券。要避免他人抢占先机,惟一途径就是保持“出人意料”的元素,而这一元素来自一个随机化的策略。①
① 一些有力的统计证据表明,可口可乐和百事可乐达成了某种发放折扣券的合作方案。据《60分钟时事》(“60M Minutes”)报道,曾经有一段长达52个星期的时间,可口可乐和百事可乐分别发放了26期折扣券,其间没有出现两家同时发放折扣券的现象。若是没有事先约定,两家独立行事,那么,它们各自发放26期折扣券而不会出现同时发放现象的概率是1/495918532948104——即1000 亿次也不会出现1次。
在商界还有其他例子可以说明我们必须避免陷人一个固定模式,防止对手轻易预测我们的行动。一些航空公司向愿意在最后一分钟买票的乘客提供优惠机票。不过,这些公司不会告诉你究竟还剩下多少座位,而这个数字本来有助于你估计成功得到机票的机会有多大。假如最后一分钟所剩机票的数量变得更容易预测,那么乘客利用这一点占便宜的可能性就会大得多,航空公司也会因此失去更多本来愿意购买全价机票的乘客。
在商界,随机策略的最广泛用途在于以较低的监管成本促使人们遵守规则。这已经应用于从税收审计、毒品测试到付费停车计价器的许多领域,同时解释了惩罚不一定要和罪行吻合的原因。
由付费停车计价器记录的违章停车的典型罚金是正常收费标准的许多倍。设想一下,假如正常收费标准是每小时1美元,按照每小时1. 01美元的标准进行处罚能不能让大家从此变得服服帖帖呢?有可能,条件是交通警察一定可以在你每次停车而又没向计价器投钱的时候逮住你。这样一种严格的监管方式可能变得代价高昂。交通警察的薪水将成为首要议题;此外,为了保证警方说到做到,必须经常检测收费机,这笔费用可能也是巨大的。
监管当局有一个同样管用、代价又小的策略,就是提高罚金数目,同时放松监管力度。比如,罚金若是高达每小时25美元,这时候,哪怕25次违章只有1次会被逮住,已经足够让你乖乖付费停车了。一支更小型的警察队伍就能胜任这项工作,而收取的罚金也更接近弥补检测成本的水平。
这是又一个证明随机策略的用处的例子。在某些方面,这个例子与网球比赛的例子类似,但在其他方面存在区别。我们再次看到,当局选择一种随机策略的原因在于这么做胜过任何有规则的行动:完全不监管意味着浪费稀缺的停车空间,而100%的监管的代价又高得难以承受。不过,处于另一方的停车者不一定也有一个随机策略。实际上,当局希望通过提高侦察的概率和罚金数目,规劝大家遵守停车规则。
随机毒品测试与监管付费停车有许多相同点。若让每位职员每天都接受毒品测试,从而确定是不是有人用了毒品,这种做法不仅浪费时间,费用高昂,而且也没有必要。随机测试不仅可以查出瘾君子,还能阻止其他人由于觉得好玩而以身试“毒”。这么做和监管付费停车的例子一样,虽然查出瘾君子的可能性不大,但罚金很高。国税局的审查策略的一个问题在于,与被逮住的机会相比,罚金数目其实很小。假如监管属于随机性质,我们必须定出一个超过罪行本身的惩罚。规则在于,预期的惩罚应该与罪行相称,而这种心理预期应该将被逮住的概率考虑在内。
那些希望击败监管当局的人,也可以利用随机策略为自己谋利。他们可以将真正的罪行隐藏在许许多多虚假警报或罪行里,从而使监管者的注意力和资源大大分散,以至于不能有效发挥作用。举个例子:防空体系必须保证摧毁几乎百分之百的人侵导弹。对进攻方而言,击败防空体系的一个办法是用假导弹掩护真导弹。一枚假导弹的成本远远低于一枚真导弹。除非防守方真的可以百分之百地识别真导弹和假导弹,否则防守方就不得不开动防空体系摧毁所有入侵导弹,不管它们是真是假。
发射哑弹的做法起源于第二次世界大战,那时人们其实不是有意设计假导弹,而是为了解决质量控制问题。正如约翰·麦克唐纳在他的著作《扑克、商业与战争中的策略》(Strategy in Poker,Business and war)中所说,“销毁生产过程中出现的次品炮弹的成本很高。有人想到一个主意,说生产出来的哑弹可以随机发射出去。对方的军队指挥官担不起任凭一枚延时起爆炮弹落在自己阵地的风险,而他也辨别不了哪些是不会爆炸的哑弹,哪些是真会爆炸的延时起爆炮弹。面对真真假假的炮弹,他不敢大意,只好竭尽全力摧毁发射过来的每一枚炮弹。”·
本来,防守方的成本与可能被击落的导弹相比只是九牛一毛,但攻击方也有办法使防守成本高到难以承受的地步。实际上,这个问题正是卷入“星球大战”的各方所面对的挑战之一;他们可能找不到任何解决方案。
11 .案例分析之七:霸王行动
1944年,盟军正筹划一次解放欧洲的行动,而纳粹决心抵挡这一进攻。首次登陆有两个可能的地点:诺曼底海滩和加来港。若守军不堪一击,登陆必然取得成功。因此,德国人一定要将重兵布在其中一个地点。进攻加来的难度很大,却也更具战略价值。因为加来更接近盟军在法国、比利时乃至德国本土的终极目标。
假设成功的概率如图7-10所示。
得失结果用0~100分表示。盟军成功登陆加来得100分,成功登陆诺曼底得80分,无论在哪个地方失手,都得O分(德国人的得失结果正好与此相反)。
假设你同时扮演盟军最高统帅艾森豪威尔(Eisenhower)将军以及德国在法国的海岸防卫指挥官、陆军元帅隆美尔(Rommel) ,那么,你会选择什么策略?
图7-10 盟军成功的概率
案例讨论
首先,将成功概率的信息和成功的分值综合起来,画出一个平均得分图(如图7-11 所示)。图中列出的分值是从盟军的角度得出的分值;德国人的得分可以看做这些数字的负数;因为双方的利益严格相悖。
图7-11 盟军得分图
基本的策略当中并不存在一个均衡,我们必须转向混合策略。用威廉斯的方法,盟军选择诺曼底或者加来登陆的机会应为(100-20):( 80-60),即4:1,而德国人在诺曼底或者加来布防的机会应为(80-20):(100-60) ,即3:2 。盟军若是采取自己的最佳混合策略,平均得分为68。
我们选用的概率和分值可能存在部分合理的成分,也可能似是而非,但在分析这些问题的时候不大可能做到完全精确或教条主义。现在就让我们把上述结果同实际情况做个比较。回首当年,我们知道,盟军的混合策略高度倾向于诺曼底,而这正是他们的实际选择。而在德国人这边,策略倾向也差不多。因此,以下情况也就不会那么出人意料了:德国决策层被盟军的双重间谍诡计、不同级别指挥官的意见分歧以及一些纯粹的坏运气(比如命运攸关之际主帅隆美尔偏偏不在前线)搞得晕头转向。结果,他们终于没能在D日(大规模进攻开始日,D-Day)下午盟军进攻诺曼底并且眼看得手的时候,将全部后备部队投入诺曼底前线,却仍然相信一场更大规模的偷袭已经瞄准加来。即便如此,争夺奥马哈滩的决战还是一度陷入拉锯状态。不过,盟军终于夺取了奥马哈滩,巩固了他们突入诺曼底的阵地。接下来的故事也就不用我们重复了。
第2部分结语
1 .历史注记
博弈论是由普林斯顿伟大的学者约翰·冯·诺伊曼首先提出的。早年,研究重点放在纯粹冲突的博弈(零和博弈)上。其他博弈则被当做一种合作方式进行考察,即参与者应该共同选择和实施他们的行动。这些方法不能涵盖现实当中的大多数博弈,在这些博弈里,人们各自选择行动,但他们之间的关系并非纯粹冲突。对于同时存在冲突与合作的一般博弈,我们提到的均衡概念归功于约翰·纳什。托马斯·谢林则扩展了相继行动博弈的分析,建立了策略行动的概念。
2 .深入阅读
开先河的著作读起来总是兴味盎然。怀着这种想法,我们推荐约翰·冯·诺伊曼与摩根斯顿的《博弈论与经济行为》(Theory of Games and Economic Behavior,普林斯顿大学出版社,1947) ,尽管其中的数学原理可能让人感到吃力。谢林的《冲突策略》(哈佛大学出版社,1960) 超出了开先河著作的范围,直到今天仍然可以为我们带来有益的指点和思考。
若谈到一部有意思的零和博弈著作,J.D.威廉斯的《完全策略大师》(修订版,麦格劳-希尔出版公司,1966 至今独领风骚。关于前谢林时代的博弈论,最透彻的高度数学化的解释来自邓肯·卢斯( Duncan Luce)与霍华德·拉法(Howard Raiffa)的《博弈与决策》( Games and Decisions ,威利出版公司,1957)。
在博弈论的其他一般论著里,莫顿·戴维斯(Morton Davis)的《博弈论:非技术的导论》(Game Theory:A Nontechnical Introduction , 第2版,基础书局,1983)可能是最容易读下去的著作。马丁·舒比克( Martin Shubik)的《社会科学中的博弈论》 (Game Theory in the Social Sciences ,麻省理工学院出版社,1982)则是一部更详细的、数学内容也更高深的著作。
还有一些很有价值的著作,讨论的是将博弈论应用于具体的情况。在政治领域,值得推荐的有史蒂文·布拉姆斯的《博弈论与政治》(自由出版社,1979)、威廉·赖克(William Riker)的《政治操纵的艺术》(The Art of Political Manipulation,耶鲁大学出版社,1986)以及彼得·奥德舒克(Peter Ordeshook)的更具技术意味的《博弈论与政治理论》(Game Theory and Political Theory ,剑桥大学出版社,1986)。至于商界方面的应用,迈克尔·波特(Michael Porter)的《竞争战略》(自由出版社,1982)以及霍华德· 拉法(Howard Raiffa)的《谈判的艺术与科学》(The Art and Science of Negotiation ,哈佛大学出版社,1982)是两个很好的资源。
3 .我们的遗漏责任
我们一直将零和博弈与非零和博弈的区别含糊带过。实际上,零和博弈的均衡有一些特点并不适用于非零和博弈,因此,这方面的严格阐述应该分别进行。
我们简化了许多案例,使每个参与者只有两个策略可以选择。这么做的前提是基本概念仍然可以大致进行阐述,不会出现重大遗漏。多数情况下,引入更多策略只有纯粹的计算方面的意义。举个例子:3个或3个以上的基本策略的随机化,可以交给一个简单的计算机程序完成。这里有一个新观点:均衡处只有一个子集的策略可能用得上(使用的概率为正数)。关于这一点,参见上述卢斯与拉法的著作。
我们一直忽略了称为“合作博弈”的内容,这种博弈的参与者共同选择和实施他们的行动,得出“核”或者“沙普利值”这样的均衡。我们这么做的原因在于,我们认为任何一个合作都应该作为一个非合作博弈的均衡结果出现,而在非合作博弈里,行动是由参与者独自决定的。这就是说,个人违背任何协议的动机应该可以辨认出来,并成为他们策略选择的一部分。不过,有兴趣的读者可以从戴维斯、卢斯与拉法以及舒比克的著作里找到合作博弈的处理方法。
4 .从这里开始
第3部分着眼于建立几类策略互动的概念与技巧。其中包括讨价还价、投票选举、边缘政策以及激励设计。我们将再次通过例子和案例分析阐述策略原理,并以注释的形式向有兴趣进一步了解某些题目的读者列出推荐书目。
第3部分
第8章边缘政策
1962年10月,古巴导弹危机将整个世界拖到了爆发核战争的边缘。苏联在反复无常的尼基塔·赫鲁晓夫的领导下,开始在古巴装备核导弹,那儿距离美国本土只有90英里。10月14日,我们的侦察机带回正在建设中的导弹基地的照片。约翰·F·肯尼迪总统在他的政府内部进行了10天的紧张讨论,于10月22日宣布要对古巴实施海上封锁。假如苏联当时接受这一挑战,此次危机很有可能升级为超级大国之间一场倾巢而出的核战争。肯尼迪本人估计,发生这种情况的可能性“介于三分之一到一半之间”。不过,经过几天的公开表态和秘密谈判,赫鲁晓夫最后还是决定避免正面冲突。为挽回赫鲁晓夫的面子,美国做了一些妥协,包括最终从土耳其撤走美国导弹。作为回报,赫鲁晓夫则下令拆除苏联在古巴装备的导弹,并且装运回国。[l]
赫鲁晓夫的目光越过了核导弹事件的边缘,却看到了他不想看到的景象,因此宣布撤退。“边缘政策”一词看来就是为这么一种策略设计的,这种策略将你的对手带到灾难的边缘,迫使他撤退。① 肯尼迪在古巴导弹危机中采取的行动,被普遍视为成功运用边缘政策的典范。
① 托马斯·谢林或多或少发明了这个概念,也是首先对这一概念进行分析的学者。本章内容从他的著作《冲突策略》(第七、八章)和《军备与影响》(第三章)中获益良多。许多人会把边缘政策的英文brinkmanship错误地说成brinksmanship,听上去更像是抢夺一辆装甲车的技巧。
返回书籍页