必读网 - 人生必读的书

TXT下载此书 | 书籍信息


(双击鼠标开启屏幕滚动,鼠标上下控制速度) 返回首页
选择背景色:
浏览字体:[ ]  
字体颜色: 双击鼠标滚屏: (1最慢,10最快)

随机致富的傻瓜

_3 纳西姆(美)
从培要到休谟
下一步,我们要从科学知识的哲学这一更宽广的视点上来探讨这同一问题。在推理问题中有一个人所共知的问题叫归纳问题。这个问题长久以来困扰着科学界,但是科学受它损害的程度却不像金融市场市场那么深。为什么?因为它所包含的随机性成分有复合效应。归纳问题在任何领域里都没有在我的金融市场领域中那样至关重要,然而在任何领域中它都不像在金融领域里那样被人忽视!
黑天鹅
在《人性论》(Treatise on Human Nature)中,苏格兰哲学家大卫·休谟(David Hume)以下面的方式提出这个问题(就是由约翰·斯图亚特·密勒(John Stuart Mill)重新表述的黑天鹅问题,现在已经众所周知):不论我们多少次观察到白天鹅,都不能因此推断所有天鹅都是白色的,但只要观察到一只黑天鹅就足以推翻前一个结论。
休谟那个年代(18世纪),由于弗朗西期·培根(Francis Bacon)的努力,科学完成了从完全基于演绎推理(根本不要求对真实世界做观察)的经院哲学向天真的、没有章法的经验主义转轨。休谟对这种矫枉过正很是反感。培要反对姥种很少能带来实际成果的、“纺织学术蜘蛛网”的做法。由于培要的倡导,科学转向强调经验观察的作用。但问题在于,如果没有正确的方法,经验观察地把人引向歧途。休谟于是站出来反对这样的知识,他强调对知识的获得和解释需要一定的严谨性,这就是认识论(英文认识论“epistemology”,来自希腊文episteme,意思是知识)。休谟是第一位现代认识论者(认识论者经常被称为方爱猫扑.爱生活者或科学哲学家)。我在这里写,严格来讲,不完全正确,因为休谟发表过远比这差劲得多的言论。他是个顽固的不可知论者,绝不相信两个事物之间的联系确有可能被证实为因果关系。不过为了这本书的需要,我们不妨不去强调这个问题。
尼德霍夫——维多利亚时代的绅士
值得一提的是,金融界有它自己的弗兰西斯·培根,那就是维克多·尼德霍夫(Victor Niederhoffer)。他是站出来反对芝加哥大学学术蜘蛛网(the cobweb of learning)以及60年代有效市场信仰(effective market religion)的第一人,那是它们最猖獗的时期。与金融理论界的经院派做法形成反差的是,他研究数据,寻找其中的不规则现象,而且找到了相当多,足够他成功地开展起以随机性研究为对象的职业,并写出一本见解深刻的书:《投机家的培养》(The Education of a Speculator)。从那以后,兴起了一整个行业,它的操作人员被称为“统计学套购者”(statistical arbitrageurs)。其最有名和最成功的一些人起初都是经他培养出来的。虽然尼德霍夫受到了一次挫折,被媒体广为宣传,但他的一些弟子却做得不错,因为他们在自己的统计学推理中加进了严谨和方爱猫扑.爱生活(methodology)。换句话说,尼德霍夫的经验主义中正是缺少一点方爱猫扑.爱生活。
我要承认,尽管我与他有那么多的学术分歧,我还是受到了他的经验主义的启发,而我在学术上的成长也有很大一部分要归功于他。1996年他对我脱口说出,任何“可测试”的论点都应该经过测试(那么显而易见的产量,而我到那时为止却没有做过),从此我的交易风格经历了一次飞跃。他的忠告一语中的。一个可测试的论点是可以分解成可以量化的成分的,是可以对它们做统计学检验的。比如,有句经验之谈,它说:
车祸都在离家近的地方发生。
那么我们可以取出事地点到驾车人住址之间的平均距离来做检验(比方说,大约20%的车祸发生在一个12英里的半径之内)。可是,在对此做解释的时候就要小心:一种天真的解释就会告诉你,如果你在你家附近的地方驾车就比在远处驾车出车祸的可能性要高。这就是天真经验论的一个例子。为什么呢?这仅仅是因为人们总要在离家近的地方驾车(假设人们有20%的时间驾驶在12英里的半径之内),所以就有可能在离家近的地方发生车祸。
就从那一天开始,我再也没有提出过一个本可测试而未经测试的命题,这不要感谢我的计算机,我很少把它用于非计算目的的用途。然而维克多·尼德霍夫与我之间分歧仍是巨大的:我会用数据去把一个命题证伪,但从不去证实它。我会用历史去驳斥一种猜想,但从不去确它。比如下面这样一种说法:
在一个给定的三个月期限内,市场从来不会下跌的20%。
这个说法是可以测试的,但即使被证实了,它毫无意义。我可以用找到反例的方法从量化的角度来否定这个命题,但我决不会仅仅因为过去的数据表明在任何三个月的期限之内市场从来没有下跌过20%就接受它。回到黑天鹅问题,让我们来考虑下面这个论点:
论点甲:天鹅没有黑色的,因为我观察了4000只天鹅,没有找到一只是黑色的。
论点乙:天鹅不都是白色的。
不管我一辈子连续观察了多少中天鹅,今后还会观察到多少只天鹅,我从逻辑上不能得出论点甲(当然,我如果享有特权肯定能够观察到所有现存的天鹅,这种情况另当别论)。倡只要我在采样中找到一只黑天鹅,我就有可能得出论点乙。事实上,由于发现了澳大利亚,我们才得以捕捉到cygnus atratus(黑天鹅的拉丁文学名)的身影,一种纯黑色的天鹅品种,论点甲已经被推翻。读者在这时实际上见到了波普尔的影子(等我们谈完了我的半个老师维克多以后再来谈他):在这两个论点之间有着强烈的不对称。这种不对称深含于知识的基础之中。它在我作为交易员处理随机性的过程中也处一核心位置。
在以归纳爱猫扑.爱生活的时候,如果不使用逻辑方法去解释过去的资料,会出现什么问题,可以通过下面这个例子说明:
我刚刚对布什总统的生活做了一次全面的统计学检测。为期55年的将近16000次观察结果显示,他一次也没有死过。这在统计学上很能说明问题,我由此可以宣布他是个永生不死的人。
虽然维克多和我的交易方式正好相反,以至于他的许多笔交易最后成了我的资产(inventory),我对他仍然十分尊敬。他靠卖出无钱期权(out-of-the-money options)过活;我靠把它们买进过活(卖出无钱期权是说,某人打赌某事件不会发生;而买进它不过是说不是说,我打赌它可能发生)。他力图获得稳定收入,我则更喜欢抓住稀有机会,取得大笔的回报。虽然我们在交易风格上看起来是针锋相对,但在外在的个人性格上却有许多共同点。这些共同点也许值得在这时提出,因为我们都把个性融入到自己的交易活动当中,一般人所谓的“工作”和“休闲”对我们来说没有明显的区别。作为交易员,我们两人都试图以经营一间科学实验室来过把瘾。我们两人都与学者和科学家过从甚密,而不与商圈里的人交往(与成功的科学家交流可以避免我们自己的思想平庸化)。我们两人都以维多利亚时代的绅士学者方式来生活,徜徉在书海之中,对20世纪的种种时髦点缀之唯恐不及。我们两人都张扬自己的个性,而避免与芸芸众生的知识见解有任何雷同之处。我们两面三刀都热衷健身活动成癖,不可一日或缺(不过他好与人一争高下,而体育中的竞争却令我反胃)。维克多的模仿对象似乎是个维多利亚时代的绅士(像他心目中的英雄弗郎西斯·盖尔顿,查尔斯·达尔文的表兄弟,一生碌碌无为,但却是一切应用统计学家的真正启迪者),而我则像一个真正的维多利时代的人,总的来说是个古典主义者,至今仍沉湎于希腊罗马文化之中。我是在那种文化中长大的,我心目中的英雄主要出自文学作品。我们两人都回避媒体、电视、报纸,不过维克多的固执和坚决远甚于我。我们俩都像躲避瘟疫一样地躲避无聊的闲言碎语(属于左边那一列的噪音太多了)。
推崇卡尔爵士的人
下面我要探讨我是如何了解到卡尔·波普尔(Karl Popper)的。那是通过另外一个交易员,他也许是我惟一真正尊敬的另一个交易员。我不知道别人是否也和我一样,我尽管是一个大量看书的人,却很少真正被我所阅读的任何东西所感染,进而使我的行为方式发生任何持久一点的变化。一本书可以给我留下强烈的印像,但当又有一些新的例子像(一本新书)在我头脑中取而代之的时候,前面的例子像就会场淡忘。我需要自己去探索和发现事物(试回想第二章中炉子烫手那一节),这些自己发现的事物才可以持久。
别人的思想能植根于我头脑中的有一个例外,那就是卡尔·波普尔的思想。我是通过交易员兼自封的哲学家乔治·索罗斯所写的文章发现了卡尔爵士(或者也可以说是重新发现)。索罗斯似乎就是为了倡导卡尔·波普尔的思想而活着的。我从乔治·索罗斯那里学到的东西,实际上与他矗想让我们从他那里学到的不大一样。在事关经济学和哲学方面我不同意他的论点。但不知怎么的,我被这个匈牙利人的魅力所折服。和我一样,他以做交易员为耻,而宁可把他的交易活动做为他学术生活中一个不太重要的延伸部分(这一点可以从他的第一本书《金融炼金术》The Alchemy of Finance中看出)。由于我从严不为有钱人所打动(这种人在我一生中见过许多),所以我从来不把他们当中的任何人当做我的角色模仿的对象,连一点这种想法也没有。或许相反的情形倒有可能,因为我憎恶有钱人。总的来说,是因为人暴富之后通常就伴随着一种史诗般的豪气。索罗斯似乎是惟一一个与我这种价值观相同的人。他愿意让人们把他看成是一位中欧地区的教授,由于自己的思想碰巧有效而成为有钱人,并以这样的看法来认真对待他(只是由于得不到其他学者的认可,才使得他想要利用自己的金钱来获取头牌地位,类似于一个人想要博取一个女孩子的欢心,用尽了各种招术,最后只得借助一辆红色法拉利来勾引她)。此外索罗斯虽然在文章中写得不很清楚,但他懂得如何对付随机性,他使自己的头脑保持批判性的开放,对改变自己的意见不以为耻(这样做的一个副作用就是,他对待人就像对待一张餐巾纸)。他四处声称自己不可能无懈可击,但正因为他有这种自知,才有更大的能量,而其他人则自视颇高。他理解了波普乐,他是按照波普尔的思维方式生活的。
说点题外话,波普尔对我来说并不是第一次听说。在我十几岁到二十几岁出头那段时间里我曾一度听说过卡尔·波普尔,那是当时欧洲和美国推行的目标教育的一部分。但是以当时所做的那种介绍来说,我对他的思想不理解,也不觉得它对人生能有任何重要性(跟玄学思想一样)。在那个年龄上,人会觉得是书都有必要读一读,没有工夫去停下来做一些思考。以这种匆忙态度很难发觉在波普尔的思想里包含着什么重要的东西。或者是因为那时我受到文人雅士文化的薰陶(读了太多的柏拉图,结识了太多的马克思主义者,有太多的黑格尔思想,认识太多的伪科学知识分子),或许是因为那种教育制度(有太多的猜想被当做真理来灌输);或许是因为我那时太年轻而又阅读了太多的东西,因而无法与现实世界联系。
于是波普尔就从我头脑中溜走了,没有一个脑细胞能留住他的一点东西。在一个少不经世的男孩子的精神背囊中是留不住这种东西的。另外当起交易员以后,我步入了一个反对知识分子的阶段;我需要以不依靠随机性的方式来挣一些钱。在黎巴嫩战争中我刚刚失去了前途和财富,是像过去两百年来我家庭中几乎每一个成员那样过着优闲舒适的生活。我突然感到经济没有保障,担心自己成为某个公司的雇员,被他们调教成一个“有敬业精神”的公司奴仆(每当我听到敬业精神这个名词,就联想到低效与平庸)。我需要有银行帐户的支撑,这样才能买来时间用以思考和享受生活。我最不愿做的就是一上来就谈大道理,以及到本地的麦当劳去上班。哲学对我来说变成了某种喜欢夸夸其谈的人在手头有了充裕的时间时所干的事。它是为那些不懂得数量方法和其他能带来成效的工作的人们保留的一种活动。它是一种消磨时间的方式,仅限于很晚的时候进行——但前提是,你要尽早,最好是第二天,就把这段废话连篇的小插曲忘掉。直到我在交易员的职业生涯中站稳了脚跟,波普尔没有再出现。
地点,地点
据说,人们往往记住自己是在什么时间、什么地理环境中被一种主导思想所征服的;宗教诗人和外交家保罗·克劳代尔就记得他在巴黎圣母院里皈依(或者说重新皈依)天主教的确切地点,准确到具体某一根圆柱附近。同样,我清楚地记得1987年,我受到了索罗斯的启发,在18街第五大道的巴恩斯&诺布尔书店里读了《科学发现的逻辑》一书的50页,狂热地买下了所有我能找到的带波普尔署名的书,生怕它们脱销。那是一间灯光晦暗的侧室,里面有一股刺鼻的霉味。我生动地记得那些思想划过我的脑海犹如神的启示。
后来证实,波普尔与我起初对“哲学家”的看法截然相反:他是个典型的决不接受我无聊废话的人。那时候我做期权交易员已经有两年了,我觉得很气愤,我完全是被金融方面的学术研究人员愚弄了,尤其是因为我所挣的钱竟来自于他们所提供的模型的失败。我那时已经开始与金融方面的学术人士交流起来,这是我涉足衍生金融工具业务的一部分。但是我很难把有些关于金融市场的基本问题与他们沟通(他们对自己的模型有点过分信任了)。我头脑中一直盘绕着一个看法,觉得这些研究人员漏掉了一点东西,可就是不知道它是什么。令我烦恼的不在于他们知道些什么,而是他们怎样才能知道它。
波普尔的答案
波普尔给归纳问题带来了一个主要的回答(对我来说他的回答就是全部回答)。没有比波普尔对科学家做科学研究的方式起到更大影响的人了,尽管许多他的哲学家同事认为他相当天真(在我看来,这正是他的优点)。波普尔的观点是,科学不应该像它听起来的那样被认真对待(波普尔在会见爱因斯坦的时候,没有像他自己一样把他当做半神话人物来对待)。实际上只有两种理论:
1、 众所周知的错误理论,这些理论已经经过检验并已被充分摒弃(他称它们为已经被证伪)。
2、 还没有被看出来是错误的理论,还没有被证伪,但是面临被证伪的结果。
一个理论为什么永远不能是正确的呢?因为我们永远不会知道天鹅是否都是白色的(波普尔借用了康德的思想,认为我们的感官机制是有缺陷的)。测试机制可能就有错误。反过来,我们却有可能说有一只天鹅是黑色的。理论是不能被证实的,我们可以再次把棒球教练约吉·贝拉的话解读一遍:过去的资料确有不少优点,但它也有坏的一面,而正是这坏的一面,才能坏事。所以我们只能是暂且接受一个理论。处于这两种类型之外的理论就不是一个理论。一个理论如果提不出在哪些条件下它会被认为是错误的,那么这个理论就可以被认为是骗术,否则无法摒弃它。为什么呢?因为一个占星术士永远都能找到一个适合用来解释过去事件的理由,他可以说,火星的位置可能是对的,但还是稍差一点(同样的,在我看来,一个交易员如果在任何一点上都不能改变想法就不是交易员)。实际上,被爱因斯坦的相对论证伪的牛顿物理学与占星术的区别就在于下面这个有讽刺意味的事实:牛顿物理学是科学,因为它允许我们在知道它错了的时候去把它证伪,而占星术不是,因为它拿不出可以让我们否定的条件。占星术由于有辅助假说掺和进来,所以没法被证明是错误的。这一点就构成科学和胡说的分界线的基础(称做“分界线问题”the problem of demarcation)。
对我来说更有实际意义的是,波普尔在许多方面与统计学家有矛盾。统计学揄的基础是,我们认识总是随着信息量的增加而增加。他拒绝盲目接受这种观念。在有些情况下是这样的,可是我们不知道是哪些情况。不少有真知灼见的人,比如约翰·梅纳德·凯恩斯,他就独立地得出了相同的结论。在贬低卡尔爵士的人当中,有一些被泛称为贝叶斯概率主义者。他们相信,以有利的条件反复做同一个实验,我们最终会坦然地相信“这能得得通”。在我第一次见到偶发事件在交易室里肆虐时候,我立刻就更深地理解了波普尔的观点。卡尔爵士担心,有些知识不会随着信息的增加而增加,但倒底是哪些知识,我们无法确定。我之所以觉得他对我们交易员来说很重要,是因为在他看来,知识和发现对于处理我们已知的情况,就不如处理我们还不知道的情况更重要。他的著名语录:
这些人有爱猫扑.爱生活,但又对自己的想法持高度批判的态度;为了确定他们的想法是否正确,他们首先试图确定自己是否有可能错了。提出大胆的设想,再用严格的措施力图驳倒自己的设想,这就是他们的工作。
“这些人”指的是科学家。但是科学家中也是什么人都有。
我们来看一看这位大师的思想背景:在科学成长的过程中波普尔是个反叛者。从第四章举出的维也纳学术圈子中我们可以看到,当时已经有了一些尝试,把哲学从辞藻和修词引向科学和慎密。波普尔理智地进入到这个已经发生剧变的哲学世界。19世纪的法国由奥古斯特·孔德首介了一个运动叫实证主义,实证主义是指把事物做科学化的解释(实际针对普天下一切事物)。从此以后那些人有时就被称为逻辑实证家。这就相当于把工业革命引入软科学。对实证主义我们不必去细说,我要说的是,波普尔是实证主义的解毒剂。在他看来,对事物做验证是不可能的。实证主义比任何其他东西都更危险。吹毛求疵地讲,波普尔的思想看起来天真而且原始,不过它确实奏效。值得注意的是,贬低他的人把他称变天真的证伪主义者(a nave falsificationist)。
我是一个格外天真的证伪主义者。为什么?因为我就靠这个活着。我实行的是极端而顽固的波普尔主义:我在所有的活动中对能反映某些客观实际的理论进行推测,但有一条定规:不让偶发事件伤害到我。事实上,我想让所有能想像得到的稀少事件来帮助我。我理想中的科学,与我身边那些四处张扬,称自己为科学家的人不一样。科学不过是个沉思的过程,不过是个形成设想的过程。
开放的社会
波普尔的证伪主义与开放社会的概念是紧密在一起的。开放的社会是指,那里不认为有房屋的真理存在;这样就允许有相反的思想出现。卡尔·波普尔同意他的朋友,低调经济学家冯·哈耶克的意见,他认为,资本主义是一种状态,在这种状态下,价格可以把信息散布开来,而官僚的社会主义则会把它压制下去。证伪主义和开放社会这两个概念都是反直觉的,都与我在白天的交易员业务中所采用的处理随机性的严密措施相连系。很明显,在处理随机事件的时候,我们必需具备开放的思想。波普尔相信,任何乌托邦的思想必然是封闭的,因为它压制对自己的否定。极权主义就是这种概念的一个很好的例子,因为它是个不能够开放让人们去证伪的社会。我从波普尔那里学到的,除了区别开放与封闭社会以外,还有区别开放和封闭的头脑。
人无完人
关于波普尔其人,我还有一些让人头脑清醒的资料。接触过他的人发现,他在个人生活当中相当非波普尔主义。哲学家兼牛津大学资深教师布莱恩·玛吉与他做了差不多三十年的朋友,形容他不食人间烟火(年轻时代除外),音调地集中在他的工作上。在他漫长的行涯中(波普尔活到92岁),后50年是在对外封闭的状态中度过的,与外面世界的喧嚣刺激相隔绝。波普尔还常为别人提供“有关他们的职业和私生活的坚实可靠的忠告,尽管他对这两者都几乎没有什么了解。所有这一切,自然了,都与他自己在哲学中所声称的(实际上也是真诚的)信念和实践直接相抵触。”
他在年轻时代也不比这强多少。维也纳学术圈的成员总躲着他,并不是因为他的思想与众不同,而是因为他是个社会问题。“他极具才智,但以自我为中心,既不可靠又自负,脾气暴燥,自以为是。他不愿意听取别人的意见,在辩论中不惜一切代价都要取胜。他对群体力量不理解,也没有能力做相应的调整适应。”
我不准备对有思想的人和把思想付诸实施的人之间的差距做一般性的探讨,只是想把有趣的基因问题提出来。我们喜欢发表有逻辑性的和理智的思想,但我们不一不定期乐于把它付诸实施。这话听起来有些古怪,但这一点只是在很晚近的时候才被发现(我们将会看到,我们从基因上就不适合理性化,不适合以理性的方式行事。我们只适于在某种已定的、不复杂的环境中,以最大可能性将我们的基因传递下去)。听起来同样古怪的是,一贯进行自我批判的乔治·索罗斯,在自己的职业行为中似乎反倒比波普尔更波普尔。
帕斯卡的赌注
我说明一下我自己处理归纳问题的方法,作为一个结论。哲学家帕斯卡宣称,人类的最佳策略是相信上帝的存在。因为假如上帝存在,那么相信上帝的人就会得到报偿。如果上帝不存在,那么信仰上帝的人也损失不了什么。与此相应的是,我们有必要在知识中接受不对称;有些情况下,利用统计学和计量经济学是有帮助的。但我不希望自己的生活依赖于它。
所以我要像帕斯卡一样,发表下面的论点。如果统计科学能够在哪些方面给我带来好处,我就用它。如果它带来一种威胁,那么我就不用。我要去掉过去资料中的危险成分,只利用它的精华。在此前提下,我要利用统计学和归纳法来下富有进取性的赌注,但我不会用它们来对风险和资金管理。我吃惊地发现,我所知道的所有幸存的交易员似乎都是这样做的。他们根据从一些观察中得来的想法(其中包括过去历史)进行交易,然而他们又像波普尔派的科学家一样,采取措施以确保如果他们弄错了的话,损失会摄制在最小的范围内(而且这种概率不从过去数据中得出)。与止洛斯和约翰不同的是,他们在采用一种交易策略之前就知道哪些事件会证明他们的想法是错误的,而且为此留下余地(而卡洛斯和约翰则不然,他们不但根据过去历史下注,而且用它们来衡量自己面临的风险)。一旦那种情况出现,他们就会中止交易。这叫做止损点(stop loss),这是个预先确定下来的退出点,是一种防范黑天鹅的措施。我发现人们很少把它贯彻到实际中去。
多谢梭伦
最后,在结束第一部分的写作的时候,我要承认,描述梭伦的天才智慧的过程,对我的思想和个人生活都产生了极其深刻的影响。通过撰写第一部分,使我更加有信心,从媒体中抽身并与商业圈子的其他成员(多半是其他投资人和交易员)拉开距离,对这些人我越来越瞧不起。目前我体验到的这种经典的喜悦,是我告别童年以来还没有经历过的。由于逃避了新闻污染,我的头脑才使我得以安然躲过了过去15年一直占主导地位的牛市(也使我因为它的谢世而职业性地发了财)。我现在正想着下一步:要重新建立一个较少信息、较多决定性的古代社会,好比说生活在19世纪,但同时还要能享受到技术进步的一些好处(比如蒙特卡罗机器),一切医学领域里的突破以及我们这个时代在社会公平方面取得的所有成就。这样一来我就拥有一切事物中最好的东西了。这就叫进化。
第二部分
打字机上的猴群
——幸存者以及其他认识偏差
如果有人把不计其数的一群猴子放在一些打字机(要造得结实)跟前,让它们胡乱敲击键盘,肯定其中有一只猴子会打出一篇一字不差的《伊利亚特》》推敲起来,这种想法就不像乍看上去那么有趣了:因为这种概率是非常低的。不过让我们把这处揄再推进一步:就算我们找到了那只出类拔萃的猴子,有哪位读者肯拿出比重的积蓄来打个赌,认为这只猴子下和篇就能打出《奥德赛》来呢?
在这个故事里,有意思的是那第二步。已经完成了的业绩(在这时指的是打出了一篇《伊利亚特》)对于预测未来能有多大关系呢?做任何决策的时候,如果是以过去的业绩为根据,仅仅依赖于过去时间序列的一些属性,那么就会面临与此相同的问题。试想那只猴子出现在你家门口,带着它那令人民绝的过去的业绩。嘿,它写出了《伊利亚特》,赶快,跟它签合同让它写出续篇来。
一般做推论的时候有个主要问题,就是那些以从数据中找出结论为职业的人,通常比其他人更快而且带着更强的自信落入陷阱。我们拥有的数据越多,就越有可能陷进去。在对概率法则略知一二的人们当中,以后面这种原则为基础来做决策的想法比较普遍:如果一个人的业绩以一种一贯的方式表现得相当出色,那么他肯定在哪些方面做得对路子,否则就是非常不可能的事。于是人们就格外看重优秀的业绩纪录。他们把这样的成功运营业绩作为判断的准绳,并且认为,如果某人过去比其他人做得好,那么在今后的日子里他比多数人做得好的可能性就很大——应该说是大得很。不过,一般来说,对概率的一知半解带来的危害比一点不懂更大。
它取决于猴子的数量
我不否认,如果有人过去比众人都做得好,那么就可以推想他有能力在未来也做得好。但是在做决策的时候这种推想的说服力有可能很弱,非常弱,以至于毫无用处。为什么呢?因为它完全取决于两个因素:他的职业中随机成分有多少,以及参与运作的猴子数量。
初次采样的规模关系极大。如果这场游戏中只有五只猴子,那么我对写出伊利亚特的猴子会格外地另眼相看,以至于怀疑它是不是古代那位诗人的转世。如果有十亿十亿十亿只猴子,那么我就不一定那么大惊小怪。事实上,如果连一只猴子都没有全凭侥幸(无法事先指定)敲打出一篇名著(例如,卡萨诺瓦的《往事回忆录》之类),我反倒会感觉意外。我们甚至于可以指望其中一只猴子为我们提供一份前副县长总统戈尔的《均衡地地球》,说不定还删除了原文中的一些空洞套话。
这个问题进入商业圈子以后带来的恶果比对其他各行各业更严重,因为它高度依赖随机性(我们已经不厌其烦地将依赖随机性的商业活动与牙医行业做了对照)。从商的人数越多,就越有可能从中产生纯侥幸的大明星。我很少看到有人去数猴子的数目。与此一脉相承的是,很少有人去数市场中投资人的数目,以便计算出在一段市场历史和投资人数已经给定的条件下,成功运营的条件概率,而不是成功概率。
现实生活是险恶的
猴子问题还有其他一些方面的意义:在现实生活中其他猴子是无法计数的,更不要说看到它们了。它们都被隐没起来了,因为人们只看到胜出者——败下阵去的人就完全消失掉,这很正常。于是人们看到的是幸存者,也只有幸存者,他们使我们留下关于机遇的一种错误认识。我们就对概率做出反应,只对社会对概率的评价做出反应。就像我们从尼洛·杜立普身上所看到的那样,即使是受过概率训练的人,在社会的压力面前也会有不理智的反应。
关于这一部分
第一部分讲述的是这样一些情形,人们不理解偶发事件,似乎既不接受综出现的概率,也不接受一旦它们出现以后的可怕后果。第一部分提出了我的一些想法,这些想法似乎还没有其他人以文字形式加以考察。但是一本写随机性的书,如果不介绍一下,人除因偶发事件造成扭曲观念以外,还会有哪些可能的认识偏差,那么这本书就不完全。第二部分的任务就相对平淡一些:我会很快地把随机性中的若干认识偏差做一个综合介绍,目前已经有许多文字在探讨这个问题。
这些认识偏差可以概括成以下几点:(1)幸存者认识偏差(也就是打字机上的猴子问题),这种认识偏差来源于我们只看见胜出者,并因此对机遇形成一歪曲的看法(第八章和第九章,太多的百万富翁和煎鸡蛋);(2)导致极端成功的最经常的原因是运气使然(第十章,失败者担待一切):(3)人类的生理缺陷导致我们无法理解概率(第十一章,随机性和我们的大脑)。
8
隔壁有太多的百万富翁
幸存者认识偏差的三个示例。为什么公园大道上只能有少数人居住。隔壁的百万富翁穿戴得太寒酸。专家太多了。
如何消除失败的刺痛
算得上幸福
马克和他的妻子及三个孩子住在纽约市的公园大道上,。不论市面是繁荣还是萧条,他每年都能挣到50万美元。他不相信近一阵子地繁荣能维持住,而对自己最近在收入方面的陡增也还没有从思想上适应过来。他年近五十岁,身材圆胖。由于五官臃肿,所以看起来好像比实际年龄要大十岁。身为纽约市的一名律师,他的生活似乎挺舒服(虽然也有些难言之隐),但是在曼哈顿居民当中他是比较稳当的一处。马克显然不属于那种会去一家挨着一家泡酒吧,或参加特利贝卡或苏荷区深夜聚会的人。他与妻子有一所乡间别墅和一片玫瑰园。像许多在年龄、思维方式和生活条件方面与他们相仿的人那样,他们更加关心的事情依次是:物质舒适、身体健康以及社会地位。工作日里,晚上九点半以前他没有回过家,有时快到午夜了还可以见到他在办公室里。到了周末,他疲倦得在三个小时车程的“回府”途中就睡着了:星期六的大部分时间马克躺在床上恢复和调养。
马克是在美国中西部的一个小镇上长大的,他的父亲是一名安分的各部分会计,工作时用的黄铅笔削得尖尖的。他对尖铅笔强烈执着,所以他口袋里随时都装着卷笔刀。马克很早就显示出天资聪慧,高中成绩极为优异。他先读了哈佛大学,后又去了耶鲁法律学校。人们会说,这很不错了。后来他随着职业的发展搞起了公司法,开始为纽约一家名声显赫的律师事务所办理大案,忙得几乎没出息时间刷牙。这并不是过分夸张,他几乎每顿饭都在办公室里吃,逐渐堆积起了发福的体态,而上司的器重也使他慢慢靠近合伙人的地位。在通常需要的七年时间里他当上了合伙人,随之而来的,也是通常伴随着的那种个人代价——他的第一个妻子(在学校里认识的)离他而去。因为这位律师丈夫形同虚设,情感交流越来越少,她产在厌烦了。滑稽的是,到最后她又与另一位纽约律师生活在了一起,先是搬过去,后来又结了婚。估计情感交流的平淡程度仍然差不多,只是那人知道怎么让她高兴。
过多的工作
马克的体形越来越松驰,所以他那量身定做的套装时不时需要到裁缝师傅那里去回炉,尽管他有时也用突击禁食的方法减肥。从被遗弃的失落感中恢复过来以后,他开始追求起他的专职助手詹妮特,并且迅速地跟她结了婚。他们很快一口气生了三个孩子,买下了公园大道的公寓和乡间别墅。
詹妮特最密切的生活环境包括:孩子们就读的曼哈顿私立学校的其他家长,还有他们所住的这幢合作公寓大楼里的邻居。从物质生活的角度来看,他们所处的位置比较靠下,甚至可以说是恰在最底层。在这个圈子里他们要算是最穷的了,因为这所合作公寓里的住户有极其成功的公司执行经理、华尔街交易员以及雄心勃勃的企业家。他们孩子所在的学校里有公司偷袭人(秘密购进某公司股份而袭取控制权的人)与他们的花瓶太太所生的第二批子女。要是把年龄差异以及其他这些母亲们像模特一样的长相等因素考虑进去,那些孩子甚至有可能是他们的第三拨孩子。相比之下,马克的夫人詹妮特,和他自己一样,只是一副“乡村别墅加玫瑰园”式的平凡外表。
你是个失败者
马克留在曼哈顿居住的策略也许是理智的,因为他的工作时间那么长,要来回通勤科是不可能的。但是从他妻子詹妮特这方面来说,代价就太高昂了。为什么?因为他们相对而言属于非成功人士,这是由他们所在的公园大道居住区这一地理位置所决定的。每隔个把月,詹妮特都要过一回难关,去忍受精神紧张和屈辱,因为她到学校去接孩子们的时候会在那里受到某个孩子的母亲的辱慢,或者在公寓的电梯里会碰到戴着更大钻石的其他女人,而她家住的却是公寓里最小的户型(G型)。她丈夫为什么不能像别人那样成功?难道他不够聪明,或不够勤奋?在学习能力测试中他不也得了接近1600分吗?为什么这个罗纳德什么什么的,他的老婆甚至从来没向詹妮特点点头打过招呼,身价就值几亿美元,而自己的丈夫读过哈佛和耶鲁,智商又那么高,却连一笔像样的积蓄都很难攒下来的呢。
我们不准备过深地触及马克和詹妮特私人生活中的契诃夫式的苦恼,但是他们的案例提供了一个非常典型的范例,能说明幸存者认识偏差(survivoship bias)中的情感效应。相比之下,詹妮特觉得她丈夫是个失败者。但是她错了,原因是她计算概率的方式太笼统,她用了错误的概率涵数来推算地位等级。与一般美国大众相比,马克已经非常成功,比他百分之九十九点五的同胞都强。与他的高中同学相比,他属于极端成功的人。如果他有时间去参加定期的老同学聚会的话,他自己会验收证这一点,他是他们当中的顶尖人物。与哈佛的其他人相比,他比其中百分之九十的人都强(当然,这是从经济条件上来说的)。与他在耶鲁学法律的同学相比,他比其中百分之六十的人都强。可是与他在合作公寓的邻居相比,他处于最底层!为什么?因为他选择居住在已经成功了的人士当中,这个地区里,失败者是被排队在外的。换句话说,失败了的那些人根本不在这种采样中出现,于是反衬得他好像没有一点成功可言。居住在公园大道,你就见不到失败者,你只见到胜出者。由于我们被剪裁成居住在非常小的社区里,所以很难估计出,在自己居住的这个范围狭小的地理区域以外,我们会是一种什么样的处境。
就马克和詹妮特而言,这就导致了相当严重的情感压抑;在这里,我们这位女主人公嫁给了一位极为成功的男士。然而,由于她没有办法感性地把他与另一种采样做比较,并得出客观评价,所以她所能看见的只能是相对失败。
有的人也许会很理智地对詹妮特说:“去读读这本书,一个数学型交易员写的,书名叫《成事在天》,谈的是人生当中被扭曲了的机遇。它可以帮助你在看待事物的时候增加一点统计学的观念,这样可以使你感觉好受一些。”作为作者,我愿意收取27.95美元(本书英文版定价——编者注)向人提供这么一副万灵药,不过我只能说,我估计它最多只能提供一小时左右的安慰。詹妮特恐怕需要点力度更大的东西才能有所缓解。我已经重复过,我们人类的天性就是无法变得更加理智,或在社会的轻视面前保持情绪不受影响,至少在我们目前的遗传密码中没有这么一条。理智思考不会带来任何安慰。作为交易员,我对这徒劳、违心的努力有些心得。我会建议詹妮特搬出那个地方,到一个蓝领居民区去居住,那样他们就不会受到邻居的羞辱,而且在等级次序中上升到超过他们的成功概率。他们可以从反方向来利用这种扭曲。如果詹妮特对社会地位比较在意,那么我甚至可以推荐其中某些大型住宅街区。
双重的幸存者认识偏差
更多的专家
我最近读了一本最畅销的书叫做《隔壁的百万富翁》(The Millionaire Next Door),是由两位“专家”写的,内容有极强的误导性(还算有点可读性)。在这本书里,两位作者试图总结出有钱人普遍具备的一些特性。他们考察了一组目前富裕的人群,发现这些人都不大可能去过奢华的生活。他们把这种人称估积累者,他们宁愿推迟消费也要聚敛资金。这本书更吸引人的地方在于举出了一个简单的、反直觉的事实,证明这些人一般不容易让人看出来非常有钱。很明显,要想显出有钱人的外表和有钱人的行为举止,就需要花钱,且不去说花钱的过程也要占用时间的。过富裕者的生活要花很多时间:购置入时的服装、培养出对波尔多葡萄酒的鉴赏能力、了解哪里有高档饭店……所有这些活动都要占用大量的时间,分散主人公去办他们眼里的正事的精力,也就是积累名义上的(也是印在纸上的)财富。这本书的寓意是说,最有钱的人往往是在那些不大被人认为有钱的人当中。而在另一方面,行为举止和外表都有钱的人,由于他们的净资产严重流失,给他们的经纪人帐户造成可观的、不可挽回的损失。
关于积累金鱼这种事,我看不出有什么特别了不起的地方,尤其是这个人傻到连从他的财富里先支取一些看得见摸得着的实惠的想法都没有(除了时而能够数数自己的金钱,从中得到一些乐趣以外)。这个问题我们先不谈。对于牺牲我的个人爱好、学术乐趣和个人价值标准去变成一个像华伦·布菲特那样的亿万富翁,我没有多大兴趣;要是让我采取一种斯巴达式(甚至守财奴式)的生活习惯,住到创业初期的房子里去,那我肯定认为完全没有必要成为这样一个亿万富翁。他如此有钱却过得如此清贫,为此人们大加选赞誉,这里面有些东西我理解不了。如果是为清贫而清贫,那么他应该去当僧侣或社会工作者。应该记住,变富的过程完全是一种自利的行为,而不是为了社会。资本主义的特点在于,社会可以利用人们的贪欲,而不必依靠他们的慈爱之心,与此同时,社会也用不着格外把这种贪欲拔高成道德上(或精神上)的成就(读者很容易看出,除了像索罗斯那样的极少数几个例外,有钱人都不能使我有所触动)。成为有钱人并不意味着直接取得了道德成就。但这还不是这本书的严重失误。
我们说过,《隔壁的百万富翁》中的主人公都是积累者,是为了投资而推迟消费的人。不可否认,这种策略可能行得通。花掉了的钱不会结出果子来(除了给花钱人带来快乐以外),但书里许诺的好处似乎被过分夸大了。仔细再读一读他们的立论,显示出他们所给的事例中包含了双重剂量的幸存者认识偏差。换句话说,这本书有两个复合型的错误。
只有胜出者才能被人看到
第一个偏差在于,被他们的范例所选中的有钱人实际上属于打字机上的幸运猴子。两位作者只看到了胜出者,但他们根本没打算对这样的统计结果做矫正。他们只字未提有些“积累者”积累的东西不对头(我家庭里有些成员是这方面的行家:他们所积累的,到头来只是一些行将贬值的货币,以及某些公司的股票,而这些公司后来却倒闭了)。书中没有一处提到,有些人投资在胜出者身上凭的是运气;毫无疑问这些人会在这本书里找到位置。可以有一处办法来纠正这种偏差:把你的百万富翁的平均财富值削减下去,比方说,削减50%。这样做的依据是,由于有这些偏差,被观察的百万富翁的平均财富被拔高了许多(而现在则是把失败者的效应考虑进去)。这样做了以后,结论肯定会不一样。
牛市
至于第二点,也是更严重的一个失误,我已经在归纳法问题中探讨过。事情集中在历史上的一段非常时期;买进它的题材意味着承认资产价值的当前回报率是永久性的(在1929年那场大崩溃开始之前,这是一种普遍的信念)。请记住,资产价格经历了历史上最强劲的牛市(到写这本书的时候仍然如此)。在过去20年中价值确实得到了天文数字般的攀升。自1982年以来,在股票中投资的每个美元平均差不多翻了20番,这里说的还只是股票的平均价格,抽样数字中有些人投资的股票可能还表现得高于平均数字。实际上每个观察对象都因为资产价格膨胀而发了财,也就是说因1982年以来金融证券和资产价格膨胀而发了财。然而一个在不那么辉煌的市场时期采用同样策略的投资人肯定会念出一本不同的经。设想如果他们那本书写于1982年,也就是延续了多年的对股票价值做通涨调整的做法结束之后 ,或者写了1935年,人们对股票市场失去兴趣以后,又会是怎样一种情景呢?
或者,设想美国股票市场不是惟一的投资工具。设想有些人没有把钱用在购买昂贵的玩具或是支付滑雪旅游方面的费用,而买了黎巴嫩里拉面值的国库券(就像我祖父那样),或是麦克尔·密尔根公司的垃圾债券(就像在80年代我的许多同事所做的那样)。让我们回溯历史,想像积累者购买了有沙皇尼古拉二世签字的俄罗斯债券,然后又想从苏联政府那里得到兑现以便进一步积累,或在30年代买进阿根廷房地产(像我的曾祖父那样),那会是什么结果。
忽略幸存者认识偏差的这种错误是个顽症,甚至(也许应该说尤其是)专业人员也是如此。为什么?因为我们受到的训练就是要利用摆放在我们面前的信息,而对我们看不见的就忽略不计。
现在我们做一个简单总结。我指出了,我们倾向于把所有可能性的随机历史中真正实现了的那个当成最具代表性的一个,而忘记了还会有其他的。总而言之,幸存者认识偏差意味着,表现最突出的事例最为人注目。为什么?因为失败者根本不被显现。
权威人士的意见
资金管理行业里权威人士云集。显然,这个领域里随机性四伏,而权威人士早晚要落入陷阱,特别是没有受过正规推理训练的。在我写这本书的时候,就有这么一位权威养成了这种非常不幸的习惯,专写这种题材的书。他与一位同事一起,对所谓“罗宾汉”策略的成功率进行了计算,就是从一定数量的经理中选取最不成功的经理做投资代理。这种计算是把钱从胜出者那里拿走,拨到失败者头上。大多数人都是请优胜的经理投资,从失败的人那里把钱拿走,但这种做法是反其道而行之。这样一来,他们的“纸上策略”(即如在“垄断”这个游戏里一样,不是在实际生活中实施的)就比之他们坚持使用优胜经理还要获得高得多的回报。他们觉得,这种虚拟模型似乎证明,我们不应该较好的经理,就像我们倾向的那样,反而应该转向最差的经理,至少他们似乎要表达这种意思。
他们的分析中有一个严重的毛病,任何金融经济学的研究生在第一眼看到的时候就应该能指认出来。在他们的采样中只有幸存者。他们完全忘了考虑那些退出了这个行业的经理。这个估样中的经理在模拟的时候经营着,而且至今仍在经营。不错,他们的模型中包括了表现差的经理,但只有表现差而又能恢复的经理,他们不会出局。所以很明显,请某个在某段时间表现差,但是能恢复过来的经理(由于具备事后聪明)来投资可以获得积极回报!如果他们一直表现不佳,就会被排除出这个行业,这个模型中也就不包括他们了。
那么怎样做模拟才是正确的呢?把五年前运营的经理群体放入模拟中,使模拟进行到今天的日期。很明显,被淘汰掉的那些人有失败的倾向:很少有成功人士会在利润如此丰厚的业务当中因为赚钱太多而退出。下一步我们转而对这个问题做更具技术性的说明。
9
买进卖出比煎鸡蛋还容易
对幸存者偏差问题做些技术性的扩展。关于“偶然性”在生活当中的分布。有能力不如走好运(不过你可能会被捉住)。生日悖论。更多的庸医(以及更多的记者)。有职业道德的研究人员何以能在数据中找到几乎一切东西。论吠的狗。
今天下午我在我的牙医那里有个预约门诊(牙医会趁此机会想法刺探出我对巴西债券的看法)。我可以比较放心地说,他对牙齿确实懂点,尤其当我进入他的诊室时带着牙痛,出来的时候得到了某种形式的缓解。如果一个人对牙齿一无所知,他要想为我提供这样一种缓解就有困难,除非那天他特别走运,或是因为他一辈子都非常走运,用不着对牙齿有任何了解就能当上牙医。看着他墙上挂的学历证书,我可以断定,如果说他能够反复对考试题目给出正确答案,在毕业之前对几千颗龋齿做了正确处理,全凭的是纯粹的随机巧合,这种可能性非常之少。
再晚一点,到了晚上,我要去卡内基音乐厅。我对那个钢琴家所知甚少;我甚至把她那佶屈聱牙的外国名字都忘记了。我所记得的,只是她在某个莫斯科音乐学院学习过,但是我可以指望从钢琴上听到一些音乐。如果说某人过去的精彩演奏使她得以来到卡内基音乐厅,而现在才发现,原来这一切都是半凭运气使然,这样的事情十分少见。我们等来的是一名冒牌货,在钢琴上敲打出粗糙刺耳的动静,这种可能性实在太低,所以我把它完全排除掉。
上个星期六我在伦敦。伦敦的星期六是个美妙的时刻,人群熙熙攘攘的,但没有平日那种功利的繁忙,也没有星期日那种萧索感。手上没带表,也没有预先定好的日程计划。我来到了维多利亚和阿尔伯特博物馆,站在我最心爱的卡诺瓦的雕刻作品跟前。出于我的职业习惯,我马上想到一个问题,在这些大理石雕像的创作过程中,随机性是否也起了很大的作用呢?它们的身体是人体的逼真再现,不过比起我所见过的任何由大自然天然产生的东西来,它们更加和谐,有更加微妙的平衡感(我联想到的奥维德所说的materiem superabat opus 句话——拉丁文,大意为“巧夺天工”——译者注),像这样的高超技巧会是运气的产物吗?
实际上我的这种发问,适用于任何在物理界或随机成分比较低的行业中的工作的人。但是任何与商界有关联的事情就不然,它们都存在一个问题。我有点烦,因为明天,很不幸,我与一个资本运作经理有个约会。他想请我以及我的朋友们帮忙寻找投资人。他自称有很好的业绩记录。而我得出的结论只是他学过怎样买进和卖出。与买进和卖出相比,煎一个鸡蛋相对更难一些。然而……他过去赚过钱,这个情况也许可以说明些问题,但也没什么特别了不趣的。这并不是说事情总是一成不变的,在有些情况下,我们还是可以相信业绩记录的。不过,这种情况确实不多。读者现在一定知道,这位资本运作经理在做陈述的时候一定会被我问个底儿掉,尤其如果他不能够显示出最低限度的谦逊和不自信,因为我认为这是在随机领域里实践的人应有的态度。我也许会劈头盖脸地提出他所决想不到的问题,因为他被过去的成绩蒙住了眼睛。我也许会训导他,马基雅弗利认为人的一生至少有50%是运气在起作用(其余的是狡诈和噱头),而这还是在现代市场形成之前。
在这一章,我要讨论业绩记录和历史时间序列中一些著名的反直觉特性。这里提出的这个概念大家都知道,像幸存者偏差、数据采掘(data mining)、数据探察(data snooping)、过度适应(over fitting)、回归平均值(regression to the mean)等等名称都是它的一些变种,基本上指的是见解,所以把业绩夸大了。很明显这个概念有些令人不安的副作用。它会延伸到更普通的一些情景中,在那里随机性可以起一定的作用,比如对治疗方式的选择,或对偶然事件的解释等。
有人怂恿我,叫我提示一下,金融研究将来有可能对普通科学作出哪些贡献,我就以对数据采掘的分析和对幸存者偏差的研究为例,这些在金融界已经精细化了,可以被扩展运用到科学研究的所有领域中去。金融领域为什么这么热门?因为在这个领域里我们的信息很多(以大量的价格系列为体现),却不能像在物理学中那样去做实验。现在像这样的研究领域为数很少。它的那些突出的缺陷就体现在对过去资料的依赖上。
被数字捉弄
全无本事的投资人
我经常会面对这种类型的问题:“你以为你是谁啊,有什么资格说我生活中的成就有可能纯属运气好?”不错,没有人真正相信自己属于运气好。我的办法是,用我们的蒙特卡罗机器,制造出纯然随机的环境来。我们以与常规方式正相反的形式来进行;在分析实际存在的人时,我们需要找出他们的特性,而现在我们只是严格按照已经知道的一些特性,人为制造出一些人来。这样我们就制造出一个纯靠运气的人工环境,丝毫不掺和技巧或其它我们在表P-1中稀薄为非运气的因素。换句话说,我们可以人为制造出一些谁也不是、专供人取笑的人来;我们要把他们设计成没有一丝一毫的能力(与暗示疗法中使用的药物完全相同,丝毫没有效用)。
在第五章我们看到,有些人幸存下来是因为他们的个性正好符合某一既定的随机结构。在这时我们的环境要简单得多,它的随机结构我们已经知道了;我们要做的第一个练习是演练一句谚语:即使是破钟,一天也能走对两次。我们要走得更远一点,以便显示统计数字是把双刃剑。让我们用先前介绍的蒙特卡罗机器来建造一群虚构的一万名投资经理(并不是非用蒙特卡罗机器不可,用一枚硬币即可,甚至可以用平常的代数来解决问题,但蒙特卡罗机器要直观得多,而且好玩)。假设它们每个人都有一场完全公平的游戏:每个人到年底都有50%的概率赢得一万美元,还爱莫能助 50%的概率输掉一万美元。让我们引进一项附加的限制:一个经理只要有一个坏年景,就把他淘汰出我们的采样,拜拜,好自为这吧。这样我们就像传奇式的投机家乔治·索罗斯那样工作了。据说他把他的经理们召集到一间房间,(操着东欧口音)对他们说:“你们当中有一半人到明年就会出局。”和索罗斯一样,我们也有极高的标准:我们要用的经理必须毫无失败记录,我们对低效率的人没耐心。
蒙特卡罗发生器抛出一枚硬币:面朝上,这个经理就能在一年中赚到一万美元;背朝上,他就输掉一万美元。我们做第一年的模拟。到了这一年结束的时候,我们指望看到有5000名经理每人增加了一万美元,还有5000人赔了一万美元;现在我们模拟第二年,像刚才一样,我们可以指望有2500名经理连续第二年赚钱;再一年:1250人;第四年:625;第五年:313。现在我们在一场简单的公平游戏中得到了313名经理连续五年赚钱。全凭运气。
没人必须称职
我们的把这个论点再往前推进一步,让它看起来更有意思。我们制造出一批有相同统计要素的人,无一例外都是不称职的经理。我们把不称职的经理定义为预期回报为负数的人,相当于光走背字的人。我们给蒙特卡罗发生器发出指令,让它从罐子里取球。罐子里有100个玩,45个黑色的,55个红色的;取出一个加进一个,使红球与黑球之比保持不变;如果我们取出一个黑球,经理就赚到一万美元;如果我们取出一个红球,他就输掉一万美元。这样,这位经理就有45%的概率能赚到一万美元,55%的概率输掉一万美元。平均起来,这位经理会每一轮输掉1000美元,但这仅仅是个平均数。
在第一年的年底,我们仍有指望见到有4500名经理赚了钱(他们当中的45%);第二年,这个数神出鬼没45%,也就是2025人;第三年,911;第四年,410;第五年,184。让我们给这些幸存下业的经理起上名字,穿上职业套装。不错,他们在一开始的受试人群里占了不到2%。但是他们会受到注意。没有人会提到占了不到2%。但是他们会受到注意。没有人会提到占到98%的另外那些人。我们应该得出什么样的结论呢?
第一个反直觉的结论是,从完全由不称职经理组成的一群人里,会产生出少量业绩记录出色的人。事实上,假设这位经理主动找上门来,你根本无法看出他是好是坏。甚至,如果这一群人完全是由从长远来看洽谈室要赔钱的人构成的,结果也不会有多大变化。为什么呢?因为存在着易变性,所以他们之中的一些人肯定会赚钱。从这时我们可以看到,这种易变性实际上对糟糕的投资决策有利。
第二个反直觉结论是,我们所关心的问题,也就是业绩纪录的最大预期值(expectation of the maximum),取决于初始采样的规模大小,而不是每个经理的个人运气。换句话说,在一个给定的市场中,我可以找到多少位有出色业绩记录的经理,远远取决于在这项投资业务一开始的时候有多少人参与进来(而没有去读牙科学校),而且不在于他们产生利润的能力。它也取决于市场的易变性(volatility)。为什么我要说“最大预期值”呢?因为我对业绩记录的平均数毫不关心,我只要看经理中最好的,不要看所有的经理。这意味着,只要1997年参加进来的人数比1993年多。我敢打保票,不会有错。
遍历性
说得更技术性一点,我要说,人们以为他们能从自己看到的采样中总结出分布规律。在完全取决于最大值的问题上,我们推论出来的完全是另外一种分布,最佳表现者的分布。这处分布的平均数和胜出者及失败者无条件分布之间的差异,我们称为幸存者认识偏差(the survivorship bias)。在这里就是指,一开始就参加采样的人当中有大约3%的人会连续五年赚钱这个事实。另外,这个例子显示出遍历性(ergodicity)的特性,也就是说,时间会把随机性的恼人效果消除掉。当我们向前看,尽管这些经理在过去五年里都是赢利的,我们可以预料他们在未来任何一个时间段里都有可能转为不赔不赚。他们最后不会比那些在练习一开始就被淘汰出局的人表现得更好。唉,长期啊长期。
几年以前,我对一位A先生说,业绩记录的作用没有他想像的那么大。那时他还是个“天之骄子”类型的人物。这句话深深地冒犯了他,他暴怒地把他的打火机朝我摔过来。这段往事使我领悟到不少东西。要知道,没有人肯承认在自己的成功里有随机性因素,只有在他的失败中才有随机性。他自负得很,因为他是一个部门的头,那个部门全是“特棒的交易员”,当时在市场里都赚着大钱。后来在1994年纽约的严冬里他们都泡灭了(阿兰·格林斯潘突然提高利率,债券市场随后崩盘)。有意思的是,6年以后,我几乎见不到他们当中任何一人继续干交易员(这就是遍历性)。
我们还记得,幸存者偏差依赖于一开始参与的人数。因此,一个人过去赚到的钱这个信息本身,既没意义也不相干。我们需要知道他来自于多大一个群体。换句话说,如果我们不知道一共有多少经理尝试了又失败了,我们就没有办法评判业绩记录的有效性。如果一开始有10名经理,那么我连眼皮都不眨一下就会把一半的积蓄交给这个优胜者。如果一开始就有1万名经理,那么我对它的结果就不予理睬。实际情况一般来说就是后一种:如今被吸引到金融市场的人太多了。许多大专毕业生的第一个职业就是做交易员,失败之后再去读牙科学校。
如果这些虚构的经理像在童话里那样变成了真人,其中一个也许就是我明天上午11:45要约见的人。为什么我要定在11:45呢?因为我要询问他的交易风格。我需要知道他是怎么做交易的。如果这个经理过分吹嘘他的业绩记录,我就可以说我有个午餐约会,时间来不及了。
生活就是巧合
我们对巧合现象的分布有理解上的偏差。下一步,我们就来看一下这种偏差怎样在现实生活中体现。
神秘信件
1月2爱猫扑.爱生活接到一封匿名信,通知人本月市场会上扬。这后来被证实了。但你没把它当回事,因为谁都知道有一月效应这么一说(历史上股票都在一月份上涨)。2月1爱猫扑.爱生活又接到一封,告诉你市场将要下跌。它又一次被证实了。3月1爱猫扑.爱生活又接到一封信,情况跟以前一样。到了7月份,这位匿名人物的先知先觉打动了你的好奇心,他叫你向一项特种海外基金投资,你把所有的积蓄全部投入进去。两个月以后,你的钱全泡汤了。你趴在邻居的肩膀上向他哭诉,结果他说他记得自己也收到过两封这种神秘的信件。但是接到第二封信以且就没有再接到这种邮件。他想起来,第一封信的预测是对的,另一封不对。
这是怎么回事?这个把戏是这样玩的。那个骗人的操作员从电话本里抽出1万人的名字。他向这些抽样人选当中的一半人寄出市场看牛的信,向另一半人发出市场看熊的信。下一个月,他选择那些接到了预测正确的信的人,这样的人有5000名。再下一个月,他向剩下的2500人做同样的事,直到这个名单最后缩减到500人。在这500人当中会有200人是受害者。投入几千美元的邮资最后能带来几百万的收入。
被打断的网球赛
看电视转播的网球赛的时候,被轰炸式的广告打断,直传某个基金在多长一段时期内比其他人的业绩优秀百分之多少(到广告时为止),这种情况并不少见。但是,话说回来,如果不是碰巧赢了市场一把,谁又会去做广告呢?如果一项投资的成功完全是由随机因素造成的,那么它上门来找你的概率就很高。经济学家和保险公司的人把这种现象叫做逆向选择。由于存在这处选择上的偏差,因此,判断一项找上门来的投资,比判断一项你想寻找的投资,需要更严格的标准。举例来说,如果我从标准划一的1万名经理中寻找,我找到一个假幸存者的可能性是2对100。如果我在家里等着应声开门,那么这个上门来揽业务的人就有接近百分之百的可能性是个冒牌幸存者。
生日悖论
向不做统计员的人描绘采掘问题,最直觉的办法是通过所谓生日悖论来说明。其实这并不是一个真正的悖论,它只是在感觉上有点怪。你“随机地”碰上一个什么人,你就有365.25分之一的机会与他们是同一天生日。而与他们同年同月同日生的可能性就非常之小了。所以,这种同一天生日的巧合就会成为你在饭桌上谈论的话题。现在让我们来看这样一种情况,在一个房间里有23个人。在这种情况下,有多大机会其中有两个人的生日在同一天呢?大约50%。因为我们并没有特别规定有哪些人一定要在同一天生日:任何一对都可以。
世界真小!
在完全意想不到的地方碰到亲戚或者朋友,也会产生类似的、有关概率的错误概念。通常人们会惊讶地叫上一声“世界真小”。世界比我们想像得要大得多,但这并不是完全不可能的情况。只不过我们没有认真测试过,我们有多大机会在指定时间、指定地点与某个指定的人巧遇。相反,我们测试的只不过是与任何一个我们过去曾碰到过的人,在任何我们会到访的地方相遇。后者的概率要高得多,也许比前者的可能性要高出几千倍。
那么,统计学家在根据数据来测定一种特定关系的时候,比如说,要找出某个特定事件的一些内在关联,如一项政策的宣布与股票市场的变化之间的关系,在这种情况下,他的结论就可以被认真看待。介理当人们用计算机去处理数据,希望找出点随便什么样的关系,那么就可以肯定会出现一种虚假的关联,比如把股票市场的走势与妇女裙子的长度联系起来,就像生日的巧合一样,它全使人们吃惊。
数据采掘、统计数字以及骗子行径
你两次赢得新泽西州六合彩的概率有多大?一千七百亿分之一。可这样的事情就会在伊夫林·亚当斯身上发生了。读者也许会认为,他一定会觉得格外受到了命运的青睐吧。哈佛的佩尔西·迪亚柯尼斯和弗里德里克·摩斯泰国勒使用了我们在前面发展起来的方法,估算出,每30人里面就会有一个人在某个地方,以某种完全出人意料的方式,撞上如此大运!
有些人把他们的数据采掘工作带入了神学。不管怎么说,古代的地中海人就曾根据鸟类的内脏解读出意味深长的信息。麦克尔·德罗斯宁编撰的《圣经密典》让我们见识了数据采掘的一种有趣的扩展应用——对《圣经》做诠释。德罗斯宁当过记者(好象没接受过统计学方面的任何训练),他依靠一位“数学家”的著作对圣经的密语进行了解读,结果帮助做出了拉宾会遇刺的“预言”。他把这情况通报了拉宾,而拉宾对此看来没有认真对待。《圣经密典》在圣经中找出了一些不规则的统计数字;就是这些不规则的统计数字帮助对此类事件做出预言。不用说,这本书卖得很好。
我读过的最好的一本书
逛书店是我最大的享受。我漫无目的地从一本书走向另一本书,心里想着,是不是应该花时间去读它。我买书经常是靠一时冲动,根据表面上的一些有提示性的迹象来做决定。许多时候,一本书的封套就是我做决定的根据。封套上常有某个出名或不出名的人物写的赞语,或者是从一些书评中摘录的片段。某个德高望重的人士或著名的杂志写的赞扬话就可以打动我去买这本书。
这是个什么问题呢?我容易把书评与最佳书的书评弄混。书平本应是对书的质量的一种评价。这里同样有幸存者偏差这个问题。我把一个变量的最大值的概率分布错认成了变量本身的分布。除了最佳评语以外,出版商决不会把任何别的东西放到封套上去。有些作者甚至走得更远,他们从不愠不火,甚至是从不客气的书评中挑出一些字句来,使它看起来像是对这本书的赞誉。某位叫保罗·威尔莫的人就是一个例子(一位英国金融数学家,具有罕见的才智,而且不受人待见)。他设法公布出,他得到的“第一次坏评语”是来自于我,还把从中摘录的一些段落加以运用,当作先誉印在封套上(我们后来成了朋友,我这样写是得到了他的允许的)。
我第一次受这种认识偏差的捉弄而买书是在16岁的时候,书名叫《曼哈顿转账》(Manhattan Transfer),由美国作家约翰·多斯·帕索斯著。我买这本书是因为封套上有哲学家让·保罗·萨特的赞语,那些话让人觉得,多斯·帕索斯是我们这个时代最伟大的作家。这么一句简单的评语,很可能是在喝醉酒或过度兴奋状态下随口说出的,却使得多斯·帕索斯成了欧洲知识界的必读书。因为人们把萨特的评价当成了对多斯·帕索斯这本书的质量的一致评价,而实际上,它只是评语中最好的一个(虽然得到了诺贝尔文学奖,多斯·帕索斯还是隐退了)。
逆测器
一位编程员帮我编了一个逆测器(backtester)。这是个与历史价格数据库联接的软件程序。利用这个逆测器,我可以任意设定一种一般复杂程度的交易规则,把它运用到过去的数据中,观察它的支作效果。比如,我可以硬性规定,如果见到纳斯达克股票的收盘价比它们上星期的平均值高1.83%以上,我就买进,宋我立刻就能知道这种交易规则过去的运作效果。屏幕上会闪现出这种交易规则给我造成的虚拟业绩记录。如果我不喜欢这个结果,我可以把百分比改为比方说1.2%。我还可以把交易规则弄得更复杂一些。我会一直这样试下去,直到我找到了一个理想的交易规则。
我这是在干什么?和以前的任务完全一样,找出一套可能行得通的交易规则。我在把规则套用到数据中去。这种做法叫做数据探察。我试得越多,我就越有可能,仅凭运气,找出一条能在过去数据中行得通的规则。从随机序列中永远都可以找到一些可以察觉到的格局形态。我敢说,在西方世界里还存在着一种可交易的证券,它与蒙古国乌兰巴托的气温变化有百分之百的内关联。
说得技术性一点,还有比这更糟糕的扩展应用呢。莱恩、蒂默曼和怀特在最近一篇出色的论文中有更进一步的结论。他们认为,有些规则可能直到今天仍在得到成功运用,但它们有可能只是一种源于幸存者认识偏差的结果。
假设经过一段时间,投资者们把所有的技术交易规则都试验过了,这些规则是从非常广泛的统计总体(a very wide universe)中总结出来的,总之,由各类规则的几千种参数(thousands of parameterizations)构成。随着时间的推移,在历史上碰巧很奏效的那些规则就会受到更多的重视,被投资团体看成是“认真参赛者”,而不大成功的那些交易规则则更可能被人遗忘……如果在一定的时间里有足够多的交易规则被考虑过,那么其中有些规则,哪怕是一个非常大的采样里,也必定会表现出上乘的业绩,尽管它们并不真的对资本回报有预知能力,而只是纯然靠运气。当然,仅根据幸存下来的交易规则子集做出的推论在这种情况下可能会有误导作用,因为它不能代表初始阶段的全部交易规则,其中的大多数未必表现得不好。
我在个人经历中近距离目睹过某些过分的逆测工作,我对此不敢恭维。有一种很优秀的产品,名叫欧米茄交易站(Omega TradeStation tm),是专门为此目的而设计的,现在已经上市,有成千上万的用户。它甚至还专门为此目的的设计了自己的计算机语言由于失眠的困扰,计算机化了的白天的交易员到了晚上就成了逆测员,在数据中耕耘,想从中找出一些规律来。他们这种做法就像是把猴子扔到打字机上,没有告诉猴子他想要哪本书,只是觉得说不定在什么地方会撞上一注虚拟黄金。他们当中许多人都盲目地相信这一点。
我的一个同事,他有显赫的学位,却越来越迷上了这种虚拟世界,以至于到了对现实世界麻木的地步。他那仅存的一点常识是不是在堆积如山的模拟实验中迅速地消失了,亦或是他本来就没有任何常识,所以才迷上这种爱好,我不得而知。通过对他的仔细观察,我看出他原有的一点天然的态度在数据的重压下消失了。他以前疑心非常重,不过不是在正确的领域内。唉,休谟啊休谟!
更令人不安的扩展领域
在历史上,医学的发展是个试验和犯错误的过程,换句话说,医学是根据统计数字来发展的。我们现在知道,在病症和它的治疗方法之间可以是完全偶然的关系,有些药物在医疗试验中成功也完全是随机原因。我不敢说自己在医疗领域里懂多少,但在过去五年里一直在阅读着一部分医学学术文章,这么长的时间足够让我对它使用的标准产生关心的了,在下一章里我们就会看到。医学科研人员很少有懂统计学的;统计学家很少有去做医学研究的。许多医学科研人员甚至对这种认识偏差丝毫都不察觉。不错,这种认识偏差也许起的作用很小,但它肯定是存在的。最近有一篇医学研究报告把吸烟与乳腺癌的减少联系起来,这样就与以前所有的研究成果发生了冲突。从逻辑上看,这种结论可能有问题,这个结论可能纯属巧合。
挣钱季节:被结果捉弄
华尔街的分析家一般都训练有素,能从公司账目中查出他们是用什么方法把自己的赢利掩盖起来的。在与这些公司斗法时他们一般都能赢。但是他们所受的训练中还不包括怎样对付随机性。一家公司帐上有一次显示出收入增长,它不会立刻受到注意;两次,那么这家公司的名字就会在屏幕上显示出来;三次,这家公司就会受到建议别人买进的待遇。
正像业绩纪录问题那样,让我们来考虑有一万家统计标准划一的公司,假设它们的平均回报率都勉强处在无风险水平上(即国库券)。它们从事一切形式的不稳定业务。在第一年底,我们得到了5000家“明星”企业,显示出有利润增长(假设没有通货膨胀)。以及5000家“废物”,三年以后,我们会有1250家“明星”企业。投资事务所的股票审查委员会将把这些公司的名单作为“强力买进”对象推荐给你的经纪人。他会在录音电话中留下口信,说他有一项热力推荐,需要立即采取行动,你会在电子信箱中收到长长一列名单,你会从中选中一两家买时,与此同时,负责你的401K退休方案的经理会向你索取整份名单。
我们可以把这种推理运用到对投资目录的选择中去,好像我们就是上面那个例子中的经理一样。假设你置身于1900年,可选择的投资项目有几百个,你可以考虑的股票市场有阿根廷、俄罗斯帝国、英国、统一德国还有好多国家的股票,他还会买俄罗斯的和阿根廷的。故事的剩下部分大家都知道了:虽然许多国家的股票市场,像英国和美国的,都收益极佳,而那个对俄罗斯帝国投资的人手里持有的东西却比中等质量的糊墙纸好不了许多。回报率好的国家在最初的统计采样中不占多数:由于有随机性的存在,所以就会有少数几种投资类别表现得非常好。有些“专家”傻乎乎地(同时也是自作自受的)宣称“在任何一个二十年时间段里,股市总是上扬的”。我怀疑他们在这样说的时候是否了解这个问题。
癌症能自愈
每次从亚洲或欧洲出差回来,由于时差关系我总会起得特别早。有时(虽说非常罕见)我会打开电视机寻找市场信息。这种凌晨搜索令我吃惊的是有那么多的另类医药贩子,声称他们的某些产品能治病。毫无疑问,这是由于这个时段的广告率低造成的。为了证实他们说的话,他们举出令人信服的例子,说明某某人用了他们的方法就治愈了。比如,我有一次看到一位原喉癌患者解释,几种维生素的组合如何救了他的命,那药的售价低得异乎寻常,只卖14.9美元。这个人完全可能是真诚的(虽然作为对他说这几句话的补偿,人家可能会终生向他提供这种药品)。虽然我们取得了这许多的进步,人们还是相信在病与治之间存在着以这类信息为基础的联系,现在还找不一箭双雕什么科学证据能比这种真诚的、带有感情色彩的证言更有说服力。这类证言不总是出自普通人:诺贝尔奖获得者(但不是本学科的)就可以轻而易举地办到。林纳斯·波林,一位诺贝尔化学奖获得者,据说就相信维生素C的疗效,他本人就每天大剂量地服用。以他这种身分来现身说法都无法再现出波林声称的那些疗效,但公众对此充耳不闻,因为波林是个“诺贝尔奖获得者”,亿所做的证言很难被推翻,尽管他没有资格对有关医学的话题发表意见。
这类现身说法中,有许多除了给这些庸医带来经济效益以外倒也没有多大危害,但有不秒癌症患者可能已经用了更加正宗的治疗方法,现在已经死去(姥不科学的方法,像在其他领域里一样,也聚集在“另类医学”,也就是未经证实的疗法,的名号下,医疗界很难让新闻界相信医学只有一个,另类医学就不是医学)。读者也许会想,我为什么说使用这些产品的人有可能是真诚的,而没有说那些人是被这种虚幻的疗法治愈,其道理是一种叫做“自发缓解”的过程。有很小一部分癌症患者,由于某种完全令人费解的原因,把癌细胞消除掉了,得到了“神奇”的康复。有某种机制触发了病人体内的免疫系统,把体内所有的癌细胞全部消除掉了。这些人就是喝了一杯佛蒙特矿泉水,或是是嚼一片干牛肉,都会像服用了这些包装那么自发;它们在本质上,可能有某种原因,我们至今还没有先进到能够探测出来。
已故天文学家卡尔·萨甘一生致力于推进科学思维,是非科学思想的死对头。他对法国路德市做了一次访问,那里的人们仅简单地接触一下圣水就得到了治愈。之后,他对癌症治愈率作了研究,发现了一个有趣的事实:在所有到访过那个地方的癌症患者中,他们的治愈率,即使是有,也比自发缓解的统计数字还低。它比不去路德市的患者的平均自发缓解率还要低!在这种情况下,统计学家是否应该得出这样一个结论,癌症患者在去过路德市以后存活率反而降低了呢?
皮尔逊教前往蒙特卡罗(按字面理解):随机性看来不随机
20世纪初,人们开始开发用于处理随机结果的技术时,设计了几种探察反常情况的方法。卡尔·皮尔逊教授(就是尼曼-皮尔逊当中的那个皮尔逊,每位在统计学101课堂上听过课的人都熟悉)设计出了第一个非随机性测试方案(实际上它是对正常状态的离差做测试,而从动机和目的来看,全都是一回事)。1902年7月间,他运行了几百万次的所谓蒙特卡罗(轮盘赌的旧名)试验,并检查它们的结果。他发现了一个有高度统计学意义的现象(误差小于十亿分之一):这种运行不是纯随机的。什么!轮盘的转动会不是随机的!皮尔逊教授对这项发现十分吃惊。可是这个结果本身什么也说明不了:我们知道,像纯随机抽取这样的事情是不存在的,因为抽取的结果取决于设备的质量。只要我们充分考虑到细节问题,我们总会从什么地方把非随机性找出来(即,轮子本身没有达到最完美的平衡,或者旋转球并不十分圆)。统计学方面的学者称之为参照系问题(reference case problem),并解释说,实践中真正的随机性是达不到的,它只存在于理论中。于是,一位经理会问,这种非随机性能不能引申出任何有意义的、可以让人获利的规则呢?如果我需要运行1万次来赌博1美元,并指望经过这番努力能挣到1美元,那么我业余去给人家介绍门卫差事比这要挣得多。
但是这项结果还有一个令人疑惑的因素。非随机性中有下面这样一个严重问题,它更关系到实际应用,那就是,连统计学先驱们也忘记了这样一个事实:一系列随机实验不一定非得毫无格局形式可言才可称得上是随机。事实上,如果数据真的表现为完全没有任何格局形式,反而成了极其可疑,看起来更像是人为的。单独一次随机实验肯定会显示出某种格局形式,我是说,只要你仔细去观察。我们知道,皮尔逊教授是最早对创建人工随机数据的发生器产生兴趣的学者之一。那是一种表格,人们可以用来输入各种科学和工程模拟(也就是我们的蒙特卡罗模拟器的前身)。问题在于,他们不想让这些表格中体现任何形式的规率性。然而真正的随机性看起来并不随机!
我要对癌集束这个著名的现象做一个分析,以便进一步说明这个问题。让我们来考虑,在一个方块上,有16支飞标随机地射中它,射中方块中任何一个位置的概率都相同。如果我们把这个方块分成16个小块,我们可以预期,平均每个小方块中都会有一支飞标,但这只是平均。在16个小方块中恰好有对应的16支飞标的概率非常小。在这个平均的方格阵中,有几个方块中将不只有一支飞标,而许多方块中则一支飞标也没有。在方阵中不体现出这种(癌)集束的现象是极其少有的。现在,把我们这个带飞标的方阵挪盖到任何一个地区的地图上,一些报纸就会宣布,其中一个地区(有高于平均数的飞标的那块地方)隐着致癌射线,律师们闻讯赶快去找患者谈话去了。
狗没有吠叫:论科学知识中的认识偏差
根据同样论点,科学中也有一种有害的幸存者认识偏差,它影响研究成果能否得到发表。在某程度上,这与新闻界有相似之处,产生不了具体结果的研究得不到发表。这看起来有道理,因为报纸没必要以头版头条大声疾呼,告诉人们什么新鲜事也没发生(相比之下,《圣经》在这方面就有足够的明智,它说:ein chadash betacht bashemesh-“普天之下没有初次出现的事物”,告诉我们事物总会重现)。现在的问题是,人们把发现某种不存在与不存在某种发现混淆了起来。没有事情发生这一事实本身就可能是一条重大信息。愉如夏洛克·福尔尔摩斯在银色火焰案中所注意到的那样,奇怪就奇怪在那条狗没有发出吠叫。更加成问题的是,有许多科学成果没有能够得到发表,是因为它们没有统计学意义,但这不等于它们没有提供信息。
我得不出结论
常有人这样问我:在什么情况下才是真正不凭运气呢?老实说,我回答不了这个问题。我可以看出甲似乎不如乙运气好,但我在做这种认定的时候很没有信心,所以这没有什么意义,我宁愿保持怀疑态度。人们经常曲解我的意见,我从没说过每个有钱人都是白痴、每个不成功人士都是因为不走运这样的话,我的意思只不过是,在不具备更多信息的条件下,我宁愿对自己的判断加以保留。这样比较保险。
失败者担待一切
—论现实生活中的非线性现象
人生中非线性的险恶现象。走向贝尔·埃尔区并染上有钱有势者的恶习。微软的比尔·盖茨为什么可能不是他那个行业里最优秀的人(不过请不要把这一事实通报他)。不许驴子吃草。
下一步,我来审视一下“人生不平”这句俗话,但是氏 们要使用一个新的视点。我们要这样说:人生以非线性方式不平。这一章是说,人生中一个小小的优越条件,如何就能转达变为高度不成比例的回报,或者说,如何在毫无优越条件可言的情况下,由于得到了随机性的一丁点帮助,京戏打开了财富之门。
沙堆效应
首先我们来对非线性下定义,可以有许多办法来对它做说明,但是在科学中最流行的方法之一叫做沙堆效应。我用下面的方法来解释。我正坐在里约热内卢伊帕内玛的沙滩上,不想作任何费力的事情,与读书写字之类的事情毫不沾边(当然这没能办到,因为我脑子里还在写着这几行字)。我从一个孩子手里借过来一些塑料沙滩玩具玩着,想要造一座巨堡,虽然本事差些,但我还是顽强地想要仿造巴比伦塔。我不断地往顶部加沙子,使它的高度慢慢增加,当年我的巴比伦亲戚价增以为这样他们就能登上天;我的设想要逊色一些;我要试试堆到多高它才会塌下来。我不断地加沙子,试试看这种结构最后怎么坍塌下来。孩子没风过大人堆沙堡,瞪大子眼睛望着我。
没多一会儿,我的城堡不可避免地倒下来,加入到沙滩 上的其他沙子中去了,这让一旁观看的孩子很开心。我们可以说,是那最后一颗沙子导致了整个结构的坍塌。我们在这里目睹的,就是由线性外力施加到一个客体上以后产生的一种非线性结果。非常小的一点额外投入,在这个例子中是那最后一颗沙粒,导致了一个不成比便的后果,也就是把我那刚起步的巴比伦塔摧毁了。大众智慧中蕴含了许多这种现象,体现在这样一些谚语中:“一根稻草压折了骆驼腰”和“一占一滴造成盆满水流”。
这些非线性力学现象有个书卷气的名字:混沌理论(chaos theory)。这个名字不正确,因为它与混沌状态没关系。混沌理论主要是关于一种函数关系,在这种关系中加入很小的一个量就会导致一个不成比例的反应。举例来说,种群个体数量模型就可以引向一条爆炸性增长或一个种群灭绝的道路,这取决于在时间起始点上种群个体数量的一个非常小的差异。在科学上有一个与此对应的很流行的比喻是气候:已经证明,一只蝴蝶在印度简单地拍动它的翅膀,最终会导致纽约刮起飓风。但是古典主义也有东西要提供:帕斯卡(与第七章帕斯卡的赌注是同一个人)在谈到克里奥帕特拉的鼻子时说,如果它稍为短上一点,整个世界的命运就会有所疑义变。克里奥帕特拉外貌迷人,纤长的鼻子十分醒目,使得裘利吐斯·凯撒和他的继任者马克·安东尼都拜倒在他的面前(在此,我的学者式的自以为是不禁区又要与常规智慧相左了:普鲁塔克称,真正使得这两位动遥了克时奥帕特拉统治的人发疯般迷恋的,是她在谈话中的辨才,而不是她的美貌,对这点我深信不疑)。
进入随机性
当随机性进入这个游戏的时候,事情就变得更有意思了,设想在等候室里挤满了演员等待试镜。能够得胜的演员人数肯定很少,而这些演员,根据我们探计过的幸存者认识偏差,在公从眼里一般被认为是这个行当里的代表。得胜地者会进入贝尔·埃尔区,他们会觉行有必要掌握一些消费高档商品的基本知识,可能由于放荡和无规律的生活方式,他们也进行一些任意挥霍的胡闹。而其他人(大多数),我们可以想像他们的命运;一辈子在社区星巴克咖啡馆端泡沫咖啡加奶,在两次试镜的间隙中奋力调整自已的生物钟。
有人也许会争辨,摊上主角的演员之所以能一跃成名,拥有了昂贵的游泳池,一定是因为具备某些他人不具备的技巧,像适合于这种职业生涯的某种魅力,某种身体特质等。对不起,我不同意。胜出者也许具备某些表演技巧,但是其他人也都具备,否则他们也不会到那等候室外去等待着了。
名气这个东西有个有趣的属性,它有自已的运行机制。一个演员被一部分公众所熟知。这种名气的运行机制遵循一种回旋螺线,它有可能是从试境头开始的。因为之所以选中了他,有可能是因为某些愚蠢的细节正好迎合考官那天的心态。要不是考官司前一天爱上了一个姓氏听来相像的人,在这个特定历史抽样中出现的我们这位入选的演员,有可能就在间隙中的那个历史采样中去端咖啡加奶去了。
学打字
研究人员经常以Q W E R T Y标准键盘为例,来形容经济中赚与赔的恶习性机制,而且说明,为会么最终结果更多地表现为不合适者取胜。打字机上字母的安排就是一个例子,它表明一种最不合适的方法反而取得了成功。我们的打字机上,字母键是按照非优化方式排列的。实际上,这种非优化方式的目的京戏是要降低打字员的速度,而不是为了让他的工作更轻巧,这是为了避免色带挤到一起去,固为设计它们的那个时代还不像今天这样电子化。因此,在我们开始制造列好的打字机和电脑化的文字处理器时,是在Q W E R T Y标准键盘上学会打字的,这样养成的习惯很难改变。就像一个演员螺纹式地上升到明星地位那样,人们会对其他人喜欢的事情加以容让。在这个过程中强加一种理性机制是多余的,何况也不可能。这叫做路径依赖性结果,曾有过多次用数学方法对行为方式进行模拟的尝试,但都因为这个而失败了。
现在清楚了,在信息时代,通过把我们的趣味划一划,人生中的不平正在加剧。因为这样一来,胜出者京戏几把所有的客都掳走了。让大多数人印象深刻的,最的靠运气成功的例子,是软件制造成商微软公司,以及它那喜怒无常的创始人比尔·盖茨了。不能是否认盖茨是个个人标准、敬业精神都很高的人,他的智商也高于平均值,但除此之外,他真是最好的吗?他与他所获得的一切相配吗?很明显不是这样的,多数人装了他的软件(和我一样)是因为其他人也装了他的软件,这纯属循环效应。从来没有人说过它是最好的软件产品,盖茨的大多数竞争对手对他的成功始终嫉妒不已。盖茨居然赢了这么一大块,而他们却在苦苦挣扎,想让他们的公司生存下去,这种情况让他们气疯了。
这种想法与经典经济学思想相违背。在经典经济学中,结果要么是产生于某个确切的原因(在这里不考虑不确定性),要么是就是好人会胜出(好人是指技术更好,占一定技术优势的人)。经济学家们是在相对较晚的时候发现这种路径依赖性效应的,然后就想批量发表这个题材,否则就会平淡无奇,一望而知。比如圣达菲研究所专门研究非线性问题的经济学家布莱恩·亚瑟写道,最终决定经济优势的,是偶然机遇与积极信息的回馈相结合,而不是与技术优势相结合,不是某个专门技术领域里被定义得得玄而又玄的技术优势。时期销售成绩,经过一段时间,哪家公司会占主导地位。”
现实世界内外的数学
解决这个问题的数学方法已经有了。在常规模型中(诸如金融中使用的著名的布朗随机步进)成功概率不随着每一步增进而发生变化,只随着累积起来的财富发生变化。亚瑟提出一些例如波利亚过程那样的新模型。波利亚过程(Polya process)是一种非常复杂的数学方法,但是在蒙特上学罗模拟器的帮助下却变为很容易理解。波利亚过程是这样的;假设一个罐子里一开始装有黑、红两种数量相等的球。你在从罐子里取出球之前,每次都先要猜一下你会拿到一个什么颜色的球。这个游戏在这方面是硬性规定的。与常规的罐子不同的是,你正确猜中的概率取决于过去的成功,因为你猜得正确或不正确取决于过去的成绩。这样,在过去猜中以后,狂中的概率就提高,过去猜错以后,猜错的概率就提高。模拟这个过程就可以看到数量巨大的不同结果,成功次数惊人,失败的数目也很巨大(我们称为欹斜)。
把这样一个过程与用通常模式设计的过程比较一下。在通常模式中,游戏者在罐子中取球的时候有新球替换进去。比如你玩轮盘赌赢了,这会增加你再次胜出的机会吗?不会。但是在一个使用波利亚过程案例中,你胜出的机会就会增加。这在数学中有什么难办的?难就难在独立概念(即,下一次抽取不取决于过去的结果)被破坏了。独立是动用(已知的)概率数学时的一个要素。
经济学作为一门科学,它的发展出了什么问题?答案:因为有一帮聪明人认为一定要用上数学,这样他们才能觉得自已的思想够严谨,他们弄出来的东西才叫科学。有些个猴急的人决心要引人数学模型技术(罪魁祸首:莱昂·瓦尔拉斯,杰拉尔德·德布鲁,保罗·萨谬尔森),而不考虑这些因素:他们使用的那类数学要么对于他所们所要处理的问题局限性太强,要么他们应该懂得,数学语言的精确性会导致人们以为他们真有解决办法,而事实上他们没有(想想波普尔,以及如果对待科学过于认真的话会有什么代价)。其实他们使用的数学在现实世界里没有起到作用,或许我们需要进一步丰富我们的下理手段。也许完全不用数学倒可能好一些,但他们拒绝接受这个事实。
所谓的复杂性理论学家(complexity theonists)来解围了。以非线性数量化方法为专业的科学家们写的书引起了一片骚动,他们心目中的麦加圣地就是位于新墨西哥,靠近圣达菲市的圣达菲研究所。显然这些科学家干得很卖力气,给我们的物理科学提供了厅妙的解决方案,还为社会科学领域里的朋友们提供了更好的模型(尽管到目前为止还没有什么令人满意的东西)。假如他们最终还是不能成功,那么结论也很简单,因为数学在我们的现实世界中只能提供辅助性的帮助。注意,蒙特卡罗模拟器的另一个优势,它可以给我们提供数学所帮不了的忙,起不了的作用。它不但免除了我们解方程之苦,还帮助我们躲开了劣等数学的陷阱。我在第四章里说过,在我们过个随时机世界里,数学仅仅是一种思考和冥想的方式,没什么更大的作用。
伯里丹的驴或随机性好的一面
随机结果的非线性有时被用来作为一种打破僵局的工具。我们来考虑一下非线性推一把的问题。假设有一匹驴既渴又饿,它的一边放着食物,另一边放着水,两边的距离完全一样。在这种情况下,它会边渴带饿地死去,因为它没法决定先去喝水还是先去吃食物。现在我们往这幅图景里注入一点随时机性,我们随机地把那匹驴推一把,使它往其中一个方向靠近一点。不论靠近哪一边,自然就离另一边远了。僵局立刻就被打破了,我们这匹幸福的驴就会不是先吃饱后喝足,就是先喝足后吃饱。
读者肯定也玩过伯里丹驴的另一个版本,用“抛硬币”的方法来打破生活中不那么严重的小僵局,让随时机性参与到决策过程中来。让运气女神来做决定,我们乐得遵命。在我的计算机在两种选择面前卡壳的时候(用技术性的语言来说,在解决优化问题时,我们需要激活一个函数,经常要用到“随机模式”),我经常使用伯里丹的驴(用它的数学名称)。
雨则倾盆
在我写这几行字的时候,我把自已的基金向投资者敞开,探索怎样筹集资金。我忽然认识到,世界的两极化对我的冲击很严重。人要不注是成功得没了边,把现金都吸引到自已这里来,要不就是边一分钱也弄不来。书的情况也一样。不是每个出版商都想出版它,就是边愿意回电话的人也没有(在后一种情况下,我的原则就是把那家出版商从我的通讯录中删除)。我深受地中海地区斤斤计较的传达室统观念影响,所以对这种态度感到极度不适,甚至要发脾气了。过多的成功是个敌人(想想那些有钱有势的人受到的惩罚),过多的失败让人沮丧。这两样我都不想要。
随机性与我们的大脑:
我们是概率盲
关于很难把你的度假想像成巴黎和巴哈密瓜马群岛的线性组合,尼洛也许再也不能到阿尔卑斯山滑雪了。对行为科学一些新发现的探计。从一本教科书摘抄的关于概率盲的一些表现。再谈一点新闻污染。为什么说你现在可能已经死了。
巴黎还是巴哈马岛
三月份你的下一次短期度假有两个选择。第一个是飞往巴黎;第三个是前往加勤比地区。你表示这两个地方支哪个都可以;反正你家那口子会用一种或另一种方式暗示出一个决定。在你对这两种可能性做想像的时候,两种截然不同、相互独立的图景浮现出来。在第一幅里,你看见自已站在奥赛博物馆里一幅毕加索的油画跟前,描绘的是阴天的景像—巴黎冬日里灰蒙蒙的天空,你胳膊下还夹着一把伞。第二幅图景,你躺在一务浴巾上,身边有一摞由你最喜欢的作者写的书(汤姆·科兰西和阿米亚努斯·马塞利努斯),一位拍马屁的侍者为你端上一杯香蕉口味的代基里酒。
你知道这两种状态是相互排拆的(你一次只能在一个地方),而且排队斥得很彻底(你只能在基中一个状态中,这个概率是百分之百)。它们是等概率的,依你看,每一种的概率都是百分之五十。
当你想到这次度假的时候,心里就产生很大的一份快乐;它提高了你的情绪,每天上下班的路程也不那么难受了。但是,在不确定情况下,真正够得上理性行为的正确方法应该是,想像自已50%在一个度假地点,50%在另一个地点,这在数学上京戏叫做两种状态的线性组合。你的脑子能转过这个弯来吗?你想不想让你的两脚泡在加勒比的海水里,而头上淋着巴黎的雨?我们的头脑一次可以正确地处理一个问题,也只能处理一个问题。除非你在病理上出现了严重量的人格障碍。现在我们来想像一下85%对15%的一个组合,情况能有好转吗?
假设你与同事打赌1000美元,在你看来这绝对公平。明天晚上你衣袋里要不就是一分不剩,要不就有2000美元,这两种情况的概率都是50%。用纯数学的语言来说,望值(mathematical expectation),也就是,用每次结果的概率乘以赌注的美元值(50%乘以0,以及50%乘以2000美元=1000美元)。你能想像出(我是说,在脑子里想像,不是用数字去计算)这个值为1000美元吗?我们一次可以想像出一种状态,只能是一种状态。单凭我们自已,我们更有可能以非理性的方式打赌,因为在我们想像的图景中只能有一种状态占主导。
一些建筑学上的思考
现在该透露尼洛的秘密了,这是个黑天鹅问题,当时他35岁。纽约战前的建筑虽然正面好看,但这种建筑形式从背面看起来完全光秃秃的,形成了强烈火的反差。医生的诊室有一记扇窗正好望到纽约东北角一条小街上的这样一个后院。尼洛永远都会记得那个院子与建筑的正面相比有多乏味,即使他能再活上半个世纪也不会忘记。他会永远记得从铅灰色的窗扇看出去,那粉红色后院的丑陋景观,以及墙上挂的医科学历证书,那份证书他在等医生进来的过程中已经看过十几遍了(时间似乎止住了,尼洛觉得有些不对劲)。消息公布出来了(用的是凝重的嗓音),“我要告……我拿到病理报告……你得的是……其实它不像听上去那样的可怕……是……是癌症。”这个病情一宣布出来,他的身体好像过了电,从后背一直麻到膝盖。尼洛想喊叫一声“什么?”,但是没能从嗓子里发出声音来。吓信他的与其说是这个消息,不如说是医生那副样子。医生眼神里的那种恐惧使尼洛猜测,情况也许比他被告知的还要糟(确实如此)。
拿到诊断的那一晚,他来到一所医药图书馆,坐在那里。他在雨里走了几个小时,浑身湿透了,身边的水淌了一滩,自已却没有察觉(管理员冲他嚷,可他没法集中精力听明白她说的是什么,她只得耸了耸肩膀走开了);后来他读到这样一句:“寿险精算师调整过的数据为72%的患者有五年存活率”。那意思是说,100个人里面有72个人能活下去。身体上如果三到五年不再出现临床症状,患者就可以被宣布为治愈(在他的年龄上则更接近于3年)。他于是松了一口气,相信他肯定能存活下去。
那么读者会想,今后五年有28%的可能性要死去,72%的可能性能存活下来,这种说法在数学上有什么区别?很明显,没有区别。但是我们生来就不能理解数学。在尼洛的头脑中,28%的可能性要死,就意味着头脑中出现他自已死去的景像,还会想到有关办理自已丧事的那些郁闷的细节。有72%的机会活下去又使他的情绪好转起来:他的头脑里又盘算起一个治好了的尼洛正在阿尔卑斯山里滑雪的情景。在这场劫难中,尼洛从来没把自已想像成72%活着,28%已经死去。
从心理学到神经生物学
根据以上我们刚刚看到的情况,认知和行为科学方面的研究人员就把有关概率的法则称为是反直觉的。这些科学家说,人类都是概率盲。这一章里我们会很快地举例说明这种概率盲的一些表现,并把在这个领域里的研究进展情况简要说明一下。
概率盲这个概念使得一门全新的学科兴起,专门研究这种认识偏差对我们的行为会产生什么效果。有关的资料充斥着图书馆的书架。这个概念的姊妹篇认为,人们在市场中的行为是非理性的,于是有众多的投资基金成立起来对此进行研究。有些基金围绕着人们对消息面会有过度反应这一思想而建立,而另一些则建立在人们会反应不足这种理念基础上(我在职业生涯的早期听说市场越多样化越好)。这些信念产生出两大类交易策略,一方面,我们见到喜欢反其道而行之的人采用了如下的操作理念:嗨,由于人们规律性地反应过度,咱们就用另一种方法,卖出赚钱的买进赔钱的。另一边是惯性操作的人,他们的做法与此截然相反:既然市场不能迅速调整,那么我们就买进赚钱的,卖出赔钱的。由于有随时机性的存在,这两大类人都会获得周期性的成功,但这不能直接证明其中哪一个理论对、哪一个理论错。
甚至边精神病医生和临订心理学家都变成了“专家”参与到这场大论战中来了。说到底,他们对人类头脑的了解还是要比那些满脑子既不现实又不科学的方程式的金融经济学家多些。而且,归根结底,最终对市场起决定性作用的是人类行为。在波士顿每年有一次由医生和心理研究人员参加的会议,他们以市场策略作为说笑资料。
这个思想也许简单,甚至枯燥,然而我们会碰上一些专业人员,我们以为他们在遇到此类问题时会拿出最高级的专家意见,而实际上他们也会和普通人一样直接掉进陷阱里。
我们的天然居住地
我不打算过分深入业余水平的进化理论来考察其中的道理(再说,虽然我在图书馆里消磨了一些时光,我还是觉得自已在这个课题上实在是个业余水平)。很明显,我们的遗传达室秉性是为了适应一种环境而发展起来的,而那种环境到今天已经面目全非。我对为数不多的几个同事说过,他们的决策过程中还残存着一些穴居人生活习惯的蛛丝马迹。但当市场经历剧烈动荡的时候,我也同样会体验到肾上腺素激增,好像看见有一只豹子在围着我的交易桌团团转。我的同事中有些人的心理结构可能与我们的共同始祖更加接近,因为他们在听到赔钱的消息时会把电话听筒也砸坏。
举一个对于经常阅读希腊文与拉丁文经典著作的人来说可能不算稀厅的事例。每当我们注意到,距今一两千年前的人们表现出来的那些情感居然与我们如此相同,仍然不能不感到吃惊。孩提时代参观博物馆,印像最深刻的是,古希腊雕塑中展现的那些人类个性与我们今天的人毫无二致(只是更和谐、更贵族气)。我以为2200年是个很长的时期,看来我错了。人们看到荷马史诗中的英雄人物有和我们仿天经历的同样的情感时,人们有多么诧异。普鲁斯特笔下经常有这种描写。按遗传标准来看,30个世纪以前的这些荷马时代的英雄们,与今天我们在停轩场里见到的拖着大包小包的臃肿的中年男人,在基因结构上完全一样。还水止于此:说不定在80个世纪以前,从叙利亚东南部到美索不达来亚西南部这块狭长地带上,人才刚刚开始步入“文明”,而我们实际上与这些人完全一样。
我们的天然居住地是什么?我说的天然居住地,指的是我们在那里繁衍最多的地方,在那里生活过的代数最多存在了13万年,这其中绝大部分时间我们都生活在非洲的萨凡那荒原上。但是为了说明我的观点,我们还没必要回溯到那么遥远的过去。让我们想像自已生活在一个早期城镇定居点环境中。这是个中心集镇,位于富饶的新月地带,距今只有3000年。从遗传基因的观点来看,这肯定属于现代了。信息的传播受到物质手段的限制:人无法快速旅行是件千难万险、危机四伏的事。你会在距出生地点半径很小的一个范围内定居下来,除非遇到灾荒,或某些未开化的部落入侵,把你和你的族人赶出美好的家园。你一辈子能认识的人数不会很多。如果发生犯罪,怀疑对像的人数也很少,很容易从中找出有罪的证据来。如果你有冤情,你的申诉也很简单,你会举出很简单的一些证据,像‘我当时不在那儿,我当时在神庙里祈祷,黄昏时大祭司还见到过我。”你还可能加上一句,萨哈家那个叫奥贝什梅什的儿子倒更有可能犯罪,因为他从这桩罪行里能得到的好处更多。你的生活会比较简朴,因此你的概率空间(space of probabilities)也比较狭小。
真正的问题在于,我已经说过,这种天然居住地里没有很多信息。直到非常晚近的时候都一直没有必要对机遇进行有效计算。这也就解释了,为什么我们要等到赌博文化出现以后,才能见到概率数学的发展。一般盾法时,由于第一个千年纪和第二个千年纪的宗都背景,所有有可能帮助认识到决定论不存在的工具都受限制而得不到发展,这就延缓了概率研究的发展。这种看法实在难以置信:我们没有计算概率,就仅仅是因为我们不敢这样做?道貌岸然理肯定应该是,我们在那时没有那个需要。我们的许多问题就出自于这样一个事实,我们从那样的居信地进化出来得太快了,比我们的基因进化得要快得多。比这还要糟:我们的基因根本没变。
法庭上的卡夫卡
O.J.辛普林案件的审判为我们提供了一个例子,说明我们这个更代社会虽是由概率统治的(因为信息爆炸的缘故),但在做重要决定的时候却边它最基本的法则都不尊生。我们有能力把宇宙飞船送上火星,但我们却没有能力按照概率的基本法则对犯罪案件进行审判,而证据,显然是个概率上的概念。我记得曾在一家叫“边缘书”的连锁书店买了一本有关概率的书。这家书店离洛杉矶法院没多远,而在那里,这个世纪案件正在审理之中。这本书是这个领域里高度尖端的数量化知识的又一个结晶。像这样一种在知识领域里的飞跃,离此仅几英里远的律师们和陪审员怎么却注意不到呢?
由于我们对可能性的基本概念有误码解,概率法则允许我们推测出的最有可能是罪犯的人(就是说,我们有相当的把握,而不仅仅是有一丝怀疑)正逍遥法外。由于对概率解读不准确,你可以被判犯了一项你从未犯过的罪行,因为我们至今仍没有一家法院有能力正确地计算出事件的交易室里,电视机开关,我见到基中一个律师正在争辩说洛杉矶至少有四个人会携带与O.J.辛普林相同的DNA特征(这样就否认了这是一个联合的事件组合,我们会在下一段看到是怎么回事)。我于是厌恶地关掉了电视机引起交易员们的一片抗议。在那个时刻以前我还一直以为,由于罗马民主的高标准,法律案件中的诡辩术已经被消除了。更糟的是,一个哈佛大学的律师使用了似是而非的论据,说虐待妻子的男人中只有10%的人会进而谋杀她们。这是个不以谋杀案为条件的概率(这是不是因辩护需要而故意把概念歪曲、或是纯属恶毒,亦或是无知都无关紧要)。法律难道不是致力于维护真理的吗?正确的做法应该是,确定一下在妇女被丈夫杀死之前还曾被他毒打过(也就是说50%)。因为在这里我们而对的是所谓条件性概率问题:就是说,O.J.辛普森杀死他妻子的概率是以她已经被杀死这一信息为条件的,而不是O.J.辛普林杀死了他妻子这样一个无条件概率。连一名受理并教授概率证据的哈佛教授都能发表出这种不正确的意见,我们又怎么能指望一个没受过训练的人来理解随机性呢?
更具体地说,陪审员(和律师)和我们其他人一样容易在联合概率这样一个概念上犯错误码。他们没有看到,证据会有复合效应。我在同一年被诊断为患上呼吸道癌并被一辆粉红色凯迪拉克轧死的概率,假设各为1/10万,那么把这两个(明显相互独立的)事件概率相乘之后,就变为1/10亿。以血型观点来论证O.J.辛普林有1/50万的可能不是杀手(律师们用了洛杉矶有四个这种血型的人这种诡辩术),再加进他是死者的丈夫这样一个事实,再加上还有其他证据,那么(根据复合效应),对他不利的可能性就提高到几千亿了。
“高素质”的人会犯更糟糕的错误。如果我告诉人们,联合事件的概率比两者之中的每一单个都小,人们会吓一跳。行为经济学家对有理性的、受过教育的人(研究生)做测试,让他们说出一位受过大学文科教育的年轻女性会是一位银行出纳员还是一位女权主义银行出纳员。从他们的平均估计来看,把她看成女权主义银行出纳员的概率高于她是一位普通出纳员。我很高兴自已是个交易员并能利用人们的认售偏差来挣钱,但我害怕生活在这样一个社会里。
荒谬的世界
卡夫卡的预言性的书,《审判》(The Trial),写的是一个叫约瑟夫·K的人的遭遇,他因为某种神秘而无法解释的原因被捕。这本书获得了成功。在它之前我们没听说过“科学”极权主义政权以及它的种种统治方法。这本书描绘了可怕的未来,人们被束缚在荒谬的自给自足的官僚体制中,它会根据这个官僚体制的内部逻辑自发地产生出自已的规则。这本书繁育了整整一批荒谬文学:我们这个世界也许太不协调了。我对某些律师害怕,听过O.J.辛普森审判中的那些发言(以及它所产生的影响),我担心,实在担心会出现什么样的后果。我也可能会因为某种在概率上毫无道理的原因被捕,然后不得不在一群对随机性一窍不通的陪审团面前,与某个能言善辩的律师唇枪舌战。
我们说过,在一个原始社会里简单的评判就足够了。在可能结果的概率空间只有一维的情况下,一个社会没有数学,或在我的行业里,交易员不用数量化方法进行交易,都很容易生存下去。一维的电思是说,我们观察的只有一个变量,而不是一组单独的事件。一个证券的价格是一维的,而一组几种证券的介格是多维的,因而就需要使用数学模型。我们用肉眼不能很容易地看出资产组合的一组可能结果,甚至无法将它在图表上表示出来,因为我们的物理世界被局限为只能以三维形式做视觉体现。以后我们会说明,为什么说我们有可能冒着使用错误模型的危险(应该承认我们已经这样做了),或者犯下对无知宽容的错误;逃离了不懂数学的律师,却又遇上不会选择正确模型到锡拉六头女妖的岩礁,在过两者之间无所适从。换名话说,我们会在这样两种错误之间摇摆:忽而听信拒绝科学的律师满嘴胡说,忽而把某些过于自信的经济学家的有毛病的理论投入使用。科学之美在于它为这两种类型的错误都留下了余地。很幸运地,我们有一条中间道路;遗憾的是,很少有人去实践。
卡尼曼和特弗尔斯基
从媒体引用、追随着人数各对一个领域的影响这几方面来说,本世纪最有影响的经济学家是谁呢?不对,不是约翰·梅纳德·凯恩斯,不是阿尔弗雷德·马歇尔,不是保罗·萨谬尔森,也肯定不是密尔顿·弗里德曼,他们是心理学研究人员丹尼尔·卡尼曼(Daniel Kahneman)和阿莫斯·特弗尔斯基(Amos Tversky),他们的专业是去发现,在哪些领域里人类无法做出理性思考和最佳经济行为。
通过这两位的揭示,我们对自已看待和处理不确定性的方式有了许多了解。他们在70年代早期对学生和教授群体进行了研究,表明我们不能正确地理解意外事件。此外他们还证明,在我们能够理解概率的极少数几种情况下,我们却似乎不会考虑把它们运用到行为中去。自从有了卡尼曼和特弗尔斯基的研究结果,一个全新的学科,行为金融及经济学(behavioral finance and economics)—蓬勃发展起来。它公然反对商学院落的那种正统观念,他们教授的所谓新经典经济学都冠以一些规范名称,如效率市场、理性期望和其他一些这类概念。在这个节骨眼上,值得停下来谈一谈规范科学和积极科学的问题。规范科学(明显是个自相予盾的概念)提供的是描述性的教育;它研究事物应该是怎样的。有些经济学家,例如那些信奉效率市场的人,认为人是有理性的,所以会以理性方式行动,因为这样做才对他们最有利(以数学语言来说就是“最佳”)。相反的是积极科学,它建立在对人类行为做实际观察瓣基础上。尽管经济学家妒嫉物理学家,然而物理学天然就是个积极科学,而经济学,特别是微观经济学和金融经济学,基本上是一种规范科学。
神经生物学
过去,心理学和经济学这种软科学有时欺骗我们。怎么欺骗的?经济学提出了一些令人发笑的思想,只要你把其中某些假定改动一点点,过些思想立刻就不复成立了。经济学家们也是如此),一面互相争斗,令我们无所适从。而另一方面,生物学和医学,在科学可靠性方面所占的位置就要高一些;与其正的科学一样,它们可以对事物做出解释,与此同时它们也允许被证伪。这两种都是积极科学,它们的理谇都是较好的理论,就是说,比较容易检验。现在传来一条好消息,神经病学家开始证实这些结果了。他们对脑子中单独一个点受伤的患者(如肿瘤,或者其他被认为是局部的损伤)做了所谓的脑部环境图,并用排除法推断这一解剖部位的爱猫扑.爱生活可以把大脑中执行各种功能的部位孤立起来。由于我们在行为遗传学和普通医学中取得了这些认识上的飞跃,卡尼曼和特弗尔斯基的研究结果现在有了一个坚实的基础。我们大脑的一些生理功能使我们以一种即定的方式认识事物并做相应行为。不管我们愿意不愿意,我们受制于自已的生理局限而不能自拔。
进化心理学研究人员对这种认识偏差提供了令人信服的理由。我们一直没有那种动力去发展对概率的理解能力,因为我们没有必要那么做,但是更深层的原因是我们的设计结构本身不能够理解这些事性。我们的构造只满足生存与繁衍的需要。为了生存下去,我们需要对某些概率高估一些,如那些能够影响到我们生存的概率。举例来说,有些人的大脑对死亡的危险有更高的警觉性,也就是说他们无所不怕,这些人生存了下来而且把他们的基因传给了我们(前提是这种无所不怕的代价不能太高,否则就有可能成为一种缺陷)。我们的大脑生来说带着这些认识偏差。遇到更复杂的情况,也就是在需要精确测定概率的时候,它们会成为一种牵制。
因此各学科以这样的方式确认了这些认识偏差的实际存在:理性化是指不仅要具有始终如一的信念(即,不存在逻辑上的予盾),而且还要能采取与这些信念相一致的行动,而我们存在的认识扭曲使我们不能实现这种意义上的完全理性化。
理解概率时存在哪些认识偏差
我在行为科学著作里至少找到了40种严重认识偏差。下面介绍一种著名的测试,它使医学界感到难堪。下面这道测试题是发给医生的(我从德波拉·班尼特的《随机性》(Randomness)这本优秀的书中借用一下)。
某一疾病的测试中有5%的假阳性率。这种疾病的发病率是人口的1/1000。人们随机受试,而不管他们是否被怀疑患上了这种病。一位患者的测试结果是阳性,那么这位患者患上这种病的概率是多少?
多数医生回答95%。他们仅仅考虑了这种测试有95%的准确率这一事实。但实际答案应该是这样的:由于这是个有病的患者,而测试又显示了这一点,所以这是个条件性概率,所以答案应该是接近2%。每五个专业人员中能答对的人连一个都有不到。
我把这个答案简化一下。假设不存在假阳性,假设1000名做了这项试验的患者中有1名会被证明染上了这种疾病。在剩下的999名没得这种病的患者中,这项测试应找出约50个病例(因为有95%的准确率)。正确的回答应该是,被随机选中并且测试反应为阳性的人,患上这种病的概率是下面这样一个比例:
患上这种病的人数
真假阳性数
在这里就是51人里有一人。
在你可能只有2%的概率得某种病的情况下,人家却说你得了那种病。想像一下,你会被强迫服用多少次那种有破坏性副作用的药!
我们是期权肓
作为一名期权交易员,我注意到,人们一般会低估期权的价值,因为他们通常不能够正确地在头脑中评价一种收益不确定的金融工具,即使他们对它的数学原理完全明白也不行。连调解人员也强调这种无知观念,他们向人们解释说,期权是一种衰退中或消散的资产,低于其内在价值(out of the money)的期权,由于失去了两个日期之间的溢价,就被认识是在衰退。
下面我要简要(但充分)的方式澄清一下什么叫做期权。比如一支股票的交易价为100美元,有人授权给我(但不是义务),在一个月以后的今天以110美元买下它。这被称为买入期权(call option)。如果这支股票在一个月以后的交易价格高于110美元,我就行使这项权利,要求期权卖方把这支股票按110美元交付给我,否则就没有道理。如果这支股票升到120美元,那么我的期权就值10美元,因为我可以从期权卖方手中以110美元买进,然后以120美元卖给市场,把中间在差额装进衣袋。但是这种情况的概率不是很高。如果我立刻行使这个权力,我就无利可图,这种情况就叫低于其内在价值(out-of –the-money)。
假设我以1美元买下这份期权,我希望它的价值一个月以后是多少呢?多数人认为是零。这不正确。这份期权有很高的概率,可以说有90%的概率,在到期日价值为零,但还有10%的概率平均价值可以到达10美元。这样,把期权按1美元卖给我并不等于给卖方带来了活钱。如果卖方相反,自己把这些股票按100美元买下,等一个月,他们就可以把它按120美元卖出去。所以现在赚到1美元就谈不上是活钱。同样,买下它也不是消散资产,连专业人员也会被愚弄。怎样愚弄呢?他们把期望价值与最可能出现的情况(期望价值是1美元,而最可能出现的情况是期权价值为0)弄混了解。他们在头脑中过分强调了最可能的情况,也就是,市场一点也不动。期权只是资本可能具有的几种可能状态的一个加权平均数而已。
期权卖方还提供了另外一种满足。它有稳定的回报和稳定的成就感,心理学家称之为有流量。早晨去上班的时候想着又能挣到几个小钱,心里是十分愉悦的。而如果想到可能需要出点血,需要以平衡的方式保持流失几个小钱,那么即使这个策略从长远一点来看注定要赚钱,如果不具备坚强一点的个性也难以接受。我注意到极少有期权交易员能够维持我所谓的买入“易变性”地位,也就是那种很有可能在到期时损失少量金钱,而准备在长期等待中看准突发机会赚钱。我发现极少数人能接受在多数到期日损失1美元,而隔一段时间赚到10美元,即使这是个公平游戏(即,他们赚到10美元的次数多于10%。)
我把期权交易员群体分为两大部分:溢价卖方(premium sellers)和溢价买方(premium buyers)。溢价卖方(也叫期权卖方option sellers)卖出期权,一般来说能稳定地进钱,就像第一章和第五章里的约翰那样。溢价买方的做法与他们相反。人们说,期权卖方是以鸡的方式吃进,以大象的方式拉出。呜呼,我在职业中遇到的大多数期权交易员是溢价卖方,他们泡灭的时候,遭难的一般是别人的钱。
似乎明白这种(简单)数学的专业人员是怎么陷入这样一种境地的?我们对数学的理解实际保持在相当肤浅的水平上;医学开始相信,我们的行动不完全听从我们发出理性指令的那部分头脑的指挥(参见安东尼奥·代玛西奥所著《代斯卡特的错误》或勒杜的《情绪化的大脑》)。我所都以情绪化的方式做思考,这是无法归避的。由于同样的原因,在其他方面很理性化的人会吸烟或参加不会给他们带来直接好处的斗殴。与此想像的是,有些人虽然知道卖期权的做法不支,但他们还是这样做,事情会变得更糟。有一种人,一般是学术界的人士,他们不仅不把自己的行为与大脑协调起来,反而以他们的大脑去适应自己的行动。他们反过来对统计数字做手脚,以证明他们的行动正确。在我这个行业里,他们以统计学论点来愚弄自己,为他们卖出期权做辩护。
概率和媒体(更多的记者)
记者所学的专业知识,是用各种方法表达自己,而不是对事物做深入调查。对他们的选拔,看重的是谁最能说会道,而不必是谁最有知识。我在医学界的朋友们称,许多医学记者对医学和生物学一窍不通,经常在最基础的问题上犯错误。我自己只不过是个医学研究的业余爱好者(虽然有时狼吞虎咽的读了不少东西),所以对此没法加以确认。但我注意到他们对医学研究报告中使用的概率几乎从未正确理解过。最普遍的一种情况与对证据的解释有关。他们普遍把不存在某种证据和有证据证明某种东西不存在这两个概念混淆起来,与我们在第九章看到的情况差不多。为什么?比如我对某种化学疗法做测试,比如治疗上呼吸道癌的氟脲嘧啶,我发现它比暗示疗法效果好,但是好的程度有限;它使存活率从21%提高到24%(除其它一些药征以外)。由于我抽样的规模较小,我不敢说这增加了的3%的存活率肯定是由于药物本身的功效;它很可能是由随机原因造成的。于是我会写一篇报告,简要说明一下我得到的结果,并且说明,(暂时)还没有找到这各药物能提高存活率的证据,需要做进一步研究。一个医学记者会抓住这一点,并声称某N.N.塔勒波教授发现证据,氟脲嘧啶没有疗效。而这种说法实际与我的想法完全相反。于是在“不起眼镇”有个天真医生,他比最没经验的记者更讨厌概率,在看到这篇文章后,就在头脑中筑起一道高墙来抵制这种药,即使最终有某个研究人员找到了最新证据,证明这种药物明显有助于提高存活率,也无济于事。
午餐时间的CNBC
金融电视频道的CNBC的来临为金融界提供了很多的好处,不过它也让一群爱表现的实践者挤进来,得到了几分钟表达自己理论的机会。人们常能看到一些看起来很体面的人对股票市场的性质发表滑稽(但听起来颇占理)的言论。其中有些言论公然违反概率法则。有一年夏天我热衷于在健身俱乐部锻炼身体,其间我经常听到像“实际市场只比最高点低10%,而平均股票比最高点低了将近40%”这类的言论。这是想告诉人们将有大麻烦或异常现象,是某种熊市的预兆。
平均股票跌40%与所有股票的平均值(也就是市场)跌10%这个事实并不是自相矛盾。我们必须考虑到股票并不同时全部到达自己的最高点这个情况。在股票不是100%相互关联的情况下,甲股可能会在一月份达到它的最高值,乙股也许在四月份达到最高值,但是这两支股票的平均最高值可能会在二月份的某个时候出现。再者,如果股票是反向关联的,如果在乙股最低的时候甲股达到最高,那么当股票市场达到最高点时,这两支股票有可能同时都比自己的最高点低40%!根据一个叫做“随机变量的最大分布”(distribution of the maximum of random variables)的概率法则,平均值的最大值肯定会比最大值的平均变易幅度小。
你此时可能已经死去
这又使我想到,在电视黄金时段播出的金融专家犯一些违反概率法则的错误。这些人被选取中可能是因为他们的相貌、个人魅力以及他们的演说技巧,但肯定不是因为他们有犀利的思想。比如,我常见到一位著名的电视金融权威发表这样的谬论:“美国人平均生命期望值为73岁。因此如果你现在68岁,你可以指望再活5年,所以要做相应打算。”接着,她就给人开出精确的妙方,指导人家在还有五年活头的背景下应该怎样投资。那么如果你80岁了该怎么办呢?你的生命期望值是否就是负7岁呢?这些记者所弄不清楚的就是非条件性的和条件性的生命期望值。在出生的时候,你的蜚条件性生命预期值可能是73岁,但是随着你年事增高而没有死去,你的生命预期值会随着你的生命增长。为什么?因为其他人的死去把你在统计数字的位置占据了,因为预期值就是平均值,所以你如果是73岁而且身体很好,你也许,比方说,还有9年的预期生命。但是预期值会变,到了82岁,只要你还活着,你会还有5年。甚至有些100岁的人仍然有正数的条件性生命预期值。所以,那位电视金融权威的论点细想起来,与下面这个例子就没有多大区别:我们手术的死亡率有1%,迄今我们在99位患者身上非常成功地施行了这项手术;你是我们第100位患者,所以你死在手术台上的概率是100%。
电视金融计划员会把一些人弄晕,这没多大危害,但是由非专业人员向专业人员传递信息就远为令人担心了。下面我们转向记者。
布伦堡的解释
我的书桌上有一架机器叫布伦保Bloomberg tm(以传奇式的创始人麦克尔·布伦堡的名字命名)。它是一个电子邮件服务器、新闻服务器、历史数据抽取工具、一个图表绘制系统、难以估计价值的分析辅助工具,而且,但不是最不重要的,还是我可以看证券和货币价格的屏幕。我使用它已经成癖,工作时对它须臾不可或缺,否则我就觉得与外部世界切断了联系。我用它与我的朋友保持联系,确定约会时间,并用来解决一些有意思的争端,这种争端能划破生活的刻板。而没有布伦堡地址的交易员对我来说就变得好像不存在了(他们只得使用英特网这种平民化的东西)。但是布爱猫扑.爱生活能中有一样我要摒弃掉,那就是记者的评论。为什么?因为他们参与到对事物的解释中来,并且使右列/左列的混淆永久化。这也不能全怪布伦堡,只是我过去十来年都没有读过报纸上的商务专栏,而宁愿读读真正的散文。
就是我写这几行字的时候,我从布伦堡屏幕上读到这样几条标题:
——利率降低,道指升1.03
日本顺差提高,美元跌0.12日元
整篇都是这类东西。如果我没弄错的话,记者自称对其做出了解释的那些东西只不过相当于纯噪音。道指在11000点的时候,1.03的变动连0.01%的变动都不到。对这样一个变动没有必要做出解释。一个正派人不会认为这种情况可以做出什么解释;这里面提不出什么道理来。但是,像那些比较文学的助教一样,记者既然收了钱提供解释,就乐得赶快拿出解释来。惟一的解决办法就是让麦克尔·布伦堡停止向记者付钱让他们做评论。
意义:我凭什么说它是纯噪音?我们做个简单的比喻。如果你和朋友参加一项横穿西伯利亚的山地自行车比赛,一个月以后,你赢了,但只赢他一秒钟。显然在这种情况下,你就不大可以自吹说你比你的朋友骑得快。你有可能是得益于什么东西,也许干脆就是随机性,不会有什么其他原因。那一秒钟本身的意义不足以让人做出结论来,我不会在临睡前的日记中写上:骑车人甲比骑车人乙骑得快,因为他吃了菠菜,而骑车人乙的伙食中有丰富的豆腐。我做出这项推论的原因在于骑车人甲在一场3000英里的赛事中比骑车人乙快了1.3秒,从而战胜了骑车人乙。——如果这个情况持续了一个星期,那么我有可能开始分析,这是不是由豆腐造成的,还是另有其他原因。
因果关系:还有一个问题;既然承认它有统计学意义,人们就需要找出一个原因和结果,那就意味着,你会把市场中出现的事件与人家提供的原因相联系。Post hocergo propter hoc(要找原因,原因就有了)。假设医院甲接生了52%的男孩,而医院乙在同一年里只接生了48%的男孩;你能够因此得出这样一个解释,你生了个男孩是因为他是在医院甲出生的吗?
因果问题可以是非常复杂的。当我们身边有许多原因时,要想孤立出其中一个来是非常困难的,这叫做多变量分析。举例来说,如果能使股票市场做出反应的有美国国内利率,美元对日元汇率,美元对欧洲各国货币汇率,欧洲股票市场,美国国际收支差额,美国通货膨胀,以及其他十几种主要因素,那么记者就需要对所这些因素进行观察,观察它们单独的和联合的历史效应,观察这种影响的稳定性。然后,还要在参考了测试统计之后把那个因素分离出来,如果你能办得到的话。最后,你还应该赋予这个因素一个恰如其分的信心水平。如果它低于90%,那么这事就到此为止了。我可以理解为什么休谟对因果关系如此极端反感,而且在任何地主都不以有接受这种推理。
首页 上一页 共3页
返回书籍页