必读网 - 人生必读的书

TXT下载此书 | 书籍信息


(双击鼠标开启屏幕滚动,鼠标上下控制速度) 返回首页
选择背景色:
浏览字体:[ ]  
字体颜色: 双击鼠标滚屏: (1最慢,10最快)

我生活的种种模式

_8 赫尔伯特.A.西蒙(美)
1987)中,我和我的合著者谈了很多有关科学发现的事情。迪帕克,库尔卡尼和我还在《认知科学》(Kulkami
and
Simon1988)的一篇论文中加上了有关这个主题的一章。其中我们总结到:科学家是探索迷宫、解决问题的人;(科学)发现的理论就是对解题理论的注释①。
科学家给自己设了许多不同类型的任务:建构问题②,发现有趣的现象,发现隐藏在数据背后的规律,对现象和有关理论提出新的表征方法,推断理论的逻辑结果并对它们进行测试,设计实验,发现能说明经验归纳结果的解释性机制,发明供观察和测量用的新仪器。无疑,还有许多别的任务。
所有这些任务使用的一般性解题过程,与棋手下棋选择着数、实验室里的被试对象解决河内塔问题、医生做诊断、计算机推销员向用户配置系统、建筑师设计房子、有机化学家合成新分子时所采用的过程相同。①
因为作者认为科学发现是解题的一种特例,故有此说。——译注②fonnulating
problems,著者说明,指界定问题并给出问题的表征(建立问题空
间)。——译注465
而且,像(科学)发现之类的工作所必需的“顿悟”原来就是人们熟知的“识别”过程的同义词。在讨论创造性活动时,常用的其他术语,如判断力、创造力、甚至天赋等,看来或者是完全不必要的,或者是与“顿悟”一样,可以用通俗易懂的概念来界定的。
许多已出版的有关科学发现的著作中包括了迄今为止的轶事,通常是自传性的,关于某项发现及其发现者的。如果科学发现需要创造力或甚至天赋的话,那么任何人声称自己做了一项发现都是不谦虚的,而且试图描述那个发现是怎样出现的,只能是枉费心机。
但如果科学发现只是普通的解决问题的话,那么,添加轶事性的证据就谈不到“不谦虚”或“枉费心机”的事了。在以下篇幅中,我将边想边说我自己的一些科学研究工作,虽然是回顾性的,看看它们是否也符合解题模式,尤其是要看看我是否能找到一些符合我所谈到的科学发现的各个组成部分的例子。
我的预言将针对过去,因为只有反向预测才真正是我们在这个领域中可以完全相信的。正向预测毕竟会受我们正在测试的理论的影响:这种理论可能符合我们的行为,只是因为我们已读到了这种理论,并且认为如果遵循它我们会做得更好。建构问题
通常认为,在回答一个问题之前,你必须提出那个问题。或者,换个比喻的说法,要找的东西必须是已经丢失的东西。但这是不是真的呢?当一个人发现了一个金矿脉时,是不是大自然丢失了这个金矿脉呢?如果我们能找到我们不曾丢失的金子,我们就有可能回答我们未曾问过的问题。
我们可以通过搜索而发现金子(甚至是我们不曾丢失的金
466子)。但那意味着我们已经问过“在哪里我们能找些金子”?但是,又如何解释当我们没有寻找金子时却找到金子的情况呢?比如,我们在进行一些别的什么活动(例如,在山上采野花)时发现了金子。至少(退一万步说),我们必须注意到金子;它必须引起我们的注意,使我们不注意花而注意它们。我们是否要通过假定一个对金子的需求来说明这一点呢?或者,用对闪光的黄色物体的注意倾向来解释这一点?同时,这种对黄色物体的吸引力是如何将我们的注意力从采花的任务中转移过去的呢?①
现在,让我们从找金子回到找问题这个话题上来。我们的比喻提出,一种发现问题的方式或者甚至是发现问题解答的方式是设法去解决某个其他的问题。这并没有告诉我们那个其他问题是从哪儿来的,但一次一个问题②1我们正在讨论“意外”这个现象。在寻找野花时,我们意外地看到岩石中闪闪发光的金黄色的东西。要感到意外,我们就必须注意到那个令人感到意外的现象。因此就有巴斯德的格言:“有准备的头脑才会有意外的发现。”
那么,现在我们又有了一个新的问题,就是:头脑怎样能变得有准备?如果我要仿效历史悠久的、采用自传轶事作为我的发现理论的证据的话,也许现在正是时候。我的第一件科学工作是研究密尔沃基市的公众娱乐活动(
Simon
1935)。对组织的研究的一个标准课题就是预算过程。在这个案例中,预算过程涉及到资金在游乐场维护(这由一个组织管理)和游乐场活动领导(这由另一个组织管理)这两者间的分配。这个分配是经常①
请注意此段文章风格如同在试验室里记录到的大声思维式口述报告。思
路活跃,条理清楚,但句子之间没有正常行文时的光顺连接。——译注②
著者说,这里指的是,通过引进新问题而解决了老问题。467
引起争吵的问题,它是怎样完成的呢?
我在这以前的经济学研究给我提供了一个现成的假设:分配资金,使得用于维护的一元钱与用于领导人员的薪金的…元钱得到相同的回报。我没有看到任何人用这种方式来考虑这方面的决策。我是不是对他们忽视常规的经济学理论的情况感到意外呢?也许在刚开始时我是感到意外。但经过思考后,我发现,我也不明白怎么能使之实施。怎么样将较好的游乐活动领导的价值去与更吸引人的、维护良好的游乐场地的价值做比较呢?
接下来我就有了一个新的研究课题:在不符合新古典经济学所假定的合理性条件的情况下,人们是如何推理的?经过进一步调查,我想我可以看到一个相当简单的模式:那些在组织上负责管理游乐场所的人想将更多的钱用于领导活动,而那些负责游乐场物质环境的人则想将更多的钱用于维护。概而言之,人们通过认同自己所在具体单位所负责的局部目标将决策带进合理的范围(Simon
1947,chap.
10)。
当然,这只是一个片面的答案。它阐明组织认同①现象,一个被证明是行政管理理论中有用的概念。更广义的问题,即:在不符合经济学家的普遍合理性的条件时(或甚至在符合这种条件时),人们如何做出决策。这仍然是目前一个相当活跃的新研究领域。核心概念是有限理性,人类思维的计算(能力)限制的别名。当人们不知道如何优化时,他们可能对能够找到足够好的解决办法感到很满意。而通过探索可能性的迷宫,人们通①organieational
identification,著者说明指形成对组织的忠诚,接受组织的目标,
并且逐步地因组织的环境及其在组织中的位置而改变一个人的世界观。
因此,“认同”这个词既包括动机的方面,也包括认知的方面。常可以找到足够好的解决办法(
Simon
1955a,1982a)。
那么,就作为科学发现的一个组成部分的发现问题而言,这件轶事说明了些什么呢?它所说明的一件事是:1935年我发现的一个研究问题导致我进行了半个世纪的研究。我从未需要去发现另一个这样的问题。说明人类理性的大问题引出了一系列无穷的子问题:人们如何解决河内塔问题;他们如何选择下棋的着数;他们怎样搞科学发现?(Newell
and
Simon
1972;Simon1979a,
sec.4,7;
Langley
et
al.
1987)
它所说明的另一个问题是,科学发现是递增性的,必须采用以前已经做的每件事作为初始条件来解释某一特殊的发现行为。我们要寻找的是这些初始条件是如何导致下一个步骤的。在上述案例中就是:我的价格理论知识,以及我的教授想知道密尔沃基的两个组织如何合作提供娱乐服务的愿望,是怎样引导我去观察那个最初使我感到意外的现象的;而那个意外又是怎样导致识别和有限理性的概念的。15年以后所采取的步骤导致了从有限理性到满意性,从满意性到探索。
第三,这件轶事为长长的例证表增加了一个例证。这些例证表明,“意外”打动有准备的头脑是科学发现的关键。对于这个头脑来说,什么是“有准备的呢”?我在经济学方面的训练(运用在研究预算问题中),揭示了理论告诉我应当发生的事与我耳闻目睹的实际发生的事情之间的矛盾。如果没有经过经济学方面的训练,我会将那个观察到的行为看做是完全“自然的”行为;而没有那些观察结果,我就会继续沉浸在愉快的错觉之中,以为效用最大化的新古典主义理论阐明了预算编制领域中人的行为。而且由于我对经济学专业的了解还相当少,所以我还没有养成忽视与该理论相矛盾的现实世界的习惯,而这种习惯在经济学专业中是很常见的。
469
没有什么是不可思议的,没有什么是神秘莫测的。那么,我们能否模拟它呢?这里的启发式策略与KEKADA相当类似——所谓KEKADA,是我和迪帕克,库尔卡尼用于模拟汉斯,克鲁勃研究策略的一个程序。汉斯发现了在活体内合成尿素的化学过程(Kulkami
and
Simon
1988)。在其预期的结果没有出现时,这个程序经历了意外,并且通过为那些令人感到意外的现象寻求解释而对其“意外”作出反应。我们还没有扩展KEKADA去模拟有限理性的发现。但是,如果我在1935年有KEKADA帮助的话我就能省很多事。来自数据的规律
在《科学发现》(Langley
et
al.
1987)中,我和我的同事们注重于从数据导出定量和定性规律。我们采用了我们称之为BA-CON和“道尔顿”的程序来模拟这个过程。
数据不是唯一可能导出新规律的出发点;理论也可以单独地使用,或与数据一起使用。至少,可能由一个比较基本的解释性的规律能直接发现一个描述性的规律。例如,牛顿说明了开普勒的行星运动第三定律可以用数学方法从万有引力定律推导出来(但请注意,牛顿是从开普勒用数据驱动的探索方法已经发现的那个规律作反向研究的)。
在发现符合经验数据的规律之前,必须拥有适当的数据,这些数据看起来好像是由一个平滑的数学函数所生成的。这里又重复一遍做炖兔肉的菜谱:首先得逮住兔子。
在我的一生中,我只偶然碰见过一次这样的数据。我不能准确地回想起到底是在什么时候第一次遇到这种数据的,很可能早在1936年我读洛特卡的《物理生物学原理》(Lotka
1924)
470时。洛特卡的数据说明,如果以某种顺序统计植物或动物的每一个属里的物种数目,然后,将这些属以其所含物种的数目按从大到小的顺序排列起来,那么,第n名的属所含的物种的数目是第1名的属(即含物种的数目最多的属)所含物种的数目的1/几。
同样,在计算一本书中不同的词出现的频率时,而且根据其频率由大到小排列词的情况下,第凡个大的频率的词的出现频率相当于最大频率词出现频率的1/n倍。而且,一本书中出现的词大约一半会出现一次,大约六分之一的词会出现两次,十二分之一的词出现三次,如此类推。这种关系对用任何字母表示的语言写的书都适用,违反规律的情况很少①。在美国城市人口统计中也可看到同样的规律:人口数量第n大的城市的人口大约相当于纽约人口的1/n倍。如果用其对数来替代这些数据的话,则这些数据点将落在斜率为-1的直线上。
乍看时,这种规律性只能说是令人吃惊,这种规律性有什么用呢?弗兰西斯,培根爵土建议我们从这些规律性归纳出一般的规律,找出满足这些数据的公式。我们的计算机程序BACON(Langley
et
al.
1987)向我们演示了如何实现之。然后,像伟大的化学家约翰?道尔顿一样,我们应当看看我们能否提出一个①
达里说的第J1个大的频数的词,即所谓秩为r真的词。译者询问过西蒙在-
篇文章中确定各词所对应的秩的方法。下面举例说明。
“文章”例:我说:“我昨天吃饭。我今天也吃饭。”他说:“我也一样吃饭。”
将其中的词按出现频数从大到小排列,我们有:
词:





昨天
今天

…样
频数:
4
3
3
2
2
1
1
1
L
秩:
1
2
2
4
4
6
6
6
6
或者,取平均值:
秩:
l2.5
2.5
4.5
4.5
7.5
7.5
7.5
7.5
如果统计-、篇大约有一千个词的文章,并按上述方法确定各个词的秩的
话,可以看到,词频的分布遵从西蒙所说的规律。471
机制,这个机制的运作能产生那个公式所描述的规律性。我们的“道尔顿”程序(Langley
etal,
1987)也模拟了这个过程。借助BACON和DALTON我们可以弄清楚要做的是什么。
我希望我能说这就是我对洛特卡数据的即时反应。但想不起来了。我记得自己对它们的痴迷,但我不记得自己是否深入地思考过它们,或者如果思考过,思考了多久。我记得1942年后我回到芝加哥时还思考过它们。我清楚地记得我坐在芝加哥大学生物学图书馆里阅读洛特卡书中所引用的一篇论文的情景。我还想起在1952年到1954年间在圣莫尼卡公寓拜访阿伦,纽厄尔及夫人诺埃尔时跟他谈论这个问题的情景。但在那些年里我正在做许多别的事情,关于词频率和城市规模的令人惊讶的数据并不是持续占据我研究活动第一位的事,而更像一个偶尔需要搔一搔的痒处。
1954年的某个时候我找到了答案。现在从我的记忆中只能找到这个发现的一鳞半爪了。首先,我寻找一个适合该数据的函数。频率范围低端的词频率规律性给我留下特别深刻印象。那些简单的分数好像指着一个涉及整数比率的公式。事实上,简单的公式f(;)=1/[i(i+1)]给出了所需的数字1/2,1/6,1/12等等。由于i大,我们大致可有:f(i)=1/j2。于是,对这个频率进行积分,就给出了秩(排列顺序)F(i)=1/;,因此,按对数尺度,秩和频率之间的关系就是斜率为-1的线性关系(J
找到了一个适合这些神奇数字的方程又提出了一个新问题:找出这个方程式的解释,即…种对这个现象似乎合理的解释。我对当时自己是如何解决这个问题的记忆甚至比我对前阶段的记忆还要淡,整数的比率又是关键。你从哪里能得到整数的比率呢?阶乘的比率是一个可能的来源:1/6可以写作1/2与1/3的乘积;1/12是1/2,1/3和2/4的乘积。总之,公式(i-
4722)!/i!产生这些必要的数。
下一步很可能只会被具有一点数学知识的人所想到。他们能在这些阶乘的比率中看到一些像Beta函数的东西,或者至少在关于组合和概率的问题中见到的那类表达式(事实上,我发现Beta函数是由于我想要找东西去查阅皮尔斯(Peirce)的《简明积分表》一书,因为我隐约记得以前在那本书里看到过一些阶乘比率)。
是否还有其他原因使我考虑概率模型呢?当然有。词频率分布与城市规模分布(以及其他适用这一规律的完全不同的现象)有什么共同之处吗?除了将它们都看成是与在瓮中摸不同色彩的球一样的随机过程的例示外,没有什么明显的东西。因此,让我们看看我们能否将这个公式解释为它代表了一些取样过程的稳定状态。
在这里我想起得到过一个隐喻的帮助。我们设想一本书是逐词写成的。如果加上一个已出现过K次的词,那么出现过K+1次的词的数量就会增加],出现过K次的词的数量就要减l。为了平衡,以前已出现过X,次的词必须出现得与过去出现过(K-1)次的词一样快。这样,K库的补充就和消耗一样快。
有时我开始设想小瀑布,它有连续的水池,每个水池都因由上一级水池流入的水和向下一级水池流出的水而保持恒定的水平。由我们的答案——我们已知的描述这样一种现象的分布——往回追溯,不难证明,平衡条件要求一个已出现X次的词再出现的概率一定要与X成比例。
,我们已经到了最后一步:解释这个概率假设。对词分布来说,它可能意味着,由于联想,一个词被选作文章中的下一个词的机会是与它已经被使用的次数成比例的;同时,由于存储在记忆中的长期关联,这个机会也与该词在语言中使用的次数成比
473例。就城市规模而言,它可能意味着,城市对移居者的显著性和吸引力与其当前规模成比例,而人口出生率和死亡率大体上与城市规模无关。(
Simon
1956b)
在此我不想为这些解释做辩护。我的目的是要了解得出这些解释的过程。经过30到50年忘却的过滤,如果我的报告与现实还有什么关系的话,那么我们就能看到一个导出原始公式的过程,它看上去很像BACON。接着是通过调用预先储存好的数学及现实世界的知识而导致的反向搜索过程——这里BA-CON成了一个专家系统的“前端”。
我的手又在激烈地挥动。你们不会不注意到我完全没有解释那个小瀑布隐喻,有时还想起它,由它帮助我说明稳定状态关系。因此,关于(科学)发现的理论还有工作要做,还有些论文要写,还有些文章要发表。但在这段小历史,或曰想象的历史中,我没看到什么魔术,没看到什么神秘。每一步看来都是由前一步所决定要进行的步骤,如果不是不能改变的步骤的话,至少也是似乎必需的步骤。
如果这些数据如此大声地呼唤着解释,如果(科学)发现过程进行得这样似乎合理,那么,为什么别人没有发现这个规律并解释它呢?确实已经有人做过。第一个人是英国统计学家G.乌尼,尤尔,他在1924年建立了一个与我刚才的阐述非常相近的模型,用以解释关于物种在属中分布的数据(我可以由洛特卡书中的脚注找这篇论文,但我没找)。第二位是英国经济学家D.G.钱珀努恩,他在1953年发表了《收入分配的模式》,阐述了一个十分相近的过程。第三位是B.曼德尔布洛特,他于1953年出版了《语言统计结构的信息理论》。1955年我那关于这个主题的论文发表之前,在查找文献和征求朋友们的意见时我学习了所有这些在我之前发表的局部成果。
474
这还不是这个故事的结尾,因为一个科学问题的解答又引出一系列新问题。在我与井尻雄二合著的《不对称分布与工商企业的规模》(ljiri
and
Simon
1977)
-书中,你们可以找到一系列应用这样机制的广义版本,去理解工商企业规模分布以及这些分布的经济学含义的文章。表

我在发现不对称分布背后的规律时所采用的小瀑布隐喻引起了这个表征的问题。科学家运用什么样的表征来思考他们的研究课题?这些表征来自何处?这个问题的一个常见的形式是:科学家(和其他人)是用言辞思考,还是采取一些很不相同的形式思考——比方说,他们是否用“思维形象”。
法国数学家雅克?哈达马特在他那本令人愉快的书《数学领域中的发明心理学》(Hadamard
1954)中强烈地赞同形象思考,反对文字思考。许多著名数学家和科学家为他作证,包括阿耳伯特,爱因斯坦。爱因斯坦在给哈达马特的一封信(Hadamard1945,pp.142
-
143)中写道,“文字或语言(无论是书面的还是口头的)对我的思考机制似乎没有任何作用。那些似乎充当思维要素的心理实体是某种记号和或多或少清晰的形象。这种形象可以‘自动地’再生和组合。”
对哈达马特和爱因斯坦足够好的东西对我来说也是足够好的。我在思考难题,尤其是数学难题时,也很难找到什么文字表现。甚至当我坐在键盘前写这一章的时候,我也无法在我的头脑中真正发现言辞(或关于那个问题的许多别的东西),直到它们从我的指端写出来。但也许我没有思考,而只是记录以前构成的、存在于我潜意识什么地方的观念罢了。
475
即使我们真的用形象思考,无论哈达马特还是爱因斯坦都没有清楚地阐明这些形象是什么,或这些形象在像头脑这样的生物结构中是如何表现的。我也没有。但是,我相信,最近我与吉尔,拉金在说明这些问题方面取得了很大进展(见《为什么…张图解(有时)抵一万个词》,Larkin
and
Simon
1987)。在此我不详尽介绍这个成果。其基本概念是:(1)在将语言命题转变为形象的过程中,显化了许多在语言中隐含和隐藏的东西;(2)(习得的)推理算子能帮助用有效的计算方式由形象作出附加推理。
作为我们分析研究的副产品,我们还说明了图解可以表现为表结构,因此可以用标准的表处理语言来编制程序,因此也是随时可在类似神经原结构的系统中表现出来的。由于自然语言的表层结构和语义符号学也可以被表现为表结构,所以命题和图像(或至少是图解)可以运用共同的表征机制。
现在,正如我们的头脑中究竟是用文字还是用形象思维这个长期存在的争论…样,关于问题的内在表征究竟是像命题的集合还是像问题状况的模式,也存在着争论(也许两者是同一个的争论)。这两种观点为认知科学界中不同的主要流派所持有,这两部分人除有时争吵外,不常交往。
在“让语言引路”的旗帜下,一部分人将言辞推理作为解题过程的隐喻,并且认为推理是某种定理证明结构。认知科学界的第二部分人将启发式搜索问题空间(任务域的一种心理模式)作为解题的隐喻。《人类问题解决》(
Newell
and
Simon
1972)坚决地主张这个观点。
让我回到我的主要话题,即用事例提供有关在科学发现中所采用的解题过程的证据。我想简略地讲讲这些事例以避免谈技术细节。经济学家常用所谓“局部均衡分析”的方法,借用若
476干个“其他条件都不变”的假设来避免同时谈论每件事。他们在假设对其他经济部门没有相互作用的前提下,考察一次失调对一个小的经济部门的影响。
在这个程序的合法性受到质疑的情况下,经济学家们当然要自我保护。他们可能要说,相互作用并不是完全没有,但是很小,因此也是不重要的。不仅在经济学领域,而且在所有的科学领域我们都能听到这样的论点。但是,这是个令人满意的论点吗?小的影响,如果持续一段时间,可能聚积成大的影响。
50年代早期,当我读理查德‘古德温发表在1947年的《计量经济学》上的论文《产品滞后市场与特殊参照系的动态结合》时,我心中就有这样的想法——是用文字还是用形象表征的?虽然现在我记不得当时我用以列出和解决他论文中所提出的问题的准确步骤,但我还记得我设计了一个划分为若干部门的大的动态系统,每个部门的各组成部分之间有很强的相互作用,部门之间的相互作用则不强。我还记得我非常辛勤地工作了几个月,想看到这样一个系统是如何运转的。那时我常常在长距离的散步中工作而不用纸和笔。
我心中对这个动态系统的系数矩阵有…个模糊的形象,这并不令人惊奇,因为这正是许多数学书中通常描述的动态系统方式。到了某个时候,我看到这个矩阵的行和列可以用许多对角块来进行排列,大系数都在这些对角块中,只有小系数在对角块之外。这个矩阵几乎成了“方块对角线”。看不到具体的方块的数量及其大小。如果一定要给出数量的话,我会说,可能有三块,每块大小是3行x3列。但这种假设的回忆纯属杜撰。
后来,我得到了一个隐喻。我想象有一幢大楼,里面有若干个房间,每个房间进而又划分成若干小单间,你可以在《人工科学》1981年第二版第212页上找到我的这个隐喻的插图。我们
477从温度的极端不均衡开始。每个小单间中的每一个立方英尺都与它相邻的空间的温度不同。
现在,有几件事看来是清楚的。在每个小单间内,通过相邻空间的热交换很快会建立恒温。后来,通过小单间的热扩散,每个房间会达到恒温。再往后,通过房间厚墙间的热交换,整个大楼会达到恒温。
而且,由于持续时间不同,每个均衡过程都可独立于其他过程而加以研究。在研究每个小单问的均衡过程时,我们可以不管其他小单间。在研究房间的温度均衡过程时,我们可以用小单间平均温度来表示每个小单间,不管其他房间的情况。在研究这幢楼的温度均衡过程时,我们可以用房间的平均温度来表示每个房间。结果,这个问题的数学计算就可以被大大简化。
从这幅图到严格证实这种简化的(近似)有效性,还有些很难的数学步骤,但要得到的结果是清楚的。我所阐述的推理过程主要是在1956年夏天进行的,并且与数学部分一起载人那年晚些时候我与安藤阿尔伯特合著的一篇论文中,但这篇论文到1961年才发表(
Simon
and
And0
1961)。
我可以不去进一步弄明白这个热交换隐喻的来源,或者怎样——在任何情况下——由一个近似方块对角矩阵的形象来推理的。我对方块对角矩阵很熟悉,因为在1952年和1953年,它们在我那关于因果次序的研究工作中起了重要作用(
Simon1952,1953)。我认为,只要是用与我们同样的方式去提出这个问题的数学家,都会在脑子里想到这个数学方法,它是相当标准的。
我们的定理和方法(它们可被用于近似方块对角矩阵求逆)已经引起数值分析人员和那些关心分层组织系统的自然科学家的注意。我们介绍的归并集合法现在也被认为是与那种在物理
478学的几个部分中起重要作用的重整过程密切相关,而重整过程是在与我们的研究完全无关的情况下创造出来的。
尽管只是个概略的说明,发现过程也显得十分平常。这个问题是在文献(古得温的论文)中发现的,并采用具有某种特殊结构的矩阵,以一种标准的方式来表征。通过说明这种系统会如何运转,隐喻使要证明的定理的性质清晰。虽然并没有揭示这个隐喻的来源,但它根本没什么奥秘。虽然错综复杂,但那些证明对专业数学家不会有多大的困难。结论是,这是一个普通的问题解决事例。发现解释性模型
以上两节介绍了寻找解释性模型的过程中的两个实例:一个是秩—频(率)关系的模型,另一个是几乎可分解的动态系统模型。怎样能发现人类问题解决的解释性模型呢?一种方法是通过密切观察解题的行为,并直接从这些观察结果中推导出模型。
这种答案有许多长处,在发明通用问题解决者程序时出现过类似情况。但即使是在该种场合,经验观察结果也不是导致发现的唯一信息来源。当时发明者们对他们所寻找的是什么样的东西也已经有了一些概念。
解释性理论有多种形式。例如,通常用气体是由一团遵循力学规律相互作用的能量分子所组成的假设来解释气体的行为。用两个磁体之间的空间中的磁力场来解释它们间的磁吸引。
在自然科学和社会科学中一个常用的解释方式是:运用微分方程组或差分方程组。在任何给定时间,假设系统处在某一特定的“状态”,于是这些微分方程决定了下一个“时刻”系统将
479运动到什么状态。因此,在力学中,这个状态是用位置和速度来阐明的,而微分方程则说明力是怎样产生加速度进而导致状态的持续变化的。
要建立一个解释模型就涉及到在现象的这些或那些表征之间进行选择。它是质点模型还是连续统模型呢?它表示静态平衡——一种稳定状态——还是动态变化呢?在由数据导出模型之前或与此同时,就必须选择表征。
大约在1955年,当我与阿伦,纽厄尔,克利夫?肖开始创立解题理论时,我们就已经致力于“表征”。事实上,正是由于认识到借助数字计算机的发明可以得到这样一种表征,才促使我们去进行人类思维的研究。我们观察到一个计算机程序在形式上相当于一组差分方程。在每一个操作周期,计算机程序就将机器的新状态限定为机器当前的状态(它存储的所有内容)连同它所接收的任何新输入(信号)的函数①。而且,这些差分方程不只是能够操作数字,还能处理各种符号。
因而,解释的任务就是要用计算机程序的形式来描述解题过程。必须检查我们所能收集到的有关人的解题行为的数据,以找到关于这个程序性质的线索。这个要求对有价值的数据类型和考查数据的最佳方式规定了严格的准则:数据类型是越紧密、越细致地跟随解题过程越好。考查数据的最佳方式是找出问题解决者的“动作”顺序以及激发每个动作的指令。
当然,表征决不仅仅是一个计算机程序。它必须包含能表征人类记忆结构的符号结构。据目前所知,人类记忆结构在某种意义上是联想的结构。在逐步地构造表征和构造应用这些表①
此处的“函数”指,机器的新状态是随其先前状态(它存储的所有内容)连同
它所接收的任何新输入(信号)的变化而变的应变量。——编注480征的理论之间,存在一种持续的双向交互作用。
有时,编制程序的便利(或需要)支配选择,有时是心理学的需求支配选择。有些原来主要是为了满足编程序的要求而对表征的考虑(例如,表处理语言,表及描述表形式的数据结构)后来被认为具有像联想网络那样的心理学意义()
一旦用计算机程序形式的信息处理模型取得了一些经验,这些模型就成了确立人类思维其他方面理论的现成的工具,正如本书前几部分所详述的那样。甚至都不去考虑别的可能的表征方式。
在过去的几年中,由于有了全新的选择单——产生式系统,激活扩展记忆模型,联结主义模型,SOAR,PROLOG语言——表征的选择又成为建立模型过程的一个重要而困难的部分。设计好的实验
实验被认为是用来检验假说的,或者,更好一点的说法,是用来在竞争的假设之间进行选择的(“判决性”实验)。然而,满足其中之一,或同时满足这两点,既不是一个实验成为好实验的充分条件,也不是必要条件。这是不够的,因为检验“变量X影响变量y”这种形式的无味的假说,其真假与否通常不是很有趣的,而且往往也不会对我们理解这个世界有很大帮助。而检验更有说服力的定量假设(例如,行星周期为其离太阳距离的二分之三次幂)就有趣得多;如果待检假设与基本的解释性理论(例如,与万有引力的平方反比律)紧密相连的话,那就非常有趣了。
但是,当我们测试这些更有说服力的定量模型时,我们必须记住,扔掉所有的统计显著性检验的标准方法,该方法已不再适
481用①。我们还必须记住,模型是由多种组成部分构成的。当我们的数据不适合于某个模型时,我们就面临着确定改变什么,或者是否要抛弃整个模型的极其艰难的判断任务。
关于充分性我已讲了这么多了,现在我来讲讲必要性。模型检验是进行实验的唯一原因吗?当然不是。之所以要做实验,或者说你之所以要花时间去仔细观察现象,一个能成立的理由是,你有可能得到意外的发现。实验产生的最好结果是出乎我们意料的东西,尤其是那些我们事先从来没想到可能发生的事情。许多诺贝尔奖就是用这样的东西做的。
为了不被指责为靠掷骰子来设计实验,我想指出,启发式可用以设计这两种实验,即检验模型的实验和产生意外结果的实验(当然,一个为检验某模型而设计的实验也可能产生意外的结果)。下面我从检验模型的实验开始提供一些事例。
几年前,我开始研究汉语。我做这个研究只是为了好玩。但是,因为我打算访问中国,所以给这个研究蒙上了一层比较严肃的面具,我称之为“让自己面对新现象”,这使我能心安理得地去做这个研究。到中国以后,我与一起工作的中国心理学家决定用汉语材料重复某些标准的短期记忆实验,我们的动机是检测一个模型。中文中是否有一个神秘的数字②(MⅢer
1956)?这个数字是不是七?对这两个问题的回答都是“是”。这没有什么意外。
与此同时,我了解了有关汉语的一个惊人的事实(这对我的中国同事来说并不感到惊奇,但对我来说的确是个惊人的事①
在这里我不能停下来去为这个说法辩护。这对心理学家来说像是异端邪
说;但数理统计学家却几乎一致认可。在(Gregg
and
Simon
1967)中可以找
到我的理由和有关参考文献。②
参见第21章关于神秘数字七的译注。482情)。一个中国大学毕业生可以认得大约7
000个汉字,每个字用一个单音节发音。但在汉语中只有大约1
200个不同的、可发音的音节(甚至将声调不同的字也计算在内)。因此,平均每个汉字大约有六个同音字。
不知怎么的(直觉或识别在起作用),我记得一般认为短期记忆在感觉形式上是听觉的,但这只是基于康拉德的很间接的证据表明:回忆方面的差错一般发生在声音相似的词,而不是形像相似的词。我们可以用中文对这个听觉假设进行直接测试。确定了视觉显示的无关联的非同音字的短期记忆容量为六七个字以后,我们提供给那些接受试验的人一系列异形同音汉字。结果相当令人瞩目:短期记忆的容量降到大约两三个字,证实了康拉德的结论。(Zhang
and
Simon
1985;Yu,Zhang,
etal1985)。
模型检验实验的一个类似的实验安排体现在我和比尔,蔡斯所做的国际象棋棋局记忆的实验中。我们的实验建立在德格劳特等人的早期工作的基础上(Chase
and
Simon
1973a,1973b)。专家和新手在记忆棋局方面的差异是否可根据他们的“块状”棋子图案词汇量的差异来解释呢?我们的实验证明了这种差异,但不像估计的那么大。虽然这个答案有些令人失望,但是比如果我们直接问专家的组块是否大于新手的结果要清晰得多。
如同汉字实验一样,关于棋记忆的实验也是通过询问某个现成的模型能做什么定量预测以及什么度量能检验这些预言来设计的。解题探索发生在一个任务领域内,通过寻找该领域的“令人意外的”或“有趣的”特征来促进解题过程。就汉语而言,首先是发现意外的特点,然后是发现相关的模型。在棋记忆实验中,顺序正好相反。
正如任何精心设计的实验应当具备的那样,所有这些实验
483都有
个实验条件和一个控制条件,在汉语实验中,我们将一系列同音和不同音的汉字进行了比较。在弈棋实验中,我们将专家的成绩与新手的成绩进行了比较,还比较了来自下得好的比赛的棋局和随机安排的棋局。在最近的一些物理学问题解决的实验中,这种专家/新手二分法又给了我很大帮助(
D.P.Simonand
Simon
1978;Lakin
etal,
1980)。使用这种范例的附带好处是,明确的实验条件和控制条件看来能使审稿人和编辑的粗暴的脾气平静下来。问题同构体
另外—个实验操作给我们带来几乎无尽的好处,即问题同构体的概念。我想我大约是在1969年或略早些时候提出这个问题同构体概念的。我没有任何证据说我或别人在此之前用过这个概念。我对它的先例作过猜测(这是情景重现描述,而不是往事回忆:,虽然在没有提示的情况下我的荷兰同事约翰,麦肯能证实它)。
索尔‘阿马里尔是最早指出改变一个问题的表征有时可能大大地促进问题的解决的人工智能研究者之…。1966年,我和阿马里尔、纽厄尔在卡内基—梅隆大学参加了…个为期-—个学期的关于问题表征的研讨会。现在只需迈出…小步(至少根据事后的认识是这样)就从…个接受试验的人可以通过找到恰当的表征使问题容易解决这个想法,到认识到只需主试者改变、个问题的呈现方式就能使接受试验的人感到问题的难易程度不同。
先例就讲这些,现在我们就来谈谈问题同构体。问题同构体是具有相同任务域和相同合法移动算子,但用一组不同的词
484来表述的问题。问题同构体很快成了“理解研讨会”(认知科学研讨会的别名)讨论的一个主题。这个研讨会在卡内基—梅隆大学心理学系每星期举行一次,已有20年的历史了。第一个例子是抓数,一个井字棋(tic
-
tac
-
toe)的同构体。后来,约翰,米切昂在这一组中又加了一个成员。约翰,R.海斯很快就成为问题同构体的最多产最灵活的设计者,为我们提供了河内塔趣题的十来个同构体,它们大多已被用在一个或多个实验中了(
Hayes
and
Simon
1974,1977;
Simon
and
Hayes
19761.
我们运用同构体是为了发现问题的什么特征(而不是问题任务域的大小)能解释问题的难度。早期解题工作,包括我们自己的工作在内,都集中在把启发的组合爆发作为问题难度的主要来源。我们还发现,河内塔趣题,(它的任务域相对较小而且容易穷尽)和传教士与野人趣题(另一项做过大量研究的实验室任务,它的任务域非常之小),可以让成年人花15分钟到半个小时才能找出解答。
关于只有任务域的大小才能影响问题难度的想法有时是难消除的。一位基金机构的评审员曾给我们的项目申请报告打低分,他认为我们的实验只能有负的结果,因为所有的同构体一定具有同样的困难(在得知这个反对理由时,我们已经用实验证明了难易差别可达16:1)。没有自变量的实验
到此为止所介绍的实验都是通过操纵一个自变量来比较两种或两种以上不同条件下的工作情况。当我检查我的其他实验时,我窘迫地发现,这个被视为完好的实验的基本条件很少得到满足。我做了些什么呢?从设计不良的实验中我可能学到了什
485么呢?答案(它使我感到意外)是:不将实验条件与控制条件进行比较,你也可以检验理论模型,除检验模型外,你还可以经常做些令人惊奇的观察,这些观察会让你想起建立新模型或改进模型的主意。
让我从我已简单说过的后一种实验的例子讲起。许多年前的一个夏天,我和杰弗里?佩奇记录了中学生解决代数文字题的大声思维口述报告,打算从中发现他们所采用的过程并将他们的行为与博布罗的STUDENT程序进行比较,该程序也是用于解决这类代数文字题的。
杰弗里想到了一个好主意。我们设计了一些“不可能的”问题,即由于其答案中包含负长度的木板或价值超出一角钱币的五分钱币,因此不可能给出具体解释的问题。然后,让接受试验者根据问题的陈述建立方程式,但不要解这些方程。
结果是完全没有料到的。我们的接受试验者形成了两组,他们在一组三个问题上相当一致。一些人建立了字面上与问题的书面表述相符的方程式。另一些人不准确地解释了问题,总是用描述一个可实现的物理状况的方程而结束。(有几个人说:“是否有矛盾?”——它的意思是:“我从与我对真实世界的了解相冲突的问题陈述中得出结论。”)
由于我们极力想得到一组尽可能信息密集的数据,因此我们要求接受试验者既大声思维,又画出问题情况的图解。第一组接受试验者所画的图解一般是不完整的、分散的,没有揭示问题的矛盾。第二组接受试验者所画的图解用了与他们的方程式完全相同的方式错误解释了题意——以便使问题变得真正可实现的。因果箭头的方向不清晰,但可以利用这些结果去推测第二组中的接受试验者在将问题情况翻译成代数语言之前曾运用意象去表示问题情况。第一组中的接受试验者只用句法指导他
486们直接将问题转换成方程式。
利用手头的这种信息,可以为这类行为设计模型并做进一步的预测。由科登。诺瓦克编写的ISAAC程序,是用来解决用自然语言表述的物理学问题的,它使用了内在图解来表征问题情况,作为言语刺激和与它最终建立的方程式之间的中介(No-vak
1976)。我与约翰.R.海斯在1972年前后编制了UNDER-STAND程序,用以说明问题的言语陈述如何能转换为类似“通用问题解决者”的问题解答器的输入。在这个程序中借用了来自代数学实验中的与上述类似的见解(
Hayes
and
Simon
1974)。所有这些工作都是在前面提到的当前关于表征和表象研究的先例。
但是,关于“无控制组的观察”的实验策略的最大量的例子要在《人类问题解决》一书中去找。数据的密度是游戏的名称,口述报告分析是玩游戏的方式。我和纽厄尔都同意,“通用问题解决者”的核心是直接从一个我们可以读明白的特定的口述报告推断出的。我们都同意它是在1957年夏季的哪个星期完成的。就细节而言,它的论据并不全都一致,但主要教训是清楚的:“通用问题解决者”理论是直接归纳一个实验室被试对象大声思维口述报告而来的,没有借助于实验条件加控制条件的实验设计方法。
除幸运之外,还有什么涉及了所得的结果呢?首先,我们已知道我们想要将我们的模型表征成一个用表处理语言的计算机程序。其次,使用了我们已知的最密集的被试对象行为记录的数据采集方法。第三,比较注意任务的选择。在解题任务选择中应用的这些准则为过去30年中搜集的关于解题过程的大部分知识,作出了解释,也给大部分理论研究成果作了说明,而这些理论已成功地解释了多种任务中的行为。
这些实验真的缺少自变量吗?我们不能认为任务领域或被试对象正是自变量吗?我们当然可以。但我们为什么要这么做
487呢?从这些实验所得到的主要知识不是来自在任务间或被试对象间进行的比较,它来自于艰苦细致地分析各个口述报告,从中归纳解题者所采用的过程。这项工作一旦完成之后,我们就能通过跨任务和跨被试对象的比较来检验我们所得结果的普适性,但对单个被试对象行为的详细的、纵向的分析则是我们建立理论的基石。
如果这套方法使我们困惑的话,那么回想一下这样的事实可能会使我们轻松一些,即对各别的太阳系行为进行详细的纵向分析是开普勒定律的基石,最终也是牛顿定律的基石。也许并不是我们的方法论需要像标准的方法论教科书那样修改,而是那种教科书错误地告诫我们,只有在提出准确的假设并确定了实验条件和控制条件后我们才能进行一项实验。也许我们需要给这些教科书添加一章或几章,以阐述如何通过专心致志地观察这个世界进行基础的科学发现——这种观察可以在实验室内或实验室外进行,可以是有控制条件的或无控制条件的,可以是有大量的假设的或者是没有假设的。作为满意论者的科学家
很久以前,我的经济学朋友就已经放弃了我,把我丢给了心理学或者其他什么遥远的不毛之地。如果我不能接受期望的效用最大化的真正信仰,那不是我接受过的良好的经济学教育的过错。
啊呀,它没产产生免疫力①。1935年我介入密尔沃基娱乐①
著者说明,此地指他所受的经济学教育没有使他不能用其他方式思
考。——译注488部制作预算的过程造成了心灵创伤,这使我成了一个积习难改的满意论者。我已概括介绍过了对这些问题的研究导致我做出的科学发现理论。它不是一种关于全局合理性的理论,而是一种面临错综复杂的情况时人类有限的计算能力的理论。它将发现看作是问题解决,将问题解决看作是启发迷宫,将启发看作是有限理性生物的唯一适当活动。
有些科学家认为,应根据能否做出正确的预言来判断理论。关于这个发现的解题理论的预言能力,我在此已给出了一些检验方法。我自己科学生活的一些经历就是例证,证明了这个理论能很好地解释在我的研究中见到的发现过程。
解题理论描述了我,像KEKADA
-样,在遇到一种非预期现象而感到意外时,阐述一个新的问题;它跟踪我的BACON式的过程,走向辨别数据规律性,以专家系统的方式引用知识去解释这种规律性;它说明了我运用图解把握住动态系统中的复杂现象;它显示了表征的可获得性以及发明新的表征方式如何影响到我为建立解释而做的努力;它刻画了我设计实验时的许多策略的特点,甚至还可能解释了我为什么常常不注意像实验的控制条件或甚至自变量这一类的事情。
当然,我在谈论预言时运用诗歌的破格。一个全面的“简单西蒙”程序还没有编成,只有他的一些片段。谈解释性说明比谈预言更情有可原。但是你不会被这个隐喻误导,它和人们所期望于隐喻一样有用。①
我一直在阐述的发现的信息处理理论还有一个优点:它不仅是一个描述性的理论,也是一个合乎规范的理论。它不仅有①
著者说明,由于模拟西蒙的程序尚未完成,因此这里谈不到预言,而只能是
给出他的行为的定性解释,说“预言”是在隐喻的意义上讲的了。——译注489
效地预言(解释)了我的行为,而且53年来它在我不知道的情况下给我提供了一套可靠的进行研究的启发式。不知不觉之中我一直遵循着BACON的指令、STAHL的指令、GLAUBER的指令、“道尔顿”的指令,以及KEKADA的指令。我找不到更好的指南了。
就是将这些启发式结合在一起,它们也远不足以形成一个指导我研究生涯的总体计划。在任何一个特定的年份,我很少知道来年的实验是些什么或者来年的问题会是些什么。但是,启发式给我的决策带来一点偏向。每当我到达一个选择点时,它们都暗示我沿着一条路而不是另一条路走,这比靠投掷钱币来决定选择要可靠一点。回顾我的研究和我的生活,那实际上就是我所能找到的计划。
但是,有一个对我的工作具有头等重要意义的启发式没有放在本章所描述的这些程序之中:要做出有意义的科学发现,你应当交尽可能多的好朋友——他们精力充沛、聪明睿智、博学多识。任何时候,只要能够,就尽可能与他们建立伙伴关系。然后,坐下来,放松。你会发现所有你需要的程序都储存在你的朋友之中。只要你不过多干预,这些程序会富有创造性和富有成效地执行任务。我与80多位合作者共同完成的工作将会证实这种启发式方法的力量。490
首页 上一页 共8页
返回书籍页