必读网 - 人生必读的书

TXT下载此书 | 书籍信息


(双击鼠标开启屏幕滚动,鼠标上下控制速度) 返回首页
选择背景色:
浏览字体:[ ]  
字体颜色: 双击鼠标滚屏: (1最慢,10最快)

我生活的种种模式

_4 赫尔伯特.A.西蒙(美)
西:无疑在你作品中出现的独特的迷宫之间有明显的差别。显然在《通天塔的图书馆》中你是从抽象概念开始的。
博:这不对!我可以告诉你这个故事是怎样涌现的。我在布宜诺斯艾利斯西部的一个小公共图书馆里工作过9年,只拿可怜的一点点工资。在那里工作的人很难相处。他们无知,实际上是愚蠢。这给我一种恐怖感。
有…天我对自己说,我整个生命要被埋藏在这个图书馆里了。为什么不发明一种由无止境的图书馆来描述的世界呢?在这种图书馆里人们能找到所有已经写出来的书,同时,我学过
229一些排列组合,看到这种图书馆中的可能性几乎是无限的。这是一个例子,我知道有关故事中该论题的起源。
这种图书馆的想法唤起我最深切最真心的欢乐,我在写它时感到真正的快乐。这不仅是一种智力上的满足,而且是一种无上的幸福。
西:那么为什么你如此强烈地被牛头人身怪物的观念所吸引?
博:这很奇特。这种观念在这个神话故事中并不像另一个名字那样吸引我。我在一本字典中看到阿斯特朗的名字。它的含义是星星或天体。这是一种印象,我总以为读者能欣赏它。
西:我确实发现你作品中的迷宫概念具有一种真正理性的统一性,虽然在每个故事或叙述中有非常有趣的特色差别。
博:事实上我相信这种统一性的出现是因为我所有讲迷宫的故事都是对我精神的特殊状态的反应,这种精神状态恰好把我带给这个题目。
西:至于你的组合分析观念,它们的起源是什么?
博:我读过一本很有趣的书,这是伯特兰德,罗素的《数学哲学导论》。后来我对一本叫《世界和个人》的书感兴趣(
JosiahRoyce
1899),这本书提出了有关这个论题的非常奇异的实例。它举了一个英格兰地图的例子。这张地图就画在整个岛上,假设这张地图本身在整个地图的某处,地图中还有地图,以此类推。这就产生了一种无限的思想。我从我父亲那里继承了对这种推理形式的爱好,他常常让我在一旁与我交谈并问我一些有关信仰的问题。有一次他拿了一个桔子对我说:“照你看,这桔子的味道是不是在桔子里?”我说:“是的。”然后他问我:“好,那么你认为桔子是自己在不断地辨味?”
230
西:我料想这些问题的结果把你引向深奥的唯我论。
博:事实上,我父亲并没有让我思考哲学根源,他只是给我提出一些具体问题。很久以后他给我看一本哲学史,在那里我遇到了所有这些问题的起源。我父亲用同样的方法教我下象棋,虽然实际上我总是下得很差,而他下得非常好。
另外,我父亲对诗的爱好也传给了我。他的书架上摆满了济慈、雪莱和其他诗人的书。他还背诵这些诗,甚至现在我背诵菲茨杰拉德的《奥马尔?加亚姆》或其他的诗时,我母亲还说她好像在父亲那里听过。
西:有人告诉我,你第一次读的《唐吉诃德》是英译本。
博:是的,确实如此。
西:这很奇怪,因为我第一次读的是用西班牙语本。当我用英语看这本书时,唐吉诃德的幽默完全失去了它的微妙。
博:是这样的。翻译作品常常如此。
然后,博尔赫斯问到我的工作,我开始谈计算机以及相信用计算机模拟有自由意志的人类思维的可能性的含意。
西:我设想自由意志有如下形式:它属于这样的事实,在我采取某一行动时我是那个行动者,而且已引起这一行为的某种东西并不使我(行动者)不自由。
所以在我们到达迷宫的岔路时,“某种东西”帮我们选择走哪条叉路。我研究的原因,以及我对迷宫着迷的原因是我一直想观察人们在面临岔道时的行为并试图理解他们为什么向左走或向右走。
博:似乎这种事在我的故事中不断发生……但如果我不用特殊的词语来写这些故事,那么一切将是不自然的。也就是说,
231如果我写了这些故事,那是因为我不得不去写,或是因为我需要写。因为如果不这样,我会创作其他故事,而它们对我就无意义,或者也许对读者就没意义。因为读者会感到它们是做作的文学练习。
这样博尔赫斯否认了《通天塔图书馆》或《岔路的花园》背后有抽象的模型。他写故事,他并不是用具体例证说明模型。他只是一个讲故事的人。一个小故事
我打算写故事时确实开始于一个模型,事实上正是我1956年的论文“理性选择和环境结构”中描述的迷宫模型。在完成的作品中无疑可以觉察这一点。虽然如此,我还是要写它。你们可以把它看作哲学、看作故事或者看作做作的文学练习。要是你们不喜欢方程式,它至少可以对我的决策理论提供一种不太费力就可以理解的介绍。
苹果:迷宫的故事
从前有个人叫雨果,他住在一个有无数房间的城堡。因为
这些房间都没有窗,而且他一出生就住在那里,城堡就是他
所知道的唯一世界。他母亲在他很年轻时就去世了。她曾
告诉他另一个“外部的”世界,由一个单独的大灯照亮,灯每
隔10或12小时开和关。她本人也没有看见过外部世界,
但关于它的故事世代相传。雨果从不确切知道他的祖先是
否真的住在那个世界或看过那个世界,或者这些故事是不
是很久以前编造出来给城堡的孩子们娱乐的。不管怎样,
他只是通过他母亲的故事知道外部世界。
232
城堡的房间是正方形的,而且非常长——雨果以轻快的脚步从房间一头走到另一头要10分钟。每个房间尽头的墙上有四五扇门。这些门上备有锁,所以只可以从一边打开,从另一边则打不开。可以打开房间西边的门进屋,同时,可以打开东边的门走到邻近的房间。当雨果走进一间房间,他身后的门就关上,他不能沿原路回去而只能通过一扇东边的门走到其他房间。
有一阵子,雨果很好奇地想知道这些房间是否可能被排成一个圈。这样,如果不是直接地,他也可以绕道回到某一房间。这一点不容易决定。
因为许多房间看起来都一样。有一次他在通过的每个房间里撒了一些面包屑,并留心看他回到他走过的房间的迹象。他一直没有再次看到面包屑,但他不能肯定是不是与他同住在城堡里的老鼠把它们吃了。
他母亲死后,雨果独自住在城堡。也许看来很奇怪,他和他的祖先一样不久就要饿死于这种与世隔绝的生活。大多数房间是没有装饰的,里面只有一两把椅子和一张沙发。雨果觉得在他漫步途中要休息或睡觉时有这些已很舒适了。但时不时地他走进一间房,看到盖着白亚麻布的小桌上有充足的可口饭菜。
我们这些习惯于多种食物的人为了餐桌上的快乐从世界各地聚在一起,可能还没有对伙食完全满意。但对口味简单的人——雨果来说,他的口味还没有发展得很精细。有的房间里有水果、蔬菜、面包、熏肉和干肉,雨果觉得这些房间里的食谱已足够令人满意了。既然雨果不了解其他世界,他对城堡为他的疲倦和饥饿所作的安排并不惊讶。他从不问他母亲是谁在桌上放了食品。
233
有食物的房间不很多,如果雨果受过足够的数学教育,
就能估计食物的相对数。连接各房间的门是用明亮的玻璃
做的,雨果透过玻璃可以看到五六间屋里有没有餐桌。如
果视觉范围内任何一间房里有餐桌,他从他站的地方就能
看到。
当雨果一段时间没吃东西而饿了时,他就会挨个在四
五扇出口门上张望,看哪间屋里能看到食品。如果没
有——通常这样一他就打开一扇门,快步走到另一间屋,在
新的地点重新察看。通常在1-2小时的活动之后,他最终
能看到一间有餐桌的屋子。然后他快步走到那里,以保证
在1小时内吃到东西。他从没有真正处于饥饿的危险。只
有一次,他被迫连续找了足足4小时才看到餐厅。
因为城堡的生活并不十分紧张,而且在雨果面前时时
摆着的食品颇为丰盛,他很少一天超过两餐,在他实际上
并不饿而溜达时,他要是碰到餐厅就只是穿过它,甚至连点
心也很少拿。有时,他要在走累之前找到餐厅,以保证在他
醒着的时候及时吃到早饭。
由于大自然的这种慷慨——或者说城堡的安排,总之
它发生了——搜索食品只占雨果一小部分时间,其余时间
他只是睡觉和闲逛。多数房间墙上有动人的壁画,幸好他
觉得这些画很令人愉快,他自己的思考也足以令他不感到
无聊。他已习惯于孤独的生活,并不因孤独而烦恼。
雨果坚持写简单的日记,他发现他的时间是这样度过
的:每24小时中睡觉占8或10小时;大约3小时找餐厅,
吃饭2小时。余下IO小时闲逛、看城堡的装饰品和在房间
里舒适的椅子上做白日梦。
雨果这样活着,除了穿的衣服外,很少需要私人财产,234但他母亲给了他一个小背包,他一直背在身上,里面有梳子、剃刀、磨剃刀的皮带和其他一些有用的物品——以及一本圣经。圣经是他所知道甚至是看过的唯一的书。在他母亲教导下,圣经是他的启蒙读物,而且不断地为他提供愉快的有教益的活动,虽然其中讲的“外部世界”上大部分的事对他几乎是无意义的。
你可能假设城堡墙上的壁画会帮他理解外部世界,学习像“树”那样简单的单词的意义。但图画没有什么用——反正如此——因为城堡壁画师画在墙上的图案是完全抽象的,即使在这些画中出现,也没有一样东西像树——或像外部世界的居民可认识的东西——那样平常。
然而壁画以另一种方式帮助了雨果。花很长时间去察看它们使他大大发展了理解和欣赏抽象关系的能力。必须认为他以几乎相同的方式来读圣经中的创世神话和寓言——具体的物体在他看来呈现出抽象符号的意义,这就是说,他理解圣经的方式恰恰与圣经的写作方式相反。这些故事的作者在故事和寓言中发现用老百姓的日常经验来传达关于世界意义的深刻真理。雨果剥除这些经验,而以抽象的体验,常常能把这些故事直接还原为这些故事要传达的主张。
我不是想暗示雨果完全理解他读过的全部东西。伊甸园的故事使他特别迷惑。智慧树上具有的什么样的诱惑力使夏娃不顾后果地任性——为一个苹果而冒被逐出伊甸园的风险?如果他不知道什么是树,他却很熟悉苹果,因为他常在铺着亚麻布的餐桌上看到它们,他母亲还曾教他说它们叫苹果。雨果觉得苹果味道很好,但也并不比他用以充饥的许多其他东西好多少。也许在这件事上,他的实际经
235
验妨碍了他的抽象能力,并使这个特殊故事比其他故事更
难理解。他确实及时学会了回答,但不是抽象概念而是经
验引导他这样做的。
木一个冬天的下午——当然是根据外部世界的事件和
日历来判断的——雨果一直在安乐椅上休息,忽然感到饥
饿,他习惯地站起来走向屋子的东头,透过玻璃找餐桌-

于什么都看不到,他打开第二扇门走到另一间旁间,重新察
看。这次他从第4扇门看到第5个房间有他所找的餐桌。
不到一小时他已到达餐厅,准备享用正等着他的饭菜。
但正在这时,雨果做了他从未做过的事。坐下吃饭前,
他扫视了一下桌子看看有什么样的面包。他看到桌子中间
放着香肠和奶酪,半个刚烤好的黑麦面包。他看到面包就
闻到——更确切地说是想到,因为与他的鼻子无关——用
白面烤制的法式面包的香味。伴随着这想象中的香味,他
稍稍觉得厌恶面前的饭菜。
如果雨果在他生命的关键时刻停了一下并作思考,他
想象中的不明确动向可能会自己平静下来,他的生活也会
和以前一样。他虽然一生中有许多时间是在进行反思,但
他以前从没有机会去深入思考实际走的路线,他现在也没
有去思考。没有再停顿,他从桌旁转身很快走向下一排门。
透过玻璃看不到餐桌,他推开其中一扇门又快步向前
走。在第3间屋的一头透过安全门他又看到了一张很远的
桌子。他努力要辨认桌上放的是什么食物,但太远了。他
几乎跑着过去,走进最后一间屋,很高兴地发现在桌上摆着
的食品中有一个法式的白面包。他津津有味地吃着,不久
后就睡着了。
雨果逐渐发展了——或发现了——口味和偏爱,这是236不知不觉中的事,并没有让他觉得不习惯。虽然不是每张桌子上有法式面包或熟橄榄(他不久开始爱吃熟橄榄),但大多数桌子上有。此外,他并不坚持每顿饭要吃这些美味。肯定,他每天用于找食物的时间增加了,但这仅仅意味他以较认真的意向代替闲逛,这或许为他的生活稍增加乐趣。
但几次重大事件预言了更困难的未来。有一次雨果先后走过4张餐桌,因为食物不合他的口味,3个多小时在饥饿中匆忙地寻找后终于找到第5张桌子,但是除了他更饿以外桌上的食品与前4次没有什么不同。在有过这种经历几天后,雨果不太挑食了。
同时,雨果发现他的偏好还扩展到对城堡墙上的画上。他发现自己有两次在一个门口简单地察看了前面的房间后走开了,因为那壁画上的颜色和图案并不令他喜欢。几星期后,在他刚有点饿时看到远处有一餐厅,但要到那里去就要经过一些房间,那里的装饰他不喜欢。到第二间屋他转身窥视其他几扇玻璃门——都看不到餐桌——看是否能欣赏着较满意的壁画而到达为他准备好饭菜的房间。他失望了,只好按原来的路走。但后来,他怀着能找到一条新路得到食物的希望转身去看别的房间。
现在雨果的日记与以前大不相同了。首先,他醒着的大部分时间用于寻找他喜欢的食物,他对某些房间的反感进一步妨碍了他的搜索。其次,他现在的日记包括了大量他走过的路线,其中标上了旅程中所伴随的愉快与烦恼,饥饿与腻烦的感觉。如果他把这些感觉加在一起,他能把日记编写为一份简单的只有一刻钟的日志,它能达到使他满意的水平。现在这个水平当然还会激烈波动,而这些波动反过来又使他的察觉能力更加敏锐。
237
雨果自己觉得无力使这些感觉的锋芒变钝,他现在开始感觉到它们的刺痛。说他感到自己无能为力也许太过分,更可能的是,他甚至还没有想到他的口味和偏爱可以由他来控制——谁能说事实上它们是否能被控制?
但是即使雨果没有限制自己的欲望,他也确实开始认真考虑如何去满足它们。他开始去寻找一种线索,在他透过一系列的门窗远远地看到餐桌时,可以判断桌上可能有什么样的食品。他提出一种理论,即以绿色装饰的房间比其他房间更可能通向白面包,而蓝色则是接近熟橄榄的重要信号。
雨果甚至开始保留简单纪录以检验他的预测。他还提,出了一种损益结算表,告诉他花多少时间搜索食品——结果如何——以及他对装饰的爱好会对他的搜索效率有多大影响(尽管蓝色和绿色顺利地通向好吃的,他还是真的喜欢可爱的红色和黄色)。
这些科学研究在某种程度上是成功的,并暂时降低了他在时间方面日益增加的压力。但损益结算表提示的倾向并不很保险。每个月用于寻找最好的食物的时间增加了,然而他不能使自己相信,他的满意程度也相应增大了。
雨果逐渐对周围环境认识得更多,对他的选择反思也更多,他还开始观察自己——这是他以前从未做过的。他发现他对装饰的爱好在慢慢地变化,以至他实际上开始喜欢绿色和蓝色,他的经验告诉他,这些颜色更可能使他得到他特别想吃的食物。他甚至认为已觉察到一个相反的效应:他讨厌高度对称的壁画糟蹋了他对佳肴的享受,在这样的房间却似乎总放有鱼子酱。但这种感觉如此微弱,以至于可能纯粹是想象出来的东西。238
他的眼睛逐渐适应为肚子服务,这多少平息了雨果的不安,因为他意识到这使他的工作容易一些。在回顾过去时,他问自己最初喜欢某些壁画是否有意识地出于在类似装饰的房间中吃到特别美味的佳肴。
雨果的探索,以及他那自相矛盾的爱好的逐渐调停,只能延缓而不能阻止灾难,如果他不断增加要求的话。在我们谈话时他已达到真正可叹的地步。他每天一醒来就坐在他休息前找到的那个餐桌边。但是他自己预备的饭莱不管怎么好——甚至鸡蛋煮得生熟正合适、面包均匀地烤得焦黄——他还是不能毫不分心地享受。他要在桌上打开笔记本,异常兴奋地计算着他一天的任务。他最近是什么时候吃的鱼子酱?这一天去找桃子馅饼好不好?或者,既然他前一天吃得相当好,他是否坚持要吃那总是很难找到的鲜草莓?
制定了暂时的菜谱后,他查阅笔记本来看看在找这些特定食物时他过去有些什么经验。他常会发现他不太可能在少于10—15小时的搜索就找到他所列出的食品的位置。
偶尔,在他特别强烈地要为快乐而搜索时,他设计这样的菜谱,除非他愿意一星期不吃饭,否则是没有希望实现的。然后他会在单子上勾掉最难找到的几项或几组项目,但只是带着一种强烈的失望情绪——甚至对城堡吝啬的安排带有一种隐约的愤怒。
在他又一次休息前,他总是打开笔记本,仔细记录他一天劳作的结果,精心记下他所观察到的可能有助于他将来探索的新线索,并检查那些否定他已形成的假说的经验。最后他制作了一张记录每天成绩的记分卡,给他特别喜欢的食品打10分或15分(如果他最近没有吃到它们就奖励5
239
分),如果饥饿使他在特别不对胃口的餐桌前停下来就愤怒
地记上一个大的“负”分。他用这些对每天的得分和上个星
期、上个月的得分进行比较。
后来的两三个月,雨果因受挫和发怒几乎变得疯狂。
他每天的分数实际在下降。高分所对应的美味饮食种类似
乎越来越少,而负分开始出现得越来越频繁。他自己确立
的目标使他每天要走20-30英里。虽然他走到最后觉得
精疲力竭,但睡觉也很少使他恢复。因为恶梦中吃不到宴
席的景象打扰了他,他常梦到正要拿起刀叉享用美味佳肴
时,它们就在他眼前消失了。他体重开始下降,因为他现在
吝惜那注意他的外表所需的时间,他因不剃胡子不理发而
更加憔悴。
一天他在途中特别不顺,身体几乎要崩溃,跌跌撞撞地
走到一间屋里,在安乐椅上迷迷糊糊睡着了。这次他莫名
其妙地为没有因梦到食物而烦恼,但他在梦中清晰地看到
以前的情景——大约两年前——那时他醒着坐在一张相似
的椅子上,也许他所在的那个房间里的有许多锐角的壁画
与以前所在的房间里的图案有些相似,这使他回想起以前。
不管怎样,他的回想极其鲜明生动。他甚至在这个梦里又
体验了温暖的舒适感,以及很早以前出现在他思想中的愉
快游戏。梦中后来没有发生什么,但这使他充满了好几个
月没有体验到的幸福感,观察者将会注意到他前额的皱纹,
一半藏在散乱的头发里,在他打瞌睡时平展了,他肢体的神
经痉挛在完全放松时也消失了。他睡了9或10个小时。
雨果醒来时,梦在他心中仍很清晰。实际上有相当一会他没有想起目前的担忧。他仍坐在椅子上赞美面对墙上的图案——刺目的深桔黄和黄褐色线条,它们的进程受到240紫色锐角的阻止。然后,他那笔记本的白纸引起了他的注意,这笔记本是在他睡着时从他手中滑落虱脚下的。他内心深处痛苦的冲击就像来自墙上桔黄色和紫色图形的闷棍。随着痛苦而来的那种同样深沉的悲哀爆发出在大厅里回荡的哭泣声。
以后的几天,他无心于曾经从事的狂热追寻。他的生活又回到先前的模式。他休息并闲逛,碰到什么吃什么,事实上他几乎不知道在吃什么。在做过那个梦后,他所感受的痛苦和悲哀扩散为一种难以确切表达的忧伤——那是一种持久的忧伤,但又不是他曾经历的那种恐怖的无情提示者。
然而,不久他感到复活的欲望在刺激他,他又小心翼翼地挑选。他受不了再打开笔记本(虽然他没有放弃它),但有时发现自己在用精美早饭时想着最好以后有一天再吃到这种佳肴。例如,有一天早上他想起好久没吃到的法国浓味软干酪。他在记忆中寻找能帮他找到的种种线索,而且那天还路过两张桌子,因为他看到桌上没有奶酪。虽然他最后也没找到,但他只是稍有点失望,而且没持续很久。
他越来越发现在接连几天成功之后他的欲望会增高,并促使他进行更周密的计划和更精力充沛的活动。但当他不能实现计划时,失败会使他的野心收敛一些。他对较适中的目标感到满足。如果法式浓味软干酪很难得到,至少熟橄榄也算相当丰盛,能让他感到有些满足。
他的新生活与童年时代的生活唯一的区别是:那时他从不缺少时间,他的闲暇从没有被没完成任务的想法打断过。他每时每刻所想干的事决不成问题。周期性地感到饥饿和疲劳以及看到遥远的餐厅乃是他有目的活动的唯一
241向导:
观在他感到选择的重负——为现在和未来选择。他心中主要想的是享受悠闲——玩味他的思想或审视壁画——另一小部分则装着他那半压抑的记忆,想着实现抱负、制定计划、并要匀出一些休闲时间用于工作。说他不幸将是不公平的,说他感到满足也不准确,因为他的抱负的起落总是与可得到的和可能的水平保持同步。尤其是,他意识到他再也不会无忧无虑了。
这些思想是他有一天下午当他听任自己悠闲时一闪而过的。他现在偶尔又有时间读读书,翻着圣经,一半在看,一半在做梦。他翻过圣经中的一页,其中一句话引起他注意:“……当那个女人看到树上有好吃的食物,而且它看上去令人很愉快……”
这时,看到或尝到的苹果的回忆再也不妨碍他思想的抽象了。那句话的意义完全清楚了——不会比他在圣经中欣赏的其他故事更晦涩了。他现在知道,这意义,不在于苹果而在于他。
虽然,我们无法知道那意义肯定是什么,显然雨果也如此。我们只能猜测,与他的旅行的尝试产生同感,用我们自己的经验来解释它们。我自己猜测雨果发现的一种意义与我在通过自己生活迷宫的路途中得到的差别不大。如果不是如此,我的经验将会证明我的理论是错误的,“苹果的故事”正是从这个模型引出的。24212.人工智能的根基
我作为科学家的一生中最重要的年月是1955年和1956年,那时迷宫已经以最意外的方式分叉了。在前20年中,我主要研究组织以及管理这类组织的人们如何决策。我以经验为根据的研究工作把我带进现实世界的组织去观察它们,还偶尔对它们做些实验。我用日常语言或那时通常用于经济学的各种数学来建立理论。虽然我多少有些跨学科的观点,但我还是很适合于被称作政治学家或经济学家,一般被认为是两者之…或两者皆是。
1955年的最后几个月彻底改变了所有这一切。在我还没来得及把所有的关注投入到管理学和经济学上时,我的注意力和努力的焦点已急剧地转到“人类问题解决”的心理学上,特别是转到发现人们用于思维过程的符号处理上了。此后我在心理学实验室中研究这些过程,并以程序计算机上所用的那种特殊形式语言来撰写我的学说。从职业角度上看,不久我就转变为认知心理学家和计算机科学家,几乎放弃了我以前的职业身分。
这一突然而且永久的变化是因为阿伦?纽厄尔、克利夫,肖和我隐约看到了当时刚出现在公众面前的电子计算机的革命性应用。我们抓住了机会,把计算机作为一种通用符号处理机(因此也用于思维)而不只是快速算术机来使用,1955年底我们发明了程序计算机使用的ⅡST处理语言,并用这种语言创造了“逻辑理论家”——第一个通过选择性搜索解决非数字问题的计算机程序。正是这两项成果使我们被定为人工智能的创始人。
要是更夸口一些而少一些技术性词汇,我们发明的计算机程序能够思考非数字问题,因而解决了历史悠久的“心—身”问题,解释了由物质构成的系统如何能具有心智的特性,我们用它打开了对广泛的任务进行自动操作的道路,而这些任务以前是要求由人类智能来完成的。我们还提供了一种新方法——计算机模拟——来研究思维。我们也得到不少臭名,引起不少从心底认为机器不可能思维的人的注意和批评,他们想警告人们来反对我们的主张。
这一章和后面几章,我将极详细地说明我在1955年和1956年的研究,把它放在它所产生的智力环境和时代精神之中。我将介绍从这种环境自身出发来看问题的观点,强调这种观点如何影响我们研究小组的思想。
要理解“逻辑理论家”是如何产生的,在我们开始之前必须在几个领域——包括心理学、逻辑学和经济学——中随便走走,考察一下在我们创立理论前它们对世界的看法。这些世界观既构成我们自己的观点,又设置了种种约束和假设。为了前进我们不得不对它们作修正。1945年前的认知心理学在大西洋北岸的美国,从威廉?詹姆斯那个时代开始几乎一244直到第二次世界大战为止,对人类思维的研究存在一个巨大的断层。美国心理学被行为科学主义、刺激—反应的联系(S
-R)、无意义音节和白鼠统治着。认知过程——耳朵在收到刺激到做出反应之间进行着什么——几乎没有提及。心智这个词留给了哲学家们,令人尊敬的心理学家是不讲这个词的。
我在《管理行为》一书的脚注中指出了威廉,詹姆斯和爱德华.C.托尔曼是我关于美国心理学家的消息的主要来源。托尔曼远非最有影响的行为科学家(除了那从欧洲移居来的格式塔心理学家以外)。在他的主要著作《动物和人的有目的行为》(
Tolman
1932)中,他把人类(和白鼠)作为寻求目的(因而是作决策的)的生物来处理,他(它)们的行为被环境所塑造。虽然托尔曼深受尊敬,但还是处在美国主流心理学的边缘。
在欧洲,心理学家心存较少偏见,而且愿意使用词汇组成的资料,对复杂行为更加注意。英国心理学家弗雷德里克,巴特利特在《记忆》(
Bartlett
1932)
-书中考察了信息如何在“头脑中”表现以及通过存贮和提取过程又是如何被修正的。德国的符茨堡学派以及奥托?塞尔兹和他的追随者们,同样关注复杂的思维过程以及思维所运用的信息在头脑里的组织和存贮的方法。
格式塔心理学家马克斯?沃特海默和卡尔,邓克尔推进了这种观点。一直到第二次世界大战之后,美国几乎才刚知道这些。同样地,一些美国的教学心理学家(我则通过哈罗德,格茨科夫)在战前就很熟悉皮亚杰关于儿童思维发展的工作;但是美国实验心理学家对此几乎一无所知。
除了托尔曼,战前美国心理学中另一个背离行为科学主义的观点:生理心理学的“标准”观点,由埃德温,G.博林在《意识的物理维度》一书的序言中加以阐明:
245心理学中简单的基本事实是一个因变量与一个自变量之间的相互关系。恩斯特,马赫提出了这一点,B.F,斯金纳大约在写这本书时接受了这个观点。他创造了“虚空有机体”概念(这是我的措词,不是他的),一个在刺激和反应之间的相互关联的系统,在刺激和反应之间没有任何东西(没有“概念的神经系统”——这是他的措辞,不是我的):本书没有遵循斯金纳的概念……而是要论证这些相互关系是科学发现的初级阶段,它们需要充实——因为探索的头脑不喜欢有距离的、残留着“不能解释”的不连续的行动。
因此我的书着手去评价1932年可以获得的神经学方面的大量填充物——有多少事实可以立刻用来填补心理生理学的真空啊。
(Boring
1933,pp.
vi-vii)
博林的最后…句话把他的心理生理学观点(卡尔,拉什利也是一个代表)与行为科学主义和我们自己的处理途径区分开来。他假定:(l)“虚空有机体”要被解释机制所充实——这是除了像斯金纳那样彻头彻尾的行为科学家以外所有的心理学家都接受的一定假设;(2)解释机制是应该神经病学的。
阿伦、克利夫和我并不与他一样具有第二个假定——不是因为原则上反对还原论,而是因为我们相信复杂行为只能不间断而不是一步步被还原为神经过程。物理学、化学、生物化学和分子生物学原则上承认最复杂的事件能还原为量子物理学定律,但它们分许多阶段进行还原,在总体的生物学现象和基本粒子的亚微观活动之间插入四或五层次的理论。与此相类似,在心理学中定位于复杂思维与神经原之间的符号层次的理论是很重要的。
几乎所有不是行为科学家的美国心理学家都同意博林,而
246反对我们,这些人把心理学解释认同为神经生理学。这种混淆,在战后阶段唐纳德,赫布那本有影响的《行为的组织》书中继续着,而且现在的一部分认知心理学家仍继承着这种混淆,这部分人采纳平行的连结网络(“神经网络”)来模拟人类心智。
既然认知的信息处理的种种理论代表着在行为(上层)和神经学(下层)之间的特定的解释层次,它们与承认这种结构的理论共鸣最强烈。我们这项工作的先驱者——主要是格式塔学派的塞尔兹及其盟友,会不会乐于被标榜为“信息处理心理学家”?他们会不会同意我们运用他们那些(在我们看来是模糊的)概念呢?不管他们同意不同意,我们都得感激他们。形式逻辑的影响
为建立成功的科学理论,我们必须有一种语言能表达我们所知道的东西。很久以来,认知心理学缺乏一种清晰有效的语言。20世纪之交,由吉塞珀,皮诺、戈特洛勃,弗莱格、艾尔弗雷德?诺思?怀特海和伯特兰德?罗素所导致的形式逻辑的进展提供了这种语言。
形式逻辑同心理学的关系常被误解。现在逻辑学家和心理学家都同意逻辑不能与人类思维混为一谈①。对逻辑学家来说,推理的有效性具有客观的形式的标准,它们只能存在于柏拉图的理念天国,而不存在于人的头脑中。对心理学家来说,人类思维往往不是严密的或正确的,并不遵循步进式演绎推理过程①
当代人工智能研究者的一个有影响的流派,包括尼尔斯,尼尔逊、约翰,麦
卡锡等人,相信形式逻辑为人工智能程序提供了合适的语言,问题解决是
一种证明定理过程。他们在两方面都大错特错了,但除下面几节中有些评
论外,这里不是与他们争论的地方。247的——简单地说,通常是不符合“逻辑的”。
那么,形式逻辑怎么能帮助心理学开始朝新方向发展呢?例如,它证明操作符号是和在木工车间锯松木板一样具体;符号可以被复制、比较、重排、组块,就像木板可以被锯开、刨平、测量和粘牢一样的明确。符号是思维的材料,但符号是物质的样式。心—身问题的提出是因为“观念”——思维的材料——与大脑可触知的生物物质之间有明显的根本的不同。形式逻辑——它把符号看作物质图案(例如,纸上的墨水图案)——表明这些观念,(至少有些观念)可以用符号来代表,而且这些符号还可以通过精确规定的程序进行意味深长的改动。
甚至符号操作和思维间相似性的比喻的运用也解放了我的思维概念。我深受鲁道夫?卡尔纳普在芝加哥大学的讲演和他的著作的影响,学习怀特海以及罗素的《数学原理》对我的影响也很深,我很早就明确地利用这个比喻作为我考虑管理决策的框架:“任何理性的决策都可以看作是从某些前提出发得到的结论……因此,如果能对他详细的说明作为决策基础的价值和事实前提的话,就可以控制一个明事理的人的行为了。”(
Simon1944,p.19)
在心理学中利用这一新观念,要求扩大符号操作以包含比演绎逻辑多得多的东西。符号可用于日常思维、隐喻思维、甚至“非逻辑”思维。这一至关重要的通则大约在第二次世界大战时开始出现,虽然它为了完美而以现代计算机的面目问世。
与逻辑学的发展相似,经济学与统计决策理论紧密地联合在一起,创立了新的“经济人的”决策形式理论。虽然经济人显然太理智而不适合于人类,这个概念引起经济学注意去明确地关心行动的推理。但经济学家只关心逻辑的演绎和正确的推理,这多少耽搁了人们对经济学和心理学的共同兴趣的认识。
249
逻辑学家在努力去严格而客观地掌握符号——作为对象——时逐渐明确了他们的操作,1936年英国逻辑学家阿兰。图灵把现在所知的处理机称为图灵机时,他通过演示机器如何操作符号而完成了向形式化迈进的第…步。我后来才知道图灵的工作,但我从克劳德,香农的硕士论文(Shannon
1938)中发现了相同的观念,香农的论文表明如何用开关电路去完成布尔代数的逻辑推理。
这时人们终于越来越相信数学像它可以用于物理学一样也可以用于生物学、心理学和社会学。阿尔弗雷德,洛特卡的《物理生物学原理》(l_otka
1924)体现这种观点,预示了控制论的一些核心概念。我以前的教师尼古拉?拉什夫斯基是这一领域的另一位先驱。虽然战前心理学领域中很少运用数学,但有一些心理学家(包括克拉克.L.赫尔)已开始对其潜力产生强烈的兴趣。战后机器智能研究的开始
第二次世界大战结束时卜上面谈到的这一发展在“控制论”的旗号下受到公众的注意。控制论这个术语是诺伯特,维纳用来包容像信息论、反馈系统(伺服机构理论、控制理论)和电子计算机(
Wiener
1948)这样…些要素的。在其他国家,尤其是“铁幕”后的国家,控制论这一术语用得更广,它还包括博弈论、数学经济学、统计决策理论、管理科学和运筹学。维纳在《控制论》第一章里描述了这些发展的历史。计算机作为一种使用符号的机器在控制论早期发展中起的作用较小;控制论的主要基础是反馈和信息论,而计算机只是最大的“机械装置”。
第二次世界大战确实没有推动控制论的发展,事实上它好
250像有点耽搁了它的发展。早期控制论发展与形式逻辑的联系,正如我提到的那样,在香农的硕士论文以及在沃尔特?皮茨和沃伦,麦克洛克一篇非常类似的论文(1943年)中就已经很明显了。后一论文提出了神经网络的布尔分析。另外还有一篇是阿图罗,罗森布鲁斯、诺伯特,维纳和朱利安,比奇洛1943年写的文章,它提供了有关行为、目的和目的论的控制论说明。在这些发展中,大多数杰出人物早期都潜心钻研现代符号逻辑。维纳是罗素在剑桥的学生;冯?诺伊曼20年代到30年代的许多工作都是逻辑学方面的;香农、皮茨和麦克洛克对逻辑的运用已在前面提到过。
太超前于时代精神的研究工作容易被忽视,而符合当时时代精神的研究工作会立刻被承认。冯,诺伊曼20年代对博弈论的贡献在1945年前很少有人知道;同样,只有少数生物学家读过洛特卡的文章;只有少数逻辑学家了解逻辑学的迅速进展和库尔特,哥德尔、阿兰,图灵、阿朗索,丘奇和埃米耳?波斯特深奥的发现。所有这些在战后的几年里都发生了变化。
我听卡尔纳普、拉什夫斯基和舒尔茨的讲演的经历记录了这些观念的激烈变化。我通过这些教师,而不是直接从丘奇或图灵那里获悉洛特卡、哥德尔以及统计决策论的最新发展。我发现有少数教师和同学也对时代精神有这种朦胧的认识。我的学位论文反映了1940-1942年讲求理智的时代风气。
那时的“无形学院”和现在一样有效地运行。关于新贡献的消息通过分散的期刊和书籍迅速传播。这些文章大多数在发表前或发表后不久就引起我的注意。同样地,我学位论文中的决策方法也很快为经济学和运筹学领域所知。
生物学和行为科学并没长久远离控制论。控制论的反馈思想不久就被利用,尤其被生理学有关方面所利用。在英国,人们
251对反馈思想最感兴趣(Ashby
1952;Walter
1953)。几乎刚提议把计算机比喻为人脑,马上就有人警告不要太在字面上去分析大脑的神经组织和计算机的线路(Von
Neumann
1958)之间的类比。图灵是最早在不同层次(符号处理的抽象层次)上认识到这个更有效果的类比的人。
反馈概念对心理学有相当大的、但相对来说非特定的影响,但香农—韦弗的信息论对心理学的影响则是清楚明确的(
MiLlerand
Frick
1949),W.E.希克提议并检验了反应时间和反应中所包含的信息量之间的关系,而其他人则试图测量人的感觉神经和运动神经通路的信息容量。信息论对心理学的适用性,其局限性逐渐清楚了,而到60年代初信息论已经仅仅成为变量分析的专门工具。
战争刚结束的那几年,欧洲关于思维过程的研究工作刚开始通过翻译和科学家的移民传到美国。邓克尔的《论问题解决》和沃特海默的《创造性思维》的译文1945年问世;G.汉弗莱在《思维》(1951年)一书中首次用英语对奥托。塞尔茨的研究和理论进行广泛的讨论。卡托那的《组织化与记忆》以及梅尔的许多关于“问题解决”的论文虽然1940年就出现了,但战争结束以前几乎没人注意。
信息论、统计决策理论和博弈论激起人们对概念形成重新发生兴趣,并提出一些新的研究方法和理论观念。卡尔?豪夫兰的《概念学习的一种通讯分析》发表于1952年。而在关键的1956年,乔治,米勒的《神奇的数字7》提出了短时记忆容量有限的理论,布鲁纳、古德诺和奥斯汀的《思维研究》一书导致了将有关博弈论的策略思想用于概念形成的研究。
第二次世界大战中对人的技能和行为的研究(“人的因素”研究)大大增加。因为这些工作多数与复杂的人—机系统中的
252人类成员——飞行员、炮手、雷达工作人员——有关系,研究者可以观察人类信息处理与伺服机构及计算机的行为之间的类比。唐纳德,布罗德本特的《人类注意和直接记忆的机器模型》(
Broadbent
1954)表明在这条探索路线上主要强调的是,对人的因素和概念形成的研究也为心理学和新出现的计算机科学领域之间架起了桥梁,同时还提供了一条重要道路,沿着这条道路计算机科学领域中的一些思想开始在心理学中合法化。
齐利格,哈里斯的《结构语言学方法》(
Harris
1951)对语言中形式化的长期关注是一个新的推动。诺曼,乔姆斯基的工作刚开始,它在很大程度上使语言学的首要任务从对结构的研究转到对过程的关注上(即生成语法)(Chomsky
1955)。我不知道在多大程度上语言学的这些发展起源于我所说的时代精神。与逻辑的某些关联是清楚的(例如,Chomsky
1956),但语言的机器翻译的早期努力却脱离了语言学的主流(见洛克和布思1955年写的历史)。数字计算机的出现
战后初期数字计算机迅速发展。逻辑学家懂得它们是通用机(图灵机),而其他人却把它们基本上看作是用数字而不是用一般符号进行工作的算术机器。
用机械装置(机器人,而不是计算机)来说明心理学理论并实施运作已有悠久的历史,在时间上早于计算机。博林(1946年)在他的论文《心智和机械装置》中对这一历史作了综述。控制论的发展对制造机器人是一个新刺激(
Walter
1953;
Ashby1952),我1952年初在兰德公司时与此有些接触。
但这些努力与计算机模拟并不相关,后者并不趋向于制造活动的机器动物,而是趋向于编写游戏程序和其他符号活动。1952年编制了第一个跳棋程序(斯特雷奇),鲍登的文章(
Bowden1953)描述了其他游戏程序。图灵(Turing
1950)在非常著名的讨论《计算的机器和智能》中已经以极尖端的形式提出了模拟问题;他还提出一种图灵测试,以证明计算机回答问题的功能和人类回答问题的功能是不可区分的:这样就为人工智能的诞生创造了条件。13.攀登:获得人工智能我生活的全新转折发生在1955年,是我在兰德公司系统研究实验室工作以及在那里接触计算机之后意想不到的结果。我在前几章已写了,我使用现代计算机的前身穿孔卡片的经历,开始是1938年在芝加哥,为了制作《市政年鉴》的统计表,后来是1941年在洛杉矶的IBM服务部。第二次世界大战时我隐约听到传闻说在马里兰州阿伯丁试验基地为计算弹道正在建造更有效的计算机。战后不久,这些传闻变得更确凿,到1945年我第一次遇到约翰,冯,诺伊曼,知道了现代数字计算机时,我一点都不奇怪了。
我在1949或1950年读了埃德蒙,伯克利的《巨型大脑》(1949年)一书后,我的了解和知识迅速增长,这本书对新机器作了极好的说明。伯克莱那时还正在销售一种自己动手装配的小型计算机(“杰尼亚克”),它们只是用电池和电线做成的,能通过重新接通线路而完成“程序”编制任务。我买了一个,从中获得一些关于计算机工作方式的感性认识。
1950年我向工商企业经理们作过一次关于计算机未来在工商企业中应用的乐观讲话,提到线性规划和博弈论是尖端应用的关键。这次讲话的摘要后来发表在《高级管理》期刊上。它表达了这样的思想:在描述这些发展时,我不希望在经理的头脑里对未来可能被淘汰一事感到过分焦虑:
目前十多个地方的科学家正在致力于这一发展。今天的工商企业经理和管理工程师要成为大人物,如果不说要几代人也要许多年。但是我想,把这些研究——与前面提到的社会心理学研究一起——看作是预示我们要及时地掌握管理理论(一种预言现实而不是与实践相反的理论)是不会错的。当这一时刻来到时,管理者将是掌握并应用这种理论的人。
(Simon
1950,p.4)
计算机在我的注意范围之内,但只是些被用作摆弄数字的机器,尽管有“巨型大脑”比喻。1950年的这个谈话中没有什么地方暗示,计算机最重要的应用可能在于用符号而不是数字来模仿智能。而获得这一见解是关键的一步,是出现真正的人工智能所必须的。阿伦?纽厄尔和我在50年代初都认识到这一点,但我们走的道路有所不同。阿伦,纽厄尔
我必须谈谈我大胆探索过程中最亲密的伙伴,他至今仍是我亲密的合作者和朋友。虽然本书穿插地描写了我的各种合作者,但我只能简要地对阿伦做些介绍。我们两人的道路在相当长时期内错综复杂地交织在一起,所以我得另写一本书才能很好地讲述我们的合作和友谊。但我要稍微谈谈我们首次见面时的年轻阿伦,纽厄尔。
我第一次见到阿伦是1952年在兰德公司。那时他25岁,完全有资格在任何大学被授予终身教师职位——富于想象力,技能全面,这是成为科学家所必需的。我猜想他一出生就随时可以获得终身教师职位。雅典娜从宙斯的山顶向他敞开怀抱。他有非凡的能量,完全献身于科学,他对重要的(和困难的)问题有正确无误的直觉。如果这些评论说他不仅聪明而且活跃,那并没有说错。
他作为认知心理学家受的最早、或许是最重要的教育是本科时在斯坦福大学读物理学专业。他听了几门著名数学家乔治,波利亚开的课。后者在一本被广泛使用的书《如何解决它》(
Polya
1945)中记载了许多他关于问题解决的思想。波利亚向阿伦介绍了“启发式”一词以及这个词的含意。在普林斯顿大学数学系纯净的气氛下当了一年研究生使阿伦相信,自己的兴趣在应用数学而不是纯数学,而且他想在不久的将来投身于实际研究而不是研究生学习。于是他接受了兰德公司的一个职位,我就是在那里认识他的。
如果说想象力和技能造就科学家的话,我们还必须加上金钱。在我和阿伦一起做博士后工作时,我知道了许多事,这比如何在研究提案中定小数点还重要一些。我第一次教训来自系统研究实验室的一个厖大科研项目,可以说是物理学和空间科学以外从未有过的大项目。阿伦和他的三个同事认为,空军建立一个完整的模拟防空站并以一个空军小队为它配备人员工作几年是当然合理的,他们在征募人员和官员。这实际上是合理的,但我要不是亲眼看到这些我自己是想不到的。
往大处着想是阿伦整个研究生涯的特色,不是为了大而去求大,是任务需要求大。阿伦通过以前与物理学家的合作得知
257研究基金如何提供,我们这些行为科学家仍需要和他一起学这一课。(在卡内基—梅隆大学为认知科学和人工智能研究以及近来为校园的计算机网申请经费时,他已教过我们这一课。)
自我们最早合作起,阿伦始终工作得很“凶”。我并不是说他比我更像工作狂,也许不分胜负——而是说他在不合适的时候工作。从一开始,他就喜欢从傍晚8点几乎一直干到黎明。而我愿意每天早上10点开始工作,晚上10点准备睡觉,经常晚上熬夜是不行的。
也许他最大的快乐就是有“紧急事件”要求他整晚或连续两晚上不睡以赶上最后期限(至少从他的行为来判断是这样)。我还记得我们1954年访问马奇空军基地时他的高兴劲,那时空军训练每天24小时,持续了整整一个周末。
这样的记忆有些是琐碎的,但我一开始和阿伦一起工作时,他的工作特点就是兴致勃勃、痛痛快快而且非常卖力。60年代中期以后,我们…直没有在共同的研究项目上密切合作过,1972年我们的书《人类问题解决》问世后再也没有合作过。尽管我们后来在工作上分道扬镳,但每当我们在一起,我们仍然有显著的共同信念、态度和价值观,这标志着我们的联系从1952年2月见面的最初10分钟起就开始了。
为了描写在那些年,特别是从1955年到60年代初,我们几乎天天见面时的作风,我要简单引用大约是1974年我与帕梅拉,麦克多克的一次谈话,那时她正在写《思维机器》一书。它主要是谈话录的形式。阿伦也许比我说得多,现在的情况如此,我想过去也常常如此。但在这些谈话中我们有一条明确的规则:人们可以无意义地含糊地谈论,但是你想作批评的话就必须准确而明智地谈论。我们可以提出半成熟或四分之一成熟或根本不成熟的想法,只是谈论或倾听,然后反复提炼它们。
258
除了谈论工作外,阿伦和我常常有共同的个人关心的事和问题。在利,巴赫离开匹兹堡以后,多萝西娅和我希望让纽厄尔当我们孩子的监护人,这是我们对他感到亲近和信任的标志。但我们主要谈论研究,只有在餐桌上或者与阿伦的妻子诺埃尔及多萝西娅在一起时才谈别的。
在工作之外我们都各自追求自己的业余爱好和娱乐。我自己猜想,当我们在一起时,总忍不住要重新继续谈论那些问题,它们是我们的生活中心——我们的科学。不论是在一起爬山,还是在阿伦的工作室或我的起居室里谈话,我们谈话的内容总没有多大变化。研究开始进行
在兰德公司系统研究实验室,阿伦和J.C,肖发明的方法对我有强烈的吸引力。肖是一位有杰出才能而且非常富有经验的系统程序设计师。他和阿伦一起发明了用一种卡片编程序的计算器来制作防空模拟的雷达地图仿制品。在这种应用中,计算机产生的不是数字而是地点,二维地图上的点。计算机,因而就成为一般的符号系统,能处理任何一种符号——数字的或非数字的。
我和阿伦渐渐醒悟到了这一点,也渐渐认识到计算机可以为我们提供我们正在寻求的形式——用计算机来模拟各种信息处理过程,并用计算机语言对这些过程进行形式化描述。
1954年夏天,我自学为IBM的第一种存储程序701计算机编制程序,我一直想着计算机。阿伦和我一起开车去马奇空军基地参加前面提到过的空军训练,我们长时间地讨论用计算机模拟人类思维的可能性。
1952年在兰德公司的暑期讨论班中,我那早期关于象棋程序设计的想法只产生了一种口头描述的程序。现在阿伦开始认真努力为数字计算机编程序,让它学习下棋。他的工作使他发表了一篇关于这个论题的论文,但没有立刻运行这一程序。奥利弗?塞尔弗里奇(Selfridge
1955)和杰里?丹尼(Dinneen1955)模仿了他的工作,他们俩的研究成果表明计算机是如何可以真正成为非数字处理器的。塞尔弗里奇和丹尼为识别图编制了一个(原始的)程序。塞尔弗里奇在兰德公司的一次讨论会上介绍了这项工作,从而促使阿伦开始他的象棋研究计划。阿伦与我多次讨论这项计划,但我的作用完全是顾问性的。
在首次发表的描述象棋程序的计划中阿伦说:“这是更多地了解各种计算机、机械装置以及处理极度复杂问题的必要程序的手段。”(
Newell
1955,p,101)这一研究因此被认为是人工智能(虽然并没用这一名称),但要考察的任务却最具心理学兴趣且已被荷兰的艾德里安?德格劳特广泛研究过(
Groot
1946)。
最初的途径也确立了我们所有后来的工作所遵循的先例:人工智能借用了心理学,心理学又借用了人工智能的成果。于是阿伦对象棋学习的方案的纲领性描述.如同我1952年的提纲(见第10章),在评价走棋子时运用了“渴望值”和“满意解决”的概念,并讨论了对于把巨大搜索空间减小到可以处理的大小来说“经验法则”(后来称为“启发式”)的必要性。这种搜索空间包含了描写棋子走动和回击的所有可能性的树形图上的所有分支。通过启发式和虽不满意但仍可以接受的走法,可以非常有选择性地探究搜索空间,避免作不可能的无遗漏搜索。研究中我们经常遵循这条路线,并密切注意着它对心理学的潜在应用,
阿伦不久参加了克利夫?肖小组。他们曾对雷达地图问题一起研究过。那时约翰?冯,诺伊曼已为兰德公司设计了一种功
260能强大的计算机(不顾他的反对,这台计算机名叫JOHNNIAC),克利夫在构建该机的程序系统中起了主要作用。我们判断JOHNNIAC够大够快,足以满足象棋程序的需要,它用一个可用容量为10
000词的磁鼓来补充有4
096词的高速存储器。它是当时最大最快的计算机了。
阿伦没有获博士学位就来到兰德公司。他想迟早获得这张会员证,但并不想因此打断他那激动人心的研究。我没费多大事就使我工业管理研究生院的同事相信,商学院对这样一篇有关我们现在称为人工智能的论文授与博士学位是完全适当的。(在卡内基,计算机科学成为一门单独学科之前,得这种学位的总共大约有十多人。)
在考虑了这种和其他选择之后,阿伦决定把他的活动基地和他的象棋研究搬到卡内基理工学院。兰德公司同意继续给他发工资,让他当公司在匹兹堡的前哨。阿伦与诺埃尔以及他们的儿子保罗于1955年春搬到匹兹堡,象棋计划的研究工作开始了。①我想尽可能多地花时间与阿伦一起对象棋问题进行研究,并对他说明我打算继续研究人类解题及“雨果式”迷宫模型(见第11章“苹果”)的理论。
我们同意每个周六见面,在广泛的话题中“漫游”——尤其谈得多的是“问题解决”和阿伦正在设计的“下棋语言”。他往往会从语言和计算机这一头出发提供想法,而我则从人类解题和我们在启发式方面所了解的东西出发。这是一种角色专门化,是由各人的条件所决定的,我们俩适度地坚持了好多年。在这种讨论中,我们从象棋以外的领域考虑了一些有关例证的问题,①
1955年秋天的这段记述是根据我于这些事发生后不久的1957年7月9日
写的备忘录,而不是根据我对很久以前的事的记忆。261包括欧几里德几何、卡托那型火柴问题以及符号逻辑(《数学原理》在我的书架上)。
既然我们打算设计的程序要在圣莫尼卡的JOHNNIAC上运行,克利夫和阿伦通过电传打字机(那是一种早期的半自动计算机网络,它使电话费上升到每月500美元)。这笔金额并没有难倒阿伦或兰德公司,但对我来说是巨大的)通讯。
1955年10月的第三个周末,阿伦和我出席了纽约管理科学学院的会议。我提前一天到,因为要与福特基金会的伯纳德,贝雷尔森在上午会晤。那个美丽的下午阳光灿烂,我决定在莫塞特高地沿哈得逊河散步。我想那天下午晚些时候我在哥伦比亚大学,也许与保罗,拉扎斯费尔德或鲍伯,默顿有个约会。
我一面散步,一面思索人们是怎样解几何题的。我脑子里想的那个例子与圆或半圆中的内接角有关(我认为有几种情况,它们取决于一条边是在其他角的内部还是外部)。忽然我非常清楚地确信我们能为机器编制程序来解这种问题。我在一张纸上匆匆写下几行字,拼命地思索了几分钟,这一信念仍非常强烈。我认为这种信念来自一个事实,即我知道我在运用启发式,而且知道它是如何缩小搜索空间的(:)
那天傍晚阿伦和我在梅里尔,弗勒德的旅馆房间里见面,梅里尔是最早邀请我去兰德公司的运筹学专家。讨论后,我们同意在圣诞节前——还有两个月的时间——尝试为机器编制几何学程序。我们都强烈地感到我们有极好的成功机会。我清楚地记得那个房间以及我们每个人坐在哪里。
同时,我们相当关注这项计划所要求的程序语言。根据他们以前的经验,克利夫和阿伦知道用计算机的机器语言直接编写我们的程序将很困难。在人工智能程序中,你不能预测系统需要建立并存储什么样的数据结构,或这些结构在运算过程中
262将如何相互作用或修正。它们要求有极灵活的适应性,而且存储器中所存储的信息必须以适当的方式附以索引,以备需要时索取。
当然这也是人类记忆的要求。我们不能假设上帝为我们在记忆中分配了特定的地点去存储拉丁语动词,而在另一处存储代数。存储一定是动态的、可以重新分配的。如果人类记忆是人工智能的向导的话,那么这种记忆应该是联想型的:每个符号应能导致与它相联系的其他符号,而这些联系能通过学习而获得。
而且,似乎有两种联想:简单的和定向性的。呈现简单的刺激狗,大多数(说英语的)被试对象会反应猫;但是呈现上一层次,狗,他们就反应动物;呈现下一层次,狗,他们反应为牧羊犬或德国种猎狗。人工智能的语言必将既能处理简单的联想,也能处理定向性的联想。在我们创造的语言中,定向性的联想被称为描述。
我们需要一种高级语言,它适合于程序设计人员,能自动地在计算机中做大部分“管家”工作,而且计算机自己能自动地把它翻译成机器语言,而存储结构又必须是完全可修改的。虽然我们三人都参加了它的设计,但阿伦和克利夫主要负责编造这种“信息处理语言”或“表处理”语言。这一任务在1955年到1956年春天是重大的首要任务。我的作用主要是对他们提出的语言设计同类似的人类功能作比较。例如我们大量讨论了如何处理“描述”——特别是如何避免限制它们的通用性。我们都同意需要适应性而避免量纲化。
1956年4月2日阿伦写的一份备忘录标志着一次重大突破——把“表结构”形式的联想记忆用于作无量纲的搜索。这一想法具有来自机械技术和人类联想网观念的双重来源,它同时扩展了描述性的表和表的网络。阿伦和克利夫不久后就实现了这一想法。构想逻辑理论家
在纽约举行的管理科学会议结束后,阿伦和我每星期六做关于几何学问题的工作。面对如何作图的问题,我们看到我们仍然不得不对付一些基本的感知问题。大约在11月初,符号逻辑开始作为一种“选择元”而出现——特别因为它不包括作图。
我的最初的书面记录是对《数学原理》2.15定理证明的分析,日期是1955年1
1月15日。那时,我通过学习那本教科书第二章的证明恢复了我的逻辑技能。到i2月初,我开始产生关于启发式的一些非常清晰的概念(例如,证明时通过代入而反向证明)。我做了证明中大部分的实际工作,并以我们的周六讨论结果作补充。阿伦在11月或10月里活跃了一阵之后,多少陷于停顿,转而准备他的博士资格的书面考试去了。
阿伦的笔记大约从12月6日恢复,那时我们已经有了程序的大部分片段,但它们没有组织好。在随后的那一周里,我们频繁地——几乎每天——短时间交换意见,我几乎每天晚上在研究证明。12月15日星期四(我感到那星期工作快结束了)我成功地用手工(计算机程序的文字模仿)完成最初的证明,所用的程序相当接近于第二年9月在我们无线电工程研究所的论文中所发表的那种程序。在后来的几天里,阿伦和我努力推敲,完善处理过程,并把它纳入我们一致认为可以在计算机上编程序的那种形式。
我不想制造一种有专门分工的印象(是希拉利还是坦津最
264先达到珠穆朗玛峰?)。提出“逻辑理论家”程序的策略的大多数实际的书面工作是我做的,正像关于语言的大多数实际工作是阿伦和克利夫做的一样。在整个时期我们处于最密切的交流之中,并且通过长期联系,发展了不寻常的交流能力。我们甚至能交流我们的微妙的思想。整个成果必须被看作共同的、不可分割的。我们中的任何一个人或两个人都不能完成这项工作。
我经常把1955年12月15日作为用计算机探索解题的生日来庆祝。那时我们知道了怎样去证明计算机能用启发式来寻找难题的答案。照当时在工业管理研究生院听我课的一位研究生爱德,费根鲍姆的说法,我对这一成就的反应是:走进教室并宣布“在圣诞节,阿伦,纽厄尔和我发明了一种思维机器”(事实上,如果我确实这样说了,我会把克利夫,肖包括在发明者之中的)。当然,“逻辑理论家”还没有在计算机中运行,但我们明确地知道如何编写程序了。
我们毫不拖延地宣布了我们的成功。在1956年1月3日给艾德里安,德格劳特的信中我写道:我想你将有兴趣知道阿伦,纽厄尔和我在下棋机器方面已有了重大进展——它不仅可以下棋,还可以作为用符号逻辑搜索并发现定理证明的机器。我们暂时改变题目的原因是,我们发现人的眼睛和与它联系最密切的中枢神经系统部分在下棋时——在无意识层次上——要做太多的工作,且我们发现人的心理过程的这方面(感知)最难以模拟。因此,我们转向那种在内容上不大靠“视觉”的解题领域。
两周前我们得到了一个程序看来能达到这个目的。虽然机器编码的细节还没完成,但似乎没有更多的概念性质的困难要克服。通过用人(我自己)来模拟这种机器——按
265规则操作而不用判断——这种模拟机器现已发现,并得到《数学原理》中约前25条定理的证明。它所完成的处理在你看来是非常像具有人类特性的,并在许多方面证实了你在象棋研究中获得的数据。
等待“逻辑理论家”在计算机上运行时,阿伦和我用英语在索引卡片上写出了程序构成部分的规则,而且还为记忆内容(逻辑公理)作了卡片。1956年1月深冬的一个夜晚在工业管理研究生院大楼里,我们把我的妻子和三个小孩,以及一些研究生叫在一起,给他们每人一张卡片,所以每个人实际上成了“逻辑理论家”计算机程序的一个构成部分——执行某种特殊功能的子程序,或其存储器的一个构成部分。每个参加者的任务是在上一层次的控制程序要求下执行他或她的子程序,或提供他或她的记忆内容。
所以我们能用由人构成的计算机来模拟“逻辑理论家”的行为。这里是用自然的人去模仿人工物对自然人的模拟。演员们对自己所做的并不比柏拉图的《曼诺篇》中的小奴隶对自己所做的负有更多的责任,但他们成功地证明了那些给予他们的定理。我们的孩子那时是9岁、11岁和13岁。这件大事他们仍记忆犹新。
我们只是简短地在未公开发行的《兰德报告-850》上,以文章“当前信息处理的发展”(1956年5月1日)公开宣布了我们的成功。1956年5月2日,纽厄尔在华盛顿读了这篇论文。直到1956年8月9日,用“信息处理语言”一Ⅱ在JOHNNIAC上编程序的“逻辑理论家”才首次完成了定理证明《数学原理》的2.01定理)。1956年9月这一方案的形式化描述用“信息处理语言”-I发表了。
266
在JOHNNIAC首次进行计算机证明后不久,我们把成功的消息告诉了伯特兰德?罗素。下面是我们的第一封信和他的回信。罗素伯爵皇后路41号里士满,萨里,英格兰1956年10月2日亲爱的罗素伯爵:
纽厄尔先生和我认为您可能乐意看到我们附在信中的一份工作报告。我们正在借助于电子计算机来模拟人类的某些解题过程。我们把《数学原理》第二章作为题材,并试图详细说明能发现定理证明的程序,它类似于书中给出的证明。我们认为我们自己的发明不是一种算术的定理演绎和有条理的决策过程,医为我们的目的是,尽可能近似地模拟人类在不能运用有系统的程序时所采用的处理过程,以及真正包含“发现”的问题解决办法。
论文中所描述的程序现在已翻译为计算机语言,用于圣莫尼卡的计算机JOHHNNIAC,大约两个月以前,这台机器进行了第一次证明。我们也广泛地用手工模拟了这一程序,发现它进行的证明非常近似于《数学原理》中的那些证明。现在,我们正在朝学习(方法和定理)以及自己编程序这个方向来扩展这一程序。您最忠实的赫尔伯特-A,西蒙267工业管理系主任
1956年11月2日亲爱的西蒙先生:
感谢您10月2日的来信和非常有意思的附件。我很高兴地得知《数学原理》现在能由机器来证明。我希望怀特海和我在我们俩人用手工花了10年功夫证明它以前就知道这种可能性。我非常愿意相信演绎逻辑的每件事都可以由机器来做。您最忠实的伯特兰德?罗素
一年后我们又写信给罗素报告用“逻辑理论家”进行学习的实验结果。
1957年9月9日
亲爱的罗素先生:
附上的材料将表明我们在用计算机模拟人类问题解决
过程中的新进展。继附件中所报告的工作之后,我们已积
累了一些关于在基本执行程序之上加一些简单学习程序的
作用的有趣经验。例如,通过诱导机器去记忆并利用这样
的事实,即在过去已被证明的某些定理在联系某些证明方
法时有用,我们在问题解决的能力方面获得了惊人的进展。
“逻辑理论家”已发现的证明一般非常接近于《数学原理》中
的证明,但在一种情况下,它创造了一种非常简单的证明以
代替书中复杂得多的证明。在命题*2.85中,pvq.一.pvr:
一:p.v.q-r,它提出这可以通过应用三段论推理形式:pvq.一.pvr:—>:—q.v.
pvr推得,运用结合律,*1.5,重新安排右边诸项。这一新的表达式还可以直接从*
1.3通过*2.05中的“假言推理”得到,证毕。这机器只要不到5分钟就找到了证明。既然机器证明既简洁又非显而易见,我们对这一例子中它的妙技感到吃惊。
您也许对我们的论文229页上的论据也感兴趣,它表明有学问的人和有智慧的人并不总是一回事。当然人们很早就知道这一点,但是有这种确凿的证据来反对卖弄学问的人是很有意思的。一般说来,当机器用一系列选择过的关键定理来工作时,要比用它试图记忆并运用书中所有以前的定理解题简捷得多。对照图7和图8可以看到典型的差别。我不敢肯定这些事实是否应让小学生们知道。您真诚的赫尔伯特.A-西蒙管理学教授
1957年9月21日亲爱的西蒙教授
非常感谢您9月9日的来信和附件。我为您的机器超过我和怀特海的例子而感到高兴。我相当欣赏您认为这些事实应对小学生隐瞒的理由。当人们知道机器能比他们做得好时怎么能期望他们去学做算术呢?我也为您精确地论证“智慧和博学不是一回事”那句老古话而感到高兴。您真诚的伯特兰德,罗素269
我们把伯特兰德,罗素所喜欢的这一新奇证明写成一篇合著的文章寄给《符号逻辑期刊》的著名编辑斯蒂芬,克利恩。他拒绝登这篇文章,认为它没有提出什么新成果。他说既然《数学原理》的方法现在过时了,那么用这个方法去证明一条定理就没有什么功劳。认为克利恩和罗素的反应之间的差别就是进一步证明博学和智慧之间的差别,这或许不太礼貌,但不管怎样,我们失去了向逻辑学家夸耀“逻辑理论家”的威力的这一机会。
给罗素的信表明从一开始我们就对模拟人类问题解决感兴趣,而并不仅仅是想证实计算机如何能解决困难问题。而且这些信表明我们很了解除了《数学原理》体系之外还有更简单的方法可证明这些定理,我们用这个方法只是作为一个例子——任何方法都同样能用作例子。后来,逻辑学家王浩等人把计算效率作为唯一标准,运用真值表或自然演绎法设计了更快的计算机证明程序,并抵毁“逻辑理论家”为原始的方法。他们的确误解了研究“逻辑理论家”的目的。
最后,这些信也表明从一开始我们就知道机器学习和自动编程的可能性(而且事实上我们在后来的几年内寻求过一些这样的可能性)。
我们及时地向科学界同行传播了我们成功的消息。我已提到5月份阿伦在华盛顿所作的有关“逻辑理论家”的简短谈话。1956年6月在达特茅斯由约翰?麦卡锡、马文?明斯基、纳撒尼尔?罗切斯特和克劳德?香农组织召开了人工智能的暑期专题讨论会。参加者包括许多那时正在积极思考人工智能的人:四位组织者之外还有奥利弗,塞尔弗里奇、雷,所罗门诺夫、特伦查德,莫尔和赫尔伯特,格伦特,阿伦和我在那儿待了一周。
虽然编制问题解决、模式识别或做游戏的程序的许多想法还很渺茫,但会上提出了两个具体的方案,即我们的“逻辑理论
270家”和特伦查德,莫尔(
More
1957)设计的,用自然演绎法证明命题计算定理的程序。莫尔编制了一个流程图并用手工模拟了他的方案。后来9月份在剑桥我们把“逻辑理论家”的使用说明书发给了大家。会上还展示了早期排除程序错误的产品。我们还和约翰,麦卡锡在达特茅斯就我们为给“逻辑理论家”编程而发明的“表处理语言”进行了长时间讨论。
马文?明斯基那篇闻名的论文“人工智能问题的探索情况”虽然几年后才以《走向人工智能》这个标题发表,但它的初稿已在1956年末作为一份技术报告写成。它很好地反映了在达特茅斯会议上讨论的有关人工智能的总体知识。①
在专题讨论会之前,有几个人和几个小组(包括明斯基和我们自己)已注意到几何定理证明。这是达特茅斯谈话中的重要话题,它促进了赫尔伯特?格伦特和纳撒尼尔,罗切斯特不久后对这个问题的研究取得成功。
接着,1956年9月我们出席了一次在麻省理工学院召开的无线电工程研究所(电气电子工程研究所的前身)的会议。会上有一段时间用来报告达特茅斯会议的结果。有人提议约翰?麦卡锡应对所有的工作做一个总结报告。因为在关于达特茅斯的介绍中我们自己的工作只相当于人工智能的一个实例(已编出程序),而且我们的工作比那次会议早,阿伦和我大声表示不同意,经过协商——在与会议主席沃尔特,罗森布里斯长时间散步途中——,会议同意阿伦和我可以提交一篇有关我们工作的论文,而约翰提交一份关于那次会议的总结报告。
于是,“逻辑理论家”不久就实际生效了。那时,凡是对计算①
明斯基的论文在发表前作过相当大的修改。1956年那最早的未发表的版
本最充分地反映了他在达特茅斯会议上的解释。271机的智能行为的潜力感兴趣的人以及计算机团体的多数人几乎都知道它的能力和结构。不知道这一消息的人会有进一步的机会从我们在《西部联合计算机会议报告》(1957年)中发表的那篇论文中获悉。他们还可以很快从其他许多来源得到这一消息。我们是锋芒毕露的。我将在下一章讲述它的传播和影响。
在报告我们的工作时,我们必须解决公众对阿伦和我合作的认识问题。虽然在形式上阿伦是以我的学生身份到卡内基来的,但他实际角色是同事和合作者。他是我的合伙人而不是门生。但我是一个众所周知的社会科学家,而他是一名正式的研究生,比我小11岁,很少发表过文章。既为了公正,也为了持久合作的可能性,我们必须认识到我们间的同等价值。我们遵循慎重的策略来做到这一点。
在我们合作发表的文章中,我们的名字几乎总是以字母排序出现。因此阿伦的名字出现在第一(有几次邀请我作的演讲是例外,不是报告新研究)。人们会把这解释为阿伦是年长的合作伙伴或按字母排序,而不是把我当作年长者。我们一般轮流出席公开会议。因为我们是可互换的部分,我们一起去开会就没有什么意义。1965年以前,阿伦是我们唯一的海外发言人。
当我提到我们的工作时,我谨慎地提及我们俩人,当人们给我寄批评稿时把我们的名字顺序写倒的话,我就按字母J顷序纠正它们。结果没出现什么大问题,那主要因为每个见到阿伦的人发现他确是个大人物——他不是任何人的门生。
我们也必须正确认识克利夫,肖在我们的发现中的重大作用。由于克利夫的沉默寡言和非常谦虚,要做到这一点就更困难了。我们肯定他是我们早期重要论文的合作者之一。我们对他没有与我们分享1975年的图灵奖感到为难。我们坚持认为,他在我们发明“表处理”语言中的合作关系应在伴随图灵奖一起
272颁发的嘉奖证书中得到承认。“表处理”语言的发现
编写并测试“逻辑理论家”只是我们1956年完成的工作的一半。我们还发明了一种全新的被称作“表处理”语言的计算机编程语言,其本质前面已经扼要地介绍过了。这些语言是约翰,麦卡锡的LISP的直系祖先,30年来ⅡSP已成为人工智能的标准语言,它也体现了现在被称为面向对象编程的主要思想。
其基本想法是,一则信息不管何时储存在存储器中,与它存在一起的额外信息要说出在哪儿可以找到相邻(关联的)信息。这样,整个存储器可以组织得像一条长珠串,但是线上的单颗珠子存储在任意的位置上。“相邻”并不取决于形体接近而是取决于存储每则信息的地址或线索,它们表明那则相关联的信息的存储地点。这样,通过改变一对地址就可以加进或减去珠子而不扰乱其余的存储。一个人可以想记多少就记多少拉丁语动词而不用预先为它们指定存储器。每条珠串称作一张“表单”。一般地说,表单上的任何项目,即任何一颗珠子,都可以是另一表单的名称,有一地址计数器与(另一表单)它的第一颗珠子相联。这样,存储结构不再限于简单的线而是能包括许多枝杈的树状结构。
但进一步的推广要求体现出定向性的联想,N.艾赫(1905年)等人的实验已表明在人的记忆力中存在着这种联想。这是由描述表单(现在通常称为特性表单)完成的。描述表单上的奇数珠子有属性名称,与它们相邻的偶数珠子是这些属性的值。
这样,属性“颜色”比方说以第7颗珠子的面目存储在一张描述表单上,它后面能跟值“红色”作为第八颗珠子。此外,一种
273值本身也可以是复合属性的表结构。这样,描述表就可以,亏对象相联系,构成描写这些对象的图式。图式观在打着稿本、框架、对象、语义网络这样的标记被广泛地用于编程:
最后,“表处理”语言要求处理过程能插人与删除项目、寻找表上的相邻项、寻找对象的属性值、指定这样一种值、产生种种对象,等等,要操纵表结构,必需有大约十几种这样的处理过程。这基本上是表处理过程中的全部内容。你可能要说这已经足够了。
新的人工智能界从一开始就承认“表处理”是人工智能的编程工具。30多年后的今天,情况还大体如此。然而其余编程专业并不欢迎这一新事物。他们看到“表处理”要浪费一半存储装置(对那时能用的非常小的计算机存储器来说是沉重的代价)。但为了给“邻近”地址储存以每一个“表项目”,这一点是不可避免的。而且,表处理程序不得不借助于解释器来执行,这样延长了执行时间,大约是原来的10倍。对于因袭守旧的编程员来说,这些语言如果不是自杀性的,也是荒唐的。
几年的经验表明这些责难为什么是非常错误的。在10年内,表处理的价值,或者甚至必要性,已在许多种编程环境中变得明显了。除了人工智能界的同仁以外,克努斯在他那有影响的《基本算法》(
Knuth
1968)
一书的第2章中也给“表处理”以广泛的信任。今天,“表处理”思想在复杂的程序设计中已很平常。
我们小组发展的语言叫作IPL(信息处理语言)。第一种在计算机中实际运行的IPL
-Ⅱ是“逻辑理论家”在JOHNNIAC上用的语言。这些语言中,IPL
-V被最广泛地用于IBM650、IBM704和其他计算机。现在它们几乎是一种死语言,虽然至少有一种版本还活跃(在PC上)。它们基本上被约翰?麦卡锡设
274计的LISP替代了,而且今天还有一些其他竞争者,
IPL语言除了是第一种表处理语言外,在其他方面也是早熟的。它们的出现仅仅稍晚于FORTRAN,因此是高级编程语言中的先驱。它们也预料到后来出现所谓的结构程序设计的思想,即一组使计算机程序在编制时能改正错误、可以理解同时又有效率的启发程序。
一个有趣但也许不能确定的历史问题是,IPL
-V是否对结构程序设计的发展有重大贡献。IPL
-V手册中相当明白地主张自上而下的编程以及独立封闭的子程序,这是结构程序设计的两个主要特征。该手册还告诫不要指令在一个子程序中涉及另一个子程序(在结构程序设计中称为非一非),不要单独只用输入和输出显示处理过程的特点,这是结构程序设计所需要的东西。
然而,既然“表处理”在计算机的早期使用阶段不受系统程序设计人员主流派的重视,他们也许重新发明了结构程序设计而不知道它在人工智能界早已被倡导并实际使用了。
至此我们到了第二部分的末尾,从1956年的冬天到1957年,表处理语言在我们的计算机上运行,“逻辑理论家”找到了《数学原理》中的证明。我们的研究项目异常快地获得两项重大成功,开发了人工智能和信息处理心理学这两门有关的学科。
对我来说,回到我以前虽感兴趣但不太令人兴奋的组织决策研究课目,并不成问题。经典数学语言没有为探索人类思维过程提供工具,也不能使行为科学和社会科学达到精确和严密的程度,但我在计算机语言中发现这一切都能做到。我已通过了迷宫中关键性的分叉点,现在开始致力于认知心理学和计算机科学的未来。
275
余下的故事——至少是它的研究部分——讲述我们这个研究小组如何从那些成功继续向前发展,也讲述它的影响,首先是帮助创立新的计算机科学学科,然后在认知心理学中产生重大革命,最后把新的基本思想介绍到经济学和工程设计中,不言而喻还涉及认识论。第三部
登高望远14.探索平原
阿伦、克利夫和我使“逻辑理论家”成为现实。在翻越了这座山之后展现在我们面前的是辽阔无垠的平原。我们看到了整个人工智能领域和整个人类认知领域。卡内基(理工学院)和许多其他学院的大批科学家已和我们一起冒险探索这些领域。这一章要讲述一些我们这个研究小组的探索活动。从1956年到1978年间我们开始是三个人,不久一些研究生和教员同事也参加了我们的小组,形成了一个群体。
从“逻辑理论家”最初的成功一直到70年代,我们在研究工作中并没有拟定一个详细的总体计划。英国军事专家利德尔?哈特曾鼓吹一种柔性战术,后来德国人在1940年闪电战中满意地借用过它:向前线奋进,当你发现一个容易攻克的地方,就全力以赴攻克它,并继续前进。我们就使用类似的战术。在不确定而且不可预见之中进行探索,必须能灵活地抓住并开拓每一个进展的迹象。我想描述一下我们是如何执行这一策略的。研究策略
在工业管理研究生院环境里,我们研究“逻辑理论家”的最初动机影响着我们的研究策略。我们既对开发新发现的计算机符号处理能力的商业应用感兴趣,又对将其扩展到有助于理解人类思维感兴趣。现在,我们常把前者称为人工智能而称后者为认知科学。
在这两条战线上,我们的策略是:选择有希望的要求智能的任务,编写并检验能够执行它们的程序。在我们研究的认知科学部分,我们也做同样的实验,让供测试的人执行同样的任务,看看计算机模拟和人的行为有多么相似。当我们对一项任务有了一定程度的理解时,就转向另一项。我们选用任务的确切顺序一部分是随机的,虽然我们打算从看来简单的任务开始向较复杂的任务前进。最后我们想仿造完整的(认知的)人——一个将使我们永远繁忙的目标。
人工智能方面比较容易与商学院的目标相关联。研究生中,弗雷德?汤奇不久就在建立把启发式用于保持组装线平衡的程序(找出对工人、任务和工作岗位的最佳布局),而杰弗里?克拉克森构建了一个专家系统(如我们现在这样称呼)为银行信托帐户选择股票明细表。选择这两项特殊任务没有什么深刻的原因:它们正好引起注意,在实践和理论上有意思,而且看来切实可行。可行性和重要性总是选择研究问题的主要依据。我们想要研究的问题其解答应该是有趣而且有价值的,但只有当我们对如何对付它有些想法时才能着手干。
一个问题对认知科学的意义,可以从心理学家对它有多么注意以及它是否阐释人类的重要能力来判断。可行性取决于编程技术的现行状态和我们对实验是否有什么好主意。“解题”是显然要研究的,这既因为我们已从“逻辑理论家”开始做这项工作,又因为它是一种极重要的人类心智活动。从1956年以来的这35年里,认知科学研究的重要部分一直是针对理解人类解题能力的。
机械语言学习是显然要研究的另一课题,因为美国心理学家对它比对其他课题作的研究更多:标准的实验是模仿人们学习外语词汇(成对联想学习)或记忆诗歌(借助系列预测的学习)的传统方式。除了我们可以自己来做的实验工作以外,在已发表的文献资料中有数千个实验可以用来检验我们的模拟模型。
把外推字母序列选为另一项研究任务有几条理由。它是一种系列行为的例子,拉什利已强调过它对心理学的重要性。这种任务已被智力测验的设计者选为测量重要心智能力的好方法。而且因为它是一种发现规律的任务,它可以开拓通向说明科学发现和其他创造性活动的必要过程之路。鲍勃,林赛的博士论文所承担的一项更抽象的探索性工作,是考察计算机怎样理解信息,把系谱图看作要理解的对象。在另一篇重要的博土论文中,罗斯,奎利恩打算设计语义记忆结构,它可显示人类联想记忆的某些特征。言语学习模型:EPAM
在“逻辑理论家”的研究中借用心理学推进人工智能的东西要比借用人工智能推进心理学的东西要多。但是心理学中有很多是研究群体心智的。我们差不多从1956年起开始思考基本的知觉和记忆过程,部分是受几何学中所提出的那些知觉问题
281的激发,部分是因为对“逻辑理论家”的学习过程越来越感兴趣。此外,那时我正在试图学习希腊语,并对我如何学习进行内省。
我第一份概述可能处理言语学习的备忘录的日期是1956年2月18日。这份大纲用的名称EPAMINONDAS不自觉地泄露了它与我学习希腊文的相互影响。特别是,我发展了有关记忆冗余量的用途的思想,这反过来又推动了我们后来关于通过事后认识而学习的研究。这一阶段,阿伦和我对辨别网络和分类图式进行了大量讨论,它们反应在EPAM之中。
为了得到有关联想记忆的研究线索:我去查阅心理学期刊时,模拟经典的言语学习行为的想法出现了。埃利诺?吉布森论刺激—反应概括化的经典论文(
Gibson
I940)是爱德,费根鲍姆后来加人到EPAM之中的许多思想的重要来源。通用问题解决者
从1956年秋天开始,我们打算认真地把“逻辑理论家”解释为问题解决的心理学理论。我们已经知道,O.
K.莫尔和S.B,安德森已在耶鲁大学用逻辑中的问题(装扮成“解码”练习)来研究问题解决(Moore
and
Anderson
1954a
and
1954b)。他们选用的形式化体系非常接近于怀特海和罗素的体系,这提示我们去用他们的任务来比较人类的行为与“逻辑理论家”的行为。为此,研究生彼得,豪茨开始用录音带记录被试者在执行莫尔一安德森逻辑任务时的大声思维对话时间。
通过1957年春译成文字的第一盘录音带,我们清楚了“逻辑理论家”与口述报告所提示的人类行为细节并不完全相当。1957年夏天在卡内基校园召开的一次组织行为的研讨会上,我们对这个问题进行了讨论。在研讨会的这一星期,阿伦和我显然都单独地发现,在某一份大声思维口述报告中,可以清楚地看到手段—目的分析是被试者解题的主要工具。
手段—目的分析,是通过比较问题的目标与当前情况、并注意到它们之间的一个或几个差距而实现的。例如:我在这里想到5英里外的地方去。对当前情况与目标之间的差距的注意,提醒我想起一种动作可能会缩小或消除这种差距(骑自行车或步行)。采取这一行动后就会看到一种新的情况。这时如果目标仍未达到,就再重复上述整个过程。
从1957年夏天到秋天,我们逐渐集中研究一种能体现新发现的手段—目的分析的程序。因为程序中的推理过程与推理所要解决的特定题目无关,我们给它起名为“通用问题解决者”,该程序的总流程图在1957年10月底以前产生,而规划法(一种通过对问题进行概括处理而简化搜索的方案)在几天以后大致形成(
Newell,Shaw,and
Simon
1962)。随后的30年研究已证实了体现在“通用问题解决者”中的那种手段—目的分析是人类问题解决技能的关键成分真:)与心理学家交谈
我们第一次打算直接与心理学家交流的文章《人类问题解决理论原理》发表在1958年7月发行的《心理学评论》上(
Newell,Shaw,and
Simon
1958a).这篇建立在“逻辑理论家”经验基础上的文章在一年多以前就写成了。文章强调该程序和人类问题解决之间广泛的相似性而没有详细描述行为的比较。
论文中我们用“基本信息处理”的程序来描述行为。这种行为可以在计算机中执行。通过对计算机模拟和在大声思维口述报告中所显示的实际行为进行匹配而检验理论,在论文中,我们
283把这种思维的信息加工理论与神经学的联想主义解释和格式塔学派的解释作了比较。
与其说文章强调我们理论的新奇性,并正式宣布心理学中出现了新的“学派”,不如说我们想表明我们的处理方法是联想主义与格式塔学派前辈的工作的继续。因此这篇论文第一次明确而慎重地说明了信息处理心理学,但并没有用那个或其他商标。
“创造性思维过程”一文第一次公开描述“通用问题解决者”(包括规划法)。这篇文章在1958年5月14日科罗拉多大学的一次研讨会以及6月兰德公司的暑期讨论班上宣读过,直到1962年才发表(
返回书籍页