然而,历史上,最初的神经网络计算机的设计仍然受到了图林机概念的影响。在麦卡洛克和皮茨的著名文章《神经活动中思想内在性的逻辑演算》(1943)中,作者提出了一种被神经元作为阈值逻辑单元的复杂模型,单元中有激发和抑制突触,这里就运用了罗素、希尔伯特、卡纳普及其他人的数理逻辑概念以及图林机概念。一个麦卡洛克-皮茨神经元在时刻n+1发放一个沿其轴突的脉冲y,如果在时刻n它的输入x1,…,xm和权重WI,…,Wm的权重和超过了神经元的阈值O(图5.15a)。
麦卡洛克-皮茨神经元的特殊应用是如下的逻辑关联模型:或门(图5.15b)模拟了句子x1和x2的逻辑析取x1ORx2(形式上是x1Ⅴx2),它为假,仅当x1和x2是假句子,否则它是真的。真值是二元表示0(代表假)和1(代表真)。对于阈值Θ=1和权重W1=1和W2=1,或门以x1w1-x2w2≥Θ的方式发放,只要x1或x2或者x1和x2都是1。
与门(图5.15c)模拟了x1ANDx2的逻辑合取x1并x2(形式上是x1x2),它为真,仅当x1和x2是真句子,否则它是假的。对于阈值Θ=2和权重w1=1和w2=1,与门以x1w1+x2w2≥Θ的方式发放,仅仅当x1和x2都是1。
非门(图5.15d)模拟逻辑否定NOTx1(形式上是x1),它为真,仅当x1是假的,否则它是假的。对于阈值Θ=0和权重w1=-1,非门以x1w1≥Θ的方式发放,仅当x1为0。因此如果x1是1,那么非门并不发放,这意味着输出y=x1=0
一个麦卡洛克-皮茨神经网络是一个麦卡洛克-皮茨神经元系统:把每一神经元的输出分解成为线路而相互关联起来,其中一些输出还与其他神经元的输入相关联(图5.16)。尽管这种系统概念非常简单,但是任何“经典的”冯·诺意曼计算机都可以用这种神经元网络进行模拟。1954年,约翰·冯·诺意曼写了一篇报告稿。它以首次明确阐述存贮程序的思想而闻名,存贮程序与其要操作的数据都可驻留在计算机的记忆装置中。该历史文献表明,冯·诺意曼完全意识到用麦卡洛克-皮茨网络进行计算的可能性。
数学上,一台冯·诺意曼计算机可以设想为一台有限自动机,包括有限输入集X、有限输出集Y和状态的有限集Q。有限自动机的动力学用下一状态的函数&来定义,将时刻t的状态q和输入X变换为时刻t+1的状态&(q,X),以及将输出函数B与状态q关联成为输出B(q)。
一台冯·诺意曼计算机的组件,诸如输入-输出单元、存贮器、逻辑控制单元和算法单元,都容易表明是有限自动机。甚至一台现代的数值计算机,它是由数千元素集成在芯片上的网络,也可以理解为麦卡洛克-皮茨类型的神经网络。一般地说,每一寄存机、图林机或递归函数,都可以用适当的有限自动机网络来模拟。但是这些麦卡洛克-皮茨神经网络的应用仍然是在程序控制系列计算机的框架中工作。
最先试图将图林的通用计算机概念扩展到自繁殖自动机思想又是约翰冯诺意曼。他注意到,一台建造其他机器的机器,会降低被建造机的复杂性,因为它使用的材料不可能多于由建造机所给定的材料。与这种传统的机械观点相反,生物进化中的活的有机体看来至少是可以与其父代一样复杂,而在长期进化中会增加其复杂性(赫伯特·斯宾塞)。
冯·诺意曼的细胞自动机概念,把活的有机体设想为细胞的自繁殖网络从而首次提出了为其建立数学模型的线索。态空间是均一点阵,它被划分为相同的元胞如同棋盘。一台初等的元胞自动机是一个元胞,它可以具有不同的状态,例如可以有“占态”(用一个记号)、“空态”或“色态”。初等自动机的集合体,被叫做一台复合自动机或构型。每一自动机都以其环境即相邻元胞为标志。自动机的动力学是由同步变换规则确定的。冯·诺意曼证明,活系统的典型特征,它们的繁殖自身的趋势,都可以用(平面上的)200000个元胞的自动机来模拟,在此每一元胞有29种可能的状态,4个相邻角上的元胞则作为环境。
这种思想由约翰·康韦发展了,他的元胞自动机可以模拟活系统群体的生长、变化和死亡。下面是一个简单的例子,其中元胞有两种可能的状态“占态”(记号)或“空态”,使用同步规则:
1)生存规则:一个有2至3个占态相邻元胞的占态元胞保持不变化。
2)死亡规则:一个元胞丢失了它的记号,如果它有3个以上的邻居元胞(“群体过密”)或少于两个邻居(“孤立”)。
3)新生规则:如果一个空的元胞正好具有3个占态的相邻元胞,那么它就获得一个记号。
图5.17a示意了一种构型在第三代的“死亡”,图5.17b示意在第二代的“生存”。康韦的理论还有一些更令人吃惊的结果,它们是通过计算机实验发现的。
元胞自动机不仅仅是优美的计算机游戏。它们还是描述了其动力学演化的非线性偏微分方程复杂系统的离散化和量子化模型。让我们再想像一块类似棋盘的元胞的平面。一条有限的元胞串,构成了一台1维元胞机自动机,其中每一个元胞都可以取两种状态之一(“黑”(0)或“白”(1)),它仅仅与其两个最近相邻发生关联,在此它们交换关于其状态的信息。1维元胞自动机的紧随的(下一个)状态是空时平面紧随的元胞串,其中每一都由取得一种或两种状态的元胞构成,依赖于它们先前的(上一个)状态和它们的两个最近相邻。图5.18b-e表示4个元胞自动机在60步中的时间演化。因此,1维元胞自动机的动力学是由3个变量的布尔函数确定的,其中的每一个变量都可以取值0或1。
对于3个变量和两个值,3个近邻有2[3]=8种可能性。在图5.18a中,它们是按照相应的3个数字的二进制数排序的。对于3个近邻中的每一个,必定有一个规则确定中间元胞的随后状态。对于8个数字的序列和两种可能状态,有2[8]=256种可能的组合。这些可能的组合之一,确定了一个1维元胞自动机的动力学,这示意在图5.18a中。
每一规则,由8个数字的二进制数的状态来标志,这些状态是每一随后的元胞串可以采取的。这些二进制数可以按照它们的相应的十进制数来排序。
这些规则的时间演化标志了1维元胞自动机的动力学,从随机的初始条件出发产生出非常不同的元胞模式。计算机实验给出了演化的元胞模式所要采取的如下的吸引子类型。经过一些步骤以后,类型1的系统到达了与起始条件无关的平衡均匀态。这种平衡终态示意为完全的白平面,并相应于某种作为吸引子的不动点(图5.18b)。
类型2的系统,经过一些步骤后,表现出恒定的或周期的演化模式,它是相对独立于其起始条件的。模式的特定位置可能依赖于起始条件,但不是总体模式结构都取决于起始条件。
类型3的系统向混沌态作为终态吸引子演化,而没有任何的总体周期性。这些混沌模式敏感地取决于起始条件,并表现出具有分数维数的自相似行为(图5.18d)。类型4的系统产生高度复杂的结构,具有局域传播形式(图5.18e)。类型3和4的系统对于微小的涨落是敏感的,微小的涨落可以影响秩序的总体变化(“蝴蝶效应”)。因此,在这些情形中,演化过程不可能作出长期预测。
显然,这4种类型的元胞自动机模拟了自组织过程中大家熟悉的非线性复杂系统的吸引子行为。在前面的章节中,我们已经看见了许多物质、生命和精神-大脑进化的例子。在第6章中,我们将要考虑许多与人类社会进化的类似性。一般地,自组织被理解为复杂系统中的相变。宏观模式从微观元素的复杂非线性相互作用中出现。相变的不同终态相应于数学上不同的吸引子。
在图2.27a-e中,已经对于流体的不同吸引子进行了考察,流速是逐步加速的。这些流体模式,与相应的元胞自动机的演化模式有许多相似之处。在最初的水平上,流体到达了均匀的平衡态(“不动点”)。在较高速度时,可以观察到两个或多个顶点的分叉,相应于周期的和准周期的吸引子。最后,有序衰退为确定论混沌,它是复杂系统的分形吸引子。元胞自动机的类型3和类型4对于建立过程模型极为有趣。类型3提供了混沌系统的演化模式。类型4表现了耗散系统的演化模式,这样的系统有时具有拟有机形式,它们可以在有机体和群体的进化中观察到。
从方法论的观点看,一个一维的元胞自动机提供了一种离散的量子化相图模型,描述了依赖于一个空间变量的具有非线性偏微分演化方程的复杂系统的动力学行为。人们局限在离散模型的原因是多方面的。非线性系统的复杂性往往太大了,难以在合理的时间内计算出近似数值。在这种情形下,一个离散的模型对于系统的长期的总体动力学行为,可以提供大致的,但是充分的信息。如果进化规则的相关性被扩大到元胞串中的两个邻居以上,动力学行为就不同了。
二维的元胞自动机,在康韦的生命游戏中已经使用了,可以被解释为采取非线性演化的复杂系统的离散模型,依赖于两个空间变量。显然,当非线性系统的复杂性增加,以及由求解微分方程或甚至由计算数值近似来确定其行为变得越来越无望时,元胞自动机是非常灵活有效的建模工具。
从历史角度看,元胞自动机的现代发展可追溯到冯·诺意曼早期的自繁殖自动机思想。除了自繁殖以外,与传统的计算机相比较,还有另一个特征对于自然复杂系统是根本性的。人的大脑具有学习的可能性,例如,通过感知进行学习。在麦卡洛克-皮茨网络提供的大脑的一级逻辑模型中,人工神经元的功能对于所有时间都是不变的。麦卡洛克-皮茨成功地揭示出,这种类型的形式神经元网络可以计算任何有限的逻辑表示。
但是,为了使神经计算机能够执行复杂的任务,有必要去发现自组织机制,使神经网络能够进行学习。唐纳德·霍布1949年提出的第一个神经生理学习现则,在神经计算机的发展中具有重要意义。神经元突触的敏感性并非一成不变,而是在改变着自身,以有利于重复出过去已经反复出现过的发放模式。
1958年,罗森布洛特设计了第一台学习神经计算机,它以名字“感知机”而闻名。罗森布洛特原先是一位生理学家,专注于人的学习过程的生理学活动。他设计的学习机具有复杂的适应性行为,工程师和物理学家都很感兴趣。因此,用不着惊奇,生理学家的新颖思想被工程师抓住了,那些工程师对机器人和计算机技术,比对于模拟人脑中的过程,具有更大的兴趣。从技术的观点来看,神经计算机的学习程序是否与心-脑系统的学习过程类似不是根本性的。它们必须在管理复杂的适应行为时是有效的,但是可以利用完全不同于已知的生物进化中的方法。
罗森布洛特的神经计算机是一种馈向网络,采用二进制阈值单元,有3个层次。第一层是感知面,叫做“视网膜”,它由刺激细胞构成(S单元)。S单元与中间层相联接,其间的权重固定,在学习中不发生变化。中间层的元素叫做联想细胞(A单元)。每一A单元都有某些S单元的固定权重的输入。换言之,一些S单元将其输出投射到一个A单元上。一个S单元还可以将其输出投射到几个A单元上。中间层是完全与输出层相联接的,输出层的元素叫做反应细胞(R单元)。中间层与输出层之间的权重是变量,因此是能够学习的。
感知机被看作神经计算机,它可以将感知模式分成可能的若干组。在两组的情况下,每一R单元学习以激活和去活方式去区别输入模式。感知机的学习程序是受指导的。因此,必须清楚地认识与所要学习的模式相应的所希望的每一R单元的状态(激活或未被激活)。要学习的模式提供给了该网络,在中间层和输出层之间的权重按照学习规则进行适应。重复此程序,直至所有的模式产生出正确的输出。
学习程序是一种简单的算法:对输出层的每一元素i,实际上输出o,它是由一定模式产生出来的,与所希望的输出d;相比较。如果oi=di,那么该模式就已正确地分类。如果所希望的输出di等于1以及实际上的输出oi等于0,那么在时刻t的所有的权重wij(t)以及激活单元(oj>0)在随后的步骤t+1树放大,或形式上有wij(t+1)=Wij(t)+σoj。常数u是学习速率,它可以按照其大小增加或减少学习的速度。如果所希望的输出等于0,实际上输出等于1,那么所有具有激活元素的权重都会消失,或形式上有wij(t+1)=wij(t)-σoj。
感知机看来是以无所不能的神经网络开创了一个计算机技术的新时代。感知机小组在早期的文章中进行了如此的夸张。但是,1969年,尖锐的批评使得这种热情消失了。那一年,马尔文·闵斯基和西摩·帕佩特出版了一本著名的书《感知机》,书中以数学精确性讨论了感知机的局限性。对于这一分析的反应是,大多数研究小组都放弃了它们对于神经网络和复杂系统探究方式的兴趣,而转向经典的AI和计算机技术,看来这比感知机迷的“猜测”要更有益。
但是1969年以后的这种科学共同体的态度,当然是又一次反应过度了。无批判的热情和无批判的谴责,对于科学的进化都是不合适的做法。达尔文进化用了成千上万年,才使得我们的大脑具有了模式识别的能力。如果我们的工程师只用几年就成功地构造出来类似的神经计算机,那就是奇迹了。
关键是随后的一些问题。感知机能够干什么?不能干什么?感知机为何不能干?回答这些问题的一个基本步骤是闵斯基和帕佩特证明的所谓感知机收敛定理。它保证了原则上可用此种网络学习并可在有限的学习步骤中发现解。在这种意义上,系统收敛到一个解已经得到了证明。
但是由此引出的问题是,特定的解是否原则上可以用感知机进行学习。一般地说,我们必须确定适用于感知机的问题类型。一些简单的例子表明,感知机并非如最初热情中所相信的那样是通用的。例如,一台感知机是不可能区别偶数和奇数的。一个特例是所谓的奇偶性问题对于初等逻辑的如下应用。
感知机不能学习排除OR(缩写为XOR)。这种无法解决的认知任务是感知机应用于AI的一个严重局限。此原因容易说明。排除OR对于xXORy,仅当或x或y为真时为真,并非x和y都为真。一条OR语句的xORy,仅当x和y都为假时为假,否则为真。如下的表提供了布尔函数OR和XOR的值:
现在,设想一个网络,有两个输入单元x和y,以及一个输出单元z,它们可以采取状态1(激活)和0(末激活)。要模拟XOR,对于一个偶的输入(两个输入单元都是激活的或都是末激活的),输出应该为0,而对于一个奇的输入(一个单元是激活的,另一个是末激活的),输出应该为1。在图5.19a,b中OR和XOR的可能输入构型示意在一个坐标系中,其中输人x和y作为坐标。
坐标x和y的每一对(x,y)具有相应的值z,它是用白点(0)或黑点(1)来标记的。一个线性的阈值元素Θ计算加权输入x和y,权重是w1和w2,形式上即是Θ=w1x+w2y。一个简单的求导提供了一条直线,示意在图5.19a,b中。直线的位置是由权重w1和w2确定的。它将阈值元素的激活和末激活的状态隔离开来。
为了求解(“学习”)OR问题或XOR问题,权重w1和w2必须以这样的方式加以调整,使点(x,y)以及值z=1与具有0值的点隔离开。这种线性的隔离对于OR问题从几何上是可能的,但是对于XOR问题是不可能的。一般地说,感知机对于输入模式的分类,局限在线性隔离模式的范围。
这种结果能够容易地被推广到两个以上输入单元和真值。许多问题在线性不可隔离的意义上,类似于XOR。实际上大多数有趣的计算问题都具有这种特征。XOR问题可以由加上一个隐含单元到具有两个输入与输出相关联的网络中来解决。隐含的元素是与输入和输出都关联的(图5.19c)。
当两个输入都是0时,具有正值的隐含中间单元就关闭了。一个0信号到达输出,以及由于在这种情况下阈值为正,所以输出为零。如果两个输入中只有一个为1,隐含单元保持关闭,输出单元由输入和输出之间的直接关联而接通。最后,当两个输入都是1,隐含的单元发放到1,并以负的权重-2抑制了输出的接通。
因此,隐含单元允许某种适当的内部表示。XOR问题已经成为一个在三维坐标体系中用二维平面进行线性分隔的问题,3维坐标系以输出单元的3个输入为坐标。分割是可能的,因为输入(1,1),现在z平面上移动到了点(1,1,1)(图5.19d)。
一台感知机只有一个中间层,它是可以学习的处理元素。对于多层网络,问题是,对于与外界没有关联的多层神经元,产生的错误是不可能直接察觉的。一个错误可以是直接在输出层和其下的中间层之间产生的。
多层神经网络可能具有的表示能力和问题求解能力,取决于学习层的数目和在这些层中的单元数目。因此,对于神经计算机的一个至关重要的问题就是要研究计算的复杂性,因为神经网络的复杂性的增加是从感知机的局限性中走出来的方式。
在4.2节中,我们已经讨论了在多层神经网络中的后向传播(图4.17)。一个后向传播的学习算法使得我们去定义甚至处于隐含层上的一个错误的信号。输出层上的错误是递归地向后传播给下面的层次的。该算法是能够构造具有许多隐含层的网络的,其神经元能够进行学习。比起单层网络来,多层网络在其隐含的层次中可以表示多得多的信息,所以后向传播网络对于克服感知机的弱点是非常有用的模型。
但是,后向传播仅仅从技术上提供了成功的模型,这些模型一般并不与生物进化相类似。它们的权重调整看来很不同于人们所知道的生物突触的行为。计算机技术的目的并不在于模拟大脑,而是在合理的时间内实现的问题有效求解。另一方面,我们必须要放弃孩童式的幻想,认为自然是类似上帝的工程师,进化中他总是在发现最好的解。正如我们在前面的章节已经强调的,自然中没有集中化的控制和编程单元。常常只有局部的解。它们一般并非是“最优”的。
1988年,戈尔曼和西杰诺夫斯基设计了一种馈向网络,并用误差后向传播方法对其进行训练,试图将其用于区别岩石与矿石的声纳系统。要区别出岩石与矿石的回声是相当困难的,甚至用受过训练的人耳也难以胜任,而这对于海底的工程是相当重要的,海底工程需要能区别爆炸矿石和岩石的声纳系统。用于这种目的的网络构造中,输入层有60个单元,隐含层有1-24个单元以及两个输出单元,每一个代表将要进行区别的原型“矿石”或“岩石”(图5.20)。
最初,一定的声纳回声是用频率分析器来处理的,它分解成60个不同的频率带。每一复盖间隔的值域在0和1之间。这些60个值是一个输入矢量的组分,输入矢量给予相应的输入单元。它们由隐含的单元进行变换,导致了两个输出单元之一的激活,这里的值也在0和1之间。因此在一个经过训练的很好调节了权重的网络中,一种矿石的回声导致输出信号(1,0),而岩石的回声则具有输出信号(0,1)。
为了训练此网络,我们必须向它输入矿石和岩石回声的样品。在每一种情况下,输出单元的实际值,都按照相应的输入,进行了测量并与预期值进行比较。其差异是错误信号,引发单元中的权重发生小的变化。用这种梯度下降的程序,网络的权重就缓慢地进行了调整。
戈尔曼和西杰诺夫斯基的矿石-岩石网络是复杂系统对于AI的一种应用。当然,它并没有声称,此系统在模拟人的大脑来区分像“矿石”和“岩石”这样两个概念。但是,我们可以说,这种技术系统也具有某种内部表示,即表示了作为其隐含层中原型矢量的两个概念。在这种限制的意义上,人工系统是有“智能”的,因为它可以完成在人脑情况下用智能来进行评价的任务。人工网络并不局限于对概念进行二元区分。1986年,西杰诺夫斯基和罗森伯格设计了一种叫做NETalk的网络,它已经学会了如何阅读。它采取从英语教科书中形成的字符串,并将它们转化成音素串以输入到语音合成器中。惊人的事实并不是它像小孩似的口吃的声音,在通俗书中它已经被赞为辉煌的成功。NETalk的基本能力是对于若干拼音概念的内部表示。对于字母表中的每一字母,至少有一个音素指定给它。对于许多字母,其中有若干音素需要标记,这取决于词汇的上下文。
西杰诺夫斯基和罗森伯格运用了3层馈向网络。它有一个输入层,一个中间隐含层和一个输出层。尽管后向传播与生物学大脑中“自然地”实现颇为不同,但与其他的解相比,它都表现为最快的学习程序。输入层注视课文的七字符窗口,例如,图5.21a中的短语“The-phone-is-”中的词“phone”。每一个七字符都被29个神经元相继地进行了分析,每一神经元代表了字母表中的一个字母,也包括括号和标点。因此,正好是每一具有29个元素的神经子系统的一个神经元被激活。
输出层包括26个神经元,每一个神经元表示一个拼音组分。对于拼音的位置有6个组分,对于发音有8个组分,对于音高有3个组分,对于标点法有4个组分,对于重读和音节划分有5个组分。于是,从这4组组分中,每一声音都有4种特征。输出层有7×29=203个神经元,与80个隐含层内部神经元联结起来,它又是与输出层的26个神经元相互联结的(图5.21b)。在这些层中的神经元是不联结的。输入和输出层的神经元也是不直接联结的。
隐含层的神经元接收来自203个输入神经元的信号,但是只把26个信号送给输出层。由于内部神经元是阈值单元,具有阈值T1,…,T8,输出是乘以特定权重的,这些积的和的大小决定了此神经元是否激活(图5.21c)。现实中,激活的发生是按照一个连续的“sigmoid曲线”,并非某种数字跃迁。
最初,权重是随机固定的。因此,NETalk始于无意义的结结巴巴的发音。在学习阶段,NETalk运用了特殊的供小孩阅读的课文,其发单是人人皆知的。随机的声音与所希望的声音进行比较,权重由后向传播进行校正。令人瞩目的是,这种程序是一种自组织,而不是一种基于规则的发育程序。对于由实际输出来近似所希望的输出造成的权重改变,仅仅存在一种总体上的要求。对这种课文运行10遍以后,网络已经能够有理解地进行发音。经过50遍以后,就只有5%的错误了。在这一阶段,对于未知的供小孩阅读的课文的发音,错误也只有22%。
今天,像NETalk这样的网络还必须用传统的冯·诺意曼计算机来模拟,因为还没有直接的复杂网络的硬件。因此,每一神经元必须顺序进行计算。甚至在今天,自组织复杂网络的原理还主要是在软件上实现的,而不是在硬件上实现的。然而,我们将谈论“神经计算机”,因为硬件的实现只是一个未来的技术发展问题,有赖于诸如固体材料或光学程序这样的新技术,而不是原则性的理论局限问题。
由神经网络进行的映射,看来是颇为成功的,用于财政、保险和股票交易预见中是有益的。原因在于,对于股票行情的短期预测以混沌时间系列为基础,如果预测的时间周期减少,那么它就变得越来越混沌。
通常的统计程序仅仅在长期预测中才是成功的,它假定了股票的发展可以平稳进行,而又不丢失有关信息。好的统计程序的精确性在60%-75%之间。但是,短期的预测则是颇为有限的。传统的统计程序为了平稳股市的发展,必须要忽略短期预测的基本特性,即经常发生着的小的交换涨落。通常的统计程序中,相关计算因子必须明确给出。一个经过良好训练并适当设计的神经网络能够识别出关联因子,而毋需明确的编程。它能够以自组织的程序权衡输入数据并减少预测的错误。而且,它可以采取改变系统环境的条件,而不像计算机程序必须由编程者明确改变。为了设计一个用于股票预测的神经网络,必须对股市数据进行二进制编码使之作为输入数据。输入矢量的构成中,包括若干分矢量,它们代表着交换量,从昨天来的绝对变化,变化方向,从前天来的变化方向,以及与昨天相比的大于1%的相关量。如果输入矢量具有固定的长度,例如40个单元,那么分矢量的长度可以有些不同,依赖于它们所希望的相关。该系统可以有两个输出单元。左边单元的激活标志了股票值的减少,而右边单元的激活则标志了增加。
在学习阶段,网络中输入的是一定时期实际上的每天的交换率,例如从1989年2月9日至1989年4月18日。以这种学习数据为基础,该网络对于后面19天的发展进行预测。预测结果与实际上的曲线进行比较,以测量该系统的精确性。已经用后向传播方法对于几个多层结构进行了考察。它们以自组织方式发展起来对于预测特定的总体启发性。例如,如果一次预测接近该日期以后某天的实际值,那么错误就是相对小的。这种拇指规则的启发方式,在于这一事实:行情趋势的变化比起它保持不变来是更为不可能的。图5.22a,b示意了,预测曲线(+)和对于银行(Commerzbank)、公司(Mercedes)的实际股票行情曲线(-)。
显然,后向传播的馈向网络在技术上非常有趣,尽管它们看来与生物大脑中的信息处理没有多少相似性。在4.2节中,我们已经分析了具有反馈(图4.8b)和霍布类型学习(图4.9a)的霍普菲尔德系统,它显得也是生物大脑的工作方式。在均匀的布尔神经元网络的情形,神经元的两种状态可以与处于外磁场中的电子自旋的两个可能值联系起来。一个霍普菲尔德模型是一个动力学系统,与金属退火过程类比,将它看作是一种能量函数。由于它是非增的单调函数,系统进入局部能量极小值,相应于局部的稳定稳恒态(不动吸引子)。
因此,霍普菲尔德系统的动力学演化可以相应于精神认识。例如,一个代表字母“A”的始态噪声图像向代表正确图像的终态演化,它用若干个例子来对系统进行了训练(图4.9b)。物理解释使用了平衡热力学的相变。正确的模式与不动点或平衡终态相联系。一个更灵活的推广是波耳兹曼机,它具有非确定论处理器元的随机网络构造,以及分布的知识表示,数学上相应于一个能量函数(图4.11b)。
关于弛豫的一般思想是,一个网络收敛到以局域相互作用为基础的或多或少总体平衡状态。通过反复地修订局部的联接(例如在霍普菲尔德系统通过霍布学习策略),网络作为一个整体终于弛豫地进入了稳定的、优化的状态。我们可以说,局域相互作用导致了协同寻求,它不是受指导的,而是自组织的。一些网络对于精神类型的活动运用了协同寻求策略,例如,对于寻找可能的假设。设想竞争假说的一定范围由神经单元来表示,它们可以激活或抑制自己。于是该系统就离开了不太可能的假设,而奔向更可能的假设。
1986年,麦卡洛克和拉梅尔哈德把这种认知解释运用于模拟两可图的识别。两可图是在格式塔心理学中为人们所熟知的问题。图5.23a示意了一个协同寻求的网络,模拟识别尼克尔立方体两种可能的取向之一。每一单元就是一种涉及尼克尔立方体的一个顶点的假设。缩写是B(黑)、F(前)、L(左)、R(右)。U(上)、L(下)。假设网络由两个联接的子网络构成,每一子网络相应于两种可能解释之一。
不相容假设是负的联接,一致性假设是正的联接。权重的分配使得2个负的输入与3个正的输入格均衡。每一单元都具有3个正的相邻联接和2个竞争的负的联接。每一单元都接受来自激发的一个正的输入。要寻求的假设子网络是最适合于输入的网络。微小的涨落(观察者特定视野的某个小的细节)可以决定哪一种长期的取向被观察到。
为使网络的动力学形象地表示出来,假定所有的单元都是关闭的。然后,一个单元接收了一个随机的正值输入。网络将向一个子网络的所有单元都被激活而所有其他网络的单元都被关闭的状态变化。在认知解释中,我们可以说,此系统已经弛豫地进入了尼克尔立方体两可图左面和右面的两种解释之一。
图5.23b示意了3种不同的演化模式,它们敏感地依赖于不同的起初条件。环路的大小表明每一单元的激活程度。在第3种变化中,达到的是一种决非处在平衡态中的未确定的终态。显然,这种网络的构造原理是协同计算、分布表示和弛豫程序,这是人们在复杂系统动力学中所熟知的。
过去已经提出来许多人工神经网络的设计。它们是受到不同的原理如物理学、化学、生物学、生理学的启发,有时只是出于技术的目的。复杂系统探究方式的共同原理是什么?在前面的章节中,协同学引进了作为处理非线性作用复杂系统的跨学科方法论。对于推动从许多科学学科中确立的共同原理来建立特殊复杂系统的模型,协同学看来是一种成功的自上而下的策略。其主要思想是:复杂系统整体状态的形成可以解释为,处于远离热平衡的学习策略中系统元素的(宏观的)相互作用的演化。整体的有序状态解释为相变的吸引子(不动点、周期、准周期或混沌)。
例如,模式识别被解释为类似于应用在物理学、化学和生物学中的演化方程的相变。我们获得了一种跨学科的研究纲领,它使我们把神经计算的自组织解释为由共同原理支配的物理的、化学的和神经生物学的演化的自然结果。正如在模式形成的情形下,一种特定的识别模式(一张原型的脸)用序参量描述为一组所属特征的集合。
一旦其中属于该序参量的部分特征给定了(例如一张脸的一部分),序参量将完成所有的其他特征,所以整个系统是作为联想记忆发生作用的(例如给出脸的一部分使脸面根据贮存的原型脸重建出来)。按照哈肯的役使原理,识别出来的模式的特征相应于模式生成期间受役使的子系统(图5.24)。
如果将作为原型学习的一小部分脸部提供给一台协同计算机,那么它就能够用编码了的姓名来完成整张脸(图5.24b)。不同程度的模糊图像序列相应于协同计算机中状态的相变。
当一个不完整的模式提供给神经元,在不同神经元状态——每一状态都相应于一个特定的原型模式——之间的竞争就开始了。这种竞争中取胜的是相应于原型模式的神经元系统的整体状态,它对所提供检验的模式有最大的相似性。与对于模式形成有效的动力学完全相似,当一个检验的模式提供给协同计算机时,它将把检验的模式从起始状态(t=0)拉向一个特定的终态,相应于原型模式之一。
检验模式的演化,可以用势场中具有一定位置矢量的粒子的阻尼运动来说明。图5.24c示意了一个这种二维势场的例子。这两个原型相应于两个低谷。如果提供了一个模式,它的特征不可能精确地表明与原型的特征一致,那么该粒子的位置就处于势场的低谷之外。显然,识别是一种对称破缺,这已在图4.20a中的一维例子中进行了说明。
在协同学系统中,势场地形的形状可以由调整序参量来改变。由于协同学系统是开放的,控制参量可以代表能量、物质、信息或其他来自系统环境刺激的输入。当控制参量低于某个临界值,地形可以具有一个稳定的位置如图4.20a中的用虚线标出的一个低谷。在涨落引起的每一激发以后,序参量弛豫地向其静止态演化。当控制参量超过了一定的临界值时,先前稳定的状态就变得不稳定了而被图4.20a中两个低谷的两个稳定状态所取代。
协同计算机的学习程序相应于势场地形的构造。势强度用地形形状表示,示意神经联接的突触力。协同学探究方式的一个优点在于,标志着一个模式的数量巨大的微观细节是用一个宏观序参量来确定的。因此,协同计算机运用了典型的复杂性约化方法,这种方法已经应用在自然进化的协同学模型中(对照3.3节)。
序参量方程允许一种新的(非霍布的)学习,即一种最小化突触数量的策略。与旋晶类型的神经计算机(例如霍普菲尔德系统)相比较,神经元不是阈值元素,而是实施简单的乘法和加法。但是,旋晶类型的神经计算机与协同学计算机的基本区别在于:旋晶类型的复杂系统是物理学上的封闭系统。因此,它们的模式生成是由保守自组织推动的,没有任何的能量、物质或信息从外部输入。由保守自组织形成的典型模式是冬天窗户上的“死的”冰花,它们是在低能低温的平衡态冻结起来的。保守自组织的相变可以完全用波耳兹曼的平衡热力学原理来解释。
在3.3节中,我们已经解释了活系统的模式生成。它只有在远离热平衡时输入能量、物质或信息,才是可能的。这种自组织叫做“耗散”自组织(普里戈金)或“协同”自组织。然而,它们甚至也是可以在物理学、化学进化中发现的。因此,作为活系统的人脑敏感地依赖于来自外部世界的涨落,它将为协同学框架中的新计算机技术提供“蓝图”或模型。自旋玻璃类型的神经计算机对于特定的技术目的可以是实用的、成功的。但是,由于它们是物理上封闭的系统,在原则上不同于如人脑这样的活系统中发生的东西。
协同计算机的模式识别过程自发地产生出对于平移、旋转和标度的不变性。这些识别特征相应于现实的情形。例如,脸部并非总是如同学习阶段给出的那样,而是它们可以平移、旋转、缩小和放大、靠近和置远。协同计算机的一个出色的应用,是振荡的识别(例如两可图)和感知滞后现象。图5.25a示意了一个人们熟悉的滞后现象的例子。当人们的注视力开始从图的左边移向右边,一张男人的脸将在大约6幅模式以后变成一个女孩脸。当人们从相反的方向来进行,从感知到女孩变到一张男人的脸只有在接近左端时才发生。
图5.25b示意了协同计算机在特征序参量的时间演化中的感知过程。间断线指的是解释“女孩”,实线指的是感知“脸部”。第一幅图示意了,从男人脸的感知向女孩的感知的转移,第二幅图示意了从女孩的感知向男人脸的感知的转移。
也许可以提出反对意见,认为至今协同计算机仍然必须用传统的串行计算机来模拟。协同计算机的原理仅仅是在软件领域中实现了,而不是在机器的硬件中得到了实现。但是协同学及其跨学科应用将导致它的材料和技术上的实现。如同激光是一个为人们所熟悉的协同学模型(对照2.4节),它可能在协同学原理的光学计算机的构造中起着根本性作用。在激光中,不同的模出现依赖于激光阈值的临界值。它们可以由它们的光子数来标志。在微观水平上,光子数目的变化率是用非线性演化方程来描述的,依赖于模的获得、丢失和饱和。在宏观水平上,序参量相应于标志若干种光波迹的场幅度(图2.28a,b)。
这是主张一种3层的构造,数据的输入层可以用全息图映射到激光上。激光及其序参量是中间层。它利用它的模,通过自组织起着决策装置的作用。在役使原理意义上的生存的模,激发起新的特征集合。这种水平被设想为输出层。协同计算机的激光构造当然必须得到实验的证实和改进。一台协同计算机将是一种真正的远离热平衡的耗散系统。
显然,复杂动力学系统对于模拟认知行为和技术系统也很有用。人脑可以作为非线性复杂系统来建模,其动力学可以受到不动点、周期或准周期吸引子,甚至是混沌吸引子的支配。例如,实验上已经证明,混沌是一种有效的大脑再置的机制。在对兔子的嗅觉球进行了研究以后,人们对于种种气味的识别已经用神经网络趋向环状渐进状态的滞后现象进行了建模。混沌态在发散、消除先前的气味记忆时就出现了。在发散期间,特定气味作为输入推动了系统趋向相应于该气味的极限环。
混沌态的技术应用是颇为有趣的,因为混沌系统能够产生信息。人们熟知的是,混沌系统敏感地依赖于其起始条件。因此,在动力学演化过程中,两条轨迹可以在一定时间惊人地分开,甚至它们的起始条件仅仅有微小差别时也是如此。由于任何观测都只能以有限精度来实现,因此就可能存在着两种不同的状态,其间的距离要小于我们的分辨能力。在初始状态,观测者看它们是相等的。但是,经过一段时间以后,一个混沌系统就使得在初始看来等同的状态之间的差异表现出来。
实际上,人们已在若干工业领域中对神经计算机的技术应用进行了探索。例子有机器人学、航空学和宇航学(敏感和适应系统,空中导航等等)、医学(医疗数据、治疗和诊断等等的评价和控制)、工业生产(质量控制、产品优化等等)、安全技术、国防、通信技术、银行、邮政等等。技术中的复杂系统探究方式不应该被看作是对于经典AI的竞争甚或对立。在目前的技术发展状态,神经网络和经典的AI系统如专家系统看来是很有用的,并适用于不同的应用领域。对于信号、图像、语音、语音合成、机器人中感觉运动协调等等的分析和识别,复杂系统显得比经典的AI系统更为合适。显然,这些神经网络的例子并非是单个的计算机或机器人,而是指不同程度的复杂功能,它们集成在多任务的复合系统中。从拟人的观点看,由神经网络实际上管理的这些问题,可以划入“低级水平”的问题。
在本章中,以AI类型专家系统为基础的推理模型已经失败了,因为它们精确的串行的程序行为是不容出错、没有灵活性的。与专家系统和知识工程相反,自组织的复杂过程不可能由明确形式化的专家知识来进行控制。另一方面,具有推理算法的以规则为基础的系统,在所有的具有逻辑结构的问题上都是成功的。例如,与感觉运动的协调相对照,逻辑编程显得是一种“高级水平”的知识。然而,低级水平的非线性动力学系统的问题却可以具有极其高度的复杂性。当然,非线性复杂系统并不局限于低级水平的知识,正如我们在前面的章节中已经看到的那样。复杂系统的原理看来是颇为适合于为高级功能建模,例如为概念、思维、自参照状态等等人脑的功能建模。但是,神经网络的技术仍然处于初期阶段。
在当今和未来的技术中,具有多模的基于规则和复杂动力学系统的多相系统对于专门用途的研究是有意义的。一个语音理解系统的构成中,可以包含实施语音识别的神经网络和可以进行句法和语法分析的基于规则的符号模式。混成系统集成了推理和动力学技术,可能对于若干种医学目的是很有用的。例如,设想一个系统,它可以用神经网络来识别和控制医学参量,并结合了与以规则为基础的演绎系统,此种演绎系统可以从识别出的数据中对于特殊的疾病进行诊断。如同大自然中的情形,一个工程师不应该教条地局限在某个“最优”策略上,而是要有目的地发现解答,最终把若干个解集成起来,但不必是最优解的集成。
5.4神经仿生学和电子空间
我们所有实现神经和协同计算机的技术努力,其目的是什么?复杂系统探究方式将使我们能够在科学、技术、工业、经济以及甚至在文化生活中,创建一种新的计算机辅助方法论。但是我们决不要忘记,必须对技术发展的方向及其伦理学目标作出决定。今天,目标是多种多样的,包括认识论的兴趣和科学的兴趣,还有技术、经济、文化以及最后——但不是最少——还包括军事上的应用。毫无疑问,医学研究和应用必定在所有这些研究目标等级中处于较高等级上。这里要提醒持有老观念的读者,医学的目的不仅仅在于从事科学的认知和研究,而且还在于运用。运用也不仅仅是工程意义上知识的技术应用,而且也是为了医治、帮助和康复。知识和研究不过是实现医学的这种基本目的的工具,自从希波克拉底时代以来医学的基本目的就是保护生命。
人的中心器官是大脑。因此,医学上保持大脑健康的任务这种重大责任就落在了神经医生身上。他们必须将其医学治疗看作是针对整个心-脑实体。为了对人的心-脑实体提供最仔细的可能医学治疗,需要一个应用性研究来致力于拓展和提高诊断和治疗能力,包括可能的神经手术、手术计划、手术技术和术后恢复。正如我们已认识到的,人的心-脑实体是进化中最复杂的系统。包括计算神经科学、物理学、工程学、分子生物学、医学和认识论的跨学科研究纲领,对于处理这种复杂系统是必要的。这也就是为什么,一些科学家已经开始了对大脑和精神的跨学科研究纲领,包括伦理学和人类学方面。我们将其称为“神经仿生学”。
一般地,“仿生学”意味着用技术的和人工的程序和系统模拟自然功能和过程。众所周知的例子是,飞机和潜水艇的设计模仿了鸟类和鱼类身体的空气动力学。历史上,仿生学是人类的一种古老的梦想,即试图以用技术手段去模拟自然原理,从而解决复杂的生命问题。在这种传统中,神经仿生学意味着,阐明普通的技术-生物学如何去加强自然神经元的发生学和功能性质以及发展起神经修复术,制备出以硅片和(或者)有机材料为基础的类似于大脑的计算机系统。这并非一幅令人毛骨悚然的弗兰克斯坦的妖怪图景。为了推动人们投身于这些研究目标,只需要让人们看一看患有大脑肿瘤或受意外伤害的病人的凄凉情景就可以了。
神经外科是关注中枢神经系统和人脑的专门医学学科。由于大脑是人的人格和智能的生物媒体,神经外科医生不仅仅要弄清有关大脑的神经学的原理,而且还要获取人的精神及其功能的知识。神经外科已经在病人治疗上取得了进步。通过引入诊断影视程序如计算机化和核磁共振断层照相术,手术中运用微手术程序,在这方面取得了显著的成功。
不过,关于脑疾病人治疗的根本性问题仍然没有解决。例如,成人的中枢神经系统中,从功能角度看,仅仅可以换掉非常有限的受损区组织。这是由于与身体中的其他细胞截然不同,神经细胞在胚胎阶段完成以后不可能进一步分裂。只有胚胎的组织才有这样的潜能,可以使自己适合于周围的宿主组织。所以,疾病或事故引起神经细胞组的损坏往往导致永久性功能障碍。在这个应用领域,人工复杂系统及其自组织原理将受到高度关注。
医学史上曾有过用自体移植物来恢复受损的周围神经的尝试。这种方法是以这样的事实为基础的:甚至成人也有能力再生神经细胞的伸展,这种伸展从脊髓索状组织伸向末梢区域直到目标器官。因此,部分功能上不重要的敏感神经被从身体中的适当地点移走,并插入想要恢复的被打断的神经区域。然而,被打断神经纤维的再生至今还没有得到完全的理解。因此,控制移植物的生长是不可能的,移植物中包括了数百的单个神经细胞伸展——它们应到达目标器官。由于中枢神经细胞是不可能再生的,对于非常接近脊髓索状组织的中心受损,移植也是无效的。
对于周围神经移植的一个改进是在分子生物学的领域中提出来的。对于神经细胞及它们联接的细胞如星状细胞和施旺细胞的生理学和生物化学的理解,可能导致新的神经移植方法。一种中枢神经系统中组织替代的高级方法是身体中自己的细胞移植,这样的细胞在移植前已是遗传上选择过并适应了的。神经生长因子的效应、在移植源和受体大脑的目标区域之间的关系,以及许多其他分子生物学的问题都必须加以调查研究。这些方法是以遗传工程的知识为基础的。
另一个周围神经移植的可能的方法,是运用人工的而不是生物的移植体。用人工替代物来恢复神经系统的受损部分,这在医学和神经病学中都已经进行了尝试。
人工移植体配有学习算法作为自然的“蓝本”。与MCP(麦卡洛克和皮茨)网络不同,它们是工作在真实时间中的BPN(生物脉冲处理)网络。图5.26示意了这种神经-技术植入体的一般图式:学习神经网络编码感觉和运动控制信号,使之成为许多平行脉冲序列,它们被一组植人的微接触体接受,以刺激未受损的神经(图5.26a)。由神经寄存的信号,被神经网络解码,用来控制运动修补体(图5.26b)。
人们对于脊髓索状组织受损的病人,也尝试了借助于BPN系统的电刺激来增进其站立和行走功能。假定末梢组织器是未受损的,末梢神经的电刺激引起了肌肉的收缩。这是由适应性学习网络的平行脉冲引起的,学习网络对病人的感觉系统的听觉命令进行编码(图5.26a)。这个系统具有学习能力,因为它通过把感觉反馈到运动的腿上,以适应特定的病人条件。但是,此系统仍然依赖于病人的意识和说话。在下一步的研究中,脑的无意识的意向性必须由脊髓索状组织中寄存的信号进行解码。然后这些信号可以被例如无线电波送往具有适应性神经编码器的接受器中,再引起如图5.26a所示的肌肉收缩。
有一项雄心勃勃的神经技术项目,它针对的是一定类型的盲人。视网膜色点炎病人的视网膜层受到一定损坏,而视网膜是负责感觉轮廓、表面、颜色和其他的视觉特征的。受损的视网膜层由神经修补术沟通。在所谓的视网植人体的构造中,观景由镜框中的光子接受器(例如半导体)寄存,其中装备了某种适应性的神经网络。外部世界的光信号由神经网络(BPN)处理,神经网络能够学习像人眼一样为接受域建立模型。它们的信号被编码,并测距地输给诱导接受器,在此受损视网膜上排列有电极,以刺激光神经和中枢神经系统(CNS)。在更先进的研究阶段,将不再需要视镜排列,具有适应性神经网络的接受单元可以直接地植人眼中。在最初的试验中,神经技术不可能完全地取代种种视觉功能;然而,所存贮的轮廓和表面的感知,将有助于病人把握方向,这就是目前努力的目标。
如果不同肌肉组的刺激可以直接在修复神经的末端分枝处进行,而不用无机金属电极,那么就可以获得决定性进展。这就必须要使用分子装置来实现生物技术的传导性,即要使用从有机分子设计制造出的电子元件。过程控制器控制着电极并处理信息,它必须以人工神经网络为基础,才能够实现高速数据处理,满足人的行走和站立的要求。显然,这些复杂神经网络的发展需要分子生物学、计算神经科学和高技术硬件工程的跨学科合作。
人工替代受损神经功能的例子还有内耳的耳蜗移植。如果听觉神经是未受损的,通过微手术置入一个有25个极的电极作为皮质器官的代替物。听觉神经现在由适当的电极脉冲来激发,它们模拟了声音模式。脉冲是由串行的以语言知识进行了编码的微处理器来控制的。但是,在进行困难的移去听觉神经的赘生物手术中,有听觉神经受损坏的危险,结果会造成病人变聋。今天有可能把人工神经网络直接联接在中心听觉通道的区域。于是听觉可以得到恢复而不论听觉神经丢失与否。生物技术、计算神经科学和工程技术的跨学科合作再一次表明是必要的。
一般来说,神经外科手术必须要考虑到如下的临床观点:神经外科的诊断、手术计划、手术技术和神经的康复,这些是受生物技术和计算神经科学中的复杂系统探究方式支持的。在诊断方面,计算机化的断层显示过程已经开创了一个新时代。由于神经外科医生不得不处理一种进化中的最复杂的器官,手术计划和进行模拟已成为准备取得成功医治的一个基本步骤。在这一方面,复杂性意味着病人的人格特征,涉及他或她的特定病史,一定致病过程的病理,个体的解剖特征以及一个手术的可能手术后果。
一种新的方法已经用于实践。一个神经外科手术可以用CAD(计算机辅助设计)辅助技术来进行模拟。用计算机产生出一个病理解剖的三维构造,它是由一个特殊的程序来控制的。在模拟中可以发现潜在的困难,从而在实际的手术中得以避免。手术技术的不断发展将减少实际的大型开放手术。立体视镜和内窥镜技术对于减少手术引起的损伤是重要的方法。激光技术与神经外科内窥镜、术内显示过程、计算机控制的调节技术结合的进一步发展,将成为一种有广泛应用的复杂手术工具。
在波士顿的麻省普通医院的一个研究小组,已经用磁共振成像技术(MRI)揭示了人的任务激活的功能成像图,这种任务激活是在视皮层中由光刺激引起的。按时间周期地注入对比剂。采用快速NRI扫描而不用注射,甚至初级的视觉皮层成像也实现了。图5.27显示了作为神经网络的脑认知活动的真实的时间成像。这些高级的基于计算机的复杂神经网络的图像,不仅仅有助于受损的病人,而且最终使我们看见自己的思维和情感。
发展人工神经网络的最重要动力来自这样的事实:以化学元素硅为基础的高度集成电路的生产,将达到它的物理极限。这种技术以程序控制的微处理器原理为基础,不可能进一步微型化。自组织的高度平行计算和策略对于处理大脑的复杂性是必要的。因此,运用某种新的底物来作为信息处理系统的基础,就显得必要了。在此迈出的第一步是开始发展以生物元件为基础的分子电子器件。在神经细胞之间的电信号可能通过有机传导物进行传导。
关于计算神经科学,神经网络的计算机模拟可以有助于鉴明由中枢神经系统和大脑实际运用的算法。现在研究的人工神经网络模型,主要是用矢量计算机、工作站、特殊的合作处理器或移植芯片(transputer arrays)来进行模拟研究。但是,当然,复杂网络中的空间-时间平行计算的优点,在用经典计算机来进行模拟时已是全部地或部分地丢失了。只有用特殊设计的神经硬件,才能满足实时任务的要求。
在未来的神经仿生学应用中,神经芯片的训练将引起巨大复杂性的非线性作用动力学,这样的芯片可用作人的神经纤维之间的界面。芯片的设计者面临着相互联结的问题:如果成千上万的权重线路要以物理方式联接起来成一个神经元,并要作出数千个神经元,那么这个线路区域将达到这样的数量级,即线路引起的时间延迟将超过代表神经元功能块的运行时间。由于技术结构尺寸的减少受到经济上和物理上的限制,仿生学的设计者现在对相互联结问题倾向于一种构造解。首先,他们要考察神经网络的真实处理时间;其次,要考虑在何种程度上有可能偏离理想的大规模平行计算。
显然,平行计算硬件将显著增加软件的复杂性,并需要新的方法。强大的操作系统。编程工具和灵活的使用者界面都必须这样设计,使得容易与系统进行界面通信。这种任务,在由计算机科学知识程度不一的人员组成的跨学科队伍中将变得特别重要;以知识为基础的专家系统可以有助于研究小组成员,使之与仿生软件一起工作,并将它们集成进研究小组中。编程神经网络硬件将完全不同于经典的冯·诸葛曼计算机的编程。一位编程者必须要鉴明必要的网络拓扑和构造,还必须说明具有相互联结图式的神经元的行为。因此,运用多相的、混成的系统——集成神经网络系统和经典的以知识为基础的系统(在5.2节中已描述),成为神经仿生学中的现实观点。
有些人可能担心,混成的计算机系统及其复杂性的增长不经过高度的专门训练,是不可能把握的。现在的计算机系统和使用者之间的界面必须加以发展。计算机生成图像的操作,应该在“虚拟现实”中直接由语音、视觉和触觉来进行。使用者将获得这样的印象,即通过若干种与其感官相连的技术设备来获得计算机产生的现实的印象。
视觉印象是由操作者及位置感知器——它可以作为眼睛罩戴上——产生的。一个小话筒与语音识别系统联系起来,把人的命令翻译给系统。所谓的“数据手套”把手和手指的运动变换成电信号,产生出触觉并进行建模(图5.28)。
在数据手套中,在两层布之间埋设了光学纤维。它们以特定的模式把光信号变换成电信号。例如,这一技术在航空学中已经有了实际的应用。美国国家航空与宇宙航行局对于机器人的发展很感兴趣,通过模拟空间站中宇航员的手的运动,机器人可以在空间执行复杂而危险的行动。看来可能的是,数据手套原理,甚至适用于模拟整个身体的运动和反应的数据服。
这种情形对于人类的想像力有久远的影响。因此,化学中的分子建模,不仅仅可以用计算机来实现,而且也可以用引入触觉要素来实现。通过数据手套的手段,化学家可以想像抓住一个分子,感觉到它的表面并以所希望的方式对它进行操作。工程师试图通过特殊的技术系统,产生出这些接触和用力的效应。在虚拟现实中,通过数据手套进行的人的操作,必定要接受触觉到的影像客体的反馈。经验世界的复杂性,应该在所有方面被模拟。
宇航学和化学的例子中,模型的虚拟现实相应于宏观和微观宇宙中的某种真实现实。但是,图像计算机产生的奇妙世界景色,仅仅是作为电子实在而存在。在技术可能性与科学幻想之间的界限看来是模糊的。在计算机产生的“远程现实”中,人们感觉到如同影像物体。已经有人建议构造一种所谓的“家庭现实发动机”,它把使用者移入所希望的和不希望的幻想的虚拟世界。如果你愿意,你就可以与玛丽莲·梦露有性关系,或是与阿尔伯特·爱因斯坦进行讨论,这都是计算机产生的虚拟实在——预言家就这样向人们保证。科幻作家如威廉姆·吉布逊描述了由计算机产生的世界——“电子空间”,它将由人们作为惊人的幻觉而经历:
电子空间,每天由成千上万合法操作者经历的交感幻觉,无论在哪个国家,只要是学习了数学概念的孩子……都可以从人类社会中所有的计算机库数据中提取出来的数据图形表示,获得不可思议的复杂性。光线布满精神的非空间中,数据奔流激荡,如同城市中的照明,退去了……
这些见解,当然对于我们文化的发展提出了根本性的批判。人们被锁在塞满自己隐私的箱子中,或操作着由超级克雷和神经网络产生的虚拟现实,这看来是一幅如同奥韦尔的《老兄》(Big Brother)中那样的可怕图景。
除了那些伦理学问题以外,还有一些严重的认识论问题,它们是计算机产生复杂人工世界的可能性问题。在传统的认识论中,哲学家如贝克莱和休谟采取了唯我论和怀疑论的立场,认为任何手段都不可能证明外在世界的实在性。我们所有的印象也许都是由我们的大脑及其精神状态产生出来的幻象。这些迷惑人的问题,并非是如同孩子般的不诸世事的哲学家的玩笑。它们应该是推动我们去考察和分析我们的论据的有效性的动力。现代逻辑学家和精神哲学家如希拉里·普特南已经以如下的方式对这些问题进行了翻译,它使我们想起了著名的图林试验。
设想一个人被一位“邪恶科学家”动了一次手术。他的大脑已经从身体上移去,置入充满营养物的罐子中,保持大脑还活着。其神经末梢与混成的神经计算机联接起来,使此人——他的大脑——仍然获得对一切事物完全正常的幻觉。他所经历的一切,都来自计算机对于神经末梢的电刺激。如果此人想要举起他的手,计算机的反馈将使他“看见”和“感觉”到手被举起,尽管存在着的仅仅是大脑中相应的模式,而非物理的眼睛或耳朵。那位邪恶的科学家可以使这个可怜的人经历任何情形。普南特说:
这个受害者甚至可以觉得自己正在阅读这些令人愉悦的但是相当荒谬的假设:一位邪恶的科学家把人们的大脑从身体中移去,并将它置入充满营养物的罐子中,保持此大脑活着。再将其神经末梢与超级科学计算机联接起来,使此人即他的大脑获得幻觉……
如果我们的大脑以这种方式置于一口罐子中,我们能够说我们还是自己吗?普南特争辩道,我们不能。我们实际上是置于一口罐子中的大脑这个命题不可能是真的,因为它是自驳斥的。自驳斥的命题是这样一种命题,其真意味着其伪。一个逻辑上的例子是万能定律:所有的普遍陈述都是假的。如果它是真的,那么因为它的普遍性,它就必定是假的。一个认识论的例子是定理“我不存在”,如果这是由我所思维到的,它就是自驳斥的,因此,笛卡尔的论据是,人们可以确信自己的存在,只要人一想到这个定理。我们是置于罐子中的大脑这一命题就具有这一性质。
假定我们是置于营养液罐子中的大脑,传入神经末梢与超级神经计算机联接,产生出大脑的所有感觉产物。由于置于罐子中的人的大脑在很好地发挥功能,当然它就有意识和智能。但是,它的关于树、马等等的思想和形象都与实际的树。马等等没有因果联系,因为实际的树、马等等是处于罐子中的大脑的外部世界,而这些思想和形象是由我们的超级神经计算机产生的。因此,如果我们假定,我们是置于具有所有这些条件的罐子中的大脑,那么词汇“罐子”、“营养液”等等,也就不涉及一个实际的罐子、营养液等等,而是涉及由我们的超级神经计算机产生的一定的思想和形象。结果是,“我们是置于罐子中的大脑”这个句子是假的(图5.29)。
我们必须意识到这样的可能性,即我们是置于罐子中的大脑,并非被物理学、而是被逻辑和哲学排除。物理学上的可能世界——我们是置于罐子中的大脑——与物理学定律是相容的。但是,在一个思想实验中,我们甚至能够必然地导出超出物理世界的真结论。
这些特征的原因看来要归于自参照性的结构,这是心-脑系统高级能力的典型特征。在4.3节和4.4节中,我们已经论证了,自参照性可能是使得意识和自我意识成为可能的根本特征,不仅仅是对于作为生物进化产物的心-脑系统是如此,而且甚至对于采取了完全不同硬件的人工复杂系统也是如此。
图林自己主张一种人们熟知的检验,它可以确定一个如计算机那样的人工系统是否是有意识的:让一个人在一个键盘上与计算机进行交谈,以及与一个并不知道的人进行类似的交谈。如果他不能区分出哪一个是计算机,哪一个是人,那么计算机就是有意识的。简言之,一台计算机,如果它可以通过图林检验,就是有意识的。
关于“罐子中的大脑”的思想实验已经表明,图林的对话检验必定会在某些特定意义上失效。由人工系统使用的词语和句子并不必涉及到实际的对象和事件,而我们在人的自然语言中要涉及到它们。词语和句子的使用可以是由句法模式支配的,它们能够被以高度精致的方式编程为图林机。魏征鲍姆的程序ELIZA模拟了病人与心理学家的对话,可以提供这些可能性的最初线索。在此意义上,图林检验不可能排除,机器的谈话仅仅是一种类似于有智能的人的演讲的句法演示。然而,原则上不可能排除,自组织的复杂系统,通过以原型模式和对于环境的经验作为特殊参考,是能够学习它们的合乎句法的词语和规则的。从这种长远观点看,它是一个伦理问题,即我们是否想要发展那些高度自主的(耗散)系统。
《复杂性中的思维物质》
克劳斯·迈因策尔著 曾国屏译
6复杂系统和人类社会的进化
人们怎样解释人类社会中政治的、社会的和经济的秩序的形成呢?本章首先扼要回顾了从古代以来的政治系统和经济系统的历史。对于政治的、经济的秩序的历史思想,人们常常使用相应时代的技术的、物理的和生物的概念来加以说明。在17世纪,托马斯·霍布斯力图把伽利略和笛卡尔的运动定律从力学移植到人类学和国家理论中。重农主义的绝对国家经济系统模型如同18世纪的机械装置(6.1节)。洛克、休谟和斯密的自由主义思想,具有牛顿物理学的历史背景。直到不久前,主流经济学还经常从线性数学、经典力学、热平衡热力学中获得灵感,有时还从达尔文进化论的模型中得到启发。像许多物理学家一样,经济学家相信他们的(线性)模型的精确可计算性,压抑了导致混沌的“蝴蝶效应”的可能性,并排除对于经济的长期预测(6.2节)。
要描述一种经济的动力学,就必须要有包含许多经济量的演化方程,这些量可能包括数以千计的部门和数以百万计的因素。因为一事物总是依赖于其他事物,这样的方程将是耦合的、非线性的,以能建立起经济复杂性的模型。特别是,现代高技术工业的经济行为和技术创新的效应,表明最好使用复杂系统的非线性动力学来建模(6.3节)。复杂系统探究方式的关键之处在于,从宏观的观点看,政治的、社会的或文化的秩序并非仅仅是单个意向的加和,而且还是非线性相互作用的集体后果。6.4节,在复杂动力学系统的框架中分析了复杂的社会和文化问题的例子:城市中心的生长,全球性的迁移问题和复杂组织的管理问题。该章最后考察了复杂的通信网络,提供了对世界性的“地球村”的前景以及人类由于现代高技术程序而受到的奴役。
6.1从亚里士多德的城邦到霍布斯的利维坦
在讨论了物质、生命、心-脑和人工智能的进化以后,本书最后讨论如下的问题:人类社会的进化是否可以至少是部分地在复杂系统的框架中加以描述和建模。在社会科学中,人们通常在生物学进化和人类社会历史之间作出严格的区分。原因在于,国家的、市场的和文化的发展被假定是由人类的意向性行为所指引的,即人类的决策是以意向性和价值为基础的。
从微观的角度看,我们实际上观察到的是一个个有着自己意向、信念等等的个体。但是从宏观角度来看,国家、市场和文化发展却大于其部分的加和。政治、社会、经济秩序的形成,表现为是由自组织步骤引起的,从而提示了复杂系统中的某些相变过程。然而,为避免任何种类的自然主义或物理主义的还原论,我们应该考虑人类社会特有的意向特征。在3.4节和4.3节中,已经在复杂系统探究方式的框架中为动物群体的演化建立了模型。诸如社会秩序、社会行为组织、巢穴的构造等等宏观结构,都用复杂系统的吸引子来解释。但是,尽管动物群体和人类社会有共同的起源,存在着共同的特征,它们之间的复杂性差异数不胜数。因此,在后续的叙述中,诸如“进化”、“本性’嘟不能限制在分子、鱼类、蚂蚁等等的机制中。它们意味着某种新的复杂动力学,对此进行的分析必须考虑到社会哲学的长久传统。
柏拉图和亚里士多德是最早试图解释人类社会的政治、社会和经济秩序形成的哲学家。他们分析了成为西方社会和国家起源的古希腊城邦(polis)的结构。在古希腊典籍中,城邦(xoYL&)例如雅典,是一个小城市共和国,可与后来文艺复兴时期意大利的佛罗伦萨和威尼斯的行政区相比较,或许还可以与现代瑞士市级的行政区相比较。古希腊的城邦不大,但是在政治上经济上几乎是自主的国家和社会。古希腊的哲学家提出的一种理想的模式或多或少由这些历史实例实现了。
柏拉图区分了几种转变的阶段,它们是一个城邦在实现和谐社会的最终目标过程中必定要经历的阶段。在第一个阶段,公民必须要学习种种技能和职业、商业和贸易,以满足整个社区的种种不同需要。柏拉图相信,城邦的公民必须要根据其天赋不同实现不同的专业化。公民为了合作工作必须组织起来。柏拉图提出,通过自发的自组织,他们的产品和服务的交换实现某种工作和需求的平衡。这种平衡的经济状态的特征是“公平”价格。
但是,柏拉图的田园诗般质朴合作的世界当然是不稳定的。人们力图追求自身的利益和获得好处。他们是自私的、不正派的,充满着嫉妒,由情欲所驱动的。于是就产生了冲突,就必须组织起政治权力以避免城邦的毁灭。柏拉图提出一种由精英、最智慧者(“哲学王”)管理国家的贵族政治。其政府的作用就是要使充满着冲突起伏的整个系统保持着某种平衡态。众所周知,柏拉图不相信民主,因为在他看来,没有受过哲学教育的普通人是无法认识真正公平的理念的。柏拉图相信,在变化着的短暂的表面世界背后,存在着一种永恒的伦理价值等级。因此,也存在着一种人们必须意识到的客观的价值尺度,以避免混沌、保持国家系统的和谐。
显然,柏拉图在捍卫一种集权式的政治权力系统。用系统理论的语言来说,即有一种中心化的处理者,控制着系统元素的所有行动和反应。如同科学世界中的拉普拉斯妖,这里有一个柏拉图的政治神话,即由理想的、聪明的和善良的政治家领导着一种和谐平衡系统。在一个像古希腊城邦的小城市中,在某些批判性气氛下,柏拉图的最佳“哲学王”的贵族政治也许是正当的。然而,真实的历史经验已经表明,甚至有教养的、有智慧的政治领导人也难逃滥用权力的诱惑。在今天的世界上,柏拉图的精英贵族政治犹如以知识为基础的复杂社会中的专家的权力。但是,在现在信息和计算机技术高度发展的条件下,柏拉图的聪明和善良政治家的神话容易转变为奥韦尔的恐怖剧中具有万能控制力量的“大兄弟”。
涉及古希腊城邦的第二位著名哲学家是亚里士多德。他假定,人在本性上是希望求生的社会动物。而且,他们是政治动物,因为他们希望生活得美满幸福。亚里士多德相信有机发展的人类社会,是由其成员的社会本性和政治本性所推动的。当城邦的社会和政治形式得以实现时,社会的和政治的动力学就达到了一种最终的平衡态。亚里士多德把过程作为这种社会的和政治的动力学的本质。
不过,自然的动力学过程并非被想像为一种因果的机械运动,而是被想像为一种像植物和动物那样的有机物生长,从最初的种子的状态开始,目的是最终实现其完整形式的终态(对照2.2节)。于是,在人类是由他们的社会本性和政治本性的冲动所推动的意义上,亚里士多德的社会模型是一种自然主义模型。但是,只有为了生存的目的而进行社会组织的这种人类本能才与动物是共通的。人类以其政治本性是要实现一种公正社会而与动物相区别。亚里士多德的著名观点是,人类是追求科学和哲学真理的理性动物,也是追求社会公正的政治动物。
公正意昧着一种完美的自然状态,如果社会是按照其平衡和谐比例来安排,犹如阿基米德天平的静态平衡一样(图6.1)。因此,在亚里士多德社会中的经济平衡是由“公平的价格”来度量的,这样的价格是物品和服务的“自然”价值。经济学也就成为亚里士多德的关于公正和国家的道德哲学中的一部分。他区分了交易公平(justitia commutativa)和归属公平(justitiadistributiva),前者涉及私人交换和公民事务,后者涉及私人和国家的关系。亚里士多德的经济公正和政治公正模型成为中世纪的主导思想。显然,在那个时代,它与亚里士多德的自然概念是一致的。
机械自然现是由伽利略、笛卡尔和其他一些人奠基的,它导致了牛顿宏大的经典物理学系统。托马斯·霍布斯在其名著《利维坦或物质,共同财富的形式和权力,基督教会和公民》(1651)中,提出了一种机械论的近代社会和国家的模型。霍布斯生活在一个发生着巨大政治变化的时期,即中世纪结束和近代发韧的时期。中世纪传统的君主政治和贵族政治已经失去了其宗教合法性。在血腥的内战中,欧洲社会和国家陷人毁灭和混乱之中。科学上,伽利略的机械论新方法及其在物理学中的成功给霍布斯留下了深刻印象。因此,他力图运用这种方法以发现一种近代社会的机械论模型,其中没有陈旧的传统形而上学来损害它在科学和政治中的合法性。
在伽利略力学中,有一种把一个系统(“物体”)分解成为其独立元素的分析或分解方法,以及一种再把这些独立的建筑块装配或统一成整个系统的综合方法。简言之,整体就是其部分之和。显然,伽利略描述了关键性的叠加原理,奠定了线性的机械论世界观。实际上,一个如同钟表一样的机械系统,能够分解成诸如嵌齿轮和其他机械部件那样的独立元件,这些元件装配在一起构成了其完美的功能。
霍布斯力图把运动定律从力学转移到人类学和国家理论。人们被假定为由情感和情绪推动的,如同肉体是由机械动力推动的一样。主要的情感因素是自我保护和求生个体的本能。在霍布斯看来,追求生存的本能是人的一种自然权力,并导致对其他人的暴力和侵犯。因此,在霍布斯的人类社会的自然状态中,就存在着一切人反对一切人(bellum omnium contra omnes)的永恒斗争,而没有任何平衡态。
另一方面,具有复杂需要的人们只能在社会中生存。因此,他们的理性支配了一种追求和平的第一自然定律。为了实现“和平定律”,就需要第二定律,即需要有一种社会契约。霍布斯指出,在这种社会契约中,所有的公民都必须把他们的自然权力转移给一位“利维坦”(“Leviathan”),唯有这位绝对君主才有权实施政治权力,统治国家。用现代语言来说,霍布斯的社会契约使得国家的权力垄断具有合法性,以保持社会处于某种绝对平衡。
霍布斯把绝对君主权定义为制订社会契约的“所有个体之和”。显然,这种思想是伽利略的叠加性或线性的力学原理的运用。霍布斯著作的标题页上(图6.2)表明,利维坦的身体是单个个体组成的巨大复杂系统,这说明了霍布斯的线性政治原理。
从混沌的自然状态到政治有序和平衡状态的“相变”,是由全体公民的社会契约来实现的,正是在这种意义上也就是由自组织来实现的。但是,利维坦的终态却是一个集权化的确定论系统,其中对公民不存在任何的政治“自由度”。霍布斯将物品和金钱的经济循环比作血液的循环,血液循环是由英国医生威廉姆·哈维发现的。心脏是推动整个循环的一台机械泵,收入和消费也就被比作血液的泵入和泵出。
这种机械的经济观点,后来由法国科学家、重农主义经济学派奠基人弗朗索瓦·魁奈(1694-1774)进一步阐述。魁奈最初是路易十四宫廷里的一位医生,受到社会机体经济思想的影响,他写了关于人类身体的“动物经济”的著作。笛卡尔的机械世界观是重农主义的主导哲学。
于是,经济系统就被描述为由齿轮、发条和钟锤组成的机械钟装置。一台时钟就是一个已经预先编好程序功能的顺序执行系统。相应地,重农主义经济是不能自我调节的。农业的进展,被重农主义经济看作推动力,被比作一台时钟中的发条和弹簧。经济生产被比作时钟中的复合运动。结果,经济的前景也就仅仅由调节类似于时钟的经济循环来保证。
重农主义者用一张特殊的表使得财富在不同社会阶层——农民(“生产阶层”)、商人(“不生产阶层”)和地主——中的流通形象化。在图6.3a中,经济周期开始于地主阶层将他们收入的地租(假定是2亿金路易)进行分配,左栏表示地租中给予农民以购买食物和农产品的份额(1亿金路易),右栏表示给予商人,以购买货物的份额(1亿金路易)两项收入使农民和商人两个阶层能够再生产新的物品。随着农民用商人的产品,商人也用农产品,金钱也就在相应的阶层的两栏之间进行流通。这种流通形成了一种齿状曲线,直到获得了表中的底部给出的净利润。
但是,为了开始新的经济循环,净利润的消费导致新的收入进行新的消费成为可能,这就会再生产出净利润。调节流通和净利润的重复再生产的机械过程,用带有滚动球的时钟来说明(图6.3b)。时钟借助滚动球沿着斜面齿状途径向下滚动来计时。经过一个流通周期以后,球再提高到系统的顶部,这种过程就重新开始。显然,在一个流通周期中净利润的分配可以比作此机械装置中的滚动球的齿状途径。经济流动周期的周而复始相应于把球提高后再沿着齿状途径向下滚动。
重农主义经济学家运用了笛卡尔力学框架的物理模型。他们的因果决定论中排除了任何种类的自我调节或个体自由,完全相应于绝对主义政治系统。公民被归结为一架政治和经济机器中发挥功能的元素。
6.2斯密的经济学和市场平衡
重农主义以笛卡尔力学背景来设计他们的经济模型,而亚当·斯密则与他的伟大先驱艾萨克·牛顿爵士的经典物理学有关。在笛卡尔的力学中,所有的物理事件都还原为相互作用的元素之间的接触效应,如同钟表中的嵌齿轮或圆球之间的撞击。因此,笛卡尔派物理学家构造出往往是不可观察的假定机制。例如,光的折射作用想像成如同微小玻璃球一样的小球之间的相互作用。碰撞和冲力定律在笛卡尔的物理学中是基本性的。
牛顿用他的名言“决不作假说”来批评笛卡尔的力学。他的万有引力定律是用数学方法从他的力学公设推导出来的,所作出的预见通过实验经受了经验确证。但是,他提出来用以解释虚空中万有引力的超距效应的假定的传递机制,则是不可观察的。
在牛顿的天体力学中,物体在一个由不可见的万有引力确定的动力学平衡系统中运动。动力学平衡中自由运动个体这一物理概念,相应于政治权力独立的自由经济和社会中的自由主义思想。与自由主义思想不同,笛卡尔的自然时钟机械装置则表现为,对应于把公民作为嵌齿轮的绝对主义的国家机器。
著名的英国哲学家约翰·洛克(1632-1704)不仅影响了牛顿物理学的认识论和方法论,而且还影响了近代民主和政体的政治理论。他追问,为什么人会自愿放弃他在自然状态中的绝对自由,并使自己服从于政治权力的控制。洛克认为,在自然状态中享有财产权是非常不安全的、不保险的,因为在无限制的自由状态中其他人总想将它从他的手中夺走。因此,自然状态是不稳定的,将转变为某种政治力量的平衡态。在洛克看来,从自然状态向有政府的社会的“相变”是由人们保持自己财产的意向所推动的。
不过,政府并不意味着无自由的绝对君主机制。它是一种均衡的状态(平衡态),其中像立法和执法都是独立的政治权力。由于法律是由作为社会的代表机构的议会来制订的,因此就有对其公民的基本反馈作用,公民只不过放弃了他们的自然的自由,以保护他们自身和财产要求:“所有这一切不会导致其他而只将导致人民的和平、安全和公共的善”。历史上,洛克的民主思想,权力分离,财产权以及宽容的思想,主要影响了美国和法国的政体。
如同在认识论中一样,与洛克相比,伟大的苏格兰哲学家大维·休谟(1711-1776)在政治理论中更富有批判性、更为精确。在认识论中,他教导人们,人类的意识是由感觉和情感的联想所制约的,它们可以为外部的经验所加强或减弱(参见4.1节)。所以,甚至在牛顿物理学中也不存在绝对的真理,只会有或多或少可能有用的方法。类似地,也就不存在如公正地决定着人类行为的永恒伦理价值。伦理观念只能由对于个体或公共的有用性来加以评价。总之,政治政体是否合法,也就只在于它们是否对于社会有用,是否被社会所接受。因此,休谟就成为了功利主义伦理学和政治哲学的先驱。他的朋友和苏格兰同乡亚当·斯密,很可能是受到了他的人类社会中自私行为的怀疑论人类学的启发。
斯密的名著《国富论》(1776)通常被誉为一门独立学科的诞生。然而,斯密是一位道德哲学的教授,牛顿是一位自然哲学的教授。事实上,斯密试图把伦理学、经济学和政治学统一起来,牛顿则力图将其物理学嵌入宇宙学甚至宗教框架之中。在他的《道德信念论》中,斯密分析了同情心在人类中的作用。在他的《国富论》中,人的自私自利行为被假定为经济学的根本推动力。
在这两本书中,斯密都试图把牛顿方法运用到伦理学和经济学中去。他把牛顿方法描述为,科学家制定了“一些基本的或证明了的原理,从这里出发,我们能够解释多种现象,并把它们联系在同一条链条之中”。与休谟相类似,斯密也不把科学的起源归功于人对于真理的热爱,而归结到一种素朴的渴望,即最大限度地“迷惘、惊奇和敬畏”。人类生命的伟大目的是要追求均一、恒定和持续地致力于改进人的生存条件。总之,人的自私倾向于追求最大的福利功能。
按照牛顿的“决不作假设”的格言,斯密强调,人类的自私决非是经济学家的一种理论构造,而是经验的事实。自私是单个人的强大的、自然的推动力,因此也就是一种人权。但是,若干个人的微观利益的相互作用,通过市场机制造成了共同的宏观福利效果。下面是摘自《国富论》的两段名言:“我不比那些倾心于交易公共产品的人们懂的更多。”以及“我们所盼望的晚餐,不是来自屠夫、酿酒商或面包师的仁慈,而是来自他们对自己利益的关心。”
市场机制是由供给和需求来调节的,供给和需求推动着竞争者的微观利益成为市场平衡中的宏观福利效果以及“国家的财富”。按照这样一种机械论的观点,借助通过某种“经济妖”或机械发条,微观利益被拉动到共同的平衡宏观态。按照牛顿的方法,斯密把引导着微观利益的“看不见的手”比作天文学中的“看不见的”万有引力中的超距作用。显然,斯密把经济描述成为一个其中发生着许多微观利益处于相互竞争之中的复杂系统。它们的相互作用的动力学,是一种竞争的自组织过程,其终态是实现供给和需求之间的平衡。
物品的价值是由金钱来度量的。当然,金钱的度量不可能不小心使用。有必要区别由市场机制实现的“市场价格”和产品的“自然价格”或真实价格。经济学家不得不去发现一种“标准价值”,以能校正金钱的价值。于是,斯密已经旨在建立一种以价值理论为基础的政治经济学。要衡量社会产品,就需要价值。图6.4说明了斯密的供给和需求的自组织过程,其中的反馈图式中,r是对于物品的需求,c是供给,m是市场价格,n是自然价格。
但是,斯密并没有像亚里士多德那样以诸如公正这样的伦理理想为背景来引入“公平”价格。他的探索是以像自私这样的人类本性的事实为基础,来分析“国家财富”的“本性”和“原因”。关于物品的自然价格,斯密和早期的古典经济学家如戴维·里卡多就试图发现诸如黄金、谷物和劳动的绝对价值尺度。
在里卡多看来,这种共同尺度应该由他的劳动价值理论来解释。里卡多跟斯密一样,熟悉经典物理学的一般思想。因此,他相信,经济学的某些结论“如同万有引力原理一样确定无疑”。随着历史的脚步向前迈进,经济和政治的问题都发生了变化,里卡多的增长、地租和劳动理论都受到了19世纪初他自己时代的历史条件的影响。最明显的是,出现了像马尔萨斯已经考虑过的要养活不断增加的人口所带来的经济问题。
约翰·斯图特·穆勒(1806-1873)这位英国的哲学家和经济学家,对经济学的方法论有着巨大的兴趣。他把“政治经济学”定义为推演分析的公理系统,以假定的心理学前提以及对人类行为的所有非经济方面进行的抽象为基础。这些抽象可比作如同力学中的摩擦那样的扰动因:
扰动因有其自己的规律,如同被扰动的原因有其自身的规律一样;从这些扰动因的规律出发,扰动的本性和数量也就可以预见……特定原因的结果于是就可以加入一般原因的结果之中或从中减去。
在上面的引语中,穆勒显然描述了经典物理学中的因果性原理,它是使长期预报成为可能的基础:相似的原因引起相似的结果。因此,穆勒的经济学方法论就与拉普拉斯经典物理学精神是一致的,假定在近似知道初始条件的情况下,运用经济学定律就可以近似正确地作出预测计算。而且,穆勒的公理假设还定义了一种简化的经济行为模型,而非复杂的经济现实。
于是,穆勒就成为了第一位明确以虚构的“经济人”为基础的经济学理论家,处于整个复杂性之中的真正的人不见了,而原先这是斯密研究的主题。这个一般性的经济人假说扩大了某种经济性功利功能,其经验基础是某种经验,即以对穆勒同时代的人进行反省和观察为基础,但是它并非是从特定的观察或具体的事件之中推导出来的。与此类似,牛顿的一般性万有引力定律也是由对于落体或运动天体的某些特定观察从经验上证明是合理的,而不是从这些事件中推导出来的。穆勒的方法论与19世纪物理学中对形式化系统和模型的新见解相吻合。
现代数理经济学的先驱们如瓦拉斯和帕里托传播了物理学的数学方法在经济学中的应用。这两位思想家都是所谓的洛桑学派的代表性人物。经典理论已经明显受到物理数学概念的影响。他们或多或少地谈及经济力量和机械平衡之间的大体相应。实际上,数理经济学的先行者们主要是从力学和热力学中借用词汇,例如,平衡态、稳定性、弹性、膨胀、充气膨胀、收缩、流、力、压力、阻力、反应、运动、摩擦,如此等等。
1874年,瓦拉斯接受了斯密的如下思想:消费者和生产者行为最大化就将导致经济的所有产品和因素市场在供给和需求总量之间的平衡。从瓦拉斯以后,一般平衡理论就成为了主导概念,它要求证明在一种经济的数学模型中存在平衡态。数理经济学家力图把复杂系统的元素从其环境中分离出来,用外源参量进行说明。不过,如果外源参量自身依赖于整体系统的影响,那么,把系统与环境分离并忽略掉实际存在的反馈,从而建立起适当的经济模型就是可能的。
一般而言,一些古典经济学家力图通过标志线性和机械性模型的某些特定的假设,来减少经济实在的复杂性。首先,他们相信理性经济人用这种虚构来看待人们的每一行为。例如,市场中的这种经济人的个体行为,应该作为一个整体被分离出来。人们的行为可以用从个体行为中抽象出来的一般行为模式来描述。于是,就有了这样的假定,人的个体行为如同遵从一定运动数学定律的机械系统中的元素一样,是规则的、可预见的。如果起始条件和环境是已知的,是可精确测量的,那么就可确信,环境之中的个体行为就犹如气体中的分子一样,其行为是确定论的。
假定了一个社会是由其成员的加和性行动构成的,经济模型的线性也就遵从叠加原理。叠加原理意味着,社会作为一个整体,与个体行动的加和没有两样。显然,线性模型是从不可预见的、非理性的个体行为的抽象,是从环境制约的抽象,是从个体与其行动之间的非加和性(“非线性”)和协同相互依赖性的抽象。
这些线性的方法论原理,完全相应于拉普拉斯的物理学世界观。它们对今日的主流经济学仍然具有强大的影响,尽管本世纪的物理学自身已经经历了一些重大的革命,例如产生了以不确定性关系为特征的量子力学。但是,海森伯的不确定性关系是依赖于普朗克常数的量子力学算符之间的一个特定关系的结果,它看起来似乎与经济世界全然不相干。然而,薛定谔和海森伯的量子形式仍然保持着线性(对照2.3节)。事实上,经典的线性动力学系统具有非常规则的行为方式,从而允许作出精确的预见。而一个非线性的模型却表现出混沌的行为,对其作出长期预见是不可能的,因此被看作一种蹩脚的经济学工具。
在20世纪,数理经济学家已经越来越放弃洛桑学派的物理主义了,该学派曾试图把经济系统比拟为某种经典物理学系统。经济学家已经在力图找到他们自己的基本数学工具。动力学模型的线性假设已经由于技术上的原因而被看作是正当的。这种正式态度在约翰·梅拉得·凯恩斯1938年给罗衣·哈罗德的一封信里有如下的表述:
在我看来,经济学是逻辑学的一个分支,是一种思维方式;而你没有坚定地拒绝试图……将其转变成一种伪自然科学……按其模型及其选取模型的艺术,以模型与当代世界相关联的做法来看,经济学是一门思维科学。
例如20世纪20年代末受特征的经济崩溃的影响,凯恩斯和其他人都强调经济系统不具备自动自我调节能力。“资本主义的不稳定性”成为所谓的凯恩斯主义中的一个常见的说法。于是,就提出了这样的建议:要借助特定的政策例如财政主义工具从外部来使经济系统稳定化。线性模型被新古典主义理论所特别采用,人们再一次集中在对平衡经济学的研究上。
非线性探究方式,主要是受到了那些对于古典平衡经济学理想感到不满意的经济学家的青睐。因此,凯恩斯学派的学者们在并不熟悉非线性的数学方法的情况下,经常对线性的平衡理论框架提出批评。
约翰·冯·诺意曼和奥斯卡·摩根斯腾的《博奕论和经济行为》(1943),开创了一个非线性数理经济学的新时代。线性编程、运筹研究,以及甚至数理社会学都受到这本名著的影响。在《博奕论》一书中,冯·诺意曼和摩根斯腾合理地假定,行动中的个人总是按照某种收益性来最大化自己的利益。一般地,使一类可能的行动a1,……,am和一类可能的状态s1,……,sn配成数对(ai,sj),式中1≤i≤m且1≤j≤n,收益uij是其一个映射。可能的收益uij构成一个(m×n)矩阵。
例如,人们已经提出来若干种在不确定性条件下进行决策的合理性标准。不确定性意味着不知道可能收益的概率。主要运用的是所谓的最大最小收益标准。在这种情况下,每一种可能的行动ai都有相应最小收益值的矩阵元,即收益矩阵(uij)中第i行ui1,……,Uin中的最小值。于是,规则要求:选取的行动使其矩阵元取最大值。简言之,最大最小值规则选取这样的行动:最不利情况下的受益最大化。该规则可以非常容易地、机械地运用于收益矩阵。
哲学家卡尔·加斯塔夫·亨佩尔想像出来如下的一个例子。在两口缸子中,装有尺寸相同的一些球,它们无法通过触摸而加以区别。在第一口缸子中,小球是铅球和铂球;在第二口缸子中,小球是金球和银球。游戏人被允许作为获取免费礼物从其中的一口缸子中取出小球。游戏人不知道缸子中的小球的分布概率。估计铂球价值为1000,金球价值为100,银球价值为10,铅球价值为1。
最大最小规则认为应该选取从第二口缸子中获得小球。在这口缸子中,最吃亏的情况是获得银球,而在第一口缸子中最吃亏的情况是获得铅球。显然,最大最小规则相当于一种悲观主义的世界观。在游戏中,游戏人假定了一个充满着敌意的对手。于是,最大最小规则建议采取一种最有用的行动。
而一种乐观主义的态度则相当于所谓的最大最大收益标准。游戏人坚信,每一次可能的行动都将得到最好的可能结果。因此,看来合理的是采取获得最好可能结果的行动,这至少可以跟其他行动获得同样好的最有利结果。在上述例子中,最大最大规则建议选取第一口缸子。
一位谨慎的游戏人也许不愿意选取最大最小规则。但在另一方面,如果知道了对手怀有敌意,最大最小规则才是合理的。一些数字的例子是支持这种解释的。对于两种可能的状态s1,s2,以及两种可能的行动a1,a2,收益矩阵如图6.5a所示。
最大最小规则建议采取行动a2。甚至把数字1减少到非常微小的值例如0.000001,而数字100放大到非常大例如10[15]时(图6.5b),最大最小规则仍然建议采取行动a2。对于一位假定了一位绝对敌意的对手的游戏人,这种决策实际上是合理的。在任何情况下,对手都将力图阻止游戏人实现最大收益的状态。否则,采取最大最小值规则就将是不合理的,因为a1将会是更好的行动。如果状态s1实现了,游戏就不得不放弃收益增值,因为它太小了。在状态s2的情况下,他将以行动a1获得一个非常大的利益增值。
为了判断这种决策是合理的,萨维奇引入了所谓的最小最大冒险标准。他主张,用冒险价值rij的矩阵(图6.5c)来取代收益uij的矩阵(图6.5a)。为了获得第j列中最大收益价值,必须把冒险价值rij加入到收益价值uij中。
在矩阵6.5a中,第一列的最大收益价值是1,在第二列中是100。于是,冒险矩阵就如图6.5c所示。
最小最大冒险规则要求:选取使得最大冒险最小化的行动。由于a2的最大冒险的价值是99,a1为1,看来合理的是选取行动a1。当然,也只有在一定的特殊条件下这个规则才是合理的。还有许多其他的合理性标准。
接下去是所谓的悲观乐观标准。它建议在悲观的最大最小规则和乐观的最大最大规则之间获得一种答案。假定对于行动ai,收益ui1,……,uin的最小值是mi,最大值是Mi。让a是一个常数,使得0≤a≤1成为乐观悲观矩阵元。于是,行动a1相应有a矩阵元ami+(1-a)Mi。悲观乐观规则倾向于具有较大a矩阵元的行动。当然,只有给定了一个特定的a,才定义了一个特定的标准。这些例子表明,合理性的绝对标准是不存在的,存在的只是一类相应于在一定条件下的不同乐观程度和不同悲观程度的标准。
冯·诺意曼和摩根斯腾的《博奕论》一书中,考虑了作为个人或群体之间进行竞争或合作的相互作用结果的社会或市场的稳定性。在许多情况下,他们对于实际的经济、社会和心理复杂性采取了过度的简化。每一位游戏者只能恰好确定他的可能行动以实现某些状态和可能的受益。一般来说,博奕论采取了线性(叠加性)原理假设,在一个社会(游戏)中的许多个人的复杂相互作用被归结为若干个人的许多简单相互作用的加和。
于是,对两人游戏的研究在博奕论中占据着重要的地位。在一个事件中,游戏人1选取行动a1、游戏人2选取行动a2,被表示为数对(a1,a2)。在此事件中,游戏人1的收益是u1(a1,a2),游戏人2的收益是u2(a1,a2)。一类重要的游戏,其特征是在每一事件中,两位游戏人的收益恰好相反,即u1(a1,a2)+u2(a1,a2)=0(“零和”博奕)。任何的合作都被排除了。于是,最大最小规则就显得是合理的,如果没有关于对手的合理性的特定信息。在其他情况下,合作常常是合理的。
数学上的根本性问题是,在此博奕中存在着平衡点。如果完全没有合作,就以如下方式定义两位游戏人的可能行动的平衡点。一个事件(a1,a2)是游戏的平衡点,如果游戏人1的所有行动a1的收益值u1(a1,a2)大于或等于u1(a1,a2),以及如果游戏人2的所有行动a2的收益值u2(a1,a2)大于或等于u2(a1,a2)。
假定游戏人2选取了行动aa,而游戏人1试图使收益最大化,那么他就可以选取行动a2;反之亦然。平衡点是稳定的,如果游戏人知道他或她的对手也处于平衡点并且没有理由要改变其行为。显然,这种平衡定义没有考虑任何动力学方面。但是,实际的社会或经济行为却是由时间中的复杂动力学所确定的。交易循环是众所周知的经济动力学的例子。于是就提出了问题:这些动力学是否受到平衡态的吸引,以及这些平衡态是否是稳定的。一般来说,博奕论并不考虑“蝴蝶效应”,即不考虑小的行为失误有时会引起总体的危机甚至引起混沌。
冯·诺意曼和摩根斯腾的博奕论并不完全拘泥于线性数理经济学的传统,它还发展起来经济福利理论的思想。一个理性的社会被假定为选取了帕雷托优化(Pareto-optimal)的利益分配。如果没有对于其他个体福利的减少就不可能增加这一个体的福利,这种利益的分配被称为是帕雷托优化的。满足这种弱帕雷托优化福利条件仍然是不充分的,还必须考虑到潜在的联合。博奕论中的合作解理论,主要是追随了福利经济学、交际手段,以及往往惯于社交的自私政治家的思想。数学上,福利经济学的政治和社会框架的公正、无偏见以及平等竞争等概念的确定,都被归结为某种对称性原理。
博奕论是一种精确的数学理论,它在经济学中的应用往往被估价过高了。其局限性是它对社会作了典型的线性假设。然而,博奕论是一项了不起的数学发明,它主要是由冯·诺意曼提出来的。值得注意的是,在本书所涉及的本世纪几乎所有科学领域的发展中,约翰·冯·诺意曼都是一位中心人物。他曾致力于程序控制的计算机、自动机理论、量子力学和博奕论的发展。而且,他还对自然科学和社会科学中的跨学科数学模型深感兴趣。所有这些辉煌的发展都主要是由线性原理支配着。但是,冯·诺意曼还是最先认识到自复制和自组织的重要性的科学家之一。他的元胞自动机理论就是一个著名的例子。
6.3复杂经济系统、混沌和自组织
从方法论的观点来看,主流经济学往往受到线性数学、经典力学、平衡态热力学模型的启发,有时也受到达尔文进化论的启发。古典经济模型中已经假设了一种理性的经济人,理性经济人通过成本最小化、利益最大化来追求收益最大化。这些理性的角色被假定通过在市场上交换商品而发生相互作用,市场是通过一定的价格机制来实现需求和供给之间的经济平衡的。
要描述经济的动力学,就需要有包含许多经济量——也许来自数千个部门和数百万角色——的演化方程。经济学如同其他领域一样,一切事物都依赖于其他事物,为了尽量地模拟经济复杂性,这种方程就将是耦合的、非线性的。但是,甚至是完全确定论的模型也会产生出高度不规则的行为,这样的行为是不可能作出长期预测的。经济学如同气象学一样有同样的缺陷。
在发现数学混沌和蝴蝶效应之前,人们相信有可能精确地作出长期的天气预报。作为一名计算机的先驱,约翰·冯·诺意曼认为,拥有了充分多的关于全球气象的数据,并有了超级计算机,就可以对于长期的、大范围的天气作出精确预报。在数学上他并没有错,因为在线性数学框架中,他如同经典的天文学家一样地正确。但是,流体和天气的实际长期行为惊人地不同于这些模型。
人们怎样来处理天气和经济学中的复杂性呢?气象学中,爱德沃·洛仑兹已经提出了一种非线性动力学模型,其中由于内在的(“外在的”)扰动就会产生出混沌行为(对照2.4节)。类似地,解释经济演化的复杂性就有两种可能的方式。主流方式是假定线性的模型,其中作出某些预先的特设、难以解释的外在冲击。而非线性方式放弃了过于简化的预设有外在冲击的线性假说,并力图通过其内在的非线性动力学来解释实际上的经济复杂性。在一些情况下,非线性作用非常弱,线性近似并不造成根本性错误。
在经济学史上,20世纪30年代的经济大萧条引起了试图从理论上解释经济的不规则性。但是,那些模型(例如卡耐基和汉森-萨缪尔森模型)都是线性的,难以解释振荡现象的形成。因此,经济学家们就假定,外部的冲击引起了所观察到的振荡。假如那时经济学家对于数学的发展更熟悉一些,他们就会早些了解到非线性的数学模型会导致循环限制,从而得出解答。
经济学家们起初只知道不动点吸引子的稳定平衡。彭加勒把平衡态推广到包括以极限环形式进行的平衡运动。但是,对于像洛仑兹模型(图2.21)中的混沌吸引子,既没有不动点,也没有不变运动,而是一种永不重复的运动。然而,它也是一种有边界的运动,一种非游荡集合,将一定的动力学系统吸引到某个动态平衡的终态。
历史上,20世纪的经济以其增长过程中发生着引人瞩目的崩溃中断为特征。例如,20世纪30年代(大萧条)和70年代(石油危机)。对于增长的结构,要特别关注创新和技术进步。成功创新的扩张,在经验上已经由逻辑斯蒂函数很好地表示出来,本书中在2.4节已经引入了这一函数。递归的表示中可以把整数t看作时间项,增长因子a>0。起初,人们对于创新是全然不熟悉的。然后,随着它被人们接受,它就达到了它的最大扩张速率。再后,随着创新方式完全地结合进经济中,对它的吸收过程就慢慢地减速了。
所形成的曲线示意在图2.22中。对于a≤3,我们获得了某个不动点吸引子,这示意在图2.22a中。对于更大的a,结果形成了一种振荡(图2.22b和图2.24b),然后是一种混饨运动(图2.22c和图2.24c)。对于a>3,周期数随着a的增加而成倍增加(图2.23a),最后它完全变成了混沌(图2.20b)。
创新和经济产出之间的相关如图6.6的模型所示。最初的输出q被看作是平衡的,随着增长速率△k的增加,输出也在逐渐增加。随着创新到达饱和状态,△k也减少到零,输出q跌落到最初的水平。于是,创新刺激出某种繁荣,但也就引出了随后的衰退。创新可以是节省劳动力的。如果每输出单位的劳动输入降低20%,就会引起失业。
人们假定新思想的增长是指数式的,像舒伯特那样的经济学家主张,在一次创新冲动的尾声就将开始一轮新的创新冲动。然后,如果大致以每年4%的速度发生经济系统连续地起作用和技术概念连续地生长,那么就会激起新的一轮繁荣和新的衰退,如此等等。对于经济循环理论,创新是至关重要的,因为在一次萧条中是没有任何的新投资基础的,而新的投资又是引出新的扩张所必需的。
一些新的思想平稳地产生出来。当足够多的思想积累起来以后,就会引进一组新的创新。它们最初的发展是缓慢的,然后随着方法的改进而得以加速。逻辑式发展标志了这种典型的创新轨迹。引入一种创新必须要有某种超前投资。投资刺激了需求。增长的需求促进了创新的传播。于是,随着所有的创新都已经被充分发掘,减速过程就将导致零增长。
熊彼特把这种现象称作创新“游泳”。在他的三循环模型中,第一个短循环相应于资本循环,创新在此不起作用。下一个较长循环相应于创新。熊彼特承认历史统计学的显著性,并把长周期波动的证据与诸如蒸汽机、炼钢、铁路、轮船和电力这些最重要的创新联系起来,注意到它们完全地结合进经济中需要30-100年。
一般地,他描述了以“集群”形式发生的技术进步引起的经济进化,并在逻辑斯蒂框架中来解释。一次技术集群被假定为以循环方式把一种平衡态转移为一种新的不动点。所形成的新的平衡,其特征是更高的真实工资、更高的消费和产出。但是,舒伯特的分析忽略了一个根本性问题:有效的需求决定着产出。
从历史上看,20世纪30年代的大萧条促成了提出经济的商业循环模型。不过,最初的模型(例如汉森-萨缪尔森的模型和郎伯格-米兹勒模型)都是线性的,因而也就需要外在的冲击来解释其不规则性。标准的经济方法论为这种传统进行辩解,尽管循环分析在数学上发现了奇怪吸引子以后就已经成为可能。在非线性系统框架中,重新表述关于20世纪30年代的大萧条的传统线性模型并不困难。
米兹勒模型是由两个演化方程来决定的。在第一个方程中,产出的变化率q正比于实际资本S与所希望的资本S’之间的差。所希望的资本正比于产出。第二个方程中涉及资本的变化率s,其产出q小于需求。需求正比于产出。由这两个演化方程决定的动力学复杂系统,将产生出简单的其振幅不断增加的谐运动。
如果以某种非线性方式将这个系统扩展,就会导致另一种不同的行为。第三个方程中考虑到净公共剩余和赤字的反常行为。目的是要产生出有若干年周期的循环。运用所谓的茹斯勒带,提出了一种数学模型。人们得到了一条莫比乌斯带,它是自上而下翻转后只给出一面的带子(图6.7a)。追随一条轨迹,由外圈扩展到右上方。然后,它折叠起来,并随着向下运动而收缩为一个内圈,如此等等。图6.7a给出了一个两维的投映,显示了这两个循环。轨线倾向于聚集在其间的空的空间。如果将此模拟继续下去,这些带子就变得越来越稠密。
图6.7a是一个简单而著名的混沌(“奇怪”)吸引子的例子。尽管其中每一轨迹都是精确地由演化方程所决定的,但它却是难以长期计算和预测的。在蝴蝶效应的意义上,起始条件的微小偏离,将引起轨迹途径的巨大变化。图6.7b示意了态空间中一条为期15年的输出轨迹,对此已在计算机实验中选择一些参数进行了模拟。图6.7c示意了作为相应的时间系列的发展。
这种高度飘忽不定的行为完全是由内在系统产生出来的,没有任何的外在冲击。在经济学中,时间系列的不规则性通常是用外在冲击来解释的。但是,它们仅仅是武断的预先假设,因此是可以解释任何事物的。从方法论的观点看,其中有混沌吸引子的混沌内在模型表现得更令人满意。然而,内在的非线性模型与带有外在冲击的线性模型都必须严肃地取自经济学,并在经济学中受到检验。
显然,一个经济系统包含了许多相互关联的和相互独立的部分,既有内在动力学也有外在影响力。一个国家的经济越来越受到世界经济运动的作用。在一个经济系统内,也有具有特定动力学的多种市场。它们受到循环的影响,例如,每年的太阳循环就决定着农业、旅游业或燃料市场的状况。因此,铁业循环和建筑循环也都是人们熟知的经济例子。因此,内在非线性并受外力冲击波的系统才是现实的经济模型。受扰动的混沌吸引子或一种超混沌,给人留下了深刻印象。正是经济事件具有飘忽不定的特征,给经济人员带来了严重的困难,他们不得不面对不可预见的未来而进行决策。
在2.3节中,我们已经看到,自组织的复杂系统可以是保守的或是耗散的。在图2.14a,b中示意了它们的不同类型的吸引子。一些为人们熟悉的自然科学中的保守的或耗散的模型都已经运用于经济领域。1967年,哥德温提出一种保守动力学模型,以使得19世纪的阶级斗争思想精确化。他考虑了一种由工人和资本家所组成的经济系统。工人将其全部收入都用于消费,而资本家则将其全部收入都储蓄起来。哥德温运用的是作了某些修订的洛特卡和沃尔特拉的捕食者-被捕食者模型,那个模型已在3.4节中作了描述。
哥德温的保守模型支持了这样的观点:资本主义的经济将处于不断的振荡之中。因此,轨迹描述了封闭轨道,如图3.11b所示。哥德温的模型受到了批评,批评者认为它只是表面上的,因为该模型并未直接涉及资本家和工人的职务收入份额或他们群体的大小。但是,主要是由于它的保守特征,使得哥德温的模型看来在经济上是不现实的。该模型把互不相干的一组假设放在一起,而假设之间的相互影响没有得到反映。
因此,加入“经济摩擦”假设,就使这个模型更为现实了。在生物学中,耗散的洛特卡-沃尔特拉模型已示意在图3.11c中,其中有一个吸引子。一个耗散系统总是具有吸引子或排斥子,其形式包括不动点、极限环或奇怪吸引子。由于耗散系统具有不可逆的时间进化,任何种类的回溯预测都是排除在外的。
现实中,人们不可能将一个动力学系统与其他动力学系统割裂开来考虑。因此,在2.2节中,我们研究了耦合的吸引系统,例如两个时钟(图2.11a,b)。组合系统的态空间由一个环形圆纹曲面代表(图2.11c,d)。整个系统的动力学,由环形圆纹曲面上的轨迹和向量场的相图来表示。
一个耦合振荡系统的经济模型,可以由国际贸易来提供。设想一个简化了的只有总投资和储备的单种经济的宏观经济模型,其总投资和总储备依赖于收入和利率。这个系统的动力学依赖于关于收入的演化方程,收入由市场上对物品的过度需求来调节,第二个演化方程是关于利率的方程。这些方程以模型中产生出内在振荡的方式构成了一个非线性振荡子。
3种经济的相互作用,例如,可以用3个独立的二维极限环来加以描述。如果这3种经济都处于振荡中,该系统的总运动就构成了一种三维环形圆纹曲面的运动。非线性振荡子的耦合可以理解为对三维环形圆纹曲面上的自主经济运动的扰动。这种耦合程序已经应用到了几种经济实例中,诸如国际贸易模型、商业循环模型和独立市场。
当允许自组织的经济系统受到政治干预的影响时,就出现了至关重要的实际政策问题。在某些情况下,市场是不可能按照福利标准来发展的。如果让经济自由放任,它就可能出现涨落波动的特征。如果不考虑经济增长的复杂性和非线性,政策措施可以对这样的倾向产生相反的效应。
对于经济突变带来的巨大社会和政治后果,已经在凯恩斯主义和新凯恩斯主义的框架中讨论过若干种政策措施。例如,当代的财政政策可以被看作一种动力学控制。它应该可以减少经济涨落的幅度。但是,战后的经验已经表明,希望把涨落减少到零是不可能的,也不可能保持就业率不变。而且,一项好的政策总是需要相当的时间来收集数据、分析结果并提出相应的立法和行政措施。结果是,任何政策当它起作用时可能就已经过时了。因此,在复杂的非线性的经济世界中,一项政策措施可能会是完全无用的。
例如,当假定的经济动力学及其政策干预的时间途径过于简单时,凯恩斯的收入政策就可能是无效的。在复杂系统的框架中,经济政策措施可以被解释为对于振荡系统施加紧急的外部作用力。因此,它不可能排除掉经济系统出现混沌现象。在物理学中,受迫振荡是人们所熟悉的。例如,如果一个像钟摆那样的动力学系统(图2.5)处于振荡中,并且受到外力的周期性影响,那么,由于振幅不断增加、振荡总体衰减以及完全的无规则性,其结果就可能是不可预见的。
从古典经济学到现在,商业循环理论的目标一直是建立起具有规则涨落的经济系统的动力学。按照线性力学的观点,实际的商业循环可以用规则系统来建模,对其可以再加上随机的外部冲击,而这种冲击又必须或多或少用适当的经济学假设来说明。当然,对于一个模型,当它的基本性质是由外部力量来决定的,这些外部力量又没有合理的经济学解释,这样的模型就是很难令人满意的。如果一个实际的系统是非线性的、混沌的,可能影响其经济动力学的外部作用力的进一步的信息也就可能是多余的。从方法论的观点看,按照奥卡姆的格言entia non suntmultiplicanda sine necessitate[无必要就不增加(理论)实体〕,他的著名剃刀应该用来切除这些多余的关于经济学的预先假设。
从一个实际工作人员的观点来看,他究竟是面对一个随机的线性过程还是一个混沌的非线性过程的问题,这是一个离题的问题。这样的两种系统都使得他难以作出精确的预测。由于混沌模型敏感地依赖于起始条件,任意精确的数字计算机也不可能计算出这种系统的长期的未来演化。轨迹将指数地发散。另一方面,他却相信,面对着系统的过于复杂的行为,随机的外部冲击是可以放弃的。
然而,具有混沌时间序列的非线性系统却并不排除局部的预见性。如果非线性系统的吸引子可以加以重构,那么数字技术就允许以足够高的精确度对系统的短期进化作出预测。短期经济预测可以是复杂系统理论在经济学中的一种有趣的应用,不过这也仍然处于其婴儿期。
对于经济学模型来说,经济学从一开始就遇上了经验检验和确证的严重方法论问题。这与自然科学中可以进行任意多次的测量并进行实验室实验形成了鲜明的对照,经济的时间序列必须包括时间单位如天、年、季度或月份的数据。典型的标准的时间序列长度是由数百个点构成的。因此,对于经济模型的有限的可靠性就已经具有了经验的理由。当然,经验式的实验基本上是排除在外的。
因此,关于内部经济动力学的适当知识,至少有助于建立数学模型,对其未来的发展可以用计算机实验进行模拟。如果政治家和管理者的经济和政治环境的假设得到了实现,他们就至少可以获得可能经济图景的“相图”。对于高度敏感的非线性系统的定性洞察,至少有助于防止反应过度的人们把该系统从不稳定点推向更不稳定,甚至也许是推向更大的混沌。
经济学中的非线性模型的主要根据,是由最近的经济增长的结构变化给出的,这种结构的变化是新领域的技术发展引起的。传统的经济学理论假定了收入递减。某种物品生产和投向市场的越多,则其生产和销售就将变得越困难,获利就将越少。人们的相互作用是由负反馈来决定的,负反馈通过对经济变化引起的每一作用的反作用来稳定经济。
在一种存在着负反馈的经济系统中,价格和市场份额的平衡就可以实现,也就可以预测。一个著名的例子是20世纪70年代发生的石油危机。20世纪70年代原油价格的突然上涨,使得人们开始节省石油,寻求可替代能源,于是又导致了石油价格在20世纪80年代的下降。在传统的经济学中,平衡即是一种对应于特定环境中的最佳结果。收入递减定理意味着存在着某个平衡点。其中有收人递减的负反馈的经济系统,对于传统的诸如农业、矿业和大宗产品等部门是典型的。
但是,以高技术知识为基础的经济部门却获得了收入递增。高技术产品像计算机、软件、飞机、化学产品和电子产品的发展和生产,需要复杂的研究、实验、计划和设计过程,需要高额投资。但是一旦高技术产品投向了市场,生产能力的扩大却是相对便宜的,收入也就开始增加。因此,现代高技术产业就必须作为收入递增的正反馈的动力学模型来描述。
具有正反馈的系统,不止一个平衡点,而是有若干个平衡点。它们不必是最优的。如果某种产品在市场上恰好具有竞争优势,市场主导者就将长期处于市场主导地位,甚至会在不必改进产品的情况下扩大其优势。现代高技术产业的许多例子表明,相互竞争的产品在开始时可以占有大致相等的市场份额。但是增加了某一特定产品市场份额的微小涨落决定着它的最后成功。常常会出现这样的情况,市场上的最后主导者从技术观点看却不是最好的。
这些效应是不可能在传统的线性动力学框架中得到解释的。但是在非线性系统中它们却是人们所熟知的。图6.8表示在正反馈情况下两种技术的竞争。某些市场份额的轨迹显示在凸面上。一种技术越是支配着市场,它就越容易获得更大的市场份额。由于主导市场的位置是由随机的涨落引发的,因而它是不可预见的。在图6.8中,左边的曲线表示最后取得支配地位的技术A。在其他两种情况下,在起始的涨落之后最终取得市场支配地位的是技术B。
这些经济模型的非线性的动力学是由最初的随机涨落和正反馈决定的。显然,可能途径的分叉是一种由最初的随机涨落导致的对称破缺,这也是在复杂物理学系统中为人们所熟悉的。读者只要回忆一下加热流体出现的定态对流卷(图2.20b),其中对流卷方向是向左还是向右就取决于起始的随机涨落。
除了耗散系统以外,保守系统中也会出现对称破缺。我们考察一下旋晶中偶极子当温度下降时发生的自组织(图4.9a)。在热平衡态,依赖于起始的随机涨落,旋晶变成指向同一方向的排列。市场份额的动力学表现出遵从同样的方式发展。很多例子表明,因为起始随机涨落而制约了技术的发展方式。在19世纪,相邻的铁路公司在大范围中采取了相同的规范。而标准的规范只是历史随机事件的结果,而不是由于技术上的理由。
这些复杂系统的行为由简单的演化方程所决定,如同铁磁旋晶系统发生对称破缺一样。图6.9示意了铁磁体中磁偶极子的演化。每一偶极或每一磁极都可以是向上(北极)或向下(南极)。一个偶极可以与其最近邻发生作用。在高温下,偶极子的方向是随机的。如果温度降低,基本的极性就会按相同方向排列起来。由于这些演化是一种对称破缺,就不可以预见在平衡终态究竟会实现哪一种方向。图6.9b示意了与此类似的铁路公司采取规范的自组织过程。
在经济和社会领域中,正反馈的自我增加机制是非线性复杂系统的典型特征。例如,我们可以考察,加利福尼亚的圣克拉拉县为何会成为著名的硅谷。在20世纪40年代和50年代,一些著名的人物(如休利特、帕卡特和肖克利)在斯坦福大学附近建立了一些电子公司。这些先锋造成了高技术工程师和产品的集中,成为一个吸引子,最终900多家公司随之应运而生。在开始时,出现的是一些随机的涨落,它们有利于圣克拉拉县。因此,硅谷是如何出现的,从非线性角度来看,这并非奇迹,而是合乎规律的事件。但是,从随机性来看,它产生于圣克拉拉县就是一个奇迹。
今天,自我增强的机制决定着高技术的国际贸易。美国和日本之间的汽车工业的竞争可以从这种框架中得到解释。起初,日本的工业向美国市场上提供小型轿车没有受到美国汽车工业的任何抵制,美国的汽车工业传统上专注于生产大型轿车。日本的汽车工业获得了市场份额,并降低价格和提高质量。于是,正反馈使日本工业侵入了美国市场。
对于这些非线性的市场效应的洞察,可以对政治决策产生重大影响。传统的观点是假定某种收入恒定或下降,政府相信开放市场,力图阻止垄断,并希望工业将支持研究和技术发展。他们相信某种不变的世界性市场价格的平衡,拒绝任何的补贴或关税的干预。对于一个收入递减的经济系统,他们的政策是正当的,但是对于收入递增的以高技术为基础的经济部门,这就可能是危险的。
不断增加着收入的运行机制改变着国家之间的竞争平衡。甚至最强大的国家经济,也可能在重要技术上错过发展。20世纪60年代在西欧和美国之间的技术差距(例如在计算机领域)是一个著名的冽子。技术标准或常规通常都是由正反馈来确立的。如同前述的铁路规范的例子,英语作为航空导航的标准语言,FORTRAN作为一种计算机语言,某种特殊的螺纹,如此等等,往往都是不可变更的,即使一种替换技术或规范可能会更好。它们获得了过多的市场份额。但是,最初的优越性并不能保证长期生存。
非线性系统具有若干个可能的平衡态,但没有最终的稳定态。非线性经济即使在最初是均匀的,但由于它们的高度的敏感性和起始条件的微小偏差,也就不可能选择同样的发展道路。因此,正反馈的非线性经济不可能像计算机那样进行编程和运行,因为它的长期进化是不可预测的。复杂系统理论可以有助于设计一个经济动力学的整体相图。但是,对于找到经济福利的局部平衡,经验和直觉有时比科学知识更有帮助。对于处理高度敏感的复杂系统,政治家们必须具有高度的敏感性。
6.4复杂文化系统和通信网络
在社会科学和人文科学中,人们常常把生物进化和人类文化的历史进行严格的区分。主要原因在于,民族和文化的发展显然是由有意向性的带着其态度、情感、计划和理想的人类行为所引导的,而生物进化系统则假定是由无意向性的自组织过程所推动的。从微观的角度看,我们用他们的意向性和愿望观察人类个体。甚至在像动物生态这样的生物系统中,个体也有某种程度的意向性行为。
复杂系统探究方式的关键点在于,从宏观角度看,政治、社会和文化秩序的发展,都不仅仅是单个意图的加和。亚当·斯密已经认识到,经济财富和福利的分配并不是由社会的一个个面包师和屠夫的善良愿望所施舍的。个体的自私自利的意向性可能会与集体利益相冲突。然而,他们的(非线性的)相互作用却通过“看不见的手”(斯密)或“理性的狡黠”(黑格尔)实现了集体的平衡态。
由意向性行为的个体组成的非线性系统,也许比例如物理的原子系统或化学的分子混合物更复杂。在4.3-4节中,意向性行为和意识的建模,是被看作一种复杂神经系统的自参照整体状态,由神经元的非线性相互作用造成的。以不同复杂程度出现的集体有序现象是所有非线性系统内在的共同特征,这样的系统并不一定要与意识相联系。作为人类社会的集体秩序的政治状态,尽管其形成可以用具有意向性行为的有意识的人们的非线性相互作用引起的相变来建模,但是显然并非黑格尔错误地认为的那样有某种意识或智慧。
因此,在复杂系统的数学框架中,“进化”概念并非专指特定的生物进化机制。在复杂系统中,所谓的演化方程描述了其元素的动力学,这些元素可以是基本粒子、原子、分子、有机体、人类、公司,如此等等。宽泛意义的另一方面是复杂性概念自身。在社会科学的情景中,有许多方面的复杂性,图6.10中示意了其中的一部分。
在本书的复杂系统的数学框架中,复杂性首先是定义为一种非线性,这是混沌和自组织的必要条件,但不是充分条件。另一方面,线性意味着叠加原理,用通俗的说法是“整体只是其部分之和”。复杂性的第二个重要方面是由算法的结构来定义的,这在5.2节中已经讨论过。计算机科学中复杂性理论提供了一种复杂性程度的等级,例如依赖于计算机程序或算法进行计算所需要的时间。由于人们常常用计算机图形来模拟非线性复杂系统,它们的算法复杂性就可能描述为它们的自组织能力。在元胞自动机理论中已经探讨了这种关系(对照5.3节),其中为不同种类的自组织复杂系统进行了建模。
在社会科学中,高度工业化社会的复杂性主要是由大量的公民及其关系、组织亚结构及其相互依赖性所构成。我们应该记得,在一个复杂系统中,造成形成集体(协同)有序时元素的巨大数目不是根本性的,非线性相互作用才是根本性的。读者也许还记得,具有混沌轨迹的天体3体问题就是可能的答案。
在复杂系统的数学框架中,对于人类历史和社会文化发展的物理学或生物学还原论,在任何情况下都是不恰当的。社会和文化发展的模型,必须联系其特定的约束和限度来进行讨论。一个重要的方法论问题是,如何提供对于这些模型的经验检验和确证。因此,对复杂文化系统进行计算机辅助模拟已成为关键性工具,籍此可以对其动力学提供新的洞察,从而对我们的决策和行动大有帮助。
历史上,对于社会科学中的非线性问题的兴趣可以追溯到托马斯·马尔萨斯。他指出,因为人口指数地增长而食物供应只能线性地增长,人口将超过食物供给。1844年,威霍尔斯特修订了该指数方程,指出人口增长的速率正比于人口生产以及资源总量与现存人口对资源消费量之差。他的著名的具有平衡吸引子特征的逻辑曲线,被运用于人口统计学、经济学和社会科学的其他许多场合。它提供了一种可能的一系列分叉和相变(包括混沌)。
由沃尔特拉和洛特卡描述的捕食者-被捕食者生态系统的演化,是另一个被应用于社会科学的模型。例如,洛特卡-沃尔特拉模型有助于我们理解农业社会的出现。因为人类能够进行学习,他们就能够改变他们与环境相互作用的程度,使得这种作用快于大自然遗传进化的反向措施。人类社会,为了生存只有不断地改进其狩猎能力,从而消灭被捕食群体。然后,社会也将被消灭。结果是,捕食者和被捕食群体都将灭绝。但是,农业使得被捕食者的生产速率增加了。于是,人类群体就增加了,并能够在某种平衡态稳定下来。
生物系统的进化是受其基因制约的。达尔文进化论中,新个体的出现是通过对突变体的自然选择实现的,其中突变是自发产生的。在较高等动物的群体中,由于模仿,出现了新的行为变化和适应的可能性。社会发展起来诸如法律系统、国家、宗教、贸易等等特殊的组织机构,从而使得后代的行为变化得到稳定化。
复杂系统探究方式提供的基本性洞察是,无论是遗传进化还是行为进化,都不需要诸如进行指导的神的意志、生命力那样的总体程序或者某种总体的进化优化策略。基因的生存或者总体行为模式的形成,都可以用组成系统的个体之间的局域相互作用来加以解释。我们可以更清楚地表述为,这是一个宗教或政治世界观的问题,即究竟有没有诸如上帝、历史或者进化那样的“总程序”。在复杂系统的方法论框架中,这些假设对于作出解释是不必要的,在奥卡姆剃刀及其理论概念经济的意义上它是多余的。
显然,诸如生物有机体、动物群体或人类社会这样的非线性系统,已经进化得越来越复杂了。我们现在的社会,与亚里士多德的城邦或重农主义者的政治系统相比较,它是一种以高度组织结构复杂性和信息网络连接为特征的社会。在19世纪,赫伯特·斯宾塞已经提到,不断增加着复杂性是进化的一般特征:“进化是结构和功能复杂性的增加……恰好是……平衡过程……”斯宾塞仍然是在热平衡的热力学框架中来进行论述的。
在远离热平衡的热力学框架中,存在着不只一个平衡不动点,而是存在着分为不同复杂程度的吸引子的等级,从不动点开始,直到具有分形结构的奇怪吸引子。因此,无论是在生物进化中,还是在社会文化的进化中,都没有某个固定的复杂性限度,只是存在不同复杂程度的吸引子,它们代表着一定相变阶段的亚稳平衡,如果一定阈值参量得到实现,这些亚稳平衡就是可以被打破的。社会的结构稳定性也就与这些不同复杂程度的吸引子相联系。
传统的关于自稳定、自调节系统的功能主义观点,源于技术上的恒温装置。它有助于我们理解社会为何保持不变化,但是却不能解释它们为何发生变化,平衡为何被打破。在复杂系统的框架中,对于社会的动力学,是按照不断地与其环境交换着物质、能量和信息的耗散系统的相变来理解的。社会的组织制度是一种耗散结构,它们可以产生出来,并可以在特定的阈值条件范围内保持木变。例如,在新石器时代的村落中,当已建立起来的社会结构已不可能保证食物供给时,农业制度就发生了从干旱农业向灌溉农业的转变。
在工业化社会的历史上,我们可以找到强弱程度不同的经济涨落,它们可能引发由社会制度的崩溃和新的社会制度的形成。例如,1922年美国的经济萧条是相对温和的,时间也不长,因而没有产生社会结构的变化。与此相反,美国历史上1929年的股票市场的崩溃却是一场真正的蝴蝶效应,引发了1933年的大萧条。这一危机使得许多公司发生了财政灾难和大量的失业,而不能被已建立起来的社会组织制度来加以运作。现成结构的临界参数被超过了。新的组织制度出现了,安全和交易委员会、联邦储备保险组织和劳工管理局就应运而生,以克服萧条的影响,并防止未来商业循环中的过大波动。这种美国社会的凯恩斯回应,以罗斯福总统新经济政策而闻名。
但是正如我们从新古典主义经济学家和第二次世界大战战后的社会发展经验中认识到的,公共福利的优化策略可能引发管理官僚制的自动力学,它使得经济动力衰退,与起初的善良的愿望相反。对系统的结构稳定性,过度的反应,跟毫无反应一样危险。另一方面,政治革命史表明,社会可能失去其稳定性,实现新的政体、组织体制和社会结构,当然,其延续性没有任何保证。
从方法论的观点看,这里有一个问题,即如何在复杂系统的框架中来表示社会的社会文化进化。吸引子和平衡态的认识需要一个社会文化动力学的相图,来定义“社会文化状态”和“社会文化的态空间”。但是,什么是维多利亚英国和魏斯曼共和国的社会文化的态空间呢?这些问题揭示了一些明显的局限性。复杂系统探究方式在历史和社会科学中的可能性如何?
要在纯粹的数学态空间中再现出一个历史时期的研究目标是不可能的。有关的数据常常是没有的、零乱的,并且不是定量的。在这最后一节中,具有态空间和动力学相图的复杂系统,被用来为人类社会系统的经济进化建立模型。例如,经济学家并没有声称要再现魏玛共和国的完整的经济发展。但是,对于那些影响或者依赖于政治和文化史的典型经济图景,商业循环周期的非线性内在模型或线性外在模型应该能够给予描述。
经济模型并非是由于自己的缘故而建立的。经济学家希望理解经济的动力学,以通过对于结构的更好洞察来对决策提供支持。社会的经济动力学嵌在总体的社会文化发展之中。从其复杂性的角度看,对于社会文化的建模,人们已经进行的尝试仅仅是针对诸如城市中心这样的子系统的。这些模型抓住的是城市系统演化的典型特征,这有助于政治家和公民在适当情形更好地进行决策。
现代工业化的社会中存在着大量的形形色色的中心,包括各种各样的尺寸、形式和特征,从非常大的人口密集的城市到小小的人口不多的村庄。我们可以问一问,这些不同中心的空间分布的原因何在,它们将如何随着时间发生进化。要对此作出回答,我们就需要了解城市系统的总的空时状态,它是由其中的人员——个人、家庭、管理者如此等等——的局域相互作用造成的,这些人员可能在追求不同的合作或冲突的利益。一个城市中心的结构有赖于商业和工业利益、货物的流通和服务、交通联系、文化吸引力、生态要求。而且这些因素都必须精确并且能够测量。城市系统与外部世界有若干种交换。因此,它可以被解释为一种耗散结构,用一种复杂动力学系统来建模。
彼特·艾伦已经提出了一种系统,用演化方程表达了其中不同作用因素的非线性相互作用。城市系统的空时结构,包括变化着的中心、居民密度,都不是其组成因素的简单加和。它并非是某个总体优化者或某种集体收益函数的结果,而是由非线性相变引起的相继的平衡态不稳定性的结果。在此意义上,城市系统的演化,并非是柏拉图哲学王(或独裁者)控制的,也并非是笛卡尔建筑师建造的或者拉普拉斯妖所预见的。在复杂系统的数学框架中,一个城市系统的生长就如同活的有机体一样。
在艾伦的分析中,城市系统的地理空间由具有50个局域点的三角形点阵来表示。城市系统的生长由两个方程所决定,方程描述了局域点的人口变化以及这些点提供的就业的演化。局域的人口和局域的就业能力由作为正反馈的城市放大作用连接起来。就业的集中提供了客观条件和公共基础设施,它们反过来又引起了正反馈,同时,居民和投资者又在争夺提供负反馈的中心空间。
计算机作出的图6.11a-e示意了一个区域的人口分布的演化,该区域起初没有局域中心之间的相互作用。城市化过程表现为局域吸引子变化的格变。图6.11b处于时间t=12单位,结构开始围绕5个主要中心发展。图6.11c中,最大中心的核心部分开始达到极大值。图6.11d示意t=34,基本结构本质上是稳定的。两个中心已经经历了中心部分的衰退。在图6.11e中,基本的模式是稳定的。衰退、中心化和非中心化都是复杂的非线性动力学引起的。
图6.11a-e形成了城市系统的总体演化的加速运动图像。每一幅图像是一特定时间的总动力学状态的一幅相图。当然,这种模型是进行了简化的。但是,可以给它加上更多的功能作用方面,进一步研究其精细的非线性相互作用。不过,这种模型对于探讨决策选择具有启发性,可以在计算机模拟的案例研究中进行分析。无论是局域的还是总体的变化都可以增加到该系统中。这些模拟研究,政府极为感兴趣。
一种可能的策略是,在特定的地点给予特殊的投资以干预城市结构。这种决策策略适用于城市系统中迄今为止欠发展区域的发展。例如,投资不仅仅是一种经济手段,同时也是一种文化吸引力和交通联系。有时,一项投资可以激起某种局部的蝴蝶效应,引出某种总体后果,而与设计者的善良意愿起相反的作用。这是可能的,原因在于模型的非线性限制了长期预测的可能性。
一个城市的动力学是复杂系统的实际例子。它表明,如果忽略了非线性的后果,个别人的良好愿望是不充分的,甚至是危险的。个体行为的集体效应是我们社会的特征。进行决策时,要尽可能地意识到这些集体效应。这些后果的重要性不仅仅出现在对于具体决策及其非线性的计算机模拟中,甚至并没有参与具体的计划活动的公民,也必须意识到社会中的复杂的相互关联性。
煽动人们要求有对一位可以解决所有问题的强有力的政治领袖,从民主观点来看,这不仅仅是危险的。从数学角度看,由于现代高度工业化社会的复杂性,还表明它是错误的。另一方面,我们不要把希望寄托在个别的政治家或党派的身上,也不要当我们的被夸大了的预期未能实现时,又走向完全对政治丧失信心的另一端。人类社会的特征是其中的成员具有意向性。然而,如同原子团、分子混合物、细胞有机体或生态群体一样,他们也是由非线性的复杂性规律所支配的。
社会学理论中,对于复杂性和非线性的认识论考察仍然处于初期。发展起一种能够适当处理社会问题复杂性的统计数学,可以作为通向传统社会学概念的桥梁。在复杂系统探究方式中,社会现象是由非线性方程来描述的。例如,对埃米尔·德克海姆谈到的社会中的连带性,我们可以把这种概念的功能方面归因于复杂系统的非线性和集体效应。我们可以把政治决策划分为“线性的”和“非线性的”,例如,“线性的”相应于“个人的”选择,而“非线性的”相应于行政管理、大众媒介和政党这样的组织体制环境。许多公民和组织机构的行动和反应,都可以被理解为社会统计描述中的固有涨落。社会的确定论特征并不仅仅反映了分布函数的平均值,它们是按照如同主方程那样的非线性规律随时间发展的。
沃夫冈·维德里希的斯图加特学派已经发展起来了这种对于社会经济动力学的研究方式。其数学建模方法是从协同学和统计物理学中推导出来的,允许对社会中的集体发展进行定量描述。协同学指出了社会中的微观水平上的个体决策与宏观水平上的动力学集体过程之间的一种关系。社会科学中在微观经济学和宏观经济学、微观社会学和宏观社会学之间作出划分是大家熟悉的传统概念。维德里希的协同学探究方式是一种对于宏观过程的几率性描述,其中包括了忽略了涨落的准确定论描述的随机涨落和偏差。
对于求解模型可以从两方面来进行考察,例如,可以用分析的方法,考察主方程或平均方程的近似解的精确性如何;也可以用数字方法或计算机辅助方法来模拟特征图景。通过在微观水平上的实际考察,确定模型的参量或借助模型模拟估计未来的发展,从而对经济系统进行分析、评价。图6.12中示意了用协同学探究方式对于社会动力学进行建模的方法论框架。
这种协同学的建模概念已经被运用到若干种社会科学的问题中,例如,对于政治见解的集体形成,人口统计学,群体迁移,以及区域地理。协同学概念特别适合于把若干个社会部门的相互作用整合起来,诸如经济和集体形成政治见解之间的关系,或者经济和迁移过程之间的相互作用。迁移是当今一个非常重大的问题,揭示了线性的、单因果的思维是多么的危险。只有善良的个人愿望而没有考虑到个别决策带来的非线性的效果是不够的。线性的思维和行动可能激发总体的混沌,尽管我们的局部行动是出于善良的意愿。
按照协同学探究方式,社会经济系统有两个特征水平,标志着社会中个体决策的微观方面和集体动力学过程的宏观方面。发生着涨落的几率性宏观过程,可由人类社会构型的主方程来描述。一种社会构型的每一组分,都涉及到具有特征行为矢量的亚群体。对于群体的迁移,迁入或离开某个区域的行为和决策,可以从群体的空间分布及其变化来识别。因此,模型的动力学允许我们描述群体的不同总体宏观状态之间的相变。
经验性管理数据可以用来对这个理论进行检验。该模型可以是关于一个国家中的区域迁移,它由经济和城市发展的不同所引起;它甚至也可以是在“南”和“北”之间的惊人的世界性迁移,即在穷国和高度工业化的西欧、美国之间的迁移,这是由政治和经济的不景气所推动的。动物群体的物理输运或迁移常常是不可控制的、随机的和线性的,没有成员和集合体之间的相互作用。但是,人类的迁移则是有意向性的(受到收益考虑的驱动)、非线性的。因为这种转移率并不线性地依赖于整体的社会构型。
两个人类群体之间的迁移相互作用可能引起若干种协同学宏观现象,比如形成稳定的混合体,形成两个独立的稳定聚居群体,或者保持着不休止的迁移过程。在迁移动力学的数字模拟和相图中,协同学宏观现象可以通过相应的吸引子识别出来。图6.13a,b示意了两个群体的均匀混合,两者的聚集或分离的倾向都比较弱。图6.13a是平均方程的相图,其中有一个稳定的平衡点。图6.13b示意了主方程的稳恒解以及具极大值的几率分布。图6.14a,b示意了两个稳定的聚居群体的形成,两群体间显示出弱的聚集倾向和强的分离倾向。图6.14a是有两个定态不动点的相图,而图6.14b描述了定态不动点的最大几率分布。
图6.15a,b表示,两群体中存在的是中等程度的聚集倾向和强烈的对称相互作用。图6.15a示意的是一个涡旋图像,而图6.15b相应于极大值的几率分布。图6.16a,b相应于某种无休止的迁移过程,每一群体都有强烈的聚集倾向,两群体间有强烈的不对称的相互作用。图6.16a的相图显示了有不稳定起源的极限环。图6.16b中稳恒几率分布有4个极大值,它们与顺着极限环的边相连接。在社会学上,这种情况被解释为由不对你的侵入和群体迁移引起的逐步侵蚀。
如果我们考虑在三个区域中的三个群体而不是考虑两个群体,那么非线性迁移模型中就会出现确定论混沌现象。一些数字模拟得到了最后轨迹状态是奇怪吸引子。在其他情况下,相继出现的分叉变得越来越复杂,最终转移到混沌态。
应用于管理和组织社会学领域,是复杂系统探究方式的另一类实际应用。实际上,现代的公司已经开始将其大型组织重组和分散化,以使其在问题复杂性不断增加的情况下成功地实现组织战略。例如,他们开始支持新方式的组织流动性,允许迅速地形成以项目为中心的团体,以及按照环境的需要进行重新组合。与采取固定的社会结构组织形式相比较,流动性组织采取的是一种较高水平的合作方式。面临着社会的两难问题,流动性组织显示了一种极其多种多样的复杂的合作行为,这是由个体战略和结构变化之间的非线性相互作用引起的。
这些社会群体的动力学可以按照复杂系统来建模。计算机模拟对于可能的行为发展方式提供总体的洞察,由此有助于管理者去实现发展的适当条件。即使复杂系统的模型是适用的,当然也不可能作出长期预测并通过集中式的领导来进行全面控制。
这种模型是由意向性动因组成的。它们的选择决定于个体的偏爱、期待、信念以及过去的不完整的知识。合作模式是从个体在一定临界值内进行选择所导致的。当群体中一部分领悟到进行合作超过一定临界值时,个体也将采取合作。临界值取决于群体的大小,也取决于从个体的相互关联模式中形成的社会组织的结构。如果允许群体改变其社会结构,就增加了以合作方式来解决社会两难问题的潜力。组织流动性有其优点,但必须与可能丢失效率进行均衡。组织的效率,可以用它在一定时间中获得的总体收益来测量。
在公司中,一般都存在着某种非正式结构和正式结构,非正式结构是人们之间的情感联系模式导致的,正式结构则是由等级组织支配的。非正式结构通过一种自组织过程而实现,它可以用社会中的人际关系结构来代表。这种研究方式可以追溯到20世纪50年代对于城市家庭的社会关系网的研究,现在已发展成为一种高级的计算机辅助的社会学工具。从个体相互关联的微观角度看问题,就形成了一种对于社会结构的全局透视。
图6.17和图6.18中,这些结构被形象化为树状结构。每一分支代表着等级组织中较高水平上的一个子部门。在较低水平上的模式代表了个体,它们造成合作因素的完整循环和造成缺陷的开放循环。把两个个体分开的组织层的数目,是由每一个体从树状结构返溯到其共同起点时的模式数目所决定的。组织中两个单元之间的距离,由隔开的组织层数来度量。两个单元之间的距离越远,它们的行动之间的相互影响就越小。因此,组织树说明了一个群体中的集束数量和程度。
关键性的问题是一个群体的结构和流动性将如何影响合作的动力学。流动性依赖于个体在社会中的移动的难易程度,以及他们是否容易取得成功并扩展到结构。在复杂系统的框架中,系统的宏观性质是从下层的组分的相互作用中衍生出来的,这里在数学上用非线性演化方程来建模。
格兰斯和休伯曼在图6.17a-d中示意了对一个固定的社会结构中某些相转移的计算机模拟,其中由3个大集束构成了3层次的等级,每一个大集束又是由3个3元素的子集束构成的。图6.17d中的最终的总合作是由图6.17a中若干个单元的集束行动所导致的。这些单元相互加强,同时又能够推动一个层次上的单元进一步加入到合作之中。这种合作的增加可以影响结构中单元的合作,甚至可以进一步加入到合作之中。
在一个等级结构中的某个微小的合作行动,就可能引起大范围地转向整个组织的合作。这种一连串增加的合作将导致某个不动的平衡点。但是,具有固定结构的群体容易成长起来并超出持续合作的界限。在这种情况下,群体将迅速演化到它的总偏离的平衡状态。但是即使在这种界限以内,合作模式也是亚稳的,即单元之间的合作不可能长期保持,终归会过渡到发生突然的对称破缺,出现总的偏离。
在流动结构中,个体单元可以在组织中移动。个体根据他们所期待的长期利益而作出合作或偏离的决策。为了评价他(或她)在结构中的地位,他(或她)将把长期报酬与期望值进行比较,如果合乎他(或她)的期望,他(或她)就会呆下去,如果不合乎就会离开,离开的选择是随机的。当个体评价他(或她)的地位时,还会考虑突破现状而形成某种新集束的可能性,如果他(或她)感到这样做并不导致任何损失的话。个体单元是否容易取得突破,决定了取得突破的临界值,它是未来最大可能报酬的某个分数。
图6.18a-e粗略显示了一个流动组织中的相变。最初(图6.19a),群体中的所有成员(按每束4人划分为4束),都是处于偏离中。图6.18b表明,几乎其中所有的成员都已经依靠自己取得了突破。在这种情况下,成员们更倾向于转向某种合作的策略,实现了图6.18c。因为不确定性,成员中不时有集束之间的切换(图6.18d)。当一束变得太大时,该束就可能开始转向偏离。在这一转移阶段(图6.18e),越来越多的成员将取得自己的突破,并重复出现类似的发展。这种类型的循环已经在模拟的组织中反复观察到了。
正如在城市生长的情形(图6.11)或者迁移动力学中(图6.13-图6.16),对社会组织的计算机实验模拟不可能对个体行为得出确定论的预测,但是它们有助于人们理解社会动力学的敏感性和复杂性。因此,就有可能去实现适宜的环境和条件,从而改进相应社会系统中的人们的生活状况。
社会文化进化的模型必须考虑到多个相互作用的方面。如果一个社会是由多层、多部门交叉的耗散结构构成的,我们就必须找到合适的图像去说明它们是如何形成的。在包含相互作用的耗散系统的复杂发展中,新的宏观结构的形成从长期角度看就是一种分散化和非计划事件。而且,在每一方面都包含着许多或明或暗的激励和鼓舞着人的行为的思想、感情和预计。它们无法直接地加以量化,因为它们溶解在一条被称作“生活方式”的洪流之中。然而,一个社会的生活方式是一种典型的社会文化的宏观现象,依赖于多种相互作用的可以鉴明的因素:诸如与经济、技术、工作、旅行、生态和传播媒介相联系的条件状况。
当代世界中,技术的进化已成为一种变化的推动力量,影响着多种多样的生活方式要素。对于自组织过程,一种显著的特征是,技术的发展是自催化的,每一种创新都催化下一种创新的产生。一种主导的思想(“范式”)是把技术和社会进化解释为技术相继被取代的结果,即一种人工物被另一种人工物取代,照此从增长到饱和的发展就可以进行数学建模,表示为相互关联的逻辑斯蒂曲线。断言技术的进展是通过一系列的相变和取代而进行的,意味着它们可以看成一系列相继的逻辑斯蒂曲线。每一条曲线都达到了某种饱和水平。随着每一水平的进化创新,就发展起一条新的逻辑曲线的相变。
在6.3节中,我们已经讨论了技术中的这些相变是与经济的增长或衰退相关联的。计算机和信息技术的发展已经前所未有地影响了几乎所有领域中的人类生活方式。看来可以将其比作一种准进化过程,即产生出复杂性不断增长的计算机和信息系统的过程。当计算机科学家们谈论新一代计算机超越了老一代计算机的复杂性时,就运用着赫伯特·斯宾塞的术语。事实上,系统功能的复杂性已经增加了。但是,另一方面,例如,问题的复杂性(由其所用计算时间来度量)就已经减少了。问题复杂性的减少就是这些技术的准进化过程的一种序参量。
计算机和信息技术系统已经成为社会文化发展中的一项至关重要的技术,以准进化过程进化着。这种过程的复制作用具有某种信息模式,它们构成了文化,并以变化着的方式从这一人群传播到另一人群。与分子和初等有机体不同,人们有其自己的意向性,信息模式的传播过程不是通过机械式模仿来实现的,而是通过通信来实现的。将其与基因相比较,这些复制作用常被称作“縻縻”(memes)。它们包括思想、信念、习惯、道德、风尚和技术等等。
任何能够通过信息通信方式传播的模式就是一种魔摩,甚至在其人类宿主无法表达它或是没有意识到它的存在时也是如此。重要的是,认识到人类文化的复制子是縻縻,而不是人们。正如卡尔·波普尔主张的,我们能够改变我们的思想,使得推动文化进化的不是人们的选择,而是“让我们的理论替我们死亡”。
在复杂系统的框架中,我们当然可以谈论在数学演化方程的抽象意义上的系统“进化”。具有其特殊生物化学机制的生物进化,只是标志了复杂系统的一般数学框架中的特殊模型。因此,人类文化的进化特征,是不可能归结为生物进化的生物化学机制的。但是像“縻縻”这样的概念,不应该被误解为只是一种社会达尔文主义的行话。它们可以说明能够从数学上定义并在经验上检验的复杂系统的基本特征。
在此意义上,世界范围的通信网络的发展,可以被解释为协助人类中的縻縻传播以建立起一种縻縻生态系统的复杂系统的进化。支撑着人类文化的縻縻是多种多样的,也是其变化和选择的机制。在6.3节,我们已经讨论了“经济縻縻”及其市场选择机制。经济市场对于其自身的人类社会环境总是具有一定程度的开放性。在它们的运行中,总是受到广泛的严格程度不一的种种力量的制约,它们是由各种法律和调控机构所施加的。
在人类社会中,法律系统和政府活动为市场提供了某种框架。在复杂系统的框架中,它们不可能免遭进化力量的冲击。它们在政治生态系统中,以其自身的机制发生着进化,进行着法律的变异和选择。一些政治縻縻,如政治欲望、政治口号或政治纲领,可以成为社会热力学相图中的吸引子。在一个开放的民主社会中,它们可能兴旺,但也可能衰落,如果由于竞争替换的选择压力使得它们的吸引力减小的话。
管理现代社会的复杂性的能力决定性地依赖于有效的通信网络。如同生物大脑中的神经网络一样,这些通信网络决定着有助于人类生存的学习能力。在复杂系统的框架中,我们必须为在其经济和文化环境中传播的信息技术进行动力学建模。因此,我们就涉及到信息的和计算的生态学。这样的例子是现实的,预订机票、银行联网、实验室联网都是现实的例子,它们都包括了许多各种各样的计算机网络。
不完整的知识和迟到的信息都是开放计算系统的典型特征,在此是没有中心控制的。这些巨大的网络,从不断增加着种种计算机辅助的信息中心的联接中出现,正在变成一种自组织系统,它们不同于它们的由单个程序控制的组件。它们的非计划性增长导致了巨大的技术复合和运用的多样性,也增加着相互兼容的困难。这种解放着人类文化的独立机器人世界,呈现出一幅令人生畏的景象,可能会是许多可能令人不安的图景的最后结局。
由于世界范围的局域信息和计算机中心的增长不可能通过中心处理者来进行规划,因而就要有一门非线性动力学,应该在复杂系统的框架中对它加以研究。甚至对简化的案例进行研究,也会对现代社会文化进化提供某些重要的洞察。计算生态的复杂相互关联性,违反了传统的等级分解要求,传统管理中进行的等级分解是将其分解为技术的、工业的或管理的部门。现代技术通信网络是增长着的开放系统,其中必定没有诸如机器或人的中心控制、同步控制或一致数据。
不完整的知识导致了某种优化差距,而信息接受的延迟则引起其中单元的振荡。合作以及对有限资源的竞争可能导致协同效应。混沌则阻止了任何稳定的问题求解策略。马尔文·闵斯基已经研究了一种简化的集体问题模型,求解使用的一些独立的单元,它们针对一组相关问题,并发生相互作用。这种例子可以运用于计算机辅助信息系统的分布系统的模型设计中。
贝纳多·A.休伯曼和塔得·哈格分析了一个模型,它有一些中心或成员,能够在种种可能的策略中进行选择,以完成指定的任务(图6.16)。此策略相应于他们所设想的报酬,单元反复地针对不同策略评价所设想的报酬,并转向具有最大报酬的策略。此模型的演化方程决定了过程改变其策略的速率。由于在一定时间间隔中只有一部分成员决定转向,所以系统的动力学必须用几率方程来建模。
此种系统可以显示出种种行为,范围从不动点一直到振荡和混沌。系统中不可避免的振荡可能是延迟的信息所引起的。不完整的知识和延迟甚至可能引起混沌行为。由于报酬依赖于偏爱选择何种策略,动力学和初始条件都将阻止对于长期行为作出预见。
世界正在成为充满数量巨大的计算系统的世界,复杂性在不断增长。其中包括有传统的冯·诺意曼机,向量巨型机,共享贮存多处理器、联接机、神经网络机和成千上万的如同阿米巴那样充满这个世界的个人计算机以及将来的分子计算机。这些计算系统正在逐步与诸如卫星、电话、光纤的种种信息系统联接起来。一个自组织的世界范围的软件和硬件系统网络的思想,已经变成现实了。
例如,1969年,在美国国防部建立了计算机辅助的信息网络。它已经成了一个迅速成长的网络的核心。这个网络已经联接了175000台计算机、936个终端及许许多多的人。在INTERNET的增长中,没有任何中央处理器的计划或控制,而是一个或多或少有些混乱的过程。然而,组织模式从混沌中出现了,或者也将以某种全球自组织的方式衰退。
在复杂的信息网络中,知识和信息分布在多个中心和个别的程序编制者中。它们的复杂性排除了集中计划。如同所有包括目标、资源和行动的系统一样,计算已经用经济学术语来加以描述了。显然,运用着市场机制的软件和硬件的计算市场已经出现。正如我们已经在6.2-3节中见到的,市场是一种自组织的复杂生态系统的形式。按照斯密的基本见解,比起任何程序编制者和集中控制者的计划和理解,消费者进行选择的力量将使得计算市场生态系统为人们提供更好的服务。原因在于,计算生态系统的巨大复杂性和多样性是与人们的市场联系在一起的。
读者可以回忆一下生物生态系统的复杂性,其中有多个层次,包括细胞、器官和机体。同样地,一个计算生态系统的元素,也是按照计算系统的复杂性增长而在不同水平上结合起来的。图6.20示意了全球的USENET网络,它通过许多的局域成长因素而成长起来。该网络的发展现状是包含了37000个节点,它只是INTERNET的一部分。如果人们想要发送或接收电子邮件或利用其他的信息服务,只要找到一个局域的USENET站就可以实现所希望的全球联结。
不过,在计算生态系统与生物生态系统之间的类似性,并不意味着任何的还原主义或生物主义。在复杂系统的框架中,计算生态系统和生物生态系统仅仅是数学演化方程的模型,由此标志了复杂系统的非线性动力学。按照闵斯基的观点,覆盖全球的计算机辅助网络可以解释为一种“市场”或“精神社会”。
哲学上,这种新的世界性“知识媒介”或计算机辅助的“智能”,使我们想起了黑格尔的理念。他的理念是一种“客观精神”的形成,它嵌在人类社会及其法律系统、经济和官僚制度之中,克服了个人的“主观精神”。但是,这些计算生态系统,既没有人类个体的大脑神经网络具有的意识,也没有大脑神经网络所具有的意向性(参见第4章)。
然而,问题是计算生态系统是否可以称作具有某种程度的“智能”。对于个体进行的智能测验,是判断其在一定时间中实现某种设定的目标的能力。在这里,智能并非某种形而上学的普遍概念;相反,这里设定了若干个精确程度不同的可检验的行为标准。一些作者已经建议,判断一个社会的“智能”,同样可以根据它运用给出的资源去实现目标的能力,这些目标是由一定的合法的子群体(例如议会)设定的。“智能”程度依赖于能够实现的目标的范围,实现目标的速度和所用手段的效率。这些定义的细节可以是不同的,但是,基于这些概念的“智能”实际上涉及到整体系统的宏观特征。这些定义的实际目的,是要比较计算生态系统及其成功地求解问题的程度。与此相反,诸如一个国家的集体“智能”这样的术语,在意识形态上是危险的。而且,我们必须意识到,智能的技术标准与意识这样的概念是有区别的,意识实际上是由生物进化中一定的大脑网络的自参照性所实现的。
信息和计算的生态系统的生长,与社会的基本性变化相联系,其特征是从传统的处理货物的产业转向信息和信息服务的知识产业。信息的生产、分配和管理都已经成为以知识为基础的现代社会的主要活动。因此,在人类和信息系统之间的界面必须不断地加以改进,以实现世界范围的人类通信网络的理想。人类的表示方式,如言谈、姿势或书写,都应该为计算和信息系统直接理解。“完整人范式”和“人机网络”是未来通信世界的最重要内容。
人类的通信不仅仅涉及到信息字符串,而且还涉及到直觉、感情和情绪。未来的通信世界有时被称作“全球村”以强调由于高技术环境导致的熟知程度。但是,对它的接受决定性地取决于与人类友好界面的实现。我们必须考虑一种新的复杂性,包括人的直觉和情绪。古老的理性理想,作为对于人类生活本质的抽象,完全地忽视了人类世界。甚至科学研究的过程也是由人的直觉所鼓舞,由人的情感所驱动,这是在未来的通信世界中必须要加以考虑的。
一些人担心,社会文化进化的最终吸引子将不是一个全球村或世界性的城邦,而是一个巨大的“利维坦”借助着现代的高技术程序来统治着人类。在虚拟现实的计算化世界中,人类的所有表达方式都将数字化,对于人们的亲密不留下任何余地。但是,社会文化进化的复杂性将允许有多个吸引子。它们不可能由人们的决策来预见或决定,但是它们将受到人们能够实现的条件和约束的影响。在一个高度复杂性的世界中,人类自由的机会是什么?在一个高度非线性的集体效应的复杂世界中,个人的责任程度是什么?这些问题导引出结语中关于复杂性、非线性世界中的伦理学的讨论。
《复杂性中的思维物质》
克劳斯·迈因策尔著 曾国屏译
7关于未来、科学和伦理学的结语
复杂系统原理主张,物理的、社会的和精神的世界都是非线性的、复杂的。这个基本的认识论结论对于我们现在的行为和未来的行为,都有重要的影响。科学和技术对于未来的发展有着至关重要的影响。因此,本书最后将展望一个复杂的和非线性世界中的未来、科学和伦理学。我们对于其未来能够知道什么?我们应当干些什么?
7.1复杂性、预测和未来
在古代,预测未来的能力似乎是预言家、祭司和占星术士的某种神秘能力。例如,特尔斐神谕中,占卜家皮蒂娅(公元前6世纪)在迷糊状态之中揭示了帝王和英雄的命运。在现代,人们变得相信拉普拉斯妖的无限能力:对于无摩擦的不可逆的线性保守世界,预测将是完满的。要预测一个过程的未来,我们只需要知道其精确的起始条件和运动方程,通过求解其未来时刻的方程就可以办到。科学哲学家们也早已致力于分析自然科学和社会科学中进行预测的逻辑条件。关于人的预测能力的信念,在本世纪中由于几方面的科学发展而动摇了。量子理论教导我们,一般地说,我们只能作出概率性预测(参见2.3节)。一大类现象是由确定论混沌支配的:尽管它们的运动服从牛顿物理学定律,它们的轨迹却是敏感地依赖于其起始条件的,因而排除了长期预测。在耗散系统中,如同贝纳德实验的流体层(图2.20),有序的出现不可能预测,因为这有赖于微观上的起始小涨落。诸如蝴蝶翅膀扇动那样的随机事件,原则上是可能影响全球的天气动力学的。在第6章中,我们已经知道,经济、商业和社会中的模式和关系常常会剧烈变化。在自然科学之外,人们的行动——这是社会科学中要观察的——能够而且正在影响着未来的事件。因此,预测可以变成自我满足或自欺欺人的预言,它自己在改变着已经建立的模式或过去的关系。预测是否也就只不过是盯住水晶球看呢?
但是,几乎我们的所有决策都联系着未来的事件,需要预测关于未来环境的情景。这对于个人的决策的确如此,例如何时与何人结婚、何时和如何投资储蓄;对于影响着整个组织、公司、社会或全球状态的复杂决策也是如此。近些年来,改进经济和生态、管理和政治中的预测和决策已经得到越来越多的强调。经济震荡、生态突变、政治灾难以及诸如新市场的机会、新技术的趋势和新的社会结构,都不应该再是杂乱无章的,不应该是上帝送来的致命事件。人们希望做好准备,因此开始发展起来种种定量的预测方法,它们针对着如商业和管理中的不同的情形。从方法论的观点看,所有的定量预测工具都标志着特定的预测水平,这限制了它的可靠应用。让我们对一些预测工具的长处和短处进行一些考察吧。
最通行的定量预测方法是时间序列程序。它们假定,在数据系列中的某种模式是可以在时间上再现的,可以外推到未来。因此,一个时间序列程序,对于预测环境因素如就业水平或超级市场每周的销售情况——在此个体的决策没有多大的影响——可能是合适的。但是,时间序列是不可能对数据模式背后的原因作出解释的。在历史上,巴比伦天文学家就运用着这种方法,他们把月亮东升的数据模式外推到末来,而没有任何基于行星运动模型的解释。在18世纪,物理学家对于太阳黑子的原因知之甚少。但是在太阳黑子的观察中,发现了一种频率和数量的模式,因而通过时间序列的连续来进行预测就成为可能。在商业和经济中,数据序列中隐含着多种模式。某种水平的模式可能在数据中并没有得到体现(例如稳定销售的产品)。某种季节性模式的出现,是按照某种季节因素引起的一系列的涨落,如有些产品的销售依赖于天气。某种循环模式可能不会以恒定的时间间隔再现自身,如金属的价格或国民总产量。某种趋势模式,出现在变量值随时间出现某种一般性增减时。在数据序列中有某种隐含模式时,此模式必须要通过将过去的数值平均化和平权化(“平滑化”)而与杂乱无章区分开来。数学上,线性的平滑化方法可以有效地运用于这样的数据:它们展示了某种趋势模式。但是,平滑化方法并不试图去证明基本隐含模式的个体组分。趋势、循环和季节性因素还可以有子模式,它们必须从分析数据序列的总模式中分离出来、分解开来。
在时间序列程序中,某种过去的数据模式被简单地外推到未来,而一个解释性模型则假定了在(“因”)变量y(这是我们希望预测的)和另一个(“自”)变量x之间的关系。例如,因变量y是每单位生产的费用,而决定着生产费用的自变量X是单位产品的数目。在此情形下我们可以在x和y的2维坐标系中建立关系模型,画出一条直线,它在某种意义上将给出这种关系的最好的线性近似。回归分析运用此种最小面积方法,去减少实际观察值y和相应的线性近似直线上的点y之间的距离。显然,在许多情形下这种方法并非一种有效的方式。一个例子是月销售量的预测,它按照一年的季节发生非线性变化。此外,所有的经理都知道,销售量并不只受时间的影响,还受到多种多样因素的影响,如国民总产量、价格、竞争对象、生产代价、税收等等。两个因素的线性相互作用,仅仅是经济中的一种简化,就像经典物理学的线性保守世界中的两体问题一样。
但是,一个更精确的复杂模型当然是需要更多的努力、更多的经验和更多的计算时间的。在许多决策的情形下,解释或预测一定的因变量要用到一个以上的变量。举一个普通的例子,销售经理希望预测下一年公司的总销售量,并对影响这种销售量的因素有更好的理解。因为他有一个以上的自变量,他的分析就成了多元回归分析。然而,他希望预测的因变量是表达为自变量的线性函数的。回归方程中的计算基于过去的观察样本的运用。结果是,基于此种回归方程的预测的可靠性,就主要取决于所使用的特定的样本。因此,可靠程度必定由统计显著性检测来度量。与多元回归涉及到一个方程不同,经济计量学模型可能包含多个联立回归方程。在线性方程中,求解的数学方法是基于线性代数和线性优化方法的(例如,单纯形方法)。尽管它们是线性的,经济计量模型可能是非常复杂的,有多个变量,只能用计算机程序和机器来把握。经济学中非线性编程的求解策略常常是将复杂的问题分解成子问题,使之可以近似地作为线性问题来处理。
运用这些方法时的一个隐含的假设是,与现有历史数据吻合得最好的模型将也是能超出这些数据作出未来预测的最好模型。但是,对于大量的真实世界的情形,这种假设并不见得有效。而且,在经济学和商业中使用的绝大多数数据,忽略了测量误差,也难以进行试验控制。因此,有必要理解,当已建立起来的过去模式发生变化时,种种预测方法是如何成功的。预测在标志着每一方法的不同预测水平上是不同的。显然,不存在唯一的方法,它可以很好地预测所有的序列和预测水平。有时,过去的数据完全不能显示未来的变化。因此,如果没有内部知识,要预测一个模式的变化是不可能的。模式转移或“范式变化”是商人和经理的日常经验,而非库恩等人的传统中某些科学哲学家们的超常见解。
有没有可以决定数据序列中的模式或关系何时发生变化的定量程序?这种方法的确存在着,其中运用追踪信号来显示预测误差中的变化,以表明何时发生了非杂乱的转移。在质量控制流程中,例如,对于小汽车的生产序列,对设备的输出要进行周期取样。只要样本的均值落在控制限度以内,设备的运行就被认为是正常的。当情况不是这样时,就停止生产并采取适当的措施,以使其重新正常运行。一般说来,定量预测方法的自动监测遵循着这种质量控制流程概念。任何时间进行的预测,其误差(即实际值减去预测值)都与控制限度的上限和下限进行对照。如果它落在可接受的范围中,外推的模式就没有变化。如果预测的误差落在控制误差之外,已建立的模式中就很可能发生了某种系统的变化。当涉及到大量的预测时,通过追踪信号进行自动监测可能是合适的。但是在只有一个序列或几个序列时,人们就只能伺机而动,去发现此商业数据的趋势中是否发生了变化。
预测技术和市场、新产品或服务的赢利的未来趋势以及与相应的就业和失业相联系的趋势,是管理者和政治家面临的最困难但也是最紧迫的任务之一。他们决策依赖于大量的技术、经济、竞争、社会和政治的因素。自从20世纪50年代出现了商业计算机以来,人们燃起了这样的希望,即通过计算速度的加快和数据存储的增加把握这些复杂的问题。的确,任何定量的预测方法都可以编程放进计算机中去运行。因为没有任何一种方法可以适用于所有的情形,于是发展起来以计算机为基础的多预测系统,从而为管理者提供一组选择方法的清单。一个例子是预测系统SIBYL,其名称来源于古代的预言家西比尔。相传西比尔曾把著名的《西比尔占语集》出售给罗马大帝塔克文(高傲的)。
的确,SIBYL是一个基于知识的系统(参见5.2节)的计算机化预测方法包。它提供的程序包括进行数据准备和数据处理,从屏幕上选用可利用的预测方法,所选方法的运用,对预测方法的比较、选取和组合。屏幕预测技术选择中,基于知识系统的推理组件提示了这样的方法:它们以大范围预测运用和决策规则样本为基础,是最接近于匹配特定的环境及其特点的。SIBYL的最终功能是,检验和比较其中的哪一种提供了最好的结果。使用者和系统的界面,要尽可能地友好和有效率,以适用于预测专家,也适合于新手。然而,我们决不要忘记,SIBYL只可能优化所存贮的预测方法。原则上,预测方法的预测水平,不可能由使用计算机而得到放大。与人的专家具有学习能力相反,如SIBYL这样的预测系统仍然是程序控制的,具有基于知识系统的典型局限性。
一般说来,基于计算机的预测自动机是遵循线性思维路线的。另一方面,现代计算机的能力不断增加,鼓舞着研究人员去分析非线性问题。在20世纪50年代中叶,气象学家偏向于使用基于线性回归概念的统计预测方法。这种发展,得到了诺什·维纳对于稳恒随机过程的成功预测的支持。爱德华·洛仑兹对这种统计预测思想产生了怀疑,并决定对比非线性动力学模型从实验上来检测其有效性(参见2.4节)。天气和气候是一个有能量耗散的开放系统的例子。为这种系统建立的模型中,用相空间的点表示其状态,用轨迹来表示其行为。经过一定时间后,轨迹就达到了某个吸引集(“吸引子”),这可以是此系统的某个稳定的点(图2.14a或图3.11c)、某个周期振荡,叫做极限环(图3.11b)或奇怪吸引子(图2.21)。如果人们希望预见包含某个稳定点或极限环的系统的行为,人们可以观察到附近的轨迹会发散,不会生长,甚至会消失(图7.2)。在这种情形下,整体的起始条件将达到定态,相应的系统也就是可预测的。一个例子是,用非线性的洛特卡-沃尔特拉方程建模的生态系统,捕食和被捕食群体具有周期轨迹。附近轨迹的发散和收敛,可以用所谓的李亚普诺夫指数进行数值度量:
我们考虑时刻t=0起始条件为x(0)和x’(0)的两条邻近的轨迹x(t)和x’(t),矢量d(t)的长度d(t)=[x’(t)-x(t)]。如果轨迹收敛,那么d(t)≈eΛt且Λ<0。量Λ叫做李亚普诺夫指数,定义为
Λ(x(0),d(0))= [(1/t)ln(d(t)(0))]
如果其值为正,李亚普诺夫指数就给出了收敛速率。在图7.2中模型过程x’(t)对真实过程x(t)提供了可靠的预测,因为假定此系统具有依赖于其起始条件的收敛轨迹。
一个非线性系统的相图,可以具有若干吸引子,分别是不同轨迹趋向的区域(“分区”)(参见图2.10)。对于预测演化系统的未来,知道了所有的吸引子及其起始条件x(0)还是不够的。如果系统的初始状态正好是远离一定吸引盆的,那么相应的吸引子终态是不可预测的。
在图2.22a-c中,非线性的逻辑斯蒂映射描述了随控制参量的不断增加发生的从有序向混沌的转移。图2.23a,b描述了相应的超过一定临界值而出现的混沌区的分叉序列。如果相应的李亚普诺夫指数为正,那么系统的行为是混沌的。如果它为零,那么系统倾向于分叉。如果它为负,那么系统就处于稳定态或分叉树上的一支。在这种情形中,系统是可预测的。在其他情形中,对起始条件的敏感性就开始出现。显著之处在于,在混沌区的非线性系统决非意味着完全不可预测。在混沌未来的灰色区中的白条或“窗口”(图2.23b),显示了具有负的李亚普诺夫指数的局域有序状态。因此,在混沌的海洋中,我们可以找到可预测的有序岛。在这种情形下,至少对于短的特征时间间隔系统是可预测的。
一般来说,可预测程度的度量使用的是开始观察后的特定时刻的观察过程和模型之间的统计相关。接近一致的值相应于满意的预测,而小的值表明了观察和预测之间存在差距。所有预测模型都有一定的可预测行为的时间,超过了以后可预测性会减少,以不同速度趋向零。对于模型的改进可能使预测行为的时间有某种程度的扩展。但是,可预测的范围依赖于涨落参量。局域不稳定混沌系统中弱的微观扰动可以在短时间中达到宏观规模。因此,局域的不稳定性惊人地减少着对预测行为的改进。预测系统的预测水平,既不可能通过改进测量仪器也不可能通过精致预测模型来改进。当我们记起洛仑兹的大气模型,使用的是具有局域的和全局稳定性的非线性系统,我们就会意识到气象学家在获取有效的长期或甚至中期预测中遇到的困难。通过不断增加的计算机的能力,天气预报就会直线地进步,这是20世纪50年代的一种幻想。
随着非线性的模型运用于不同的研究领域,我们获得了对于振荡化学反应,物种、群体的涨落,流体湍流和经济过程的一般性洞察。例如,太阳黑子的形成,以前用时间序列的统计方法进行分析,它决非是一种杂乱的活动。它可以用非线性混沌系统来建模,具有几种特征的周期和奇怪吸引子,对其活动的预测是有限的。例如,在公共舆论形成的非线性模型中,我们可以区分出选举(“分叉”)前的可预测的稳定态与向稳定多数的转变,选举前两种可能的意见都没有受到偏爱,而不可预测的微小涨落却可能在很短的分叉间隔中引起突然的转变。这种情形使我们想起在沸腾水中气泡的形成:当一个气泡变得充分大时,它以其向上的方式稳定地生长是可预测的。但是,它的出现和初期的生长却是一种随机涨落问题。显然,非线性建模解释了现代民意测验中毕希娅们和西彼尔们的困难。
今天,非线性预测模型并不总能够提供比标准线性程序更好的、更有效的预测。它们的主要优点在于,对真实过程中的实际的非线性动力学的解释,对局域的短期预测水平的证实和改进。但是,为了通过求解方程而预测未来的行为,首先要构造起支配了时间t的观测的适当动力学方程。甚至在自然科学中,对于如地震那样的复杂领域的适当的方程是否能够推导出来也还不清楚。我们可以希望在计算机的存贮中放入一张典型的非线性方程的表,在观察过程中系数可以自动地得到调节。与对所有可能的相关参量进行穷竭式搜索的做法相反,学习式策略可以从粗略的模型出发,只经过一段相对短的时间的运行,就可以说明相对窄的值域中的少量参量。通过神经网络的学习策略,已经实现了对于短期预测的改进。以学习数据为基础,神经网络通过自组织程序可以权衡输入数据,并减少对短期股票行情的预测误差(图5.22a,b)。若只有一部分股票市场的顾问使用这种技术支持,他们会做得很好。但是如果股票市场上的所有代理人都使用同样的学习策略,那么预测就将成为某种自欺欺人的预言。
原因在于,人类社会不是分子或蚂蚁的复杂系统,而是具有高度意向性行动的存在物,具有或多或少的自由意志。一个特殊的自我实现的预言是俄狄浦斯效应。在此人们如同那个传说中的古希腊国王一样徒劳地试图改变他们的被预测的命运。从宏观的观点看,我们当然可以观察到一个个的个体以其自己的活动,对于代表看文化、政治和经济秩序(“序参量”)的社会的集体宏观态有贡献。然而,社会的宏观态当然并非只是对其所有部分的平均。它的序参量,以定向(“役使”)其活动、激发或抑制其态度和能力,强烈地影响着社会中的个体。这种反馈在复杂动力系统中是典型的。如果由于内部或外部的相互作用,环境条件的控制参量达到了某种临界值,宏观变量就可能运动到某种不稳定区域,在此高度发散的多种可能途径成为可能。微小的不可预测的微观涨落(例如为数很少的有影响人物、科学发现、新的技术),就可能决定了社会将在分叉处不稳定态的发散途径中取得何种途径。
7.2复杂性、科学和技术
尽管存在上述困难,我们仍然需要对于局部和全球的短期。中期和长期预测的可靠支持。从政治角度上看,一个最新要求是为科学和技术的未来发展建立模型,因为科学和技术已经成为现代文明中的一个关键性因素。实际上,这种发展似乎是在受科学思想和研究群体的复杂动力学支配,科学思想和科学群体是嵌在复杂的人类社会之网中的。研究群体的共同主题,长时期或短时期地吸引着研究人员的兴趣和能力。这些研究的“吸引子”,表现为支配科学家的活动,如同流体动力学中的吸引子和涡旋。当研究状态变得不稳定时,研究群体可能分解成追求特殊研究途径的小群体,它们可能会以获得答案而告结束,或可能再度分叉,如此等等。科学的动力学表现为由其复杂性不断增加的分叉树中的相变来实现。有时,科学问题得到了明确定义,并导致清楚的解答。但是,也有“奇怪的”和“扩散的”状态,如同混沌理论中的奇怪吸引子。
历史上,对科学成长的定量探索始于统计方式,如雷诺夫关于“18世纪和19世纪的西欧物理学发展中创造性的波型涨落”(1929)的工作。罗伯特·默顿从社会学观点讨论了“科学和技术中兴趣中心的变化”,皮特里姆·索罗金分析了15世纪以来科学发现和技术发明的指数增长。他强调,发明或发现的重要性并不取决于主观的判断,而是取决于由基本创新引起的相继科学工作的数量。早在1912年,阿弗雷得·洛特卡已经设想,借助于微分方程来描述诸如疟疾和化学振荡的传播的真正流通过程。在一篇1926年的文章中(《科学产量的频率分布》),他运用了关于科学思想传播的流行模型。首先是有一个“感染思想”中心,它以流行型波的形式感染了越来越多的人。因此,从认识论的观点看,科学领域的积累和集中就使用所谓的洛特卡分布和布拉特福特分布来建模,此模型开始于某些个体作者的若干篇文章,它们成为出版物群的核心。流行模型还应用于技术创新的传播。在所有这些例子中,我们发现了众所周知的逻辑映射的S曲线(图2.22a),即开始较慢,随后是指数增长,最后又是慢增长到饱和。显然,学习过程也是用S曲线的3阶段来描述的,即个体最初的成功学习较慢,然后是迅速的指数的增长,最后又是缓慢的趋近于饱和的阶段。
从统计分析转向动力学模型具有重大的方法论优点,即难以理解的现象如科学活动中的奇怪涨落或统计相关,都可以在计算机辅助的模拟实验中获得动态变化的图景。流行模型和洛特卡-沃尔特拉方程只是模拟科学共同体的耦合生长过程的最初尝试。不过,进化过程的基本性质如创造出新的结构要素(突变、创新等等),还没有得到反映。社会系统中的进化过程的描述,必须要包括不稳定的相变,新思想、新研究领域和新技术(如经济模型中的新产品)藉此取代掉已有东西,从而改变了科学系统的结构。在对艾根的前生物进化方程(参见3.3节)的推广中,科学系统的描述使用了一组可分清其数目的领域(即科学研究领域的子领域),其中每一领域都以一些占据的元素为标志(即科学家在特定的子领域中的工作)。自复制、衰退、交换和从外部来源的输入或自发发生等基本过程,都必须要建立模型。每一自复制或死亡过程,都仅仅改变某一个领域的占据状况。对于简单的无交换的线性自复制过程,一个领域的选择价值由该领域的“诞生”率和“死亡”率之差给出。当一个新的领域开始被占据,正是其选择价值决定了此系统对于此创新是否稳定。如果其选择价值大于任何此领域中的其他任何选择价值,新领域的生长就将超过其他领域,系统可能会变得不稳定。具有较高选择价值的新领域的进化,标志了一种简单的选择过程,它遵循达尔文的“适者生存”。
但是我们决不要忘记,这种数学模型并不意味着把科学活动还原为生物机制。进化方程的变量和常数并不涉及生物化学量及其测量,而是科学计量学的统计表。自复制对应于新的科学家加入到他所希望从事的研究领域之中。他们的选择受到教育过程、社会需求、个体兴趣、科学学派等等的影响。衰退意味着,科学家只在科学领域中活动有限的年头,科学家可能会因种种原因(例如年龄)而离开科学系统。领域迁移意味着科学家在科学领域的交换过程,它遵循迁移模型。科学家也许会偏爱具有较大吸引力的领域,此种领域表现为具有较大的自复制率。当过程包括了领域之间的交换,这些领域具有自复制和衰退的非线性生长函数,那么一个创新的选择价值的计算就是相当复杂的数学任务。一般来说,一个具有较高选择价值的新领域,是由系统对于相应扰动的稳定性来标志的。
实际上,科学的生长是一个随机的过程。例如,仅仅有几个先驱者投身到新领域的初始阶段,就是典型的随机涨落。科学子领域中可能占据密度的随机动力学,用主方程来建模,它使用由自复制、衰退和领域迁移的转移几率定义的转移算符。此随机模型,为科学生长过程的几种计算机辅助模拟提供了基础。相应的确定论曲线,作为对于大量一致的随机系统的平均结果,也被看作是趋势分析。结果,子领域的科学共同体的一般S形状曲线的生长规律,即具有缓慢的起始阶段、迅速生长阶段和炮和阶段,也在一些模拟中得到了证实。在一系列的模拟中(图7.3),假定了一个研究领域大约有120-160个成员。对于5个领域,选取了100个科学家作为起始条件,此起始条件紧接饱和领域。第6个领域还没有建立起来(其起始条件中成员为零)。在第一个例子中,已经对若干种情形,模拟了自复制过程对新领域生长曲线的影响。随着自复制率的增加,新领域以邻近领域为代价,增长得更加迅速。
新领域的形成可能会有更加共存或更加选择的趋势。起始阶段的生长可能会或多或少快一些,或者也可能被延缓。科学史上一个生长被延缓的著名例子是混沌理论本身,它在起始阶段只受到非常少的科学家的注意(例如彭加勒)。尽管新领域的数学原理是相当清楚的,但是其指数增长是前些年当计算技术可以处理非线性方程时才刚刚开始。有时,一个形成中的领域不可能成长为一个真正的科学领域,因为它与众多的环境领域相比仅仅具有弱的选择优势。遗憾的是,有些技术领域如能源的替换(例如风能、太阳能),就仍然处于这种可怜状态,它们被强大的传统的或核的能源工业所包围。如果一个新的有吸引力的领域出现了,就可以看到科学家从周围领域争相进来的现象。这些人们正在适应新领域的风格和问题求解模式。这种直接的领域迁移,有时导致了科学中的时髦现象。
众所周知,如果适当控制参量的增加使之超过一定的临界值,S形状的非线性逻辑映射就会产生出种种复杂动力学行为,如不动点、振荡、确定论混沌(图2.22)。显然,随机论模型和确定论模型都反映了科学生长的某些典型性质。这些效应是新领域的结构分化、缺省、创造、扩展,伴随着缓慢、消失、迅速生长、过度时髦和消退。对这些动力学效应的计算机辅助作图模拟中,可以用适当的序参量来标志,序参量能以科学计算数据为基础进行检验。在种种条件下的可能图景可以进行模拟,从而去预测未来发展的里程碑和领域。
但是迄今为止,对科学研究领域进化的建模,仅仅考虑了所选择的领域中科学人力的变化。科学生长的更合适的表示,必须要考虑到科学努力中的问题求解过程。但是,要找到一个合适的态空间来表示科学领域中问题求解的发展,是一个困难的方法论问题。在生物进化的数学理论中,物种只能用高维生物特征空间的点来表示(图3.4)。一种物种的演化相应于一个点通过表现型特征空间的移动。类似地,在科学系统中,也必须建立起科学问题的高维特征空间。科学文章的构型以引证数量中的多维尺度技术进行分析,用二维或三维空间的点来表示。研究问题常常用关键词(“宏观术语”)的序列来表示,关键词根据它们在科学叙述中出现或共同出现的频率来选取。
在连续的进化模型中,问题空间的每一点都用相应于所研究问题的矢量来描述(图7.4a)。问题空间由科学领域的所有科学问题构成,其中一些可能是未知的和还没有进入研究之中的。这种空间是距离空间,因为两点之间的距离相应于所表示的问题之间的主题关联程度。时刻t工作于问题q的科学家自身在问题空间的分布密度为x(q,t)。在此连续模型中,x(q,t)dq指的是在时刻t工作于“问题元”dq的科学家人数(图7.4b)。
因此,此研究领域可能相应于问题空间中种种关联点的密度云。在这些较大密度区域之间的单个点,相应于科学家工作于独立的研究问题,它们可能代表了可能的新研究领域的核心。科学史表明,一组研究问题成长为一个研究领域可能要花上数十年之久。在此连续模型中,领域的迁移过程以密度变化来反映:如果一位科学家从问题q变化到问题q’,则密度x(q,t)将变小,x(q’,t)将增加。科学家在问题空间的运动,用一定的生产-输运方程来建模。函数a(q)表示,在领域q中科学家通过自复制和衰退而生长的人数变化率。因此,它是一个在问题空间具有多个极大值和极小值的函数,表示了科学领域中的吸引力的增加或减小。类似于物理势能(例如图4.10),人们可以把a(q)解释为具有山地和低谷的吸引力势能地形,代表着研究领域的吸引子和停滞区(图7.4b)。
知识生长的动力学模型已成为科学计量学上可检验的。因此,它们可能在科学哲学及其科学生长概念、科学史及其科学文献评价之间架起桥梁。在认知计量学中,最近进行了一种尝试,对研究问题进行量化,并在由图书计量学的、认知的和社会的特征所构成的适当问题空间中,将它们表示出来。由波普尔、库恩等人提出的简化的科学史模式,就可能用可检验的假说来代替。库恩的具有“常规”科学阶段和“革命”科学阶段的不连续的序列,显然难以解决知识的生长问题。另一方面,某些历史学家的朴素信念,即认为科学的生长是永恒真理的不断增长,无论如何也是不适合于复杂研究动力学的。甚至波普尔的精致了的后期哲学,认为科学并非通过不可归约的已有定律的单极增长,而是通过假说和批判的学习策略而增长,也需要更精确和更明晰的历史地变化着的方法论、体制和组织的标准。现代计算机的计算能力不断增加,使我们能够在社会科学中进行新的模拟试验的定量探索。动力学模型的巨大优势在于,通过计算机辅助以图形方式显示出改变参数的多种形象。这些形象可能会确证。限制或反驳所选的模型。最后,我们的科学政策决策时同样需要可靠的支持。不同的未来发展图景可能会帮助我们决定,我们的有限的研究预算资源向何处投资,以及如何实现所希望的未来社会状态。
因此,非线性建模和计算机辅助的模拟可能使我们推导出多种未来,但是不可能提供一种在它们之中作出选择的算法。为了实现所希望的未来社会状态,常规的目标必须要包括进来。20世纪60年代以来,罗马俱乐部的一系列报告引起了一种国际性争论,涉及人类的目标和可选择的未来,并有定量的长期预测的支持。在7.1节中,我们看见了对于非线性世界进行长期定量预测的限制。结果是,政治决策不可能逼出科学思想和技术创新。但是,它们的发生或不发生却决不是完全随机的事件。我们需要工具来评价所希望的目标和它们实现的机会。
一种非定量的方法是所谓的德尔斐方法,它通过对专家组的咨询调查来帮助对科学技术的趋势进行决策和预测。“德尔斐”这个词涉及传说中的占卜家皮蒂娅(图7.1),据说她为了作出预言而收集有关顾客的信息。今天的德尔斐方法运用了科学专家的估计。每个专家之间保持隔离,使之判断不受社会压力或群体行为的影响。向每个专家征询,一定时期的可能的和(或)有希望的发明和科学突破的名称及其权重。有时,向他们征询的不仅仅是每一种发展的可能性,还要估计出每一种潜在发展的出现将对其他潜在发展的出现的影响的可能性。因此,人们就获得了一种相关的未来发展之网,这是可以用主观条件概率的矩阵来表示的。在下一阶段,专家被告知达成共识的项目。当他们被要求叙述出他们不同意大多数人的意见的理由时,若干个专家就会重新评价他们关于时间的估计,并排列出缩小了的每一种突破的范围。
当然,德尔斐方法不可能提供唯一的答案。但是,专家意见的分布情况集中了有关潜在的主要突破的大量信息。对多数人意见的偏离,应该在专家不受到巨大压力的情况下得到缩小。但是,德尔斐方法因此不可能预见意外之事。有时,德尔斐方法得到了相关树方法的支持,以从构造的决策构中的多种可能中选择出最好的方法。决策树方法运用了决策理论的思想,以评估一定未来的希望程度,并选择出有关的科学技术的领域,其发展对于实现这些目标是必需的。
显然,复杂的非线性世界没有唯一的预测和决策方法。我们需要某种整合的(“杂交的”)定性和定量方法的网络。最后,我们在运用这些工具和把握我们的未来时,需要有伦理学路标来指引我们。
7.3复杂性、责任和自由
近年来,伦理学已成为吸引力不断增加的主题,工程师、医生、科学家、管理者和政治家等各种人物对此都很感兴趣。引起这种兴趣的原因是不断增长着的环境、经济和现代技术问题、责任问题以及越来越多的警告,还包括对于高度工业化世界的批评的接受越来越少。但是我们必须意识到,我们的伦理行为标准并非从天上掉到地面来的,也并非是由某种神秘的巨大权威所诏示的。它们已经发生了变化,并将继续变化下去,因为它们植根于我们的社会文化世界的进化之中。
在人类社会的建模中,我们决不要忘记,这里面对的,是其中有着意向性活动的人的高度非线性复杂系统的自参照性。在社会科学中,有一种特殊的测量问题:对社会行为进行观察和记录的科学家自己也是他们所观察的社会系统中的成员。政治选举中的民意测验统计的效应,是一个众所周知的例子。再者,社会的理论模型可能具有规范性功能,会影响其成员的未来行为。一个众所周知的例子是19世纪的社会达尔文主义,它试图把人类社会的发展解释成一种生物进化的线性延续。实际上,这种社会理论激发起来一种粗暴的意识形态,它为历史上的社会、经济和种族的胜利者进行的无情选择披上合法的外衣。今天,有些时髦的是,用自组织的生物模型使基本民主和生态经济的政治思想合法化。但是,自然既不好也不坏,既不爱好和平也不穷兵黩武。这些都是人类的评价。经历了多少个百万年之久的生物策略,是以无数群体和物种——由于基因缺陷、癌症等等——为代价的,因此从人类的观点看,其间充满着其他种种残忍。它们不可能为我们的政治、经济和社会的发展提供伦理学标准。
在本书中,我们已经看到,历史上的生命、精神和社会模型,往往都是依赖于历史的自然概念和历史的技术标准的。特别是,线性的机械论因果现,在自然、社会和技术科学史上曾经是占支配的范式。它还影响了伦理规范和价值,对于它们的理解不能脱离产生它们的历史时代的认识论概念。认识论和伦理学的历史的相互关联性,并不意味着任何种类的相对主义和自然主义。对于科学理论和假说,我们必须把它们的历史的、心理学的发明和发现的内容,与确证和有效性的内容加以区分。甚至人权也有其意义变化的历史发展。黑格尔曾经主张,人类史可以被理解为“向自由的发展”。因此,在我们讨论一种复杂的非线性世界中的伦理后果时,我们需要简要回顾一下伦理标准的历史发展。
伦理学如同逻辑学、认识论、科学哲学、语言哲学、法哲学、宗教哲学等,是一门哲学学科。历史上,“伦理学”一词可以追溯到古希腊语中的nuo&,它原意是指习惯和实践。起初,伦理学被理解为关于道德习惯和风俗习惯的学说,目的是教会人们怎样生活。伦理学的中心问题也就是去发现一个好的道德准则,以忠告人们如何更好地生活,更正当地行动,以及更合理地决策。古希腊追随苏格拉底的哲学家们已经讨论了其中的一些基本概念。柏拉图,这位苏格拉底的学生,把苏格拉底对于更好地生活的探索推广为对于最大的善的普遍理念的追求,这种理念是永恒的、独立的历史生活,隐藏在短暂的、不断变化的物质世界背后。
亚里士多德批评他老师的永恒价值学,认为它忽视了真实的人类生活。在亚里士多德看来,善、正义和理性的有效性都涉及政治社会(城邦)、家庭和个人之间的相互作用。城邦中正义的实现涉及自由人的自然利益的比例或平衡。幸福就是人的最大的善,它的实现是按照城邦和家庭的自然习惯和实践而成功地生活。显然,亚里士多德的伦理学概念与他的有机自然观相适应,他的自然中充满着植物、动物和人类的生长和成熟。
在古希腊城邦解体以后,伦理学也就需要一种新标准框架。在伊壁鸠鲁的伦理学中,强调了个体生活、行动和感情的内在平等,而斯多葛派的伦理学则强调所有人的自然实现的外在平等。在基督教的中世纪,永恒价值的等级则是由神的世界秩序来保证的。在近代初期,普遍接受为伦理学基础的神学框架的解体时机就成熟了。
笛卡尔不仅仅主张一种机械的自然模型,他还主张一种以科学理性为基础的道德系统。巴鲁赫·斯宾诺莎推导出来一个理性主义道德公理体系,与确定论的、机械的自然模型相呼应。因为人们相信自然规律与理性规律的一致,人的自由也就仅仅意味着按照理性的确定论规律而行动。最大的善,也就是指理性对于质料性人体的情感的支配作用。霍布斯捍卫一种机械的自然观和社会观,但是他却怀疑人类的理性。政治规律和习惯都只能由集权的“绝对君主”来保证。最大的善是和平,即是处于某种极权主义国家的不动的、最终的平衡。
洛克、休谟和斯密的自由社会,则可以理解为类似于关于可分离的力和相互作用着的天体的牛顿模型。在美国和法国革命中,个体的自由被当作一种自然权利。但是在一个确定论因果关系的机械论世界中如何来论证个体的自由呢?甚至自然事件也不过是线性因果链的结果,原则上不可能从运动的力学方程中推导出来。只有人类才被假定能够自发地、自由地作出决策,激起因果行动链,而不受外部环境的影响。康德把这种人的特征称作“自由因果性”。
人们不受任何一个人的意见和愿望的支配,只有可以为所有人接受的忠告才被看作是合理的。用康德的话来说,只有那些被普遍接受的“准则”才可以被看作是普遍的道德规律。这个正式的道德普遍性原理,是康德的著名的理性范畴规则:我们的行动应该遵从这些规则,它们被正当地看作普遍的道德规律。个人的自由受到他(或她)的邻居的自由所制约。在另一处著名表述中,康德说,人作为一种自由动物不应该被误解为侵犯别人利益的工具。因此,除了受确定论规律支配的机械论自然界,还有一个具有自由和道德规律的内部理性世界。康德的自由伦理见解,已经融进了所有现代宪法国家的正式原则中。
但是,在真实的政治和经济世界中自由规律如何才能实现呢?在工业化的最初阶段,英裔美国人的功利主义伦理学(源于边沁和穆勒)要求对个人的幸福作出评判。多数人的幸福被看作是最大的伦理学的善。与康德建议的正式的个体自由原理不同,功利主义的幸福原理可以被解释为对于它的物质性完善。在美国宪法中,它被明确地解释为自然人权。功利主义的哲学家和经济学家把对于幸福的要求看作一种收益函数,即以优化的最小代价来实现多数人的最大福利。这种功利主义原理已经成为福利经济学的伦理学框架。
现代哲学家例如约翰·罗尔斯就认为,功利主义原理与康德的伦理普遍性要求结合起来,有助于实现现代福利政治中的公平分配的需要。从方法论的观点看,功利主义的伦理的、政治的和经济的模型相应于一种自组织的复杂系统,其中具有单个的平衡不动点,由社会收益函数的优化来实现,与实现多数人的物品的公平分配相联系。
显然,康德的伦理学以及英裔美国人的功利主义都是判断我们的行动的规范要求。它们可以为个体所接受,也可能不被接受。黑格尔主张,个体的主观的伦理标准是历史中的客观的历史过程的产物,是由社会的组织体制来实现的。因此,他把社会中个体的主观道德和主观理性与组织的客观道德和客观理性进行了区分。历史上,黑格尔的以市民社会的现实的习俗和道德为基础的伦理学,使我们想起亚里士多德的现实的古希腊城邦的伦理学。但是,亚里士多德的社会秩序是静态的,而黑格尔假定了一种国家及其组织体制的历史进化。
从方法论的观点看,值得注意的是,黑格尔已经把个体的微观水平与社会及其组织体制的宏观社会进行了区分,宏观水平不仅仅是其中公民的加和。而且,他把社会的进化描述为并非由单个个体的意向性和主观理性所决定的,而是由集体理性的自组织过程所决定的。然而,黑格尔相信的是一种颇为简单的进化模型,其相继的平衡态导致了一个最终的不动点,这个不动点是由一个公平的市民社会的吸引子所实现的。黑格尔以后的真实的历史过程表明,他的自组织的、以理性的历史力量推动人类社会到最终公平态的信念,是一个危险的幻想。众所周知,他的模型由右翼和左翼的极权主义政治家所修改和滥用。
弗里德里希·尼采抨击了这种客观理性信念以及作为唯心论意识形态的永恒伦理价值的信念,指出它们与真正的生活力量不相符合。尼采的生命哲学受到达尔文进化生物学的影响,它在19世纪末已经成为一种流行的哲学。尽管尼采已在他的著述中批判了民族主义和种族主义,但是他对生命和生存斗争的胜利者的颂扬却在我们这个世纪的政治中被严重误用了。然而,他另一方面表明了从自然科学中借用的概念影响了政治和伦理思想。
在我们这个世纪,马丁·海德格尔继续了尼采的虚无主义以及他对现代文明的批判。在海德格尔看来,人类的技术进化是一种没有任何取向的自动作用,这就忘记了人和人性的根本基础。如海德格尔这样的哲学家,不可能也不会改变或影响这种进化。他仅仅有容忍这种强加的命运的自由。但是,海德格尔是以什么方式来反对技术文明而不只是屈从、听天由命并逃匿到某种没有技术的、历史上从未存在过的田园诗式的乌托邦里去呢?看来,这是对于自然和社会中的拉普拉斯万能计划和普遍控制能力信念的极端反动。
本书中已经讨论过的复杂系统方式的伦理学后果是什么呢?首先,我们必须意识到,复杂系统理论不是一种形而上学的过程本体论。它也不是一种传统哲学意义上的认识论信念。这种方法论的原理,对于自然科学和社会科学中建构非线性复杂系统的模型,提供了一种启发性的图式。如果这些模型不能够进行数学处理,其性质不能够进行量化,那么我们得到一种经验模型,这样的模型也许与数据符合,也许不相符合。而且,它力图在奥卡姆剃刀的意义上最小程度地运用假设。因此,他是一种数学的、经验的、可检验的和有启发性的经济的方法论。而且,它还是一种跨学科研究纲领,结合了多种自然科学和社会科学。不过,它并非一种传统哲学意义上的伦理学信念。
然而,我们的自然和社会的复杂性非线性过程的模型,对于我们的行为却具有重要的影响。一般来说,在一个非线性复杂现实中,线性的思维方式是危险的。我们已经认识到,传统的自由概念是以线性的行为模型为基础的。在这种框架中,所有事件都是某种明确定义的起始原因的结果。因此,如果我们采取一种线性的行为模型,那么对一事件或结果的责任就显得是唯一地决定了。但是,由局部的亿万自私的人们的非线性相互作用造成了全球性危害的情形又怎样呢?记住,作为一个例子,我们需要的是一个良好均衡的复杂的生态和经济的系统。由于生态混沌可以是全球性的、不可控制的,一些哲学家例如汉斯·琼纳斯就主张,我们应该停止一切可能引起某些未知后果的行动。但是,我们却决不可能预见一个复杂系统的长期发展。难道我们因此应该后退到海德格尔那样的屈从态度上吗?问题在于,无所事事并不能必然地稳定一个复杂系统,却可能将它推进到另一种亚稳态。然而,对于复杂系统作出短期的预测则是可能的,例如在经济学中是可以作出努力来加以改进的。
在一个线性的模型中,人们相信结果的范围类似于它的原因的范围。因此,一个该受惩罚的行动,法律上的惩罚就是按照受损程度的大小来进行。但是,微小涨落的蝴蝶效应,最初不过是某个人、某个群体或某个公司引发的,最后却导致了某种全球性的政治和经济危机,对此又该怎样办呢?例如,考虑管理者和政治家的责任,他们的失误可能引起数以千计或数以百万计的人们的灾难。
人类的生态的、经济的和政治的问题都已经成为全球性、复杂的和非线性的问题,传统的个人责任的概念也就让人怀疑。我们需要的是新的集体行为模型,它们依赖于我们有着种种差别的一个个成员及其见解。个体的决策自由并没有被废弃,但却要受到自然和社会中复杂系统集体效果的制约,从长期看复杂系统是不可预测和不可控制的。因此,只有个人的良好愿望是不够的。我们必须考虑它们的非线性效果。全球的动力学相图提供了在一定环境下的可能图景。它们有助于实现合适的条件,去促进所希望的发展,并防止有害的发展。
例如,电子化的全球村可能意味着一种对于个人自由的严重威胁。如果在巨大的通信网络中容易获得公民的信息并对其进行评判,那么就必须老老实实地承认,这有被利益组织滥用的危险。如同在传统的物品经济学中,可能出现信息的垄断,而不利于其他的人们、阶级和国家。例如,考虑前面讲到的“第三世界”或“南方”,其信息服务系统没有那么发达,它们在一个全球性的通信村中就可能得不到公平的机会。
我们的医生和心理学家必须学会把人看作心和身的复杂非线性事物。线性的思维可能有损于作出成功的诊断。医疗中采取局部的、孤立的和“线性的”疗法,可能会引起负向的协同效应。因此,值得注意的是,对于复杂的医学和心理学情形进行建模必须要保持高度敏感性并谨慎从事,以治愈和帮助病人。复杂系统探究方式不可能给我们解释生命是什么。但是它向我们表明,生命是多么复杂和敏感。因此,它可以帮助我们自觉意识到我们生命的价值。显然,对于政治学、经济学、生态学、医学以及生物科学、计算科学和信息科学的伦理学,从复杂系统理论可以得到一些结论。这些伦理学结论强烈地依赖于我们关于自然和社会中复杂的非线性动力学的知识,但是它们并非是从复杂系统的原理中推导出来的。因此,我们并不捍卫任何的伦理学自然主义或还原主义。城市发展、全球生态、人的器官或信息网络的动力学模型,都仅仅是提供了有不同吸引子的可能图景。问题在于,我们应该评价出,哪个吸引子应是我们在伦理学上所偏爱的,并通过实现合适的条件而有助它的实现。伊曼努尔·康德在3个著名的问题中概括了这些哲学问题:
第一个问题涉及认识论,关系到我们的认识的可能性和限度。对于自然和社会的非线性动力学,复杂系统理论解释了我们能够知道什么和无法知道什么。一般说来,这个问题要求进行科学研究,以改进我们关于复杂性和进化的知识。
第二个问题涉及伦理学和对我们的行动的评价。一般说来,这个问题要求我们,在处理自然和社会中高度敏感的复杂系统时保持高度的敏感性。我们既不要冒进也不要后退,因为冒进以及后退都可能推动系统从一种混沌态变到另一种混沌态。我们既要谨慎也要积极,遵从进化中的非线性和复杂性条件。在政治上,我们应该意识到,任何一种单向因果性都可能导致教条主义、狭隘偏执和狂热盲信。
康德的最后一个问题是“我可以希望什么?”这涉及最大的善,传统上宗教哲学中是作为summum bonum(最大的限度)来讨论的。初看起来,它好像是超出了复杂系统理论的范围,复杂系统理论只允许我们在长期问题上导出某种总体图景,在特定条件下作出短期预测。但是,当我们考虑人类的长期的社会文化进化,人们为之奋斗的最大的善就获得了他们个人生命的尊严。这并不依赖于个体的能力、智能程度或由偶然的出生带来的社会优越性。它是一种人们在历史的斗争中的自决定的自由行动。在复杂性不断增加的继续进化中,我们必须尽力保护最大的善。
《复杂性中的思维物质》
克劳斯·迈因策尔著 曾国屏译
译者后记
20世纪初以来,相对论拓展了对广袤宇宙的追索,量子力学深化了向物质深层的进军,系统科学、非线性科学、自组织理论则代表着对复杂性的新探索。本世纪科学技术的突飞猛进,特别是80年代以来的新技术革命迅速地改变着我们赖以生存的物质条件,改变着我们的生活方式。
科学技术的新动向、新成就必然影响时代的社会生活、社会文化以及人们的思维方式。量子力学和相对论诞生以后,种种系统理论从20世纪中叶兴起,自组织理论于70年代前后问世,非线性科学80年代以来逐渐成为学术热点,90年代信息技术进入了新的发展阶段。探索和理解复杂性,成为走向21世纪的科学技术主旋律,必然对我们走向21世纪的思维方式产生深刻影响。
克劳斯教授的《复杂性中的思维》,从科学前沿探索与人类心智探险史的结合中,涉猎从物理世界的进化到生命世界的进化,从意识的起源到认知科学的兴起,从社会政治系统到社会经济系统的运行,从哲学史到哲学前沿的反思,阐述了探索复杂性将引起人们思维方式的变化,引起世人对共同未来的关怀。《复杂性中的思维》是一本扣人心弦的著作。
有鉴于此,当我完成《自组织的自然观》(北京大学出版社,1996)书稿后见到《复杂性中的思维》(第一版)时,有了将它译成中文出版的念头。在中央编译出版社、原书作者以及德国施普林格出版社的积极支持下,按《复杂性中的思维》第二版翻译的中文版,现在摆到了我国读者面前。
曾国屏
1997年元月于清华大学