人工科学
      H.A.西蒙
      前言
          本书象一部赋格曲,它的主题和反主题首先出现于我在大陆两端的两次讲学(其间
      相隔十年有余)。但是,现在主题和反主题交织在一起,成为本书整体的各章。
           1968年春,我受麻省理工学院卡尔·康普顿讲座之邀去进行讲学,这给我提供了
      一个将我大部分研究所围绕的一个论点表达清楚并发挥详尽的很好机会。我的研究首先
      是在组织理论领域,后来是经济学和管理科学,晚近是心理学。
           1980年,我又受加利福尼亚大学伯克利分校的H.罗恩·盖瑟讲座之邀去进行讲学,
      这次机会使我得以修正和扩充那一论点,并把它应用到几个新领域。
          这一论点是,某些现象在某种非常特别的意义上是“人工的”。即,这些现象之所
      以是现在这个样子,只是因为系统在目标或目的的作用下被改变得能适应它所生存的环
      境。如果说,自然现象由于服从自然法则而具有一种“必然性”的外观,人工现象则由
      于易被环境改变而具有一种“权变性”的外观。
          人工现象的权变性总使人怀疑将它们归于科学领域是否适当。有时候,这种疑问是
      针对人工系统的目的论特征以及由此产生的对施策(Prescription)与描述
      (description)加以区分的困难。我觉得,这不是实在的困难。真正的问题是要表明,
      怎么对人工系统居然还能提出经验命题,要知道这些系统在不同的环境下,也许会呈现
      与现在的样子很不相同的外观。
          约四十年前,我几乎是刚刚开始研究管理组织,就遇到了以几乎是纯粹的形式出现
      的人工性问题:……管理颇象演戏。好演员的任务是理解并扮好分配给他的角色,虽然
      不同的角色也许体现了大不相同的内容。演出的成功取决于剧本的成功和表演的成功。
      管理过程的成效随组织的成效和组织成员发挥其作用的成效而变。[《管理行为》,
      Administrative Behavior,252页]那么,怎样才能构造一种包含着比关于优秀表演的
      标准规范更多内容的管理理论呢?尤其是,怎样才能构造一种以经验为根据的理论呢?
      我的论述管理问题的著作,尤其是《管理行为》一书和《人的模型》的第四部分企图回
      答这些问题,它们指出:人工现象的经验内容,凌驾于权变性之上的必然性,源于行为
      系统对环境的适应不能够尽善尽美——源于我所谓的理性的局限。
          随着我的研究进入其它领域,我逐渐明显地看到,人工性问题并不是管理与组织所
      特有的,它影响着范围更广阔的学科。经济学既然假设了经济人具有理性,那么经济人
      就是非常老练的演员,他的行为可以反映环境加给他的一些要求,不过一点也反映不了
      他的认知构造。但是,这一困难必然超出经济学,延伸到与理性行为(思维、解决问题、
      学习)有关的所有心理学领域。
          最后,我开始发现,由人工性问题可以解释,为什么工程或其他专门职业难以用不
      属于本专业的支持性学科的经验材料和理论材料来补充本专业。工程、医药、商业、建
      筑、绘画这些职业关心的不是必然性而是权变性——不关心事物是怎样的,而关心事物
      可以成为怎样,简而言之,关心的是设计。创造一门或多门设计科学的可能性同创造任
      何人工科学的可能性一样大。这两种可能性要么并存,要么共消。
          我的这些论文试图说明人工科学何以是可能的,并试图说明它的性质。我主要以下
      面这些领域为例:经济学(第二章),认知心理学(第三、四章),计划和工程设计
      (第五、六章)。由于卡尔·康普顿不仅是一名杰出的科学家,而且是一名杰出的工程
      教育家,我想,将我对设计问题的诸结论应用于工程学课程体系的重建问题(第五章)
      不是不合适的。类似地,罗恩·盖瑟对系统分析法在公共政策制订中的应用的强烈兴趣,
      特别在第六章得到了反映。
          读者在本书讨论过程中将发现,人工性问题之引人入胜,主要是当它关系到在复杂
      环境中生存的复杂系统的时候。人工性和复杂性这两个论题不可解脱地交织在一起。因
      此,我才在本书中收入了一篇早些时候的论文“复杂性的构造”(即第七章)。我在两
      次讲学中只能简略提及的有关复杂性的一些思想,该文论述得较为详荆此文原载1962年
      12月召开的美国哲学学会会议的文献汇编。
          我想在书中适当地方的脚注里对一些人士表示特别的感谢。我尤其要感谢艾伦·纽
      厄尔。二十多年来,我工作的很大一部分是与他合作,本书也是题献给他的。如果他不
      同意我论点的某些部分,那么这些部分也许是错误的;但是,对于我论点的正确部分,
      他享有一大部分功绩。
          许多思想,尤其是第三章和第四章中的思想,源于我已故同事李·W.格雷格和我
      共同做的工作。其他一些同事,以及现在和当年的许多研究生,在文稿的许多页上留下
      了他们手指的润泽。这些研究生当中,我尤其要提及L.斯蒂芬·科尔斯,爱德华·A.
      费根鲍姆,约翰·格拉森,帕特·兰里,罗伯特·K.林赛,戴维·尼夫斯,罗斯·奎
      利恩,劳伦特·西克罗西,唐纳德·S.威廉斯和托马斯·G.威廉斯。他们的工作对这
      里讨论的题目特别有意义。
          第七章的以前几稿包括乔治·W.科纳、理查德·H.梅厄、约翰·R.普拉特、安德
      鲁·斯科恩、沃伦·韦弗和威廉·怀斯贡献的许多有价值的建议和资料。
          本书报道的大部分心理研究是国家心理健康研究所的公共健康服务研究补助金(代
      号MH——07722)所支持的。第五章和第六章报道的一些关于设计的研究,是由国防部
      长办公室的高级研究项目处资助的(代号SD——146)。这些补助金,以及卡内基公司、
      福特基金会和艾尔弗雷德·P.斯隆基金会的资助,使我们能在卡内基-梅隆大学进行了
      二十多年旨在加深我们对人工现象的理解的多方面的探索。
          最后,我要感谢麻省理工学院和加利福尼亚大学伯克利分校,它们给我提供了准备
      和发表这些演讲的机会,它们也使我对在这两个充满激励气氛的校园内进行着的人工科
      学的研究情况有了更好的了解。
          我要感谢这两个学校,还因为它们同意出版这个将各次讲演合成一体的集子。康普
      顿讲座的内容构成了第一、第三和第五章,盖瑟讲座的内容构成了第二、第四和第六章。
      由于本书的第一版(1969)获得了良好反应,我对第一、三、五、七各章的修改只限于
      订正几个明显错误、更新几桩事实和增添一些过渡段落。
          
       
      
          第一章 理解自然界和人工界
          距牛顿生活的时代约三百年后的今天,我们对自然科学这一概念已非常熟悉了,对
      物质科学(Physical science,指物理、化学、天文、地理等学科。--译注)与生物
      科学之熟悉则最无疑义。一门自然科学是关于世界上某一类事物——物体或现象——的
      知识体系:关于这些事物的特征和性质;关于它们的行为和相互作用。
          自然科学的中心任务是化令人惊异的事物为易于理解的常情:它要表明,如果正确
      地看待,复杂性不过是遮蔽着简单性的外表;它要发现隐藏在表面的混乱状况之后的规
      整模式。早期的荷兰物理学家西蒙·史蒂文曾用一幅漂亮的图画(图1)说明,由“永
      动不可能”这一点便可“自明”地得出斜面定律。经验和常识都告诉我们,图中的球链
      既不会向右旋转,又不会向左旋转,而将保持静止。(既然旋转不改变图中的一切,那
      么,球链不动则已,一动就会永久运动下去。)因为球链的悬垂部分是两边对称的,所
      以我们可以截去悬垂部分而不破坏平衡。截去这一部分后,长斜面一侧的球与较短较陡
      的斜面一侧的球保持平衡,球的数目与该侧斜面倾角的正弦值成反比。
          史蒂文对自己设计的斜面球链图甚为得意,就将它画入了一幅装饰图案,并在它的
      上方题写了: WONDER,EN IS GHEEN WONDER意思是:“多么神妙,但并非不可究其蕴
      奥。”
          自然科学的任务正是要表明令人惊奇的事物并非不可理解,要表明怎样才能理解令
      人惊奇的事物,但是并不使惊奇感丧失。因为,当我们解释了令人惊奇的现象,揭示了
      藏而不露的模式之后,又产生了新的惊奇感,我们惊异复杂性如何由简单性编织而成。
      自然科学与数学给人的美感与音乐和绘画给人的美感是同一的,都在于将只呈现出一部
      分的模式全部揭示出来。
          我们如今生活的世界,与其说是自然界,远不如说是人造界或人工界。环境中的几
      乎每一事物都留下了人工的痕迹。我们度过大部分钟点的环境的温度被人工保持在20摄
      氏度;我们所呼吸的空气的湿度被人工加大或减小;我们所吸入的不净物质基本上是人
      生产出来的(也是人在对它们进行过滤)。
          再者,对于我们之中的多数人——即白领工作者,大部分环境主要是由称为“符号”
      的一连串人工物构成的。我们通过眼睛和耳朵接收这些以文字和言语形式出现的符号,
      又通过口和手将它们注入环境——如我此刻正在做的。支配这些符号串串规律,决定何
      时发送符号、何时接收符号的规律,决定符号内容的因素,所有这些都是我们集体智慧
      的产物。
          有人也许反对说,我夸大了我们这个世界的人工化程度。人必须服从重力法则,就
      象石头必须服从重力法则一样;作为生物,人在食物以及其他许多方面必须依赖现实的
      生物界。我愿承认我犯了措词过分强烈的过失,但我要抗辩说,我并没有过分夸大。如
      果有人说,宇航员(或飞机驾驶员)服从重力法则,因此他就完全是一种自然的存在物,
      那么这一说法是成立的。但是,这样说就要求我们对“‘服从’自然法则”的含意作更
      精微的理解。亚里士多德并不认为重者上升轻者坠落是自然的(《物理学》,第四册),
      但是,很可能我们所理解的“自然的”比他所理解的更深刻。
          同样,我们应小心谨慎,别轻易将“生物的”等同于“自然的”。森林也许是自然
      的存在物;农场则肯定不是。人们赖以为食的物种——玉米、牛等等都是人类智慧的产
      物。犁过的田地隶属自然的程度并不比沥青路面街道隶属自然的程度更大,也不更校这
      些例子确定了我们的问题的条件,因为我们称为人工物的那些东西并不脱离自然。它们
      并没有得到无视或违背自然法则的特许。同时,它们又要适应人的目标和目的。它们之
      所以是它们现在这个样子,正是为了满足人们想飞翔或想吃得好些等等的愿望。人的目
      标变了,其创造物也随之而变。
          如果科学要涵盖这些体现了人类目标和自然法则的物体和现象,就必须具备将这两
      个不同部分联系在一起的手段。这些手段的性质及其对某些知识领域——经济学,心理
      学,尤其是设计学——的隐含意义,是本书所关注的中心问题。
          人工界
          自然科学是关于自然物体和自然现象的知识。我们问,是否可以有一种“人工”科
      学呢?即关于人工物体和人工现象的知识。不幸的是,“人工的(artificial)”这个
      词被贬义的气氛笼罩着,我们必须先驱散这种气氛方能继续前进。我的词典将
      “artificial”定义为“由人工而不是由自然产生的;不真实的或不自然的;矫揉造作
      的;与事物的本质无关的”。该词典提供的同义词有:矫揉造作的,虚假的,虚构的,
      假装的,虚伪的,冒充的,假造的,捏造的,不自然的。列举的反义词包括:事实上的,
      真的,诚实的,自然的,现实的,真实的,真挚的。我们的语言似乎反映了人们对自己
      的创造物的强烈不信任感。我不打算评价这种不信任是否站得住脚,也不打算探索其可
      能存在的心理根源。但是你们必须知道,我在使用“artificial”这词时尽可能用其中
      性意义,义为与“自然的”一词相对立的“人造的”。
          在某些场合,我们将“artificial(人工的,人造的)”与“synthetic(合成的,
      综合的,人造的)”区分开来。比如,我们称仿蓝宝石色彩的玻璃制品为人造
      (artificial)宝石,而化学结构与蓝宝石无法区别的人造宝石则称为合成
      (synthetic)宝石。与此类似,我们经常区别“人造”橡胶和“合成”橡胶。因此,
      有些人工物是自然物的模仿品。模仿品可以采用与自然物的构成相同的基本材料,也可
      采用完全不同的材料。
          一旦引入了“合成(或综合)”与“人工物”这两个概念,我们就进入工程学领域
      了。因为“合成的(综合的)”一词经常在更广的意义上使用,意思是“设计出的”或
      “由……组成的”。我们说,工程与“综合”有关,科学与分析有关。合成物或人工物,
      特别是具备人们所需特性的未来的人工物,是工程活动与工程技巧的主要目标。工程师
      (更广义地说,设计师)所关心的是事物应当如何,即:为了实现目标,为了具备功能,
      事物就应当怎样。因此,人工科学将与工程科学(science of engineering)非常相象,
      但与目前称为“工程学(engineering science)”的活动则大异其趣。本书第五章将
      讨论二者的区别。
          谈了目标问题与“应当怎样”的问题,我们也就引入了对立着的规范性与描述性的
      概念。自然科学找到了一条路子,能够排除规范性,只研究事物是如何如何的。当我们
      从自然现象转向人工现象、从分析转向综合时,还能够(或应该)继续排除规范性吗?
          我们至此已说明了区分人工物与自然物的四个方面,因此可以确定人工科学的范围
      了: 1.人工物是经由人综合而成的(虽然并不总是、或通常不是周密计划的产物)。
           2.人工物可以模仿自然物的外表而不具备被模仿自然物的某一方面或许多方面的
      本质特征。
           3.人工物可以通过功能、目标、适应性三方面来表征。
           4.在讨论人工物,尤其是设计人工物时,人们经常不仅着眼于描述性,也着眼于
      规范性。
          作为范型的环境
          让我们更深入地讨论一下人工物的功能方面或目的方面。欲达到目的或适应目标,
      则涉及以下三者之间的相互关系:目的或目标;人工物的性质;人工物的工作环境。如
      果我们从目的角度来看一只钟,则可借用儿童的定义:“钟就是告诉你时间的。”如果
      我们注意钟的本身,则可以从另一些角度来对钟加以描述,如齿轮的布置呀,弹簧力或
      作用于钟摆上的重力之利用啊,等等。
          但是,我们也可以就钟的使用环境来对钟加以考察。在阳光充沛的地区,日晷仪当
      钟使。然而,日晷仪在菲尼克斯比在波士顿更有用,而在冬季的北极则毫无用常十八世
      纪科学技术面临的艰巨挑战之一,便是要发明这样一种钟,它在颠簸摆晃的船上仍能指
      时,且指时的准确度足以帮助船员确定经度。要想在这么艰难的环境里走时,这种时钟
      就必须具备许多精巧的性质,其中某些性质对于陆上用钟是基本无用或完全无用的。
          在表征人工物的三者关系的三项当中,自然科学影响着其中两项:人工物自身结构
      及其工作环境。一只钟到底能否指时,取决于它的内部构造和它的安放场所。一把刀是
      否能切断东西,取决于制作刀身的材料和待切物体的硬度。
          作为“界面”的人工物
          我们可以从对称的角度来看这一问题。人工物可以看成是“内部”环境(人工物自
      身的物质和组织)和“外部”环境(人工物的工作环境)的接合点——用如今的术语来
      说就叫“界面”。如果内部环境适合于外部环境,或反之,人工物就能有利于实现预期
      的目的。因此,如果时钟不怕晃动,便可作为船舶的航行钟。反之,如果它经不住晃动,
      那我们还是将它放在家中的壁炉架上,装上船去反而把它毁了。
          请注意,这种将人工物看成界面的思想方法同样适用于许多非人工物。它适用于事
      实上所有可看作适应某种情形而存在的事物,尤其适用于在生物进化力的作用下进化至
      今的生命系统。
          一门以飞机为研究对象的理论可以借用自然科学来解释飞机的内部环境(例如动力
      装置)、外部环境(如不同高度上大气的性质)以及内部环境与外部环境之间的关系
      (如机翼在空气中的运动)。一门以鸟为研究对象的理论亦可用完全相同的方式分成几
      个部分。
          给定一架飞机,给定一只鸟,我们可以用自然科学的方法加以分析而不问其目的或
      适应性,也不考虑我所说的内部环境与外部环境的界面。毕竟,它们的行为同其他任何
      事物的行为一样,是受自然法则支配的。(至少,我们全都相信飞机的行为是受自然法
      则支配的,我们大部分人相信鸟也是这样。)功能解释从另一方面看,如果说内外环境
      的划分对于飞机或鸟的分析并非必不可少,但这种划分的结果表明,它至少能给人很大
      方便。这样说是有几条理由的,通过下面的例子就可以明白。
          北极的许多动物长着白色的皮毛。我们通常对此作出的解释是,对于北极的环境,
      白色是最佳色,因为白色的动物较之其他颜色的动物更不易被发现。当然,这不是自然
      科学的解释,而是借助目的或功能作出的解释。这种解释不过是说,在这样一种环境里,
      这样一些动物将“成功”,即生存下来。要将这一陈述变成解释,我们必须把自然选择
      或其等效机制的概念加到陈述中去。这种解释的一个重要特点是,它主要要求对外部环
      境的理解。看一看冰天雪地的环境,我们就能预知我们可能遇到的动物的主色;对于那
      些动物的生物学方面我们无需知道多少,只要知道这样几点就行了:它们经常处于相互
      敌对的状态,它们使用视觉线索指导自己的行动,它们是有适应性的(通过选择机制或
      其他机制)。
          理性在人类行为科学中的作用与自然选择在进化生物学中的作用是类似的。我们只
      要知道一个经营组织是利润最大化的系统,就经常可以预知,如果我们改变该组织所处
      环境的话,它将如何改变其行为——如果对它的产品收销售税,它将如何改变价格。有
      时,我们可以进行这种预测(经济学家不断地在做这种预测)而无需对适应机制(也就
      是构成了企业内部环境的决策机构)作出详细的假定。
          因此,在研究适应系统或人工系统时将内外环境分开的第一个好处是,只要对内部
      环境作极少的假定,我们经常就可根据对系统目标与对系统外部环境的了解来预测行为。
      由此立刻得到一个推论:我们经常发现,差异很大的内部环境在一样的或类似的外部环
      境中实现一样的或类似的目标——飞机与飞鸟,海豚与金枪鱼,钟摆驱动的时钟与发条
      驱动的时针,继电器与晶体管。
          从内部环境的角度来看,这种划分经常还有一个对应的好处。在很多情况下,一个
      特定系统能否实现特定的目标或能否适应环境,只取决于外部环境的些许几个特征,而
      与外部环境的细部根本无关。生物学家对适应系统的这种性质是很熟悉的,他们称此为
      体内平衡。多数优秀设计的一个重要特性就是体内平衡。设计者想方设法将内部系统与
      环境分离开,以使内部系统与目标之间的关系保持不变,不受表征外部环境的多数参数
      在大范围上变动的影响。船舶航行钟对颠簸只作出抵消性的反应,无论船怎么动,钟面
      上的指针与真实时间的关系保持不变。
          可以通过各种方式实现对于外部环境的准独立性:消极的隔离,反应性的负反馈
      (这是讨论得最频繁的隔离形式),预测性的适应,或上述几种方式的不同组合。
          功能描述与综合
          对于所有可能情形中的最好情形(至少对于设计者而言),我们甚至可以希望将已
      经描述过的两个优点结合起来。这两个优点是通过将适应系统分为目标、外部环境与内
      部环境而获得的。我们可以希望做到,表征系统的主要性质及其行为而对外部环境和内
      部环境的细节都无需详述。我们可以期待一门人工科学,其抽象性与普遍性主要依赖于
      界面的相对简单性。
          设想我们要设计一个物理装置作为计数器用的情形。假如我们要这个装置能计数到
      一千,那么它就必须能呈现至少一千个状态中的任一状态,能保持在任一特定状态,能
      从任一状态转换到“下”一状态。对于这样一种装置,有几十种不同的内部环境可供应
      用(并已经得到了应用)。一个每隔20弧分刻有一个槽口的轮子,与一转动和止住该轮
      的棘爪装置结合起来,就能达到目的。将十个电气开关适当地联接成串来表示二进制数,
      也可达到目的。如今,我们可能不用电气开关,而采用晶体管或其他固体器件。
          我们的计数器将由来自外部环境的某种脉冲(机械脉冲或电脉冲,根据具体情况而
      定)触动。但是,通过制作一种合适的内外环境之间的转换器,就可使内部脉冲的物理
      性质与外部脉冲的物理性质不发生关系。于是,该计数器就可对任何东西进行计数。
          从机巧装置的组织和功能方面——即内部环境与外部环境的界面——对机巧装置进
      行描述,是发明活动与设计活动的一个重要目标。下面的申请要点引自1919年的一次关
      于改进了的电动机调节器的专利,工程师们对这种语言不会陌生:我所声明是新颖的、
      并要求得到专利状保护的东西是: 1.在电动机调节器中,反转手段与通常起作用的电
      场减弱手段相结合,使上述电场减弱手段在电机启动时不起作用,电机启动后则起程度
      不同的作用,作用程度的大小可通过固定上述反转手段来确定……我们知道该发明与电
      动机的控制有关,除此之外,此处几乎没有提及确定的、具体的物体或现象,却提及
      “反转手段”和“电场减弱手段”,它们的进一步的作用在专利申请要点之前的一段文
      字里讲得很清楚:图示的这一特定型号电动机及其控制方法的优点对于那些擅长此行的
      人将是易于理解的。在这些优点中可以一提的是,该发动机起动转炬高,能迅速反转。
          现在,我们假设该电动机装在一合龙门刨床上(见图2)。发明人是这样描述其行
      为的:参见〔图2]。图上画出了调节器与电机M驱动的龙门刨床(100)的大略连接关
      系。这个调节器改动后,一方面控制电机M,另一方面受龙门刨床的往复床(101)自动
      调节。调节器的主轴上有一控制杆(102),连杆(103)将该控制杆与装在刨床架上的
      控制杆(104)连在一起,控制杆(104)一直伸出到往复床上挡块(105)与(106)的
      滑槽中去。可以理解,这样安排后,往复床的回向运动就能(通过上述连接方式)使调
      节器的控制轴在两个极限位置之间来回运动,从而影响反转开关(1)和(2)的选择性
      动作,也以上述方式影响其他开关的自动动作。
          这样,内部环境被赋予的性质就在外部环境中为实现目标服务了。电机将在滑床位
      置的控制下周期性地反转。电机行为(比如一个与电机有关的变量的时间路径)的“形
      状”将是外部环境(在本例中就是滑床上两挡块之间的距离)的“形状”的函数。
          我们刚刚描述的这一装置从微观上说明了人工物的性质。对于人工物的描述,最重
      要的是将内部系统与外部系统联系起来的目标。内部系统是一个能在某些环境里实现目
      标的自然现象组织。但是一般说来,有许多功能等效的自然系统都能实现这些目标。
          外部环境决定着实现目标的条件。如果内部系统设计得当,能适应外部环境,那么,
      内部系统的行为在很大程度上是由外部环境决定的,恰如“经济人”的情形一样。要预
      测内部系统的行为将是怎样,我们只需要问,“一个设计合理的系统在这种情况下会如
      何表现呢?”行为呈现的是任务环境的形状。
          适应性的限度
          但是,事情当然较之上面的叙述使人感到的要更复杂一些。“如果愿望是马匹,所
      有乞丐都会骑。”(这句谚语的意思是,愿望不象马那么听话,不是那么容易实现的。
      ——译注)如果我们总是能够确定这样一个变化自如的内部系统,它可以完全呈现出任
      务环境的形状,那么设计与发愿就变成同义语了。“在金刚石上划痕的手段”规定了一
      个设计目标,这个目标可以使用许多种不同材料来实现。但是,直到我们发现了至少一
      种服从普遍自然法则的、可实现的内部系统——对于本例,就是硬得足以在金刚石上划
      出痕来的材料——时设计才算完成。
          我们经常只能满足于近似地达到设计目的。那时,内部系统的性质就将“显现出
      来”。也就是说,系统的行为不仅要对任务环境作出部分响应,还要对内部系统的限制
      性作出部分响应。
          这样看来,早先描述的电机控制的目标,是使电机能“迅速”反转。但是,电机必
      须服从电磁定律和力学定律,因此,要难住这个系统也很容易,只要把它放在这样一个
      环境里,该环境所要求的反转过程之速是电机力所不及的。在良性环境里,我们对电机
      的了解只能限于人们要求它做的;在苛刻的环境里,我们就能了解一点它的内部结构—
      —尤其是内部结构中对功能发挥起了主要限制作用的那些内容。
          在通常的使用条件下,桥梁不过是一个比较平滑的表面,上面可以通行车辆。只有
      超载时,我们才能认识建桥材料的物理性质。
          通过模拟获得理解
          人工性含有这种意思:感受上类似而本质上不同,外表相象而不是内里相象。用前
      一节的术语来表述,我们可以说,人工物体是这样模仿实在物体的:它始终以同一面孔
      对着外部系统;相对于同样的目标而言,它能适应多种多样的外部任务。模仿之所以是
      可能的,是因为不同的物质系统可以被组织得表现出几乎一样的行为。衰减的弹簧与衰
      减的电路服从同样的二阶线性微分方程。因此,我们可以用这二者的任一个模仿另一个。
          模拟技术
          数字计算机由于其抽象性,由于它能处理多种符号,已大大地延伸了行为可被模仿
      的系统的范围。一般地,我们现在称这种模仿为“模拟”。我们试图通过在各种模拟的
      (或模仿的)环境里检验模拟物来认识被模仿的系统。
          模拟,作为一种获得认识和预测系统行为的技术,当然是先于数字计算机出现的。
      模型船坞和风洞以小仿大,是研究大系统行为的重要手段。我们确知,欧姆定律被发现
      是因为它与简单水力学现象类似而使欧姆得到了启发。
          模拟甚至可以采取思想实验的形式,这种实验事实上从不当真进行。大萧条年代在
      我记忆中留下的生动景象之一,是我父亲书房中的一张彩色图表。这是一个经济系统的
      水力学模型(货币和商品用不同的液体表示)。设计这张图的是一位名叫达尔伯格的具
      有技术统治论倾向的工程师。当时,这个模型尚未超出写写画画的阶段。但是,它可以
      用以描摹一些特定经济措施或经济事件的估计结果——只要模型依据的理论是对的!
          随着我受到的正规经济学教育的增多,我逐渐对那个幼稚的模拟看不上眼了,没想
      到二次大战后,一名杰出的经济学家A.W.菲利普斯教授真地建造了一个叫作莫尼亚克
      的水力学模型来模拟符合凯恩斯理论的经济。当然,菲利普斯教授的模拟体现的理论较
      之原先那个更正确些,而且实际建造了模型并开展了模拟工作——这两点是该模型的优
      胜之处。不过,莫尼亚克作为教具虽然有用,但它所能告诉我们的无一不可以从用简单
      的数学表现出的凯恩斯理论很方便地推断出来。结果,它很快就被越来越多的计算机经
      济模拟挤出了市常作为新知识源的模拟这个标题使我们面对一个关于模拟的重大问题:
      模拟怎么可能告诉我们一些我们尚不知道的东西呢?这一问题通常隐含着回答:不可能。
      事实上,在人们时常听见的关于计算机与模拟的两种断言(我马上就要利用它们)之间,
      存在着有趣的相似之处: 1.模拟不会比作为模拟的组成部分的假定更好。
           2.计算机只能做程序让他做的事。
          我不否认这任一断言,因为我觉得两个断言都是对的。但是,不管这两个断言怎么
      说,模拟确实能够告诉我们一些我们还不知道的东西。
          模拟是通过两种互相联系的方式提供新知识的,一种显而易见,另二种或许有点难
      以捉摸。明显的一点是,即使我们的前提正确,也许还是很难发现这些前提的含义。所
      有正确的推理都是同义反复语组成的漂亮的系统,但是,唯有上帝才能直接利用这一事
      实。而我们则必须从我们的假定吃力地理出结果来,而且很容易出错。
          因此,我们可以期望模拟成为一种强有力的手段,能根据关于支配着气体行为的机
      制的知识导出气象理论和天气预报方法。确实,正如许多人所知悉的,应用模拟技术的
      尝试已有好些年了。大大简化后的想法是这样的:我们已经知道了正确的基本假设,即
      局部大气方程,但是我们需要计算机来算出大量变数相互作用(从复杂的初始状况开始)
      的结果。这不过是将我们用代数法解两个联立方程时所采用的思想外推到现代计算机的
      规模上罢了。
          这种模拟方法在工程设计上有许多应用。因为,许多类设计问题的特征是,内部系
      统的组成部分的基本行为规律——力学的、电学的或化学的——都是人所熟知的。这种
      设计问题的困难之处经常在于预测这些组成部分的总体将如何表现。
          知之甚少的系统的模拟
          更有趣也更难以理解的问题是,当我们起初对支配内部系统行为的自然法则知之不
      多时,模拟是否对我们有所帮助。我要说明,为什么对这个问题的回答也必须是肯定的。
          首先,我要做一番简化问题的预备说明:我们很少对巨细无遗地解释与预测现象发
      生兴趣;我们通常感兴趣的只是从复杂的现实抽象出的几条性质。因此,虽说人造卫星
      毫无疑问是人工物体,但我们通常不把它看成是月亮或一颗行星的模拟物。它只不过与
      月亮等服从同样的物理定律,这些定律只与惯性质量与引力质量有关,而与卫星的其它
      许多性质无关。一颗人造卫星就是一颗月亮。类似地,从谢平港的原子能发电站输进我
      家里的电力并不是对燃煤电厂或风车产生的电力的模拟。麦克斯韦方程对二者都成立。
          我们越乐意对一组现象的细节进行抽象,就越容易模拟现象。再者,我们不必了解
      或猜测系统的整个内部结构,只需了解或猜测对于抽象有重大意义的那一部分结构就行
      了。
          幸好事情是这样。不然的话,过去三百年中构造自然科学时采用的自上而下战略便
      行不通了。我们对物质的总体的物理和化学行为有了很多了解,然后才有了关于分子的
      知识;对分子化学有了很多了解,然后才有原子理论;对原子有了很多了解,然后才有
      了基本粒子理论——假如我们现在确已具备这样一种理论的话。
          这种从顶层开始到尚未建成的基础自上而下建造科学摩天楼的方式之所以可能,是
      因为每一层次上的系统行为只依赖于对下面一个层次上的系统进行的非常粗略、简化和
      抽象的特征概括。这真是幸事。否则的话,桥梁和飞机的安全性也许要取决于看待基本
      粒子的“八重法”是否正确了。
          人工系统和适应系统具有一些性质,使得通过一些简化的模型对这些系统进行模拟
      特别容易。本章前一节对这些系统的特征描述说明了原因。如果,我们感兴趣的方面源
      于对系统各组成部分的组织,只与个别组成部分的几条特性有关,那么,类比系统的行
      为而不管内部系统的做法就特别可行。于是,对于许多用途而言,我们也许只对一种材
      料的抗张强度和抗压强度这样一些特征量感兴趣。我们也许对其化学性质根本不关心,
      甚至不问这种材料是木头还是铁。
          早先引用的电机控制专利说明了这种以组织性质为目标的抽象。该发明由“反转手
      段”与“电场减弱手段”结合而成,也就是说,由一些根据在组织化整体中的功能来区
      分的组成部分组成的。使电机反转,或减弱电机的场强,有多少种方式呢?我们可以用
      多种方式来模拟专利声明中描述的系统,而不用复制(哪怕是近似地)它画的那个实际
      物理装置。抽象程度再提高一点点,这个专利声明就可改写得既包括力学装置又包括电
      学装置。我想,卡内基-梅隆大学或麻省理工学院的每个学工程的大学生都能设计出一
      种体现了可逆性和可变起动扭矩的机械系统,来模拟专利所述的系统。
          作为人工物的计算机
          对于这种功能描述,没有什么人所设计的工具能有数字计算机那么方便。数字计算
      机确实是变化自如的,因为,计算机的各种性质中,几乎唯一能透过计算机的行为探测
      到(当它运行正常时;)的性质是组织性质。它进行基本运算的速度可以使我们对其物
      理元件和支配这些元件的自然法则进行一点推断;比如说,有了速度证据,我们就能排
      除掉某些工作速度“慢”的元件。至于除运算速度外的其他方面,人们对运行中的计算
      机所能作的任何有趣的陈述,几乎都与硬件的具体性质没有任何特别关系。一部计算机
      是许多基本功能元件的组织,在很高的近似程度上可以这样说,只有那些元件所完成的
      功能才与整个系统的行为有关。
          作为抽象物的计算机
          计算机的高度抽象性使得人们很容易地就将数学引入了计算机理论的研究,也使一
      些人得出了错误的结论,认为当计算机科学涌现之时,它必是数学性的而非经验性的科
      学。我来依次考察一下这两点:数学对于计算机的意义和对计算机进行经验研究的可能
      性。
          由约翰·冯·诺伊曼开了先河的一些重要理论思索,是围绕计算机的可靠性问题进
      行的。问题是如何用不可靠的部件建成一个可靠的系统。请注意,这个问题不是作为物
      理问题或物理工程问题提出的。假设负责元件的工程师已尽了最大努力,但部件还是不
      可靠,我们只有通过将这些部件组织起来的方式才能解决这一可靠性不够的问题。
          要把这转化成一个有意义的问题,我们必须对不可靠部件的性质再多说几句。我们
      已知,任何计算机都可以由一批简单、基本的元件装配而成。了解这一点对我们有所帮
      助。例如,我们可以以所谓皮茨-麦克库洛赫神经元作为最简单的元件。从名字就可看
      出,这些元件是类比脑神经细胞的解剖学特性与功能特性(人们认为脑神经细胞具有的
      特性)而设计出的,不过它们是高度抽象的东西。形态上,它们与最简单的几种开关电
      路(“与”电路、“或”电路和“非”电路)是同形的。假设我们现在要用这样的元件
      建一个系统,假设每个基本单元具有一个正确工作的确定概率,问题是要安排好这些元
      件及其相互连接,使得整个系统能可靠工作。
          对于我们现在的讨论很重要的一点是,元件可以是神经元,也可以是继电器;不用
      继电器,用晶体管也一样。支配继电器的自然法则是人所熟知的,而人们对支配神经元
      的自然法则的知识则很不完善。但那无关紧要。该理论所关心的只是,元件的不可靠性
      水平是确定的,元件以确定的方式相互连接。
          此例表明,能否就一个系统构造一门数学理论,能否模拟那一系统,并不依赖于对
      支配系统元件的自然法则是否已有一种管用的微理论。确实,这样一种微理论也许是根
      本不相干的。
          作为经验物的计算机
          下面我们讨论经验性的计算机科学(与计算机元件的固体物理学或生理学不同)的
      可行性问题。几乎所有已设计出的计算机都具有一些共同的组织特征,这是一桩经验事
      实。它们几乎都可以理解成一个主动的处理器(巴比奇所说的“磨坊”)和一个储存器
      (巴比奇所说的“仓库”),还有与这二者结合的输入输出设备。(有些较大的系统,
      多少是采取了藻类群集的方式,是由具有这些组成元件的一部分或全部的小系统装配而
      成。但是,或许我们可以暂时简化一下问题。)它们都能储存符号(程序),这些符号
      可由程序控制元件加以解释,并得到执行。几乎所有计算机的同时、平行活动能力都非
      常有限——它们基本上是“一心不二用”的系统。一般都需要先将符号从较大的存储单
      元里取出,送入中央处理器,然后才能对它们处理。这些系统只能从事简单的基本操作,
      即对符号进行记录、储存、复制、转移、消除和比较。
          既然现在世界上已有许多这样的装置,既然它们的性质似乎也与人的中枢神经系统
      有共同之处,那么就没有什么能妨碍我们写一部计算机的自然史。我们可以象研究兔子
      和金花鼠那样研究计算机,看它们在不同模式的环境刺激下会如何表现。由于它们的行
      为在很大程度上反映了我们所描述过的普遍的功能特性,而与其硬件的细节无关、我们
      就可以构造一个一般性的(然而是经验性的)计算机理论。
          为设计计算机分时系统所作的研究是将计算机行为作为经验性现象来研究的很好例
      子。当时,只有点滴理论可用以指导分时系统的设计,可用以预测一个具体设计型号的
      系统在用户(他们对该系统提出了种种要求)环境里到底会如何表现。大部分实际设计
      一开始时都有不少严重缺陷,对性能的大部分预测是惊人地不准确。
          在这种情况下,研制和改善分时系统的主要路子就是先建一些系统再看看它们的行
      为是怎样的。人们正是这样做的。他们循序渐进地建造、改动和改进计算机。或许,理
      论本可以预见到这些实验的结果,使这些实验成为不必要的。但事实不是这样。在对这
      些极其复杂的系统相当熟悉的人当中,我不知道有谁对理论如何可以预见实验结果的问
      题能说出非常具体的意见来。要理解这些系统,就必须先把它们造出来并观察其行为。
          类似地,设计来做游戏或求证数学定理的计算机程序是在极其广大、极其复杂的任
      务环境里生活的。即使这些程序本身的规模和复杂性不过适中(较之大计算机的监控器
      与运算系统),但是,由于对任务环境知之甚少,还是不能准确预测这些程序的性能优
      劣如何,它们搜索问题解法的选择性如何。
          这里也一样,理论分析必须伴以大量实验工作。报道这些实验的文献日益增多。关
      于试探法器件在减小有待搜索的问题空间方面的试探能力的大小,这些文献已开始给我
      们一些精确的知识。比如,在定理证明方面,试探能力的研究已取得一系列进展(赫伯
      朗定理,分解原理,支援集(set-of-support)原理等等的应用),这些进展是以经验
      性探讨为基础并受其指导的。
          计算机与思想
          随着我们关于计算机的理论知识和经验知识的不断拓宽和加深,我们将发现,计算
      机的行为在很大程度上受一些简单的普遍法则支配,计算机程序表现出的复杂性在相当
      大的程度上是环境(程序正试图使自己的行为适应它)的复杂性。
          如果这一前景能够实现,那就为计算机模拟打开了一条极其重要的路子,计算机模
      拟将成为深化对人类行为的认识的工具。因为,如果说主要是元件的组织而不是元件的
      物理性质决定着系统的行为,如果说计算机多少是按照人的形象创造出来的,那么,计
      算机就成了探索关于人类行为的不同组织假定的影响的明显手段。不等神经生理学解决
      元件设计的问题,心理学就可以上场了--不管那些元件是多么能引起兴趣,多么值得
      注意。
          符号系统:合理的人工物
          计算机是称为符号系统(说得更明白点,是物质符号系统)的重要人工物族中的一
      员。该族的另一重要成员是人的智力和大脑,我们有些人则认为这是最重要的成员。本
      书主要关注的就是这族人工物,特别是人的智力和人的大脑。符号系统几乎是完美的人
      工物,因为,适应环境便是它们的全部存在理由。它们是目标寻求型的信息处理系统,
      通常为容纳了它们的更大系统服务。
          符号系统的基本能力
          一个物质符号系统包括一组称为符号的存在物。这些存在物是能够作为符号结构
      (有时称为“表达式”)的组成部分的物质模式(如黑板上的粉笔痕迹)。我在计算机
      例子中已经指出,一个符号系统也具备一些对符号结构发生作用的简单程序,这些程序
      产生、修改、复制和消除符号。物质符号系统是一架机器,它一边历时运动,一边产生
      出发展着的符号结构。符号结构能够(而且通常确实)作为它正试图去适应的环境的内
      部表象(如“心象”)。有了这些符号结构就可模拟环境(且不管模拟的真实性是大是
      小,模拟得细致还是粗糙),从而对环境进行论究。当然,要使这种能力对符号系统有
      用处,系统就必须具有向外界打开的窗口,也必须具有手。即,系统不仅要有从外部环
      境获得信息的手段(这些信息可以经编码成为内部符号),还要有产生信息的手段(这
      些信息主动作用于环境)。于是,系统必须使用符号来标明系统之外的世界之中的物体、
      关系和行为。
          符号也可以标明符号系统能够解释和执行的程序。因此,支配符号系统行为的程序
      可以储存在系统自己的存储器中(同其它符号结构一道),受到激活后便被执行。
          符号系统前冠以“物质”二字是为了提醒读者,它们是作为实在世界的手段而存在
      着。有的符号系统由玻璃和金属制成(计算机),有的由血肉组成(大脑)。过去,我
      们比较习惯于认为数学和逻辑的符号系统是抽象的、没有形体的,而不考虑纸、笔、人
      脑这些东西。事实上,必须有它们才能赋予符号系统生命。计算机将符号系统从柏拉图
      的理念天国输运到发生着实际过程(完成这些过程的是机器或大脑,或协同工作的两者)
      的经验世界来了。
          作为计算法的智力
          下面三章着重讨论以下假说:智力是符号系统的产物。稍微叙述得正式一些,这假
      说是:我刚才描述的那种物质符号系统具有表现出广义智力行为的充分必要手段。
          该假说显然是经验性的,其真伪有待在证据面前判断。第三章与第四章的一项任务
      便是评价一些证据,这些证据可分为基本的两类。一方面,我们构造一些确实能表现出
      智力行为的计算机程序,为假说的充分性提供了证据。另一方面,我们收集了一些关于
      人类思维过程的经验资料,这些资料有助于表明,人脑是作为一个符号系统工作的。这
      就使假说所要求的必要性更能站得住脚了,因为这些资料意味着,所有已知的智力系统
      (大脑和计算机)都是符号系统。
          经济学:抽象的理性
          在将人类智力作为物质符号系统的产物加以考察之前,第二章介绍了一个抽象化和
      理想化的壮举——被现代经济理论(特别是所谓新古典经济理论)奉若神明的人类理性
      的理想化。我们之所以说这些理论是一种理想化,因为它们的主要注意力是人类思想的
      外部环境,是对于实现适应系统的目标(效用或利润的最大化)而言的最优决策。它们
      试图确定,在外部环境规定了的情景中,什么样的决策算是实质上合理的。
          理性受到内部环境的限制,受到物质符号系统的特征的限制。经济理论对此的态度
      往往是实用主义的,有时甚至是机会主义的。在对一般均衡进行比较正式的分析时,在
      研究适应性的所谓“合理估计”方法中,几乎都将“信息处理系统也许只有非常有限的
      适应能力”这一可能性给忽略了。另一方面,在讨论市场机制基本原理时,在关于不确
      定状况下的决策的众多理论中,理性的过程方面得到了更认真的处理。
          第二章,我们将见到忽视理性限度和关心理性限度两方面的例子。讨论了经济学的
      理想化之后,在第三章与第四章,我们转而对思想的内部环境——在象大脑这样的物质
      符号系统的参数所强加的约束条件内实际发生的思想过程——进行更为系统的研究。
          
       
      第二章 经济合理性:适应性的手段
          稀缺性是生活的重要事实。就我们对资源(土地、资金、燃料、时间、注意力等)
      的使用而言,资源是稀缺的。分配资源是理性所要完成的一个任务。经济学学科最关心
      的就是这一任务的完成质量如何。
          在所有社会科学中,经济学以最纯粹的形式表现了人类行为中的人工成分。它是在
      三个或更多的层次上表现的:个别活动者的层次(经济人或企业),市场层次,整个经
      济的层次。在三个层次上,外部环境都是由现有的技术,由其他经济活动者、其他市场
      或其他经济的行为所确定的。内部环境由系统的目标,由系统表现出合理的、适应性的
      行为的能力所确定。
          经济学能非常好地说明,外部环境与内部环境是如何相互作用的,尤其是,智力系
      统对其外部环境所作的调整(它的本质合理性)是如何受其发现特定适应行为的能力
      (它的过程合理性)的限制。
          经济活动者
          初级课本中出现的那种企业理论说:由“企业家”管理的公司以追求最大利润为目
      标,但公司所处环境很简单,公司的计算能力不成问题。一家出产小器械的公司,有了
      将支出额与产品产量联系起来的或本曲线,有了将收入额与产品销量联系起来的收入由
      线,便多少能对产销进行控制。目标(利润最大化)完全确定了公司的内部环境;成本
      曲线和收入曲线确定了公司必须适应的外部环境。我们立刻能推断,理性的企业家将选
      择能造成总收入与总成本的最大正差的产量。给定成本曲线和收入曲线,任何学过微分
      学基础的人都能求出这个最优值。只要简单地求个导数,令导数为O,然后将作为因变
      量的该产量求出。
          上一章中我们所谓的人工系统的所有要素都在这里了。该系统适应一个外部环境,
      它只受自己的内部环境所确定的目标的支配。要预言它的行为,我们需要关于外部环境
      和目标的信息,但不需要计算最优产量所用过程的知识。在前面,我把适用于这种场合
      的合理性概念称为本质合理性,与过程合理性相对(当适应过程本身有问题时,就需要
      过程合理性了)。
          我们可以对关于公司的这一梗概理论在许多方面进行扩充,对它作出实证的(描述
      公司的行为会是怎样)或规范的解释(指导公司如何实现利润最大化)。事实上,在商
      学院和大学里,经济理论的这两个方面都是教给学生的。有一次,当我怀疑这个理论对
      现实公司行为的描述的真实性时,一位同事说:“呃,如果学生们现在不是象理论所说
      的这样行事的,那么,等他们从这里毕业出去后就会这样行事。”这真是一个自我证实
      的理论。
          规范理论
          让我们先在规范性的道路上走一会儿。人们是怎么利用理论来提出建议的,我不大
      相信,任何有牟利动机的公司,在选多大产量以使收入与费用之差最大的问题上还需要
      指教。如果我们更仔细地询问公司是如何着手求得那个使利润最大化的产量的,这个规
      范性的问题就变得有趣了。有了工厂运营历年的成本会计帐目,便可以估计一条成本曲
      线,而确定某一批产品定多高的价格才能卖出去,这一问题则可能较为困难。至多只能
      估计一下概率分布,而公司则也许要问,它应当将利润预期值最大化呢,还是寻求利润
      最大化与风险最小化之间的折衷方案(这种方案与潜藏在企业家内心深处的影子般的
      “效用函数”相应)。
          在实际生活中,这个小器械公司不仅要选择产量,也要选择质量——或者说,用普
      通工厂设备便可制造的各式器械的花色品种。现在必须决定,应如何分配工厂机器以生
      产最有利可图的器械组合。这样,我们就从用作教科书例子的非常简单的公司模型一步
      步地走向现实经营界中现实公司的复杂情形。随着我们一步步地走向现实,规范性问题
      就渐渐地从找到正确的行动路线(本质合理性)转变为找到计划那一行动路线的方法了
      (过程合理性)。
          过程合理性
          如果说,忠实地模拟现实世界使成本收入关系(公司的外部环境)变得极其复杂,
      那么,这样做也给内部环境引入了相应的复杂性。因为,适应性的内部限度包括外部环
      境的不确定性(收入曲线与成本曲线的实际水平)和根据那些事实来解最优化问题的现
      有计算能力的限度。公司的规范理论成了在不确定状况下作估计的理论,成了计算的理
      论。它们决不是浅薄的理论,因为信息模糊性和计算复杂性都在增加。
          如今,好几个应用科学的新分支都有助于公司获得过程合理性。其中之一是运筹学
      (又名管理科学);另一分支是组织理论。运筹学为处理困难的多变量决策问题(有时
      涉及不确定性)提供了算法。线性规划的单纯形方法就是这样一种重要算法;排队论是
      另一算法;库存控制与产量平滑的线性决策规则则是第三种。现在,这些算法与类似的
      计算程序广泛地应用于经营决策中。
          这些有力的算法给了决策问题一个足够坚固的数学结构,以致只需一定量的搜索
      (在计算机帮助下,人花不了多大力气就可完成这一搜索),便能找到解法,即使有几
      百个或几千个变量。例如,在线性规划中,简化问题的关键假定是:准则函数(效用函
      数)、所有约束条件以及变量之间的其他关系都是线性的。对于线性决策规则,关键假
      设则是:准则函数是二次函数,系统中的动态关系由线性微分方程表示。只要这些假定
      确切成立,接受对问题的数学结构的这些严格限制,就使我们能计算出“最优”决策来。
          当然,对于简化了的模型是最优的决策在现实世界中很少是最优的。决策者有二重
      选择,一种是想象的简化情景中的最优决策,另一种是与复杂的现实世界更接近的情景
      中的“足够好的”、令人满意的决策。试探法技术对问题结构的要求比线性规划或线性
      决策规则的要求要低得多,但该技术一般只能求得令人满意的方案,而不是最优方案。
      不过,试探搜索能处理一些组合问题(如生产排程问题)。这些问题太大,即使最大的
      计算机也求不出精确解。有些人除了自己的头脑外别无任何计算机帮助,因此,为了求
      得即使是近似的解,他们也要做大量的简化。对于他们来说,试探式搜索法是解决问题
      和制定决策的一种特别有力的工具。
          运筹学这一数学工具迄今主要是用于中层管理的经营决策:生产作业计划,库存控
      制,最优产品组合或投入组合的选择,仓库选址,等等。关系到公司的长远未来的各种
      高层管理决策——总的投资政策,研究与发展规划,专业化与多样化,管理人才的招募、
      培养与留用——仍旧主要靠传统方法来应付,也就是说,依赖于经验丰富的经理的“判
      断”。
          这并不是说高层决策不能形式化。但是,事实上,形式化必然将现实世界情形的本
      质方面抛在一边。更糟的是,形式化必然要以一些无法测量的参数与变量为出发点。不
      确定性、计算复杂和缺乏可运算性一直是将运筹学方法延用至高层管理的主要障碍。人
      们关心的定性问题经常无法用经典的运筹学模型来反映,因为人的思维与决策并不象运
      筹学技术那样依赖数字。既适用于非数字信息又适用于数字信息的试探式搜索法则有着
      更为广阔的应用范围。我们在下面两章将认识到,它实际上是人类解决问题的主要工具。
          令人满意
          一个人将不去做他不能做到的事,无论他多么想做。规范经济学表明,对现实世界
      的较大规模的最优化问题,人们现在还拿不出(在最近的将来也拿不出)精确的解法。
      面对这一困难,现实世界的公司转向这样一些程序,它们对最好解答不可知的问题求得
      足够好的解答。规范微观经济学证明了现实世界的最优化不可能,从而也就表明,经济
      人实际上是可满足的人,即接受“足够好”的方案的人。这并不是因为他的要求低,而
      是因为他别无选择。
          这一结论并未解决下面的问题:寻求满意与寻求最优的区分是否重要?经济决策问
      题的可获得的近似解与不可企及的最优解是否差得那么远,以致我们在描述性的经济学
      当中,也必须重视这二者的差异?尤其是,经常有人这样认为:对于分析整个市场或全
      部经济的目的而言,二者的差距无关紧要,采用最优化模型是有道理的(尽管承认该模
      型的假定是不现实的)。我认为,二者的区分不但重要,而且非常重要,但若在这里评
      论认为二者差距不重要的老调子就偏离我的主题了。我的主题是要表明,人工系统的行
      为如何会受到系统适应能力限度的强烈影响。
          市场与经济
          传统经济理论的兴趣中心不是个别消费者或个别公司的行为。经济学主要关心的是
      更大的人工系统:经济及其主要组成部分——市常市场的社会功能是协调众多的个别经
      济活动者的决策与行为——是保证运往市场的汤菜量与顾客将购买食用的汤菜量之间保
      持某种合理关系,保证生产汤菜的成本与能够卖得出去的价格之间保持一种合理的关系。
      任何社会,只要不是自然经济,只要存在着大量专业化和分工,都需要一些机制来完成
      这种协调功能。
          然而,市场不过是许多协调方法中的一种。没有哪个社会是完全依赖已有各种协调
      机制中的单独任何一种机制的。对于某些目的,统计学提供了协调行为模式的合适基矗
      比如说,公路规划依赖于对公路使用情况的估计,而这种估计又取决于统计上稳定的驾
      驶行为模式。
          对于其他一些目的,社会也许依赖讨价还价和谈判过程来协调个体行为,比如,促
      成雇主与工会在工资问题上达成协议,形成合法多数,等等。当只涉及两个方面或为数
      不多的方面时,讨价还价过程也许是不可避免的,但很麻烦,因为讨价还价过程通常不
      能提供一种决定如何解决的独特方式。这些过程之所以被采用,一般是由于在利益冲突
      比较剧烈的情况下缺乏更好的方案。
          社会还采用等级组织(经营组织,政府组织,教育组织)在另一些方面起协调作用。
      这些组织的正式权力直线关系是从上至下的。最后,有些社会采用五花八门的投票程序
      来制定某些重要决策或选择掌权人。
          虽然在几乎任何社会中,都可以发现统计平均法、市尝讨价还价、等级制和投票表
      决这些组成协调系统的单元,但在这些方法的结合采用以及应用这些方法去解决的社会
      分配任务的性质方面,国家与国家、文化与文化之间是很不一样的。比如,在协调经济
      活动方面,资本主义国家中市场的作用比较突出,而在社会主义国家中等级组织起的作
      用最大。但是,若用这个公式来描述现实就太简单化了,现实中各种协调机制总是结合
      采用的。资本主义社会的经济单位主要是公司,而公司本身就是一种等级组织(有些规
      模很大),在公司内部运营当中只略微利用一点点市场机制。相反,在社会主义国家中,
      为了取得行业间协调,利用市场价格代替等级控制的程度越来越大。无论在资本主义社
      会还是在社会主义社会,讨价还价过程,甚至投票表决过程,都在大量发生着。不过资
      本主义国家的投票表决过程较之社会主义国家要公开得多,正式得多。
          看不见的手
          经济学在考察各种社会调节过程时,给予市场机制头等地位——有时几乎是排斥其
      他一切的地位。市场机制确实是了不起的机制。在许多情况下,它能造成这样一种局面:
      只根据自己的私利行事的无数人的消费、购买和销售行为产生的资源分配结果是清除市
      场的(clear markets),也就是说,经济生活中所耗用的汤菜以及所有其他商品的生
      产与消费之间确实达到了平衡。
          要达到这样一种平衡,只需要满足相对说来很弱的条件。主要必须满足的条件是,
      供过于求时价格下跌,生产量和供应量随价格降低相应减少。具备这些性质的动态系统
      可以形成许多许多个。这些系统将寻求平衡,并围绕平衡点在一定幅度的条件范围里振
      荡。
          在当代新古典经济学中,对价格机制提出了强得多的要求,不仅要求它能清除市常
      如果某些相当强的假定(主要是完全竞争的假定与经济活动者追求利润最大化或效用最
      大化的假定)得到了满足,则可以严格证明,市场所产生的平衡将是最优的(这里的最
      优是在以下意义上说的:不可能偏离平衡而同时使每个人的境况变得更好)。这些就是
      人所熟悉的、著名的竞争平衡存在定理和帕累托最优性定理。阿罗、德布劳、赫维茨和
      其它一些人已经将这些定理非常漂亮地形式化了。
          就现实世界的市场而言,帕累托最优定理不大能使人信服,因为这几个命题要求本
      质合理性,而我们在讨论公司理论时已发现这种合理性不大站得住脚。由寻求满意而不
      寻求最优的消费者和生产者所占据的市场并不满足这些定理赖以立足的条件。因此,我
      想着重讨论经济系统的市场清除性质,而不是系统平衡位置的最优性所要求的东西。这
      正如人们对一只跳舞的狗所下的评语:“奇迹并不是它跳得很好,而是它居然会跳”。
      只要允许人们按照互相同意的价格交换商品,就能使许许多多人的生产活动与消费活动
      纳入模式化的模序。人们可以对此感到惊异,但并不要求模式具备最优性质。
          我们已经习惯了这种观念:象人体这样的自然系统或生态系统是自我调节的。为了
      解释这种调节,我们寻找反馈环而不是寻找中央计划与指导机构。但是,不知为什么,
      这种关于无需中央指导的自我调节的直觉认识没有移用到人类社会的人工系统上来。多
      年前我曾给建筑学专业的学生教过城市土地经济学,当我指出中世纪的城市是模式化非
      常强的系统,然而这些系统大多是响应人们的许许多多个别决策而“生长”出来的时候,
      他们总是表示惊讶与不信,这种情景我至今记忆犹新。在我的这些学生们看来,模式就
      意味着有一个计划者。模式总是先在此人的头脑里构思出来,又经他的许可着手实现的。
      城市竟能象雪花一样“自然而然”地获得模式,这一观念是他们所陌生的。他们对这一
      观念的反应正象许多基督教原教旨主义者对达尔文进化论的反应一样:不存在没有设计
      者的设计!
          当马克思主义的原教旨主义者把在东欧建设新型社会主义经济的任务承担起来之时,
      也作出了类似反应。他们花了约三十年时间才认识到,市场与价格在社会主义经济中可
      以起建设性的作用,它们在资源分配方面甚至比中央计划更具优势。即使在今天,人们
      也还没有完全吸取这一教训。二次大战后,将这一异端邪说引入波兰的先驱者之一是我
      从前的老师奥斯卡·兰格,他为宣传这一观念,不顾自己的事业发展与生命受到威胁。
          市场过程之所以受欢迎,主要是因为它们避免了给中央计划机构加上计算的重负,
      这种重负是中央计划机构承担不起的,即使它们有最大的计算机的得力支持。市场过程
      使得将决策任务分给许多活动者成为可能,从而减轻了对信息与计算的要求,因为那些
      活动者最可能掌握对他们的决策有意义的信息,这些信息大部分来源于当地。
          对市场机制特征的概括,没有比弗里德里希·冯·哈耶克做得更好的了。他在第二
      次世界大战后的几十年中,是解释与辩护市场机制的领袖。他的辩护理由主要倒不是说
      通过市场机制可以实现最优状态,而是说人的内部环境受到了限制——人的计算能力是
      有限度的。在他1945年发表的著名文章“社会中知识的应用”中,他雄辩地阐述了理由:
      当我们试图建立一个合理的经济秩序时,我们想解决的问题是什么呢?根据某些熟悉的
      假定,回答是十分简单的。如果我们具备一切有关的信息,如果我们能从一给定的偏好
      系统出发,如果我们掌握关于现有手段的完全的知识,那么剩下的问题不过是纯粹的逻
      辑问题……任何两个商品或要素的边际替代率在这些商品的所有不同用途中必须是一样
      的。
          然而,这断然不是社会面临的经济问题。而我们为解决这一逻辑问题而发展起来的
      经济演算,虽然是朝向社会经济问题的解决跨出的重要一步,却并未对如何解决问题提
      供答案。原因是,经济演算据以开始的“数据”,从来就没有为整个社会的利益被交给
      
      
      
      
      
      
      
      某个能从这些数据算出结果来的个人,也永远不会如此。
          ……我们必须加以利用的关于局势的知识从来就不是以集中的或综合的形式存在的,
      这些不完全的、经常还是互相矛盾的知识尽是以东鳞西爪的形式散在各处,由形形色色
      的个人掌握着。因此,社会的经济问题不仅仅是如何分配“给定”资源的问题——如果
      “给定”的意思是:将资源交给一个个人,让他审慎地解决由这些“数据”所设定的问
      题。还不如说,社会的经济问题是这样一个问题:如何确保社会任何成员所已知的资源
      最好地用于各项用途(这些用途的相对重要性只有这些个人才知道)。或简而言之,这
      是未以完整的形式交给任何人的知识的利用问题。
          关于利用价格系统来解决这一问题,他写道:如果我们想理解价格系统的真正作用,
      就必须把它看作是交流信息的机制。……关于这一系统的一桩最重要的事实是,它在运
      行时使用信息很俭剩换句话说,参与这一系统的个人只需知道很少的东西便能采取正确
      的行动。只有最要紧的信息才以缩略的形式通过一种符号加以传递,而且只传递给有关
      的人。将价格机制描述为一种记录变化的仪器或一种电信系统,这不仅仅是一种比喻。
      有了这种机制,个别生产者为了调整自己的行动以适应变化(他们对这种变化的了解也
      许永远不会超出价格运动反映出的那么一点东西),只要观察几个指标的运动就行了,
      正如工程师观察几个仪表盘的几根指针一样。
          关于市场机制人们已写了很多东西,有解释的,有批评的,有辩护的。世界三分之
      二的人口(其中不仅包括原始文化,也包括传统的自给自足型农业),在日常生活中对
      市场机制应用极少。而在现代工业世界中,市场机制则是最重要的组织手段。正如冯·
      哈耶克所指出的,市场机制的最突出特征便是它减少对信息与计算的要求并使这种要求
      局部化的方式。
          因此,在现代经济学文献中,不是只有一种市场机制,而是有两种。一般均衡理论
      的理想市场机制是一部眩目的机器,它将众多具有本质合理性的经济活动者寻求最优的
      选择,结合成一个集体性决策,该决策对于社会是帕累托最优的。冯·哈耶克描述的实
      用主义机制则是一部朴实得多(也可信得多)的设备,它根据计算能力与局部化的信息
      来完成决策任务,努力追求一定程度的过程合理性。它不做最优化的许诺。
          我不打算在这里评价市场(不论两种解释中的哪一种)的社会效用。显然,实用主
      义的解释描述了现实世界的市常若得不到可执行的算法的支持,本质合理性的规则不过
      是无价值的货币。
          不确定性与估计
          个人层次上的追求满意与社会层次上的市场这二者所带来的简化程度不论有多高,
      我们都不应以为,这些手段使选择成了意义不大的智力练习。有些最大的问题仍未解决,
      包括外部事件的不确定性与相互估计的不确定性。
          不确定性既然许多行动的结果一直延伸到将来,正确的预测对于客观上合理的选择
      便是至关紧要的。我们所必须了解的有关未来的东西,有的与自然环境有关(如将会影
      响明年收成的气候);有些与超出经济范围的社会政治环境有关(如伊朗革命);有些
      与其他经济活动者(顾客、竞争者、供应者)的行为有关,而反转来,他们的行为又受
      我们的行为的影响。
          对于简单的情形,源于外部事件的不确定性可通过估计这些事件的发生概率(如保
      险公司所做的)来应付。但是,由于计算复杂和需要信息,这样做通常要花不小的代价。
      另一可供选择的措施或补充措施是利用反馈,根据未估计到的或预测错了的事件进行修
      正。即使对事件的预见不是完美无缺的,即使对事件的响应也不够精确,适应系统面对
      相当程度的震击仍能保持稳定。在每次震击使系统移位以后,系统的反馈控制机制又不
      断使系统复位。虽然,并不是因为存在着不确定性就使人们无法进行明智的选择了,但
      是,不确定性的存在促使人们采用稳健的适应程序,而不采用只在对精确了解的环境作
      用进行细致调整后才能很好地发挥作用的策略。
          估计一般来说,如果一个系统结合采用正馈控制(以对未来的预测为基础)和反馈
      控制(它帮助纠正过去的失误),就能控制得比较准确。然而,为对付不确定性而进行
      估计又带来了它自身的问题。控制系统的正馈可能具有破坏稳定的不适宜作用,因为,
      系统的前瞻努力可能使自己反应过度,进入不稳定振荡。若每个活动者都企图预见其他
      人的行动(从而就要预见其他人作出的估计),市场系统中的正馈就可能变得对稳定特
      别有破坏性。
          在经济学中,估计对稳定的破坏性的标准例子是投机空想。当然,并不是所有的投
      机都是空想。在许多情况下,市场投机使系统稳定,使它的波动幅度变校因为投机者总
      是企图发现,某些具体价格何时高于或低于“正常”或均衡水平,以便在前一情况下卖
      出,在后一情况下买进。这种行动将价格向均衡点推近。但是有时候。上涨的价格造成
      价格将涨得更高的估计,因此导致投机者买进而不是卖出。随后的情形象是在经济上做
      “小鸡”游戏,所有游戏者都认为自己能在打击发生之前逃出去。在此例中,破坏稳定
      的原因是,大家都不相信实际价格将很快回到长期均衡点。在经济学中,人们普遍同意,
      破坏稳定的估计在恶性通货膨胀与经济周期中起着重要作用。至于谁的估计是反应链的
      第一推动者或对此怎么办的问题,意见则不那么一致了。
          但是相互估计所带来的困难不仅仅影响着金融系统与经济周期。凡在不完全竞争的
      市场上,这些困难都要表现出来。上一节描述的市场机制是完全竞争的机制。既然每个
      公司都将市场价格看成不受其行动影响的“给定物”,那么,价格就象物质世界的法则
      一样,在决策的外部环境中占有同等份量。但在不完全竞争的市场上,公司不必对价格
      作这样的假定。比如,若一个行业只有几家公司,那每一家都可以试图猜透竞争者的心
      思。如果只有一方在玩猜别人心思的游戏,那是没有问题的;但是,只要参加这种游戏
      的不止一方,那么连理性的定义都成了问题。
          一百多年前,奥古斯钉库尔诺着手构造了一个理论,内容是在两个公司组成的不完
      全竞争市场中进行合理选择的问题。为构造此理论,他提出了“智慧有限”的假定。尤
      其是,他还假定,每一公司都估计了竞争者对自己的行动的反应,但每一方在分析时都
      只考虑了一步。如果其中一个公司甚至两个公司都考虑对反应的反应,情形又当如何,
      如果我们沿库尔诺的路子走下去,就可能被引入一个无限回归的猜测之中。
           1944年,即库尔诺身后一世纪,冯·诺伊曼和摩根斯坦发表了《博奔论和经济行
      为》,朝问题的正确形成迈出了一大步。但博弈论离解决问题还差得很远。它只是表明,
      在利益对立、涉及多人的情况下,要想指出合理的行动有多么困难。这种困难在称为
      “囚徒的难题”的游戏中清楚不过地表现了出来。在此游戏中,每个参加者可在两种着
      法中选择一种。这两种着法一是合作性的,一是进攻性的。如果双方都选择合作性着法,
      则双方都获得一点赏格。如果一方选择合作性着法,而另一方选择进攻性着法,则进攻
      者的赏格大大增加,而合作者被罚得很惨。如果双方都选择进攻性着法,则双方都受罚,
      但受罚程度不如第二种情形中那么严重。并不存在最有利的策略。只要对手不进攻,每
      个玩游戏者都可通过合作获利。但是,如果他能确信对手取合法性着法,则进攻获利更
      大。只要不遇到进攻行为,背叛总归合算。互利的策略则不牢靠。
          重复玩此游戏能改善局势吗?即使重复地玩,时机安排得比较巧妙的背叛行为还是
      合算。非常有趣的是,罗伊·拉德纳最近证明(私人信件),如果游戏者追求令人满意
      的而不是最优的赏格,那么合作方案也许是牢靠的,即使只将游戏重复有限次。由于这
      一结果可以推而广之,那么,在这种竞争情形里,有界理性较之无界理性似乎能产生更
      好的结局。
          在多种目标完全冲突或部分冲突的情况下,理性就要面临矛盾。“囚徒的难题”游
      戏(它显然适用于国际关系与大规模威慑政策)不过是可以说明这种矛盾的无数游戏中
      的一个。古典经济理论为了避开这些矛盾,选择了垄断与完全竞争来进行基本分析,而
      在这两种情形中,互相估计都不起作用。人对复杂相互作用的可能场景进行计算的能力
      是十分有限的,从而避免了相互猜测的无限回归。似乎正是由于这个原因,才使得市场
      制度远在垄断与不完全竞争的范围之外仍是可应用的(虽然不是最优的)。
          合理的估计最近,在经济学当中越来越流行这样一种观点:应当假定经济活动者能
      “合理地”作出估计来解决相互猜测的问题。这就是说,经济活动者对支配经济系统的
      规律是了解的,他们对系统未来情形的预测是对实际均衡状况的无偏见的估计。由这些
      假定可得出很强的结论。比如说,根据这些假定,投机行为会破坏市场稳定的可能性就
      基本被排除掉了。
          构成了合理估计假说的基础的假定遇到了困难——这些假定都是经验性的,但是几
      乎没有支持它们的经验证据。确实,我们知道人的理性是非常有限的。这就使我们怀疑,
      公司、投资者或消费者是否具有贯彻合理估计战略所必需的知识或计算能力。
          总之,我们目前对实际经济系统动态过程的了解是不完善的。我们知道,从原则上
      说,人能够对未来事件、对同伴的行为做出估计。这种能力是经济均衡不稳定的潜在根
      源。人们事实上是如何对未来进行估计的,对于这一问题,我们没有多少经验性的知识。
      因此,目前还难以在相互竞争的经济理论所提出的各种模型中进行选择,以解释经济的
      周期性行为。
          市场与组织
          市场只是人们用以在个人层次以上实现理性行为的机制之一。对于这个目的,市场
      的主要竞争者是等级组织。在象我国这样的社会中,组织是嵌在市场结构大蛋糕中的小
      葡萄干。中央政府是例外,它确实是一块很大的葡萄干。在社会主义国家,政府通常被
      认为是唯一的中央组织者,没有它就没有合理的、协调的行为。我们已经看到了这一观
      点的谬误。在民主制度下,中央政府的角色是混合的,但人们主要把它看作规则制订者
      与仲裁者(游戏的规定者)而不是中央计划者。
          组织中的分散化让我们暂时把政府撇在一边,集中考察一下公司的例子,看看正式
      组织是什么样的。在经济学文献中,组织经常被当作市场的对立物,被看作一个非常集
      中化的结构,其中所有重要决策都由中枢机构制订。这是一种误解。组织若以高度集中
      的方式管理,则又会超出过程合理性的限度,采用等级权力制所获得的许多优点又会失
      
      
      
      
      
      
      
      
      
      
      
      
      
      
      
      
      
      
      
      
      
      
      
      
      
      
      
      
      
      
      
      
      
      
      
      
      去。现实世界中的组织的行为完全是另一个样子。
          在组织范围内,如果一个人为另一人或更多人的决策(从而为他们的行为)提供某
      些前提,并迫使他们采用这些前提。我们就说他行使了权力。由于一项决策可能受到大
      量事实前提和选择标准的影响,因此,单是这些前提的一部分由上司规定这一点并不意
      味着完全的集中化。事实上,等级权力制产生的主要优点与将价格作为信息传达物来使
      用所产生的主要优点是一样的:事实情况可在组织的某一特定场所决定(在这些场所,
      决定情况所需要的技能与信息的各有状况比别处都好),然后,这些情况可汇报到“集
      中点”,在这里,可将对某一具体问题有意义的所有事实归到一起,最后作出一个决策。
      在集中点只需要一小部分源知识、源信息和源技能就可以了。这种集中点可以有很多个,
      散布于组织各处。
          因此,经营组织象市场经济一样,是巨大的分布式计算机,其最终选择过程是非常
      分散化的。如果我们仔细看看一些大公司(特别是细分为许多专业化产品部的公司)的
      上层,就能发现,这些高级层次主要行使以下职能:(1)将投资计划的资金分配给分
      部的“投资银行”职能;(2)选择分部的管理班子并评价其绩效;(3)关于基本基金
      和超出现有分部经营范围的、未来可能进行的新活动的长期计划。人们常说,这些大公
      司的各分部的运营与独立的公司差不多,它们甚至有自己的资产负债表和“盈亏总结
      算”,有时还有权从公司外购买可由公司其他分部很方便地提供的商品。
          我们不为典型的公司产品分部要求过分的独立性,但是可以看出,正式等级组织与
      决策的完全集中化根本不是同义语。于是,至少有两种将计算功能分布于社会系统之中
      的机制:市场机制和等级机制。两种机制不是完全等效的。例如,资源分配的几条最优
      性定理对于理想的竞争市场可以得到证明,但对于等级制的决策过程则一条也得不到证
      明。结果,等级制组织有时诉诸内部市场或“影子价格”的方法以接近资源分配的最优
      化。例如,大公司在一定限度上采用内部价格以控制分部之间或更小的单位之间的交易。
      类似地,社会主义国家也越来越依赖价格机制来调节其经济组织之间的交易。这两种情
      况都提供了中央计划的局限性的证明。
          外部影响支持与市场相对立的组织的理由是什么呢?经济学家往往用“外部影响”
      来叙述这一问题,但我们也需要对不确定性给予一定的注意。外部影响之所以产生,是
      因为仅当一次活动的全部投入与产出都能定出市场价格时,价格机制才象所鼓吹的那样
      灵验。举一个惯用的例子,如果允许工厂从烟囱里向外排烟而无须对周围的居民付健康
      补偿费,那么价格机制就不能保证生产活动水平从社会角度说是最优的——该产品的价
      格将定得过低,从而使人们过多地使用它。
          经济学家所偏好的对外部影响的补救办法是,将这个未被说明的影响纳入价格系统
      的计算之中,如征收排烟税。由于不存在明显的烟尘市场(或不如说除烟市场),这就
      产生了如何定价的问题。虽然用成本收益分析技术可以求出此问题的答案来,但是,这
      是些管理性的答案,而不是由自主市场机制给出的答案。
          分部运营中存在的类似外部影响问题使大公司不大情愿让分部之间与部门之间的交
      易完全由内部价格支配。在缺乏完全竞争的情况下,如果没有独立的市场来定价,就不
      清楚该如何确定恰当的价格。
          不确定性的消除不确定性还产生另一些问题,这些问题有时使社会系统感到,用等
      级制而不是用市场来进行某些决策是很有吸引力的。对于一个器械公司,如果生产部只
      管生产器械,市场行销部只管销售,那么让生产部与市场行销部分别估计第二年的器械
      需求量就不很合理。让两个部门根据同一估计(即使不正确)来运营,较之根据不同的
      估计(即使比较正确)来运营,也许要重要得多,也更有利可图。因为,面对不确定状
      况,标准化也许比预测更有效。
          有这样一种断言:由于不确定性,人们才用等级机制代替市常这一断言从某种意义
      上说似乎是自相矛盾的。因为,不确定性似乎要求最大限度的灵活性,而市场的分散化
      决策似乎比等级制的集中决策更易获得灵活性。但是这只是个肤浅的分析。一切取决于
      不确定性的原因。如果关于个别市场状况的大量事实是不确定的,那么分散化的定价就
      显得很有吸引力;如果不确定性是总体性的,如果一些重大事件也充满了不确定性(这
      些事件将在同一方向上对组织的许多部分发生影响),那么,也许更可取的做法是,将
      为未来作假定的过程集中化,并指示分散化的单位在其决策中采用这些假定。
          显然,关于提高理性限度的社会机制的论题并未被我们这一简短讨论所穷荆不过,
      我们已不厌其烦地说明,在有界理性的世界上,有好些方法可提高个人的计算能力,加
      
      大他们集体生存和繁荣的可能性。人类通过结合采用市场和管理等级制,已大大地提高
      
      了自己的专业化能力和分工能力。不过,若将人口的巨大增长和广延分布仅仅归功于这
      两种机制是太过分了——现代医学与现代技术也有几分功劳。但是,我们这个物种如今
      在地球上的统治地位是人类理性增加的证据,而使理性增加成为可能的正是市场和等级
      制这些社会性的人工物。
          进化模型
          创造人工物的一种方式是让它从造物主的脑子里蹦出来。另一种方式是让它响应某
      种选择力而进化。最简单的进化图式取决于两种过程:产生者与考验。产生者的任务是
      产生变种,即过去从未存在过的新种,而考验的任务则是剔除新产生的变种,只让能很
      好适应环境的变种生存下来。拿现代生物进化论来说,遗传变异是产生者,自然选择是
      考验。
          关于经济人的另一理论
          没有人认为现代市场经济是深思熟虑的设计的产物。当然,它是从早些时候的自然
      经济演化而来。几百年来,众多经济活动者的无数决策塑造着它。与此形成对照的是,
      刚才对个别公司行为给出的说明——无论是追求最优的还是追求满意的——却认为,个
      别活动者在给定市场环境的范围中是深思熟虑地选择适合其目标的行动的。适应是通过
      理性活动者进行的选择而实现的,而不是通过对活动者进行自然选择(选择出这样一些
      活动者,他们的行为恰好是适应性的)而实现的。
          有时,经典的公司最优化模型被攻击为不现实的,事实上错误的。这时,就提出了
      另一种以进化论前提为基础的公司理论。它争辩说,人们(和公司)是寻求最大化还是
      寻求满意,这并不重要,因为,在竞争市场组成的世界中,只有那些象追求利润最大化
      一样做决策的人才能生存。如果这一非常重要的论点是正确的,我们对经济人是否采用
      最大化方法的问题就不必关心了,因为,无论他是否追求利润最大化,结果基本一样。
      因此,我们要仔细考察一下,这一进化论的论点是否隐含着最优化。
          我们的讨论所隐含的意义超出了经济学而延伸入生物学,因为进化生物学文献大量
      使用着最优化的语言与概念,近年来,甚至借用了线性规划和运筹学中的其他一些最优
      化算法来描述生物系统中自然选择的结果。只有当经过深思熟虑的理性适应这样的过程
      能够象自然选择过程一样可靠地导致同样的系统均衡状态,上述做法才是合理的。
          局部极大与全局极大
          在最优化的数学方法当中,局部极大与全局极大的区别是至关紧要的。在加利福尼
      亚平原,每座小丘都是高度的局部极大值点,但只有惠特尼山才是全局极大值点。对于
      许多目的来说,站在诺伯山上与站在惠特尼山上还是有区别的。找局部极大值点通常是
      相当容易的:一直往山上走好了,直到无处可走为止。但是,找到全局极大值点通常却
      极其困难,除非这块地形具有很特别的性质。线性规划之所以计算可行性大,适用性广,
      是因为它的先决条件很强,足以保证局部极大值点就是全局极大值点。而且,解线性规
      划问题的单纯形算法是迅速攀登到极大值点的一个非常有力的程序。
          没有理由认为现实世界(无论是生物界还是经济界)具有线性规划问题那样的简单
      性。尤其是在互相独立地进化着的子系统(物种、公司)组成的世界中,很容易想象出
      这样一种均衡状态:每个子系统最优地适应了周围的子系统,但均衡只是局部的。如果
      任一子系统偏离这种均衡态过远,所有子系统也许就要向一全新的均衡态演化。
          进化的近视性
          达尔文主义的进化是非常近视的。这种进化的过程是从一个状况向另一状况一步一
      步作渐进式的改善。每前进一步,进化着的生物体就变得更“合适”了(相对于其他生
      物体构成的它的当前环境而言)。但是,没有理由说这一过程正通向适合性的某个全局
      极大值点,更别谈对于全系统的极大值点了——如果我们确实还能在总体意义上谈适合
      性的话。
          在这一方面,进化过程的许多数学模型都是误人的。因为这些模型假设,有两种以
      上的生物在竞争。按照最简单的假设,最适的物种生存,其余死亡——除非它们能找到
      一个不同的、特化的小生境,它们在这个小生境里能够保持一种比较优势。这种理论不
      敢断言,所有小生境都被占据了,或小生境组成的系统是不变的——几乎可以肯定,这
      种系统不是不变的。它也肯定不敢断言说,小生境组成的完整系统处于最优状况。
          如果一个系统只有处于全局极大值点才平衡,那么,我们可以或多或少地不注意系
      统是如何达到平衡位置的这个问题(除非我们的任务就是找到最优状况)。我们可以满
      足于假设一个神秘的过程(诸如放任经济人去从事利润或效用最大化活动那种神秘过
      程),也可以假设一个同样神秘的、由自然选择完成的最优化。但是,如果我们考察的
      系统处于具有很多局部极大值点的环境中,那么,除非我们对系统进化的方法与历史有
      所了解,否则就无法理解这个系统或预测其行为。我们也无法判断,是否有任何理由将
      
      这样的系统看成“最适的”。
          这并不仅仅是在原则上反对将登山法与最优化混淆起来。在一个主要靠近视登山法
      得到发展的系统中,即使在看得较远的时候,也许还是很难从一个已经达到的局部最高
      点转到另一个虽已在望、但隔着一道深谷的另一局部最高点。从英制度量系统向公制度
      量系统的改换是个很恰当的例子。如果让一个社会从头开始选择度量制,而且它对两种
      度量制都熟悉,那它肯定宁取公制而不取英制。但是,如果未来的收益要按某利率打折
      扣,那么,一旦某种度量制已深深嵌入社会中的人工物和技术实践,从这种度量制转变
      到另一种度量制在经济上也许就永远不会合算。要不是由于遵从国际标准对美国有巨大
      的好处,我很怀疑一次成本收益分析就能证明向公制度量系统的转变在经济上是合理的。
          将经济看作是由许多公司组成的,将生物学的生态系统看作一个通过某种产生器-
      考验过程(也就是通过试探搜索)而进化着的系统,虽然不失为可行的做法,但不能由
      此前提就得出结论说,系统已达到的或可能达到的位置与讨论完全竞争的纯粹理论求得
      的均衡有些相似。而且,并不存在一个有待系统去适应的固定环境。每个公司在适应由
      其他公司和消费者组成的环境的时候,该环境也在变化和演化。生态系统中,在每一物
      种适应由其它物种组成的环境的同时,该环境也在与那一物种同时进化。这种系统的进
      化与未来只有通过其历史方能知晓。
          经济进化的机制
          如果我们提出结论说,公司和生物物种对各自环境的适应都是试探搜索的例子,因
      而也是登山法与局部最优法(或寻求满意)的例子,那我们还得对产生适应的机制进行
      解释。按当代生物学的观点,这一机制存在于基因内部——基因通过成功地复制自己表
      现其适应程度。公司的哪个组成部分与基因相应,现在还不清楚。
          温特和奈尔逊(Nelson)就这一论题写过一些富有创见的东西。他俩认为,公司的
      大部分工作是通过标准操作程序完成的。这些标准操作程序其实就是进行日常决策的算
      法,它们已程序化了,经理和雇主从前一代接过这些算法,又传给下一代。进化产生者
      是由所有那些对上述算法进行创新与变更的过程组成的。进化考验是公司在改变算法之
      后的盈利能力与增长率。能盈利的公司是适合的,它们通过将所获利润重新投资、通过
      自己对新投资项目的吸引力而增长。
          温特和奈尔逊注意到,经济进化与生物进化不同的是,一家公司可向另一家公司借
      用成功的算法。因此,这种假设的进化系统是拉马克主义的,因为,任何取得有目共睹
      的成功的新思想,都可被纳入运营程序。成功的变异可由一家公司转移到另一家公司。
          经济学与心理学
          本章的主要论点是,要想懂得我们称为经济的人工系统,就必须懂得它的内部环境,
      特别是公司与消费者的收集信息、推断和进行复杂计算这几种能力的限度。经济学是一
      门关于人类理性的理论,它对过程合理性(决策方式)必须象对本质合理性(决策内容)
      一样关心。
          在个人层次上,这种对程序的关心导致我们对寻求满意的技术进行了考察,而这些
      技术又将我们引向了认知心理学,这是下两章中我们将讨论的题目。在市场层次上,对
      理性限度的关心导致我们将价格系统主要看作这样一种设制,它能使活动者为进行合理
      的(即令人满意的)决策所必须占有的非局部信息量减少。在经济系统层次上,我们着
      重讨论了估计的形成方式,讨论了活动者互相猜测意图所产生的稳定作用和破坏稳定的
      作用。
          效用函数
          本章没有怎么谈诸经济目标--即效用函数的诸成分。认为效用函数是给定的且保
      持不变,这是不现实的。新的经历产生新的口味。有些人沿着这一方向作了些努力,想
      挽救古典理论。他们用更基本的“需求”来代替有形产品和劳务作为效用函数的自变量
      --例如,通过听音乐获得的享受,而不是听音乐的小时数。于是,贝克和斯蒂格勒谈
      到投资于音乐体验以增加每单位听音乐时间所能获得的乐趣。
          试图用如此重大的措施来挽救传统的效用观是否能有所得,也许值得怀疑。继续上
      例,如果我们不认为听音乐会导致效用函数的变化,那么我们必然在头脑中假设了一个
      从听音乐“制造”出音乐享受的生产函数(生产函数可随经验而变化)。这样做,只不
      过将“口味”从效用函数转移到假设的新生产函数上来了。干脆将效用函数看作一个进
      化着的结构,似乎还更加省事。
          愿望水平
          现代经济学认为,一个人对各种现有选择的效用量的看法,应根据此人的行为来推
      断,也就是要观察他宁做哪些选择而不做另一些选择。如果这些选择是前后一致的并且
      是可转移的,效用函数就被推翻了。虽然现今已有大量证据表明,人的选择经常不是前
      后一致的(就效用函数的存在所要求的那种前后一致而言),但是我暂时不想抓住这一
      困难不放,却想提出与此不同的另一组问题,这些问题是关于经济学所定义的效用与心
      理学家所认识的享受或幸福之间的关系。
          就我所知,从来没人在心理学实验室里构造过一个关于幸福的心理物理学量表,将
      它与光强感受量表与重量感受量表放在一起。曾有些无畏的民意测验者向应答者询问过
      幸福程度或工作满意程度,但他们只用称名量表报告了应答者的回答。我想他们并没有
      做正式的量表编制工作。编制这样一个量表也许倒是一桩有趣的任务。
          我们可以推测一下幸福的“温度表”可能具有的某些性质。首先,与效用函数不同,
      它不一定只取正值。它可以有一个零点(或最小满足点),零点以上测量幸福程度,零
      点以下测量不幸的程度。其次,如果在相对稳定的生活环境里定期测量人们的幸福程度,
      我们只会偶尔发现远离零点的“温度”(两个方向上都是如此),而且,正负测量值在
      一定时间后趋向于回归至零点。大概大多数人在此测量计上的反映是前后一致的,要么
      略低于零点(稍有不满),要么略高于零点(稍稍满意)。
          为了处理这种现象,心理学引入了愿望水平的概念。愿望有很多“维度”:有人想
      要舒适的工作,有人渴求爱情,有人想吃得好,有人想旅游。无论对于哪一维度,对可
      达物的估计决定着愿望水平。愿望水平是要与目前的经历水平进行比较的。如果经历水
      平超出愿望水平,满意感为正值;如果愿望水平更高,就是不满意。没有一种简单的机
      制可用以进行不同维度之间的比较。一般说来,一个维度上的一大增量方能补偿另一维
      度上的小小的减量——因此,系统的满意感是与历史有关的,凡涉及补偿措施的决策都
      很难做。
          我在别处曾论证说,愿望水平机制是一些选择机制。我们估计,在进化力的作用下,
      一个在不确定与波动的环境里生存的机体恰恰会产生这种选择机制。
          社会中的人
          经济学这门科学对在人类行为与人类社会管理的所有方面表现出的人类理性进行赞
      颂。它之所以被不公正地称为“沉闷的”科学,主要是因为李嘉图的经济学对人类进步
      没抱多大希望。这个称号是不公正的。事实上,经济学给人类精神画的像是浪漫的,甚
      至是英雄的。古典经济学对人类的描述是,他们在个别地和集体地解决无比复杂的资源
      分配最优化问题。经济人的智慧使他能在所处环境中为满足自己的需求和需要进行最好
      的适应性变化。本章的讨论中心是智慧的适应能力,但我也试图提出了更复杂的状态。
      在对经济人和经济设制进行纵向描述时,一方面要叙述经济人的适应战略,同时别忘了
      叙述内部环境所设置的限度——信息处理的限度。
          在进行这番描述时,还必须兼顾经济决策者的有意识的理性行为与无计划但具有适
      应性的进化过程这二者,正是这些进化过程使经济设制成为今天这个样子。
          运筹学与人工智能引入了新的技术,它们加强了经济活动者的过程合理性,帮助他
      们进行更好的决策。在较大的规模上,市场和等级组织这样一些社会系统促进合作行为,
      同时节约使用一种关键性的稀缺资源:人类处理复杂情形和大量信息的能力。在本章中,
      我未打算对各种形式的个体组织与社会组织进行评价(也未打算对同等重要的讨价还价
      与投票程序进行评价),只是将这些组织作为对一个重大人类问题的常用解决方案给予
      了描述。
          分析表明,要想深入理解过程合理性的手段,就要更仔细地考察一下人脑是怎么工
      作的,考察一下人类理性的限度。下两章将描述我们在过去二十五年中关于人的信息处
      理过程已了解到的东西,第三章讲述1970年之前的情况,第四章则集中讨论过去十年。
          
       
      
          第三章 思维心理学:将智慧嵌入自然
          让我们观察一只蚂蚁,它在风浪侵蚀成的海滩上费力地前进。它向前走几步,突然
      向右转去,为了爬一座陡峭的小丘时省些力。又绕过一块卵石,停下来与一位同伴交换
      信息。就这样,它绕来弯去、走走停停地回到了家。为了不将这只蚂蚁的目的拟人化,
      我将它的路径画在一张纸上。这是一个带角的不规则线段的序列——不能说是随机游程,
      因为蚂蚁有着潜在的方向感,有着奔向一个目标的感觉。
          我将这幅未起名的画绘一位朋友看。这是谁的路径呢?或许是一位高明的滑雪运动
      员沿一个障碍重重的陡峻山坡下滑。或者是一只帆船在遍布着岛屿与浅滩的海峡里迎风
      而上。或许这是在一更抽象的空间里的路径:一名学生求证一个几何定理时走过的搜索
      路线。
          无论是谁走出了这路径,无论在什么样的空间里,为什么它不是直的呢?对于蚂蚁
      
      的例子(就这一方面而言,以别的事物为例也一样)我们知道答案。它大致知道家的位
      置,但它无法预见到所有这些障碍。它必须不时改变路线以对付碰到的困难,必须经常
      绕过越不过的障碍。它的眼界很窄,所以它遇到一个障碍就对付一个障碍;它试探绕过
      或越过障碍的种种方法,却不大考虑未来的障碍。要使它陷入深深的迂回阵中,那是很
      容易的。
          若将蚂蚁的路经看作几何图形,那么它是不规则的,复杂的,难以描述的。但说实
      
      在的,这种复杂性是海滩表面的复杂性,而不是蚂蚁的复杂性。在那个海滩上如果有另
      
      一个小动物,它的家与蚂蚁的家在同一位置,那么它很可能走一条非常类似的路径。
          几年前,格雷·沃尔特制作了一个机电“海龟”。只要给海龟的电池充好电,它就
      能探索一个表面,并总能找到自己的窝。更近一些时候,有几个实验室(包括马萨诸塞
      州坎布里奇的马文·明斯基教授的实验室)开始制作目的寻求的自动机。假设我们着手
      设计一个与蚂蚁大小差不多、运动手段类似、感受器敏感程度相当的自动机。假使我们
      赋予它一些简单的适应能力:如果碰到一个陡坡,它就试图倾斜地往上爬;如果碰到越
      不过的障碍,它就试图绕过去,等等。(除了元件的微型化方面有问题,凭目前的技术
      水平肯定能搞出这么一个设计。)它的行为与蚂蚁的行为有多大的不同呢?
          这些猜测暗示着一个假说,该假说也一样可以作为推论从我们对人工物的前述讨论
      中导出:一只蚂蚁,若视作行为系统,是很简单的。它的行为随时间而表现出的表面复
      杂性主要是它所处环境的复杂性的反映。
          一开始,我们也许觉得这一假说不无道理或没有道理。这是个经验性假说,有待检
      验。检验方法是,看看是否只要赋予蚂蚁的适应系统一些很简单的性质就能解释它在给
      定的或类似的环境中的行为。由于第一章详论的那些原因,这一假说的真伪与蚂蚁是简
      单系统还是复杂系统(从更微观的角度看)不应当有关系。在细胞或分子水平上,蚂蚁
      显然是很复杂的,但内部环境的这些微观细节也许与蚂蚁的行为基本无关(就行为与外
      部环境的关系而言)。因此,自动机虽然在微观层次上完全不同,却可以模拟蚂蚁的大
      致行为。
          本章中我想探讨这一假说,不过用“人”代替了“蚂蚁”。
          一个人,若视作行为系统,是很简单的。他的行为随时间而表现出的表面复杂性主
      要是他所处环境的复杂性的反映。
          现在我想稍微限制一下我的陈述。我并不想考察腺体内脏齐备的“完整的”人,而
      只限于讨论Homo sapiens,即“思想着的人”。我本人坚信,上述假说对完整的人也成
      立,但开初时将困难分割一下,只分析认知行为而不分析总体行动,这也许是更加稳健
      的做法。
          我还想在另一方面限制一下我的陈述。人可以在记忆中储存大量信息,有了适当的
      刺激就可将它们“召唤”出来。因此,在我看来,与其说这一装载信息的记忆是机体的
      一部分,还不如说是机体要适应的环境的一部分。
          给简单性假说指定一些先验概率的理由在上两章已经述及。一个思想着的人是一个
      适应系统;人的目标确定了他的内部环境与外部环境的界面。后者包括他的记忆库。由
      于他的适应性很强,他的行为所反映的主要是外部环境(就他的目标而言)的特征,只
      揭示了一点点内部环境(使人能够思想的生理机制)的限制性。
          我不打算详细重复这一理论观点,而想在人的思维过程领域寻求对这一观点的经验
      证实。我特别想指出的证据是,思想着的人的内部环境的“固有”性质中,只有几条限
      制着思想对问题环境的形状作出适应性变化。思维过程和解决问题行为中的其余一切都
      是人工的——都是习得的,都可以通过发明更好的设计及将这些设计存储于记忆中而得
      到改善。
          作为人工科学的心理学
          解决问题过程经常被描述为在一个由很多可能性组成的大迷宫(它描述了环境)里
      的搜索。要成功地解决问题,就要选择性地搜索迷宫,将迷宫化约为易于处理的几个部
      分。让我们以称为算术码问题的一种难题(Puzzle)作为具体例子: D O N A L D+G 
      E R A L D D=5——————— R O B E R T任务是用0至9这十个数字代替竖式中的字
      母。同样的字母必须以同样的数字代替,不同的字母用不同的数字代替,代替后的数字
      式是一道计算正确的算术问题。这一具体问题有一附加提示:字母D应代以数字5。
          对此问题的一种考虑方法是,考察将十个数字与十个字母进行配对的所有10!(10
      的阶乘)种方式。10!这个数目还没有大到使现代计算机心生恐惧的地步。它只不过比
      三百万多一点。(准确地说,是3628800。)如果设计一个程序来系统地产生所有可能
      的配对方式,并且产生一种配对方式并加以检验需十分之一秒,那么至多十个小时就能
      完成任务。(有了D=5的提示,只需一个小时。)我并未编写这个程序,不过我想大计
      算机检验每种可能性所需时间比十分之一秒短多了。
          没有证据表明人也能达到这个速度。对人来说,产生与检验每一配对方式要花一分
      钟。要想记住已经进行到哪里了,已经试过了哪些配对,他感到非常困难。他可以用纸
      笔帮忙记一记,但那使他的速度更慢了。这样干,这项任务也许需要几个人年的工作量
      (假设每周工作40小时)。
      
          我们排除这种无遗漏的系统搜索方式,因为对于人来说,这样解决该问题是不可行
      
      的。但请注意,我们只不过对人的能力假设了很粗略的几点便排除了那种搜索方式。我
      们假设:简单算术运算所需时间是秒的数量级;运算基本上是序贯进行的,而不是平行
      进行;记忆容量没有大到容许以几分之一秒的速度储存新信息的地步。这些假定说到了
      一点人的中枢神经系统的生理机制,但没说多少。例如,若能向大脑植入一个具有袖珍
      计算器所有特性的子系统来改进大脑,这将是脑外科——甚至进化——的一个十分了不
      起的奇迹。但是,即使发生了如此重大的变化,对于解释或预测该问题环境中的行为这
      些目的来说,也只会将有关假说改变那么一点点。
          人们经常解“DONALD+GERALD=ROBERT”这样的问题。他们是怎么做的呢?表现环
      境、进行搜索的其他路子是什么呢?搜索策略大大减少搜索的一个方法是如前进行系统
      配对,不过是将数字与字母一一配对,这样,配对尚未完毕就可能发现前后矛盾,于是
      一步就能排除掉整组的可能配对方式。我来说明一下这是怎么回事。
          假设我们从右边开始,依次试着为字母D、T、L、R、A、E、N、B、O、G配对,按1、
      2、3、4、5、6、7、8、9、0的顺序代入字母。已知D=5,于是将5从现有数字的表中排
      除。现试试T=1。在右列检验一下,发现有矛盾,因为D+D=T+C,C是10或0。既然
      (D=5,T=1)是不可行的,我们就可将余下的八个数字与余下的八个字母配对的余下
      8!种可能性全部排除。同样,除T=0外,T的所有其他可能配对方式都可排除,不管余
      下的字母的配对情况怎样。
          这方法还可进一步改善:每当两个加数已知时,直接用加法计算出应该用哪个数字
      来代替表示该栏和数的字母。按这一改善了的方法,无需搜索代表T的数字,因为从D=
      5能直接推断出T=0。用此法,DONALD+GERALD=ROBERT问题靠纸笔就可很容易地解出,
      十分钟就足够了。图3表示了搜索树,但稍微简化了一些。每一分支伸展到发现矛盾的
      点为止。例如,当确定(D=5,T=0)后,L=1的配对导致R=3的推断结果,这就产生
      了矛盾,因为从问题算式的左列来看,R=3则意味着G是负数。
          图3在一个方面已经简化了。用一个数替代E后出现了矛盾结果而终止的每一分支,
      事实上还应再分一次权,因为在这些情形中,都是由于看到字母O与哪个数字配对也不
      行才发现矛盾的。在每一情形中,必须检验四个配对来确定是否有矛盾。因此,完整的
      搜索树有68个分支,68较之10!或9!是小得多了。
          通过稍稍(相对而言)偏离无遗漏的系统搜索法,一个大空间就被缩小成一个小空
      间。必须承认,这些偏离并不象我使它们显现出的那么简单。在我们所提出的方法中,
      有一步骤是要求发现某种配对所隐含的矛盾。这当然指的是“比较直接的矛盾”。因为,
      如果我们有一个能发现所有隐含着的直接和间接的矛盾的高速程序,那么,问题解答几
      乎可以立刻求出。对于此问题,除了唯一正确的一组配对方式外,其余组配对方式都隐
      含着矛盾。
          寻找直接矛盾是这样的意思:作了一个新的配对后,将刚被代替的字母所在列部检
      验一下。如果可能,对于每一个这样的列,都将一个尚未配对的字母当作未知数求解,
      然后检查答案,看看求出的这个数字是不是尚未被配对的。如果不是,则有矛盾。
          我们现在不是蛮力搜索,而是有了一个结合了搜索与“智慧”的系统。我们能否将
      这一过程再往前推一步,能否从解法中彻底消除所有的尝试法搜索?回答是,对这个问
      题可以,不过并不是对所有算术码问题都可以。
          使我们在解眼前这道题目时能消除尝试法搜索的多数步骤的基本思想,是不要采取
      自右至友进行系统配对的方式。反之,我们搜索问题算式的一些已十分确定的列,这些
      列能使我们求出新的配对方式,或至少能对配对的性质进行新的推断。
          让我简要地叙述一下这个过程。由D=5,我们立刻推断出T=0,如前所述。我们也
      知道,1进位进到了第二列,因此R=2L+1,是一奇数。最左边,由D=5,我们断定R大
      于5(因为R=5+G)将这两个推断合起来考虑,我们有R=7或R=9,但我们并不试验这
      两个配对。此时我们发现左起第二列具有特殊的结构O+E=0——一个数加上另一个数
      等于它自身(因进位而进入此列或从此列消去的数不算)。数学知识或经验都告诉我们,
      这只有当E=0或E=9时才成立。既然已有T=0,则E=9。这又消除了R的一种可能,于
      是R=7。
          既然E=9,则有A=4。左起第三列必然进上了一位,因此2L+1=17,或L=8。现
      在剩下来要做的是将1、2、3和6依某种顺序代替N、B、O和G。注意到无论O为何值,总
      要向左列进位,得到G=1。现在只剩下3!=6种可能性。我们也许愿意用尝试法来消除
      
      多余的可能性,最后得N=6,B=3,于是O=2。
          我们刚才在关于搜索策略的三种不同假设下,搜索了走出问题迷宫的解决路径。策
      略越复杂(在某种意义上而言),需要的搜索越少。但重要的是要注意到,一旦选定了
      策略,搜索路线就仅仅取决于问题结构,而不取决于解题者的任何特征。通过观察一个
      人或一部自动机在这一问题环境里运算,我们能了解到一些此人的什么情况呢?也许我
      们能推断出他接着会采取什么策略。通过过去犯下的错误和摆脱错误的成功经历,我们
      也许能发现他的记忆能力与基本过程精确性的限度。关于这些过程的速度我们能了解一
      些。在有利的情况下,我们也许能了解到,在各种可能策略中,他事实上能获得哪几种,
      在什么样的情况下能获得它们。关于中枢神经系统的神经学特性,我们肯定不能学到任
      何具体东西。中枢神经系统的具体内容与个人的行为也没关系,它只是定下了可能性的
      界限。
          绩效的限度
          让我们从正面叙述一下,在我们看来,这种问题情景中的行为所揭示出的界限和限
      度到底是什么。在叙述时,我们将引用实验证据和对人的绩效进行计算机模拟所产生的
      证据。这些证据涉及各种各样的认知任务,从比较复杂的(解算术码问题、弈棋、定理
      证明)经过中等复杂程度的(概念获得)直到心理学实验室最喜欢的简单任务(机械言
      语记忆,短时记忆广度)。重要的是,在这极其多种多样的任务中,内部系统适应性的
      限度只有一小部分得到反映,而且这些限度对所有任务基本上是一样的。因此,讨论这
      些限度是什么,就意味着给人在各种各样的任务环境中的绩效提供了一个唯一前后一致
      的解释。
          概念获得速度的限度
          对概念获得问题,人们已在下述的一般范式内进行了广泛的心理研究。刺激物是带
      有简单几何图案的一组卡片,图案之间的区别反映在好几个方面:形状(方形、三角形、
      圆形),颜色,大小,图形在卡片上的位置,等等。一个“概念”的外延方面是由某一
      组卡片——这些卡片的图案是那一概念的例子--定义的。该概念的内涵方面是由一种
      性质定义的,所有提供例子的卡片都有这一性质,但任何一张其余的卡片都不包含这一
      性质。概念的例子如“黄色”或“正方形”(简单概念),“绿三角”或“大而红”
      (并言概念),“小或黄色”(选言概念),等等。
          在这里的讨论中,我将引证使用N维刺激物的实验,每一维度有两个可能值(简单
      概念)。每次试验时,给受试者看一个例卡(正值或负值),他回答“正的”或“负
      的”,然后根据情况告诉他“对了”或“错了”,予以强化。在这一类的典型实验中,
      将试验次数和错误回答次数记录下来以报告受试者的行为,最后得出一个用无错率来反
      映的成绩。有些(不是所有)实验也要求受试者不时地报告回答所本的内涵概念(如果
      存在的话)是什么。
          情形是如此简单,以致象算术码问题一样,我们可以先验地估计出,一个受试者平
      均需要几次试验就能发现例卡所指的概念是什么(条件是受试者采用效率最高的发现策
      略)。每次试验,不管回答是什么,受试者可根据实验者用作为强化物的断语断定该刺
      激物到底是不是概念的一个例子。如果是,受试者就知道,该刺激物的某一属性值(例
      如颜色、大孝形状)确定了这一概念。如果不是,受试者则知道,它的某一属性值的互
      补物确定了概念。无论在哪种情况下,每一试验都将可能的简单概念排除了一半;在刺
      激物组成的随机序列中,平均说来,每一新的刺激物又将仍未被排除的概念的大约一半
      给排除了。因此,发现正确概念所需平均试验次数与刺激物的维数的对数值成正比。
          假使每次试验都给以足够的时间(慷慨一些,就说给一分钟吧),假使给受试者纸
      笔,那么,任何智力寻常的受试者都能被教会效率最高的策略,并且不感到太困难。而
      实际上。在这些实验进行时,受试者并未被教给高效策略,也没有纸笔,对连续出现的
      每个刺激物只有很短的反应时间——一般为四秒钟。他们发现正确概念所需试验次数比
      根据高效策略计算出的次数多得多。一个被要求不用纸笔在四秒钟内做出反应的受试者
      是无法采用高效策略的,即使他经过训练。虽然据我所知还没有做过这样的实验,但这
      一点完全可以肯定。
          关于人的思维过程,这些实验告诉了我们什么呢?首先,这些实验告诉我们,人并
      不总能自己发现一些巧妙的策略,虽说教会他们这些策略很容易(观看一名国际象棋大
      师与一名笨汉弈棋,也将使我们信服这一点)。这算不上什么令人吃惊的结论,但也许
      具有启发意义。我马上还要回过来讨论这一结论。
          其次,这些实验告诉我们,人并没有足够的手段将信息储存在记忆里以使自己能采
      用高效策略,除非大大降低展示刺激物的速度,或允许受试者采用帮助记忆的外部手段,
      或既降低展示速度又允许采用外部手段。我们通过其他证据得知,人具有的半永久记忆
      力实际上是无限的(人在一生的大部分时间里能不断将零乱的事实向记忆里储存,便可
      说明这一点),实验成绩不好的瓶颈必定在于快速存取记忆(所谓短时记忆)的存储量
      太小,在于将存储量有限的短时记忆库中的内容转移到大规模的长时记忆库所需时间不
      够。
          根据从其他实验获得的证据,人们估计,快速存取的短时记忆库只能存储七件东西
      (或许少至四件),从短时记忆库向长时记忆库转移一件东西所需时间或许长达五至十
      秒。为了使这些陈述有作用,等一下我们必须更准确地把握“件”的意义。我们暂时假
      定一个简单的概念就是一件。
          即使没有纸笔,我们也可以指望受试者采用高效策略,只要(1)受试者被教给了
      高效策略,(2)每次试验给他二、三十秒对刺激物作出响应和处理的时间。由于我并
      没有做这个实验,上述断语是一预言,可用以检验理论。
          这一次,也许你又感到结果是显而易见的(如果不说是微不足道的话)。如果是这
      样,那我提醒你,仅当你接受了我的一般假说时,结果才是显而易见的。这假说是:人
      受目标指导的行为在相当大的程度上只是反映了行为发生的环境的形状;只需对人的信
      息处理系统的特征有个粗略的了解,便可预言该系统的行为。在此实验中,有关的特征
      量似乎是(1)短时记忆容量,以件数(或块数,我将采用这种名称)测量;(2)将一
      件或一块信息固结在长时记忆里所需时间。下一节我将探讨这些特征在各种任务环境中
      表现出的一致程度如何。在此之前,我要对受试者的策略知识和训练受试者的作用进行
      一番评论,作为本节结尾。
          策略可以学会,这并不是一桩惊人的事实。学到策略后可大大改变绩效,提高工作
      效果,这也不令人吃惊。所有教育机构都是根据这些前提建立的。这些前提的完全含义
      一直未被进行认知实验的心理学家们所认识。由于行为是学到的技术的函数,而不是人
      的信息处理系统的“固有”特征的函数,因此,我们关于行为的知识在性质上就应当看
      作是社会学的而不是心理学的——也就是说,这一知识揭示出,人们在特定社会环境里
      成长的过程中到底学到了什么,他们何时、又是如何学到了一些具体的东西,这也许是
      个困难问题,但是我们不能将学到的策略与构成策略基础的生物系统的固有性质混淆起
      来。
          巴特利特和我们自己的实验室所收集的关于算术码难题的资料说明了同一观点。在
      那一难题中,不同的受试者确实使用着不同的策略——我在前一节简述的各种策略,还
      有其他一些策略。他们怎么学会这些策略的,或他们是怎样在解题时发现这些策略的,
      我们不十分清楚(见第四章)。不过我们知道,策略的复杂程度与受试者过去接触数学
      与喜欢数学的程度成正比。但是,策略问题放在一边,在算术码问题中,强烈表现出来
      的唯一涉及人的特征是短时记忆的有限容量。受试者在执行更带综合性的策略时遇到的
      大部分困难(或许还要加上他们对这些策略的普遍的厌恶感),都源自这些策略给短时
      记忆加上的压力。受试者之所以遇到困难,就是因为他们不记得已进行到哪一步了,不
      记得已经试过哪些配对,不记得在他们有条件进行的配对中隐含了什么假定。在一个短
      时记忆只能容纳几块信息、将这些信息转移到长时记忆所需时间又不够的处理器中,所
      有这些困难必然发生。
          记忆的参数——每块五秒
          如果我们刚讨论的几个参数是内部系统的主要限制(它们在人类认知行为中表现出
      来),那么,估计这些参数的值,确定它们对于不同受试者和不同任务的变化性或不变
      性如何,便是实验心理学的一项重要任务。
          除了感觉心理学的某些领域,心理学中典型的实验范式关心的是检验假说而不是估
      计参数。在实验报告中,我们能看到许多这样的断语:某参数值与另一参数值有——或
      没有——“显著差别”,而对参数值本身却很少评论。事实上,一些人有时候采取这样
      一种不正当做法:报道置信度或方差分析结果,而根本不报道这些结论所本的参数的数
      值。
          我不仅反对实验心理学的发表方面的这种偏向,还有另一点不满。一般说来,人们
      在选择对理论最有意义的行为测度单位时一点也不谨慎。于是,在关于学习的实验方面,
      人们漠然地以“达到标准的试验次数”、“错误总数”、“达到标准的总时间”(或许
      还有其他测度值)来反映“学习速率”。特别是,用试验次数而不是用时间来反映学习
      速率的做法(这种做法在本世纪上半叶一直盛行,而且几乎一直影响到当今),不仅掩
      盖了该参数的显著不变性(我将讨论这一点),也导致了关于“一次试验”学习与“渐
      进”学习的非常没有意义的争论。
          他们还不如埃宾豪斯。在他以自己为受试者的记忆无意义音节的经典实验中,他将
      记忆不同长度的音节序列所需的重复议数与时间都记录了下来。如果你不辞麻烦地计算
      一下,可以发现他在实验中的每音节记忆时间约为10至12秒。
          我看不出有什么必要将这个常数计算到两位小数——甚至一位也没必要。这里说的
      不变性是在一个数量级上的不变,或许是对于因子2不变——这个不变性与日常温度
      
      (在大部分地区,它保持在绝对温度263度与333度之间)的不变性更有可比性,而不好
      与光速不变性相比。没有理由看不起因子2范围内的不变性。牛顿对声速的最初估计值
      包含了一个30%的捏造因子(一百年后才消除),而当今,基本粒子的某些新的物理
      “常数”甚至更含糊。我们通常可以期望,在任何近似的(甚至非常粗糙的)不变性下
      面发现一个真实的参数。一旦我们知道了测量时必须控制哪些条件,该参数的值就能准
      确确定。
          如果这个不变性只反映了埃宾豪斯其人的一个参数——虽然是个几年内保持稳定的
      参数,那么它对传记比对心理学更有意义。但情况不是这样。当我们考察本世纪三十年
      代的赫尔-霍夫兰的一些实验(其报道见S.S.史蒂文斯手册中卡尔·霍夫兰写的一章)
      时,我们再次发现,大学二年级学生用系列预期方法固结无意义音节所需时间在十至十
      五秒之间(这是我们计算的,原先报道的是试验次数而不是时间)。当鼓速增加时(比
      如从每音节四秒加快到每音节两秒),达到标准的试验次数成正比地增加,但总的学习
      时间基本保持不变。
          在这些山中有许多金子。如果从我们现在这一观点出发重新考察过去的无意义音节
      实验,结果会表明,在许多实验中,基本学习参数为每音节十五秒左右。你可以根据已
      报道了的实验(J.A麦克乔奇的《人类学习心理学》一书中报道的实验)自己进行计算。
      然而,似乎是B.R.布杰尔斯基首先使这一参数不变性成了一桩记录在案的事实,并以
      证实这一不变性为直接目标进行了实验。
          在不变性有多大才算“常数”的问题上,我没有夸大。另一方面,提高参数测量质
      量的努力才刚刚开始。我们知道几个对该参数的值有重要影响的变量,关于这些影响,
      我们有一至今非常有效的理论解释。
          我们知道,意义性是一非常重要的变量。学习具有高联想值的无意义音节与互不相
      关的单音节词所需时间约为学习联想值低的无意义音节所需时间的三分之一。学习意义
      连续的散文的每词时间又是学习互不相关的序贯词的每词时间的三分之一左右。(根据
      埃宾豪斯记忆《唐璜》的实验也能得到后一数字。记忆《唐璜》的每音节时间约为记忆
      无意义音节的每音节时间的10%)。
          我们知道,相似性——尤其是刺激物之间的相似性--对固给参数的影响没有意义
      性那么大,我们也可以根据理论来估计相似性的影响程度。
          关于机械言语学习的文献报道了上述现象和其它现象,对这些现象的解释最成功的
      理论是一种信总理论,它被编成了一个模拟人的行为的程序,叫作EPAM。EPAM在文献中
      已有详细报道,这里我就不讨论了。只提与我们的分析有关的一点。EPAM理论给我们提
      供了理解“块”的基矗一个块是刺激物的为人所熟悉的最大子结构。因此,“QUV”这
      样一个无意义音节由“Q”、“U”、“V”三个块组成,而“CAT(猫)”这个词就是一
      个块,因为这是一个人们很熟悉的单位。EPAM认为,固结一个块所需时间为常数。经验
      数据表明,该常数似乎为每块五秒左右,或更大些。事实上,EPAM就意义性、熟悉性和
      相似性对学习速度的影响所做的一切定量预测,都是从块的概念和固结一个块所需时间
      的不变性的概念而来的。
          记忆参数——七块还是两块?
          在关于学习和解决问题的实验中一再表现出来的内部系统的第二个限制性质,是短
      时记忆所能储存的信息量。这里,适当的单位似乎又是块,该术语在这里的意义同在固
      结常数定义中的意义完全相同。
          由于乔治·密勒的一篇理所当然地受到称赞的论文“神奇的数字七,加上或者减去
      二”,人们的注意力就被吸引到这个参数上来了。原先,人们通过数字广度、示数判断
      和区别物体的任务,已对这一参数有所认识。下列情况已不象他写论文时那么讲得通:
      三种任务涉及同一个参数,而不是三个不同的参数。这里我们仅考察数字广度类的任务。
      现在仍不很清楚,该参数的正确值是7还是4——变程太大,使人感到不舒服了。
          关于短时记忆的晚近一些实验所揭示的事实是这样的。如果要求受试者读一串数字
      或字母,然后背诵出来,那么他一般能正确背出串长达七件甚至十件的字串。如果在让
      受试者听和背的当中插入不管什么任务(即使再简单),能背出的件数就下降到两件。
      我们可以称这些数字为“电话号码簿常数”,因为人们在日常生活中对它们很熟悉。如
      果看了电话号码簿后不被打搅(被自己的思想打搅也不行)立刻拨电话,我们一般能记
      住七个数字。
          有些实验似乎表明,受打搅后仍记住了两块以上。不过,这些现象用我们前一节讨
      论的机制几乎便足以得到解释。对这些实验中的一些可以这样解释(如密勒已经指出
      的):受试者先将刺激物重新编码成少量的块,然后才送入短时记忆。如果十件可重新
      
      编码为两块,那么就能记住十件。在另一些实验中,短时记忆似乎记住了“太多”的内
      
      容,那是因为留给受试者的时间较长,事实上允许他们将“超载”件固结在长期记忆里。
          我仅从文献中引两例。N.C.沃和N.A.诺尔曼报道了他们自己和其他人的一些实验。
      这些实验表明,被打搅后,只有件序列的头两件能记牢,其它件没有保持住一点点记忆
      痕迹。对这些实验中的受试者的固结时间的计算表明,向长时记忆转移的每五秒一块的
      转移速率能解释大部分记忆痕迹。(这一解释与沃和诺尔曼提出的理论模型完全一致。)
      罗杰·谢泼德曾报道说,让受试者看连续许多张照片(大部分是风景)后,要求受试者
      在一大摊照片中挑出已经见过的,结果表明他们记得很牢。我们注意到这一任务是识别,
      它所要求记住的只是区分线索,而且每件平均时间为六秒左右,那么,设现象在我们提
      出的理论框架之内是完全可以理解的,甚至也是可以预料得到的。
          记忆的组织
          我还可以引用很多实验来支持固给参数和短时记忆容量参数这样两个概念,来支持
      这样一种假说:这些参数是信息处理系统的主要的(几乎是唯一的)特征,这些标准心
      理实验揭示了(或可能揭示)这些特征。我并未将这些可以引证的实验都列举穷荆这并
      不意味着不存在其它参数,并不意味着我们找不到揭示其他那些参数和估计它们的大小
      的实验方法。它实在只是意味着,我们不应在支配人类行为的规律中,在行为确实简单、
      唯有行为环境复杂的情形中去企求多么了不得的复杂性。
          在我们的实验中,我们发现,心算任务(举例来说)提供了一个找出其他可能参数
      的有用环境。丹色罗一直在进行的工作表明,在进行四位数乘以二位数的心算时,基本
      算术运算和阶段运算结果的固结所需时间只占总时间的一部分(或许占一半)。大部分
      余下的时间似乎用以将数字从被暂时固结的记忆中检索出来,将它们“安排”在短时记
      忆库中的适当位置上,在那儿对其进行运算。我们希望通过丹色罗的工作得出这些新参
      数的估计值,并对这些参数所依赖的过程获得一定的理解。
          刺激物的组块
          现在我想指出某些实验所揭示出的内部系统的另一种特征,它更具“结构性”特点,
      也较难定量。一般认为,记忆是以“联想”方式组织起来的,但“联想”的意义到底是
      什么却不大清楚。麦克米伦和格雷格揭示了联想的一个方面的意义。他们让受试者记忆
      一些字串,尤其是打乱了次序的字母表上的24个字母。他们的单张卡片每次呈现一个或
      三个、四个、六个、八个字母,以鼓励(或引诱)受试者对字母串进行组块。在字母都
      组成块的所有各种情况下,受试者记忆它们所用时间约为每次记忆一个字母所需时间的
      一半。
          麦克莱恩和格雷格也试图弄明白,记住的序列是作为单个长串还是作为分层次的块
      串(其中每个块是一短串)储存在记忆中的。为此,他们对受试者在记诵字串(特别是
      倒背)时的组块方法进行了估计,结果很清楚:字母表是以短的子序列组成的序列的形
      式储存的;子系列往往相应干实验者呈现的块,或那些块的子块;如果让受试者自己组
      块,他们往往偏好三、四个字母的块。(请回忆一下在关于意义性对机械记忆的影响的
      实验中长度为三、四个字的块的作用。)视觉记忆麦克莱恩-格雷格实验中的材料是符
      号串。我们可以就二维视觉刺激物的信息存储形式提出类似问题。记忆和思维在何种意
      义上表现了刺激物的视觉特征?我不想重新激起关于“无形象的思想”的争论——不用
      说,绝不以原形式激起争论。但是,这个争论现在或许较之世纪之交时更易处理了。
          当我进入这块危检的场地时,我因想到还有最强烈地反对精神第一性论的人走在我
      前面而得到安慰。例如,B.F.斯金纳的《科学与人类行为》(Science and Human 
      Behavior,1952,266页)中有一段话,我引证如下:根据条件反射的模式,人可以看
      见或听见“不存在的刺激物”:不仅在X出现时,而且当任何经常伴随X的刺激物出现时,
      他都能看见X。晚餐的铃声不仅使我们馋涎欲滴,还使我们看见了食物。
          我不十分清楚斯金纳博士的“看见食物”确指什么,但他的这段话使我有勇气谈一
      谈信息处理理论中“看见食物”的所指。让我简述一个用以阐明这个问题的实验。假设
      我们让受试者记住下面的视觉刺激物——一个魔方形: 4 9 2 3 5 7 8 1 6然后我们将
      刺激物拿开,问受试者一系列有关问题,记下他的回答时间。3的右边是什么数字?1的
      右边是什么数字?对角线上3的右上方的数字是什么,这些问题的难度不尽相同。事实
      上,我安排这些问题的次序是使难度越来越大,我估计受试者回答最后一个问题较之第
      一个问题需要长得多的时间。
          为什么会是这样呢?如果储存在记忆中的图象等同于一个刺激物的照片,那么我们
      估计回答不同问题所需时间不应有很大差别。我们必须得出结论说,被存储图象的组织
      
      方式与照片很不一样。另一种假说是,被存储图象是一个表结构——这一假说与麦克莱
      恩-格雷格实验所获数据相符,而且在相当大的程度上与认知的信息处理模型的精神是
      一致的。
          比如,若储存的是由“顶”、“中”、“底”三个表(顶4-9-2,中3-5-7,底
      8-1-6)组成的表,那么经验结果就易于理解了。要回答“3的右边是什么数字?”沿
      着表搜索下去就行了。要回答“5的紧下面是什么数字?”的问题,却要对两个表进行
      逐项比较,比前一过程复杂多了。
          当然,受试者无疑可以象记住左右关系一样记住上下关系或对角关系。EPAM之类的
      理论预言说,受试者记住左右和上下两种关系比只记住左右关系要多用约一倍时间。这
      一假说很易检验,但据我所知,尚未被检验过。
           A.德格鲁特关于国际象棋棋局理解的著名实验提供了关于“视觉”形象存储的性
      质的证据,它与我刚刚举的例子的方向是一致的。德格鲁特将从实际比赛中取来的棋局
      在受试者面前放置大约五秒钟,然后撤去棋局,要受试者将它重布出来。特级大师与大
      师可以几乎无差错地重布棋局(棋盘上或许多达20至24个子),而不会下棋的人简直不
      能把任何一个子的位置放对,水平中等的棋手重新布局的质量则介于大师与不会下棋者
      之间。但惊人的是,若给大师和特级大师看棋子乱摆(但棋子数相同)的其他棋盘,他
      们照样摆出来的能力不比不会下棋者重布实际比赛棋局的能力更强,而后者重布此棋盘
      的成绩与重布实际棋局的成绩一样好(或一样糟)。
          我们从此实验能得出什么结论呢?该实验所得数据与“国际象棋大师有特殊的视觉
      想象力”这一假说是不相符的——否则为什么他们重布棋盘的成绩会下降呢?这些数据
      强烈地使人感到,关于棋局的信息是以棋子之间的关系的形式储存着,而不是对64个方
      格进行“电视扫描”。着认为任何人(哪怕是大师)能在10秒内储存64(或24个)棋子
      的信息,则与前面提出的参数——短时记忆容量为7块,固结一块需5秒钟——不符合。
      但他非常可能做到(在短时记忆和长时记忆中)储存足够的关于棋子间关系的信息(假
      使每一关系是一熟悉的块),以致他能重布出图4的棋局: 1.黑方用车保王,侧翼出
      动的王象保王马。
           2.白方用车保后,后的位置恰在王之前。
           3.黑方王5位置上的黑兵受到白方王马进攻,白方后5的兵受到黑方后马进攻,白
      后也攻击对角线上的黑兵。
           4.白方后象从王马5的位置进攻黑马。
           5.黑后从后马3的位置进攻白王的位置。
           6.黑兵站在后象4的位置上。
           7.白方王3位置上的兵堵住了对方黑兵的进路。
           8.各方失一兵一马。
           9.白方王相站在王2的位置上。
          没提及的各子仍处于起始位置。由于上面列出的某些关系比较复杂,我就必须提出
      理由说明为什么将每一关系看成一“块”。我想,多数老练的棋手都会把它们看成块。
      顺便说一句,我是根据自己对棋局的记忆写下这些关系的,写的次序是想到一条写一条。
      有一项实验观察了目注这一棋局的弈棋熟手的眼睛动作,该实验获得的数据倾向于支持
      我们就棋子之间的关系是如何被分解与存储的问题所作的分析。眼睛动作的数据特别清
      晰地表现了第三条关系与第五条关系。
          视觉记忆的讨论对我的主题的隐含意义是:仔细说来,许多视觉化现象并不依赖于
      构成视觉化现象的基础的神经学,但却可以根据记忆的组织的非常一般和抽象的特点加
      以解释和预言——这些特点与我们为机械学习和概念获得现象构造信息处理理论而假设
      的特点基本相同。
          我们尤其被这样一个假说所吸引:记忆是表结构(其组成部分也可以是表)的组织,
      这种结构包括描述性部分(二项关系)和短表(三个元素或四个元素)部分。具有这种
      组织形式的记忆似乎具备合适的性质,能够解释与视觉刺激物、听觉刺激物以及“符号”
      刺激物的存储有关的现象。
          处理自然语言
          一门关于人的思维的理论不能(也不应当)避而不提最富于人类特征的认知技能—
      —语言应用。语言在我刚才勾勒的认知过程的总画面中处于什么位置呢?它在我的总论
      点(即心理学是一门人工物科学)中起着什么作用呢?
          从历史上说,现代转换语法理论和认知的信息处理理论诞生自同一母体——即现代
      数字计算机的发展激发出的思想所组成的母体,诞生自这样一种认识:虽然计算机是用
      硬件体现出来的,但它的灵魂是程序。在转换语法和信息处理心理学这两方面最初的一
      批学术论文中,各有一篇先后提交给了1956年9月麻省理工学院的一次会议。因此,这
      两个理论体系从早期起就具有密切的关系。这很自然,因为从概念上说,它们都是以对
      人类智力的同一种看法为基础的。
          有些人也许要反对说,不是这样,两种理论赖以为基础的对人类智力的看法几乎是
      完全对立的。因为我一直在强调人类思维的人工性——人类思维如何通过个人对知识的
      学习与社会对知识的传播,使自己适应任务环境的要求。形式语言学理论的首要支持者
      们采取了一种有时被称为“本能论”的立常他们争辩说,如果孩子不是在出生时已先天
      具有运用语言技能的基本手段,根本不可能后天获得任何象说话和理解语言这么复杂的
      技能。
          这一争论使人想起了关于语言普遍现象的辩论——即所有已知的语言是否具备一些
      共同特征的问题。我们知道,语言之间的共同性决不是特定的,而与所有语言似乎都以
      某种方式共同具备的非常一般的结构特征有关。象名词与动词之间——物体与行动或物
      体与关系之间——的区别这种现象似乎在所有人类语言中都存在。所有语言似乎都具有
      称为短语结构的盒中盒特征。所有语言似乎都通过转换从一些符号串导出另一些符号串。
          如果我们认为这几条就代表了本能论观点极感兴趣的普遍现象,那么对本能论观点
      至少还有可能的两种不同解释方式。一是,语言能力纯是语言性的,语言是独特的,语
      言所要求的各种人类能力在其他任务中并不都能获得应用。
          本能论立场的另一种解释是,发音和对其他人发音的理解依赖于人的中枢神经系统
      的某些特征,这些特征对于所有语言是相同的,而且,对于除听、说外的人类思维过程
      的其他方面也是不可或缺的。
          前一解释并未对两种基本假定之间惊人的类似之处作出说明(一种是关于人类能力
      的现代语言学理论的假定,另一种是关于人类思维过程的信息处理理论的假定),后一
      种解释例确实做出了这种说明。早先我对人类记忆结构所作的假定,正是人们想要为一
      个能处理语言的信息处理系统作的假定。确实,在这两个领域之间有大量的相互借用。
      二者都以按层次组织的表结构为记忆组织的基本原理。两者都关心串行运算的处理器如
      何能将符号串转化成表结构或将表结构转化成符号串的问题。在这两个领域,同一类计
      算机程序通用语言已被证明为适合于作这些现象的模型和模拟手段。
          语言处理中的语义学问题
          让我提出一种方法,它将使思维的语言学理论和信息处理理论之间的关系比过去更
      紧密。语言学理论迄今主要是一种句法理论和语法理论。在诸如自动翻译任务这种实际
      应用中,当翻译取决于比句法线索更多的东西时--当翻译取决于上下文和“意义”时,
      这一理论就遇到了困难。语言学的进步所必须把握的主要方向之一,是发展一种合适的
      语义学以补充句法。这一点似乎是显而易见的。
          我大致叙述的思维理论已经能为这样一种语义学单元提供一个重要组成部分。我所
      描述的记忆组织原理可以作为讨论语言串和三维视觉刺激物(或其他非语言刺激物)的
      内部表象的基矗给定这些原理作为几种刺激物的组织的可比基础,就较易将语言解释中
      的句法线索和语义线索的协调给概念化。
          麻省理工学院和卡内基-梅隆大学已在这一方面进行了几个研究课题。我想叙述其
      中两个。它们说明,采用这种研究路线,何以就能对语义线索的应用可以消除句法放异
      性这一点作出解释。
           L.斯蒂芬·科尔斯在1967年完成的一篇博士学位论文中描述了一个计算机程序,
      它通过阴极射线管上的图象来消除语义歧异性。我用一个比他实际采用的任何例子更形
      象的例子来论述一下他的程序。看这个句子:I saw the man on the hillwith the 
      telescope.这个句子至少有三种可接受的解释。语言学家无疑还能发现其它种解释。
      选择三个明显的解释中的哪一个,取决于我们认为望远镜在哪里:是“我”拿着望远镜?
      是山上的人拿着望远镜?还是望远镜就在山上,但不在那人手里?
          假设这句子伴以图5,就不再有疑问了。显然是“我”拿着望远镜。
          科尔斯的程序能识别图象中物体和物体之间的关系,能将图象表现为表结构。对于
      眼前的例子,我们可以用这样的表结构来描述看见((我,用(望远镜)),(人,在
      (山)上))我并没有重复他所用的程序的实际细节,只是表明了,如此表现出来的一
      幅图画可以很容易地与言语串的不同解析相对照,从而用以消除言语串的岐义。
          劳伦特·西科洛西的另一程序说明了语义信息如何可以帮助语言习得。读者也许熟
      悉I.A.理查兹及其助手编的“看图说话”课本。这些课本是以多种语言为对象编写的,
      每一页上有一幅画,下面是用有待学习的语言写的关于该图的一个或几个句子。图画与
      伴随的句子是循序渐进地安排的,从非常简单的情形开始(“我在这里”,“那是一个
      男人”)到比较复杂的(“书在书架上”)。
          西克洛西的程序取作为输入的东西与“看图说话”课本类似。假设图画已被转化成
      一个作为内部表象的表结构(与前述例释科尔斯的系统的那个表结构有些象)。该程序
      的任务是,当碰到这样一幅图画时,学会用它正在学习的自然语言说出一个合适的句子
      来——一个叙述图象内容的句子。在关于望远镜的那个句子的情况下(这个句子比实际
      
      检验该程序时所用的任何句子都复杂),人们希望该程序对该图的反应是说出“I saw 
      the man on the hillwith the telescope”,或Ich habe den mann auf dem Berg 
      mit demFernglas gesehen,如果它正在学德语的话。
          当然,只有当该程序已经掌握了翻译所需的词汇和语法时,才能作出正确的反应。
      如果它的词汇和语法不敷要求,它就将与图画有关的句子加添到自己的词汇库和句法库
      中去。
          我并不想将一些开创性的实验扩充为一门完整的语义学理论。这些例子的意义在于
      它们表明了,人们为其它原因而设定以对较简单的认知任务中的人类行为进行解释的记
      忆结构,也适合于解释以下问题:语言串怎样可以在内部得到表现,其他刺激物怎样可
      以得到类似的表现,表现的共性——二者都采用了按层次组织的表结构——如何可以解
      释语言和“意义”在人头脑中的会合。
          那么,人生来具有习得和使用语言的能力这一论点,与语言是人工色彩最强的,因
      而也是人的所有创造物之中最能反映人的特征的这一论点之间,并不存在矛盾。前者断
      言,存在着一种内部环境,它限制着人所能进行的信息处理的种类。语言结构揭示了这
      些限度,这些限度反转来又解释了人类语言之间存在的共性。
          后一论点(关于语言的人工性)断言,内部环境对适应性、对可能的语言所加的限
      制是对组织的非常一般的限制,不是对句法的非常特殊的限制。再者,根据这一论点,
      这些限制不仅施于语言,也施于通过外界刺激所得到的经验的其它每种内部表现方式。
          这样看待语言与思维的关系,使人们可以赋予沃夫假说一个新形式。如果用强烈措
      词来表述,沃夫假说是:唯有可表达的才是可思想的。假如刚才那种对思维与语言的关
      系的观点站得住脚,那么说“唯有可思想的才是可表达的”也一样正确。我想,康德会
      觉得这一说法很亲切。
          结论
          我在本章开初提出的论点如下:
          一个人,若视作行为系统,是很简单的。他的行为随时间而表现出的表面复杂性主
      要是他所处环境的复杂性的反映。
          这一假说又是基于第一章的论点:行为要与目标适应,因此,行为是人工的;因此,
      行为只能揭示出行为系统的那些限制了适应性的特征。
          为了说明我们如何一方面开始检验这些论点,同时开始构造一个由构成人类行为基
      础的简单原理组成的理论,我概述了从大量人类绩效(特别是心理实验室中研究的那些
      绩效)中取出的一些证据。
          人类受试者在解算术码难题、获得概念、记忆、向短时记忆存放信息、处理视觉刺
      激信号和完成采用自然语言的任务等方面的例子,都强烈支持这些论点。人类行为的人
      工性——从而变化性——所要求的证据很少超出对日常生活的观察。因此,这些实验的
      意义主要在于表明了这样一点:在从事不同任务时,人类信息处理系统的组织具有一般
      的共性。
          无可否认的证据表明,人类信息处理系统基本上是序贯运行的。表现在它一次只能
      处理几个符号;正被处理的符号必须存放在特别的、容量有限的记忆结构中;该记忆结
      构中的内容可迅速变化。受试人采用高效策略的能力方面受到的最大限制,源于短时记
      忆结构的储存能力太小(四块),源于将一块信息从短时记忆转移到长时记忆所需时间
      相对说来较长(五秒)。
          当我们从主要运用中枢神经系统的短时记忆能力与顺序处理能力的任务转向涉及被
      储存信息的检索的任务时,就遇到了对适应性的新限制。通过这些限制,我们获得了关
      于思想与大脑的组织的新信息。对视觉理解和需要使用自然语言的任务的研究越来越清
      楚地表明,记忆确实是以联想方式组织的,不过这种“联想”的性质与计算机行业通常
      称为“表结构”的东西相象。我已简单说明了这些性质,下一章将对这些性质进行更多
      的讨论。
          从实验证据产生的对人类思维所作的推论就是这些。这些推论很简单,正如根据我
      们的假说可以估计到的那样。再者,虽然这一图景将不断扩大和清晰起来,但我们估计
      它基本上不会变得更复杂了。只是人类的自尊心才使人们争辩说,较之蚂蚁的路径的复
      杂性,我们的路径呈现出的表现复杂性源于根本不同的东西。
          我的探讨方法和我的论点有一个奇怪的地方:我对生理学方面一点也没谈,但通常
      认为大脑产生思想。我已讨论了思想的组织,却一点也没谈脑的结构。
          让思想脱离实体这种做法的主要原因当然就是我刚刚讨论的论点。计算机硬件与脑
      “硬件”之间的差别并未妨碍计算机模拟各种人类思维过程,这正是因为计算机和脑在
      进行思想时都是适应系统,它们试图改变自己以适应任务环境的形状。
          如果改变这一结论,使它含有神经生理学对解释人类行为无所贡献的意思,那就糟
      了。那当然就成了一种可笑的学说。但是,我们对人工物的分析导致我们对行为的生理
      
      学解释所必须采取的形式持一种特别的观点。神经生理学是对称为人的一种适应系统的
      内部环境的研究。要解释适应性的限度就得靠生理学:为什么短时记忆限于四块?相应
      于“块”的生理结构是什么?在固结信息的五秒钟里发生了什么?联想结构在脑中是如
      何实现的?
          随着我们的知识的增长,生理学解释与信息处理解释之间的关系就会变得象生物学
      中的量子力学解释与生理学解释的关系一样了(或相似于计算机科学的固体物理学解释
      与程序解释的关系)。它们构成了相互关联的两个解释层次,内部系统的限制特性在这
      两个层次的界面上显示出来(如眼前的例子所示)。
          最后,我们也能估计到,既然在内部,我们把信息处理心理学与生理学联系了起来,
      那么在外部,在任务环境方面,我们也将把心理学与搜索大的组合空间的一般理论结合
      起来。不过那就是本书第五章的内容了,因为设计理论就是搜索的一般理论。在讨论那
      一问题之前,我们必须就设计者使用的大量信息是如何储存在人的思想中的、又是如何
      取出的这些问题进行更多的讨论。
          
       
      第四章 记忆与学习:作为思想环境的记忆在第三章展开“人类思维过程是简单的”这
      一命题时,选择来说明论点的例子或许有欺人之嫌。DONALD+GERALD=ROBERT这样的任
      务对于聪敏的成人也足够困难,但它并不需要储存在记忆中的多少信息。解题人必须识
      数,会加减,或许还需要懂得一点点等价的概念。不过,需要知道的全部大概也就是这
      些了。让我们将这一任务与在匹兹堡或在东湾驾驶出租汽车的任务比较一番。出租汽车
      司机必须在记忆中储存大量的关于街道名称、街道位置和十字路口的信息(我的匹兹堡
      地图的街道索引部分收入了约8500个条目),否则再聪敏也无法将车从此处开到彼处。
      然而,如果记忆中有了这些信息,选择一条路线多半不需要一个非常复杂的策略。
          人的思维过程是简单的这一假说是从本世纪50年代和60年代的信息处理研究中产生
      出来的。这种研究多半采用难题型任务(类似于上一章讨论的算术码问题和概念获得任
      务),完成这种任务可以不大依赖于记忆力和以前学会的技能。传道士与食人者难题、
      河内塔难题和逻辑推断问题是又一些例子。所有这些问题都是心理实验室普遍研究的问
      题,它们支持上一章描绘的人类思维过程的图景。
          从这些相对说来无内容的任务着手研究人类思维过程,这是有道理的,但是研究终
      止于这些任务就没有道理了。因此,在过去十年中,认知心理学和人工智能两个领域的
      研究都在越来越多地转向语义丰富的领域——包含着有意义的、充实的内容的领域。在
      这些领域,要熟练完成任务,就需要从记忆中检索出的大量专业知识。在这些领域中,
      人类思维仍然显得是简单的吗?
          在讨论这一问题时,我们将对专业人员每天工作中遇到的任务和准备投入专业生涯
      的大学生们遇到的任务的完成绩效特别有兴趣。实验室研究得相当普遍的专业领域(因
      此它们的部分参数是已知的)包括:弈棋,进行医学诊断,解大学物理题,发现经验数
      据的规则性。我们就用这些和其他一些问题作为例子。
          对于第三章考察的那些任务的完成,长时记忆只起微弱的作用,因此,我们在那里
      发现的简单性主要是过程的简单性(只需设定几个基本的符号处理程序就可解释行为)
      和思想构造的简单性(思想的顺序性和短时记忆的有限性)。有几个参数,尤其是短时
      记忆的组块能力和向长时记忆储存新块所需时间,在确定系统能力的限度方面起着主要
      作用。
          随着我们转向语义丰富的领域,就产生了简单性与复杂性的新问题。长时记忆内容
      的丰富性意味着结构的复杂性吗?还是只要对第三章简述的表结构进行简单的组织便可
      实现这一丰富性?取用长时记忆库内容的程序必须更加复杂吗?或者,在这里引人注目
      的仍是一些对第三章难题型任务的解法作了说明的过程?将新数据与新程序存入长时记
      忆所需的学习程序引入了更大的复杂性吗?我们将看见,对人类绩效的研究和用计算机
      模拟所产生的证据,一般而言是支持简单性假说的。较大的记忆库不一定意味着较大的
      复杂性。
          语义丰富的领域
          人工系统内外环境的边界划分有某种任意性。第二章我们讨论经济行为时,本也可
      以将公司的费用函数看作内部环境的一部分。可是,我们将决策过程从生产技术中分离
      了出来,将理性计算能力的限度仅看作为对适应性的内部限制。费用函数与需求函数都
      被看作公司试图去适应的外部环境的一部分。
          我们可以用类似观点来看一个解决问题的人,他解决问题的基本工具是上一章描述
      的那种小的信息处理系统。这个处理器所作用的外部环境由两大部分组成:一个是通过
      视觉、听觉、触觉所感知,通过腿、手和舌所作用的“实在世界”,一个是关于这一世
      界的大量信息(正确的和不正确的),它们储存在长期记忆中,可通过识别或联想检索
      出来。处理器解决难题型问题时,记忆所起作用有限。是问题的结构而不是记忆的组织
      驾驭着解题搜索方向。当处理器解决语义丰富领域的问题时,一大部分解题搜索发生于
      长时记忆中并受在那里发现的信息的指导。因此,要解释这些领域的解决问题过程,就
      必须依赖于一种适当的记忆理论。
          长时记忆
          关于人类长时记忆的一些性质,上一章已经阐述了。实质上,长期记忆的容量是无
      限的——虽说老年时新东西存不进去了,但似乎从来没人能将记忆充填到溢出的地步。
      将一新块存入长时记忆需5至10秒,而将以前存入的信息检索出来,所需时间则短得多
      (零点几秒至几秒)。由于从记忆中检索出的一个思想会导致另一个,记忆通常被描述
      成“联想式”的。信息储存在互相联系的表结构中。
          根据我们目前对长时记忆的认识,还可以将这一描述再延伸一下。我们可以将记忆
      着作一本大百科全书或图书馆,信息按主题(咨询中心)储存,大量采取相互参照方式
      (联想式联系),并且具有一个通过多重著录帮助人们在很多词条中直接找到标题的详
      尽索引(识别能力)。长时记忆的作用象第二环境(与通过眼耳所感觉到的环境并列),
      解决问题者在其中搜索并能对其中的内容作出反应。
          医学诊断是一语义丰富的领域,现已受到广泛研究。这既是为了理解内科医师采用
      的诊断过程,又是为了建造计算机诊断系统。医学教科书和参考书的厚度表明,准确的
      诊断所需要的信息量是很大的。人们在研究内科医师的诊断策略时发现,在医生们边想
      边说的初步诊断中有两种突出过程:直接识别(某一症状的呈现几乎立刻使医生作出某
      病也许是其原因的假设)与搜索过程(与第三章描述的较简单的解题任务所采用的过程
      很象)。诊断通常是从症状出发,然后假设一个病源,接着是消除疑问与排除其它可能
      性的检验,又发现新的症状,等等。于是,搜索在两个环境(医生掌握的医学知识的
      “思想”图书馆与病人身体)之间交替进行。在一个环境中发现的信息用以指导在另一
      环境中的下一步搜索。
          直觉
          对于“直觉”的突现火花,对于这种有时能让专家立刻得出对新手来说只有经过漫
      长的搜索才能找到(如果还能找到的话)的答案的东西,又该怎么说呢?(我将“直觉”
      放在引号里,以强调它是一种过程的名称,而不是读过程的解释。)直觉是一种很真实
      的现象,可以非常简单地加以解释:大部分直觉飞跃都是识别行为。让我用弈棋来说明
      这一点。
          第三章我描述了国际象棋大师与特级大师的惊人能力,他们能在看棋局五至十秒钟
      后几乎无差错地将棋局重布出来。这一本事与短时记忆的已知限度不矛盾,只要注意到
      对于国际象棋大师来说,一个棋局不是由25个孤立的棋子组成的,而是由五六个块组成
      的,每一块是几个棋子的熟悉的组合。既然我们可以根据人们惯走的着法估计出(至少
      粗略地)棋局有多少种类,我们也就可以估计大师的长时记忆中必须储存多少个熟悉的
      块才能重布棋局。几种不同估计方法得出的数字的总量值都在50,0O0上下。我们不必
      认真对待这一做字,但有趣的是,这个数字与受过大学教育的读者的自然语言识别词汇
      量在同一数量级上。
          因此,我们可以说,大师弈棋技巧的一部分就在于储存在记忆中的50,000块,在
      于以局面检查的结构的形式出现的索引,该索引使他能在棋盘上将这些块中的任一块认
      出来,并能从长时记忆中检索出与这一块有联系的信息。这一与熟悉的棋局有联系的信
      息也许包括遇到这种棋局时应当怎么办的知识。因此,一个有经验的弈棋者在认出称为
      开放线的局面时,立刻就想到向该线运车的可能性。这一步也许是(也许不是)佳着,
      但是,它是每当出现开放线时就必须考虑的一着。弈棋高手不仅认出自己已置身其间的
      局势,也识别出对付这一局势的适当措施。
          一个能够对50,000个不同件进行区分的局面检查系统可以非常迅速地进行区分。
      如果每次检查结果是二分的,那么,完成每次识别只需进行约16次检查。(“二十问”)
      游戏就是以20次两分检验能区分一百万件这一事实为基础的。)如果每次检查需10毫秒,
      则全过程可在200毫秒内完成——比人类识别能力的时间极限小多了。
          当下快棋(十秒走一步)或同时与50个人对弈(在这个棋盘上走完一步,马上就要
      迅速地考虑另一盘棋)时,大师主要是凭“直觉”处理,也就是要识别棋局和这些局面
      所暗示的着法。这时,大师将不如在锦标赛中走得好(锦标赛中每走一步平均约有三分
      钟考虑时间),不过相对说来棋锋仍很剑一个人的技巧也许会从特级大师级下降到大师
      级,或从大师级降到高手级,但绝不会消失殆荆因此,识别能力以及同可以识别的棋局
      相联系的信息,构成了弈棋技巧的一大要素。
          多少信息?
          大师储存的信息量与其他领域的专业人员具有的信息量似乎大致差不多——不过,
      
      对信息量仅有最粗略的测量值。初看起来,象棋艺、医学、数学、化学这些如此不同的
      
      学科对记忆容量的要求不大可能是不相上下的。但是,记忆容量差不多这一点对这些领
      域的性质并未揭示出什么东西。无人能够掌握有关棋艺、医学、化学或任何其他严肃领
      域的现有全部知识。这里同在别处一样,技巧的量度必须是人。如果一个专业人员与同
      行的其他专业人员知道得差不多一样多,那么他或她的知识才够用。给专业人员的知识
      设置了上限的是能够用以获得和保留知识的时间量——它只是人一生中处于醒觉状态的
      时间的一小部分。
          根据目前人们对向长时记忆库储存新信息的速率的了解,在十年内(比如专业训练
      的十年)掌握50,000块这么大的知识量并不是不可思议的。当然,与大师(或其他专
      业人员)所知道的东西相比,50,000块是估计过低了。但是,即使我们将这一估计值
      提高一、两个数量级,那么多信息或许仍能在十年内掌握。若向长时记忆库储存一个新
      块需十秒钟的注意力,那么十年的强化学习(每年学3500个小时),就可以产生1260万
      块的记忆储量。不过,即使一名白天黑夜连轴转地工作、空想时间减到最少的有献身精
      神的专业人员,也不大可能掌握比1260万块更多的内容,因为,大概大部分时间不能花
      在学习新东西上,而是用以巩固已经学过的东西。
          在这一问题得到研究的几个领域,我们确实知道,即使最有才能的人也需要约十年
      时间方能达到第一流的专业水平。除了从开始下棋到达到大师水平只用了九年零九个月
      的博比·费希尔,还没有任何人在不到十年的时间内达到这一水平的。除了莫扎特,从
      来没有一个作曲家认真研究和练习未满十年就写出第一流作品的;即使对于莫扎特,他
      开始谱曲的头七年到十年间作的曲子是作为少年曲(Juvenalia)而出名的,算不上是
      “大师”之作。
          当一个领域发展到这样一种地步,以致不可能在十年上下获得淳熟的专业活动所需
      要的知识,那么就可能发生几种适变性的变化。专业化程度通常将增加(如在医学中所
      发生的那样),从业人员在其工作中将更多地借助书籍和其他外部参考手段。
          建筑学是很好的例子。在这一领域中,专业人员所需的许多信息储存在参考书(如
      现有建筑材料目录册)、设备、部件和法定建筑规程之中。没有哪个建筑师打算将所有
      这些记在脑中,或搞设计时不经常借助这些信息源。事实上,建筑学几乎可以作为语义
      丰富的任务领域的设计过程的代表。即将出现的设计结果体现在一组外部储存结构之中:
      草图、平面图、公用系统图,等等。在设计过程的每一阶段,这些文件所反映的局部设
      计起着重要刺激物的作用,它们向设计者暗示下一步应该试图做什么。有了新的子目标,
      人们又能从记忆和参考源汲取新信息,朝设计的完成迈出又一步。在下一章,关于这一
      设计活动循环及其对风格的隐含意义,我还要给以进一步讨论。
          不应当以为,人类知识的每一进展都使专业人员必须掌握的信息量增加了。相反,
      科学上的一些最重大的进步,是发现和检验了一些能将大量事实归到几条一般原理之下
      的有力的新理论。在知识的精致化与通过理论将知识压缩成更加简略的形式这两种趋向
      之间一直存在着竞争。因此,我可不敢说如今的职业化学师一定比半世纪前(也就是在
      量子力学的一般定则公诸于世以前)的化学师学得更多。但他必须知道得家一个勤奋的
      人在十年左右的研究时间里所能学到的那么多,这样说或许没问题。
          为处理的记忆
          至此所讨论的记忆仿佛主要由一批资料组成似的。但是专家不仅具有知识,还具有
      技能。他们不仅获得了识别局势、提供有关这些局势的信息的能力,也获得了处理这些
      局势(如果遇到了它们)的管用的专门技能。医生不仅要诊断,也要开药方和动手术。
          知识与技能的界限是捉摸不定的。例如,当我们用机器语言之外的任何语言编写计
      算机程序时,我们实际上写下的不是程序而是数据结构。然后,这些数据结构被解释或
      编译成程序——也就是说,成为计算机能够理解与执行的机器语言指令。但是,对于多
      数目的,干脆将翻译步骤忽略掉,认为用较高级的语言写成的计算机程序就反映了过程。
      这样做对我们是很方便的。
          我们可以认为,医学诊断系统(人或机器)具有大量医学知识和依此进行推断的几
      条通用程序。或者,我们也可以认为,知识是组织在程序中的,它指导专家如何继续诊
      断。例如:如果病人发高烧,那么检查一下是否还有下列症状。
          类似地,学生的几何知识亦可作为定理来储存:如果两个三角形的对应三边相等,
      那么它们是全等的。
          或者,换一种方式,作为条件一行动偶(这叫作产生)加以储存:检验两个三角形
      的对应进是否一一相等;如果都相等,储存这两个三角形全等这一断语。
          无论专门知识的储存形式是数据或过程,还是二者的某种组合,都不改变我们对复
      杂性已下的论断。我们还是可以认为,专门化的知识或技能留驻在长时记忆这一外部环
      境中,等待着被用于控制和指导解题搜索的一般过程——象手段目的分析和识别这样的
      过程,我们在第三章讨论较简单的任务环境时已经列举了这些过程。
          理解与表现
          解决问题的活动必以理解该问题的活动为先导。下面是一个大部分人都觉得颇难的
      难题型任务的例子。
          饮茶仪式
          在喜马拉雅山区的山村客栈里流行着一种非常典雅的饮茶仪式。仪式包括一名主人
      和不多不少两名客人。当客人到达入座后,主人为他们恭行五种礼仪。这五种仪式列在
      下表,是按喜马拉雅山民归于他们的高贵程度的递增次序排列的:通火;煽风;分米糕;
      彻茶;诵诗。
          在礼仪进行过程中,在场的任一位都可以向另一人,“尊敬的先生,允许我为您完
      成这一繁重的任务吗?”不过,只可以要求做另一人正打算做的诸事中高贵程度最小的
      一桩。而且,若一个人打算做好几件事,那么他请求为别人做的事不能比他已经开始做
      的高贵程度最小的事更高贵。习惯要求,到饮茶仪式结束时,所有任务都已经从主人传
      递给了地位较高的一位客人。怎样才能做到呢?在“通用解题者”(见第五章)出马解
      决饮茶仪式问题之前,必须根据书面陈述,用“通用解题者”能够处理的结构物摘取一
      个问题描述。这些结构物是:符号结构、发现结构之间差别的检验、改变结构的操作子、
      符号化的目标及对目标完成情况的检验。当问题用这样的结构物来表现时,“通用解题
      者”才能理解,然后使它的各种程序(探测差别的,求取相关操作子的,运用操作子的,
      评价解决问题的进展程度的)工作起来。
          事实上,饮茶仪式问题与喜马拉雅山的山村客栈一点关系也没有。仪式底下是一个
      抽象问题,它关系到两类客体(参加者与任务)、客体之间的关系(每一任务分派给一
      个参加者去做)、任务的排序(按照高贵程度)和操作子(将任务由一个参加者传递给
      另一个参加者)。要理解这一问题,就要求将这些内容从自然语言的陈述中摘取出来。
          一个有理解力的程序
          有一个名叫“理解”的计算机程序,它模拟人们对饮茶仪式这种问题建立内部表象
      (即进行理解)的过程。“理解”分两阶段进行工作:先对问题指令的句子进行语法分
      析,然后根据经过语法分析的句子摘取出的信息构造一个表象。
          分析自然语言句子的任务已在上一章进行了讨论。分析的任务就是根据线性词串推
      断出隐含着的词组和从句的层级结构。“理解”程序是用相当正统的方式(类似于现有
      的其他语法分析程序)完成这一步骤的。第二阶段(构造)更为有趣。这里,对经过语
      法分析的句子进行考察,以期发现提到了哪些宾词和宾词集,提到了宾词的哪些性质,
      这些性质间的关系是什么,哪些谓词与关系描述了状态,哪些描述了步骤,目标状态是
      什么。“理解”接着构造一个表现状态的规则,产生出步骤符合规定(通过将一个状态
      转变为另一状态)的程序。
          例如,对于饮茶仪式问题,可以用三名参加者的表来表现一个状态,每一参加者则
      用他打算完成的任务的表来描述。另一张表可以说明五项任务的高贵顺序。步骤符合规
      定的程序将从某一参加者(施方)的表中抹去一个任务,加到另一参加者(受方)的表
      中去(经检查确认这一任务不如施方或受方表上的其他任务高贵之后)。
          既然,(如上一章所论证的)表结构能够很普遍地表现各种符号信息,那么从原理
      上说,象“理解”这样一个程序便能够为实际上任何一种不需现实世界的知识便可被理
      解的难题型问题构造表象,因为任何这样的问题都可依照宾词、宾词的关系及这种关系
      的变化来描述。
          理解物理学
          与理解“饮茶仪式”类的问题相比,理解语义丰富领域的问题就要求具备该领域的
      基本知识。考察一个简单的静力学问题:一梯子的脚搭在竖直的墙上,又与水平地面接
      触。梯子顶部由墙中水平引出的一根30英尺长的绳子拉着。梯子50英尺长,重100磅,
      重心距梯脚20英尺,一名150磅重的人站在距梯项10英尺的梯级上。
          求绳子受到的张力。
          为了着手解决这一问题,必须知道什么是摩擦系数,知道可以把梯子看作一个有支
      点、有一些力作用在此支点上的杠杆,知道可以将一个人抽象地看成一块物质或一个支
      点,知道诸如此类的许多事实。这种问题与饮茶仪式问题的区别,不在于前者有着现实
      世界的参照物,而在于它要参考一些应该是已知的东西。
          戈登·诺瓦克编写了一个非常有趣的程序,叫“艾萨克(ISAAC)”,它能够理解
      上述这种物理学(静力学)问题,“艾萨克”之所以能完成这个任务,是因为它借助简
      单的图式在存贮器中储存了关于杠杆、质量、斜面等等的信息。那些简单图式描述了这
      些宾词,并指出了与它们相联系的各种信息。例如,一个关于梯子的图式是这样的:梯
      子类型:梯子位置:(梯脚位置、梯顶位置、提到的其它点的位置)支持物:长度:重
      量:附加物:(附加到其他宾词上的东西)陈述的句子进行语法分析。不过,对于“艾
      萨克”来说,除了确认宾词和关系并加以适当的表现以外,还涉及更多的东西。意义已
      知的(即“艾萨克”的存贮器提供了图式的)一些特殊种类的宾词必须连同其图式一起
      被识别,图式的“孔”必须填入必不可少的信息。必须承认梯子是一杠杆,必须用杠杆
      图式构造出一个梯子,详细说明其长度、重量、重心、支点位置、作用在支点上的力,
      等等。
          确认了合适的宾词图式、积累了关于这些图式的合适的信息之后,“艾萨克”就能
      将各个图式(它们分别描述了梯子、人、梯子置于其上的表面)装配成一个复合问题图
      式。用这一复合图式作为指导,“艾萨克”构造适于描述力的平衡的方程并求解。
          对于能理解语义丰富领域的问题的系统,“艾萨克”是有代表性的。物理学知识以
      两种形式储存在该程序里:一是组无图式,它指导着表现问题状态(问题图式)的过程,
      二是产生平衡方程(即静力学定律,与“理解”一类程序中创造操作子的过程相应)的
      程序。
          比较这两个有理解力的程序,我们看见,“理解”必须凭空创造出自己的问题表述
      与操作子,只受问题指令中信息的指导,而“艾萨克”则必须注意问题陈述中提及的事
      物与存贮器中储存的图式与物理定律是否相符。一个更精致的理解系统则要结合这两种
      能力。该系统的一个组元(相应于“理解”)在遇到新的问题领域时会产生状态表象并
      将这些作为图式集储存下来。另一组元(相应于“艾萨克”)将努力应用已储存的表象
      来解释呈交给它的新问题。
          现存的有理解力的程序无论是多么原始,它们总归提供了一组基本机制(或曰一个
      理论)来解释人类能够理解问题是怎么一回事——无论是他们一无所知的新领域中的问
      题,还是他们以前已多少具备一些语义知识的领域中的问题。有些程序对范围愈益扩展
      的各种任务中的理解过程给以解释,我已描述的这两个具体系统便是这种程序的越来越
      壮大的家族中的成员。这些系统中有一些是处理相对说来不明确的任务的。比如,现在
      有很多研究以也许有助于人们理解儿童传说或新闻故事的过程为对象。与这里讨论的解
      决问题任务——对于这种任务,很易检验系统是否理解了问题(即,它是否构造了一个
      解决问题者可据以求出答案的表象)——不同,一个故事是否已被“理解”的检验是模
      棱两可的。在这种检验任务中,可以实现不同水平、不同深度的理解。
          具有理解力的程序为我们第三章讨论的一个题目——视觉图象问题——提供了新的
      启示。“理解”产生的状态描述与“艾萨克”的组元图式与问题图式是在前面的讨论中
      作为“心象”提出的符号结构的佳例。事实上,诺瓦克编写了一个辅助程序(作为“艾
      萨克”的一部分),它根据自己的问题图式产生一个对问题情形的实际(即使还嫌简单
      的话)描述,可以显示在阴级射线管上。
          规模与简单性
          具有理解力的程序从外界获得信息(在本书的几个例子中,是以自然语言文本的形
      式),将它转化为知识,又将知识以表结构或程序的形式储存在长期存贮器中。如果存
      贮器获得了一张非常残缺不全的、往往还是模糊不清的外部世界的照片,解题程序就可
      在存贮器这个内部世界(而不是外部世界)里完成其部分工作。每当需要付出昂贵代价
      才能获得外部世界的信息时,能够在内部世界工作的优越性就显示出来了。
          随着对更多事物的知识的增加,存储库也在增大,从根本上说可以无限增大。然而,
      不管存贮器达到多大容量,它仍由同样的基本组元构成,按照同样的原理组织和标引,
      由基本形式相同的程序进行操作。我们可以说系统由于规模增加而变得更复杂了,我们
      也可以说它是简单的,因为它的基本结构末变。
          如果我们正在讨论国会图书馆的简单性与复杂性,我们亦可如是说。随着藏书量从
      几千册增加到几百万册、几千万册,用以放书的书架总长英里数亦相应增加,目录卡片
      数也同样增加。但是,不论这种增加给人的印象有多深,就图书馆建筑而言,总不能说
      复杂性增加了。正如我在第七章将要讨论的,从单细胞生物向多细胞生物的转变代表在
      复杂性上提高了一级;小公牛体重的增加或藻类菌落群体的增大则并不反映复杂性的增
      加。
          人们的头脑中载有许多领域的知识,甚至还经常载有几个领域的专门技能。由于这
      些领域往往是互不相同的,领域的众多丝毫不增加在其中任一领域工作的复杂性。在图
      书馆中钻研希腊语课本并不因为图书馆也收藏有关于拉丁语、梵语和古汉语的著作而更
      困难一些(或更容易一些)。
          最好把人的记忆看作发生着人的思想过程的环境的延伸(有时是大大的延伸),而
      不要看作是思想过程复杂性的增加。这整个建筑的了不起之处正是在于,记忆使系统能
      
      在广阔范围内的不同任务领域里有效地工作,而使用的基本设备与系统在理解和解决饮
      茶仪式问题或物理学中的简单静力学问题时采用的设备是相同的。
          学习
      
          思想的外部环境,无论是实在世界还是长时记忆,都经历着不断的变化。对于记忆,
      这种变化是适应性的。它将关于现实世界的知识更新,增加新的知识。它加进去有助于
      一些任务领域的技能的新程序,改善现有的程序。一门关于人类思维的科学理论必须考
      虑记忆内容的这一变化过程。
          如果人的认知系统确实很简单,那么,只有发现变化之后的不变量,才能揭示出这
      一简单性。这些不变量包括记忆基本参数(内部环境的参数)和第三章描述的一般搜索
      和控制过程。除了这些,我们还可以找一组基本过程,它们带来了长时记忆的适应性,
      即我们称为学习的东西。我们可以提出如下假说:这些学习过程是不为它物所动的推动
      者,它们可以用简单而恒定的方式解释变化过程。
          在一系统中,凡任何变化使系统适应环境的能力产生了或多或少是永久性的改变,
      这种变化就是学习。有理解力的系统,尤其是能理解新任务领域的问题的系统,是学习
      系统。第三章描述的模拟人的机械言语学习的EPAM也是学习系统,该章描述的模拟第一
      语言学习的西科洛西系统也是。
          任何多组元系统都可以在许多方面加以改善。“学习”这个术语并不是只能专属地
      用于人类认知系统的任何单独一种变化。然而,我们不必被学习形式的多样性唬住,因
      为它们可以简化为几个基本类,与认知系统的几个主要组元相应。
          沿着一个维度,我们可以区分获得信息(储存的数据结构)和获得技能(储存的程
      序)这两种过程。“理解”程序说明了二者。“理解”程序构造的状态描述构成了新知
      识,新操作子,新技能。除了这些,还有新的感知辨别的学习,如EPAM所例示的。运动
      技能虽然部分地基于已经列举的各种学习,但或许也还包含其他要素。
          根据关于学习的研究的目前发展水平,要想对各种学习过程作一详尽的分类还为时
      过早,而要解释人体所能完成的各种学习就需要这种分类。不过我们有理由相信,多数
      种类的人类学习可在我们刚刚描述的符号处理系统的框架内得到解释。
          理解式学习
          每个老师都知道,学生学习功课的死记硬背方法与消化理解方法(或曰注重意义的
      方法)之间有天壤之别。死记硬背学会的东西几乎可以逐字逐句地反刍,但是不可能用
      作为认知工具。实验室实验表明,消化理解较之死记硬背通常能更快地掌握材料,记住
      的时间更长,能更好地将这些材料转到新任务上去。
          尽管机械学习和有意义学习的区分有着重大的实用意义,人们还没有从信息处理角
      度充分弄懂这种区别。这部分地是一标引问题:有意义的材料以某种方式被标引了,于
      是当用得着它时便可很容易地取出来。部分地,它又是冗余问题:有意义材料是有冗余
      地存储的,这样,如果材料的任一小部分忘记了,可以根据余下的部分重新构造出完整
      的材料。部分地,它是表现问题,有意义材料是以程序而不是以“被动的”数据的形式
      存储的,或者,如果以数据形式存储,那么是以使通用解题程序和其他程序能方便地利
      用它们的方式加以表现的。理解与意义度的所有这些方面都需要进一步探索。
          产生系统
          对于数据结构与程序组成的信息处理系统,通常,设计出向现系统增加新图式和其
      他数据结构的方法比向现系统增加新程序要容易。在人工智能研究的早先几年,人工智
      能和模拟程序通常组织为程序与子程序的层级结构。程序的修改涉及一个或更多子程序
      的修改,是一桩不易完成的任务。
          在过去几年里,一种新型程序结构时行起来:产生系统。一个产生系统是任意多个
      产生过程的集合。每一产生过程由两部分组成——一组检验或条件,一组行动,每当产
      生条件得到满足,产生过程所包含的行动就得以贯彻。在此意义上说,产生过程的进行
      完全是相互独立的。产生过程通常由下记号表示:条件→行动这使人想起刺激-反应
      (Stimulus-Response)心理学中的熟悉的S-R偶。虽然产生过程是比S→R偶更复杂的
      宾词,但有时还是可以用后者来譬喻前者。
          模拟人的认知行为的系统可由两种产生过程构造而成:一种产生条件是对短时存贮
      器内容的检验,另一种产生条件是对外界的感知检验。前一种产生条件的例子可以是:
      “如果你的目标是进屋子,那就打开门。”这里,进屋的目标应由短时存贮器中的一个
      符号结构表现,这一结构是否存在便是对短时存贮器的检验。
          感知产生过程的例子可以是,“如果门锁着,那么使用你的钥匙。”这里,条件在
      现实世界受到检验(确定门锁了没有)。
          行为受感知产生过程支配的系统有时叫作刺激驱动或资料驱动的;行为受短时存贮
      器中的目标符号控制的系统叫目标驱动的。一个以目标驱动为主的解决问题者似乎是由
      想望的目标倒过来工作。一个以刺激驱动为主的解决问题者则似乎是由自己知道是指向
      目标的步骤正向工作。当然,目标导向系统通常既采用以认知为条件的产生过程,又采
      用以目标为条件的产生过程。
      
          现在已有许多认知模拟是靠产生系统来进行的。人们特别喜欢用产生系统来进行模
      拟的原因是,比较容易赋予这种系统学习能力——赋予学习能力也就是构造所谓的适应
      性产生系统。由于产生系统只不过是产生过程的集合,通过取消某些产生过程或加入新
      的产生过程就修改了系统。这种改变的结果也许是适应性的,也许不是,但至少这种改
      变系统的方法是没有疑义的。从例子中学习在科学和数学课本解释新方法的章节中,几
      乎总能发现给出一步一步详细解题过程的例题。例如,在一切等代数课本中,也许会发
      现如下内容: 9x+17=6x+23 3x+17=23(两边同减去6x) 3x=6(两边同减去17) 
      x=2(两边同除以3)在每一步,代数方程都被修改并给出修改“理由”。当求得形如
      下式的表达式时,过程终结:<变量>=<数值>这一方程与类似方程可由下列产生系
      统求解:如果表达式是<变量>=<实数>的形式→终止。
          如果等号右侧有变量项→
          从两边减去变量项,化简。
          如果等号左侧有变量项→
          从两边减去数值项,化简。
          如果变量项的系数不等于1→
          两边除以该系数。那么,若一个过去未学过解题程序的聪敏学生遇见了课本中列出
      解题过程的例题,他可通过下法学到程序。考虑例题的头两步,他注意是采取什么措施
      将第一行转化为第二行的。他又比较方程对,注意到6x从右侧消失了,左侧x的系数也
      变化了。试一下该措施,他发现它恰好能产生这一结果。而且,消去了6x的表达式在形
      式上比最初的表达式更接近最终等式。这样,将被消去的最初表达式的特征作为行动条
      件,他就学会了一种新的产生过程。这一产生过程是我们的产生系统中的第二步。类似
      地,比较第二与第三方程,他推出并掌握了第三种产生过程,通过比较第三与第四等式,
      又推出并掌握了第四产生过程。第一个产生过程大概他已经会了,也就是说,他懂得
      “解”代数方程是什么意思。
          我在叙述中略去了一些重要细节,比如,该学生怎样为产生过程选择合适的推广程
      度(为什么第二产生过程的条件句与行动句中说“变量项”而不说6x?)但即使这一简
      化了的例子也使人对适应性产生系统如何获得新技能的问题有了个一般性的了解。这一
      具体图式是戴维·内乌斯设计和编制程序的。
          通过例子进行学习的思想可以延伸一下,成为通过“干”进行学习的方法。假设一
      个解决问题系统能解决某一具体问题,但效率不高,要经过大量搜索。最终发现的通往
      解答的路径在剥去所有搜索旁支后,就可作为一个具备解算过程的例子,前面几段说的
      程序都可应用于此。安乍伊和西蒙曾为河内塔难题(Tower of Ha- noi puzzle)编了
      一个这样的“干中学”图式,它通过连续几遍地解决该难题,逐渐掌握一个有效的通用
      战略。
          发现过程
          已为别人所知的事物之学习与对于大家都属新鲜的事物之学习,两者之间没有鲜明
      的界限。什么算得上新颖,取决于解决问题者头脑中已有哪些知识,在增长知识过程中
      从环境得到了什么帮助。因此,我们应当能想