|
复杂性中的思维 作者: 克劳斯·迈因策尔 4、复杂系统和心-脑的进化 人们如何解释心和脑的形成呢?本章首先扼要回顾一下心-身问题的历史。除了宗 教传统以外,前人所持有的心和身的概念常常受到科学和技术的最高级标准的影响(4. 1)。在复杂系统框架内,大脑的模型是非线性动力学的复杂细胞系统。精神状态的形 成(例如模式识别、感情、思维)被解释为大脑集合体中(宏观)序参量的演化,序参 量是远离热平衡的学习策略中神经细胞的非线性(微观)相互作用引起的。例如,模式 识别就被解释为某种相变,显示出与决定着物理学、化学和生物学中模式形成的演化方 程有相似之处。在神经生理学的认知心理学的最新研究中,科学家甚至推测,意识和自 我意识的形成也取决于作为自反映的神经实现的“元细胞集合体”的产生率。弗洛伊德 的无意识,被解释为某些注意状态和序参量的(部分)关闭。甚至我们的做梦和情绪也 表现为是受非线性动力学支配的。 “人的脑和心问题上的牛顿”被找到了吗?当然没有。复杂系统探究方式不能解释 精神是什么。但是,我们可以为在一定条件下的某些精神状态动力学建立模型。甚至原 则上也包括为意向性行为建立模型。复杂系统不需要类似于大脑中的“小人”这种虚构 的中心处理者。因此,瓦丘的富有嘲笑意味的观察过时了,他的观察中没有发现人体中 有任何灵魂,甚至经过了上百次的解剖也是如此。精神气质被理解为复杂系统的一种整 体状态,由其部分的局域非线性相互作用引起,但是不可能被还原为部分。我们的奇妙 的情感、想像和创造性,自从人类文化开始以来一再为诗人和艺术家所赞颂,但是复杂 系统方式还没有触动这些问题,尽管我们将模拟其非线性动力学的某些方面。 4.1从柏拉图的灵魂到拉美特利的《人是机器》 自然中的最复杂的器官之一是人的大脑。今天,我们知道,由于有了大脑,才使得 人的精神、意识和人格的形成成为可能,而这一切自从人的思维出现以来一直被看作是 人的最大的奇迹之一。运用复杂系统探究方式,我们可以用复杂神经网络的非线性相互 作用来为人的感知和思维的形成建立模型。因此,复杂系统的模型就有助于我们去理解 心-身过程是如何工作的,是如何在一定条件下的自然进化中出现的。基于这种观点, 从长远来看,对于符合自然进化规律的意识和精神的形成,也就不会感到惊奇了。但是, 它的产生仍是一个谜。 在我们探讨复杂系统和心-身的进化之前,让我们先回顾一下早期的精神哲学和神 经生理学史。对照历史背景,我们可以看到,传统的心-身问题中的哪些问题已经由复 杂系统探究方式解决了,哪些问题还没有得到解决。 在前面的几章中,我们已经指出早期的神话和宗教信念都试图解释人们生活的世界 并对自然力作出想像。显然,人的欲望、恐惧、愤怒和想像力,如同自然的强制力那样, 支配着人所生活的世界。意识或心灵或精神或灵魂都是生命所经历的,它们似乎在人死 后就“离开”了人体。人们已经力图用自己熟悉的关于相互作用着的物理事物的经验, 来为这些未知的过程建立模型。精神或意识状态被假定为叫做“灵魂”的特殊的实体或 某种类似的东西,正是它们造成了人的意向性行为。伴随着这种精神状态的假设,引出 了这样一个问题:灵魂处于身体中何处。通常的回答是,它是由身体提供的,或它是集 中在某些器官中,例如心脏和肺部。尽管这种惊人的“事物”效应显然是真实的,但是 它不能像上帝或幽灵那样,是不可见、抓不住的。因此,人们普遍地相信,它具有某种 神性的起源。前苏格拉底的哲学家们,在对传统的信仰和宗教信念的批判中,从自然中 寻求原因和原素。一些思想家把“灵魂”看作诸如“气”和“火”这样的物质,因为, 它们被看作最精细、最轻盈的物质形式。在阿那克萨戈拉看来,精神是运动和有序的原 则,因此也就是生命的原素。在赫拉克利特看来,灵魂如同由宇宙的规律(逻各斯)所 控制的火焰。灵魂如同火,被水消灭:“死就是灵魂变成水”。这些探索就是用熟悉的 已知的东西来为未知的东西建模。 值得注意的是一位早期的医学思想家、毕达哥拉斯派学者、克劳东的阿尔克梅翁, 他看来是第一位把感觉和思维定位在大脑的古希腊思想家。像古希腊早期的太阳中心宇 宙中的天体模型一样,这种天才的思想很快就淹没在亚里士多德的权威之中,亚里士多 德认为心脏是意识的场所,大脑仅仅是用空气来进行冷却的机器。尽管亚里士多德深受 古希腊医学思想家的影响,但是他不同意希波克拉底的伟大洞见:大脑是“意识的信使, 并告诉它发生什么”。 德谟克利特捍卫了早期的还原主义精神哲学。他力图把精神状态还原为最小原子的 相互作用。他的还原论中,“灵魂”当然就仅仅由特殊的物质(但不可观测的)原子来 定义。与物质的定义或类比相反,毕达哥拉斯哲学家把人或动物的灵魂解释成非物质性 精质,因为它可以想像为非物质的思想,如数字和关系。换言之,灵魂是用数学的比例 系统来建模的,它的和谐或不和谐代表着如同音乐旋律的精神状态。 毕达哥拉斯的概念影响了柏拉图关于人类灵魂的哲学,这种哲学与他的形式或理念 论结合在一起。在他的对话《美诺篇》中,柏拉图表明,一个未受训练的奴隶是可以求 解数学问题的。在柏拉图看来,所有的人在获得任何(先验的)经验之前都有某种永恒 的知识。人通过分有永恒的形式和理念具有某种先验的知识例如数学,这些形式和理念 是ante rem即与存在物的失真的、暂时的表面现象无关。 亚里士多德批评了柏拉图的实在背后的理念世界的假说。理念是人对形式的抽象, 形式在自然中发挥着作用。灵魂被描述为活物体的形式(“实质”),即“原初隐德来 希”,它是一种目的性力。但是,它并不与物质分离。灵魂是人体中的一种潜能。按照 亚里士多德的说法,人的机体被理解为一个整体。 然而,在亚里士多德和斯多葛传统中,已经发现了神经系统的解剖学。盖仑相信, 神经把心灵普纽玛输送到肌肉,从而引起运动。心灵普纽码不仅仅是一种如同呼吸和空 气那样的物质材料,也是一种生命精灵。在中世纪,亚里士多德和斯多葛派的自然哲学 对伊斯兰传统中的医学思想家有巨大的影响,如阿维森那,他建立了一个医学学派,在 手术、药理、治疗和康复中都留下了令人印象深刻的活动。后来,这些波斯和阿拉伯世 界的医学准则只为少数几个基督教中世纪的思想家如艾伯特·马格努斯所认识。在关于 心和脑的哲学方面,例如,有关人的意识问题的科学讨论总是被宗教意识形态所掩盖, 解剖尸体长期以来也是相当危险的事情。 与亚里士多德和阿维森那传统中的整体论哲学相反,笛卡尔的理性主义倡导了一种 二元论的本体论,把精神和物质、灵魂和身体严格两分。人体是一台物质机器,是按照 机械和几何定律构造起来的。它受到天赋观念的引导和控制,天赋观念体现在人的精神 之中。在他的《沉思录》中,笛卡尔通过怀疑一切事物的方法而得到人的精神的最基本 直觉。方法上的怀疑是要找到那不容置疑的东西。笛卡尔能够怀疑所有的科学的结果、 常识的结果和感知的结果,但是他不可能怀疑他自己的存在,这样的存在使得认识过程 如怀疑成为可能。 那我是什么呢?是那进行思考的东西。所思考的东西是什么呢?它在进行着怀疑、 理解、肯定、否认、下决心、反驳,它还在进行想像和感受。 当然,笛卡尔理论的困难之处在于精神和身体的相互作用。他假定人的机体以及它 的种种器官都是受到座落于大脑中的精神所引导的。神经是进出于大脑的消息通道。它 们作为发令的精神和执行的肌肉之间的因果链而起作用。按照他的力学的钟表范式,笛 卡尔相信,在神经通道中快速地运动着所谓的“动物精灵”的细微物质粒子,它们相互 推动着,从而把来自大脑的输入传递给肌肉。 与自然界的所有机械效应相反,人的精神可以自由地决定运动的方向。因此,精神 对动物精灵的作用就使它们的运动转向。这并不违反笛卡尔的物理学规律,只要“运动 的量”是守恒的(即后来所谓的动量守恒定律)。图4.1示意出笛卡尔的机械感知模型: 微小的光线粒子撞击着人的眼睛,通过特定的神经激发了大脑及其“动物精灵”。手臂 的运动由大脑中的精神的感知所协调。 在《灵魂的情感》一书中,笛卡尔甚至试图把所有的情绪状态如害怕和热爱分析为 被动的物理结果,种种“动物精灵”的流动都由外部事件引发。如果在笛卡尔的机械模 型中,用生物化学物质和物理电效应如荷尔蒙和神经激发来取代动物精灵,那么这种神 经活动概念就显得相当现代了。 笛卡尔的主要困难是非物质的中介相互作用问题,也就是无广延的不可见的精神, 与物质性的即有广延的可见的身体之间的相互作用问题。笛卡尔把精神植于非常小的脑 器官——松果腺之中,而松果腺驾驭着动物精灵的运动。但是,无广延的精神是如何作 用于有广延的粒子如动物精灵的呢?在力学的框架中,这种相互作用问题原则上是无法 解决的,从而引起了精神哲学的若干发展。 在偶因论哲学家如马尔布兰奇看来,所有的因果关系都是不可思议的。上帝必定干 预了所有特定情形的因果作用。因此,心-身问题就赋予了神学的特设假说。斯宾诺莎 把笛卡尔的心和身的二元论归结为单一实体的一元论。上帝就是万物的唯一实体。自然、 精神和身体的一切外表,都仅仅归结为宇宙“实体”的属性(“状态”)。任何时候都 没有奇迹。但是,上帝和人的精神都自然化了,自然也就在宇宙泛神论中变得神圣了。 按照复杂系统探究方式,正是莱布尼茨提供了最令人瞩目的精神哲学。与其自然哲 学相联系,我们回想起莱布尼茨的宇宙,它与笛卡尔和斯宾诺莎的宇宙相反,是由无限 的许多实体(“单子”)构成的,它们相当于空间中不同点的观察,或多或少地透视了 整体。因此,单子被看作一种类似灵魂的实体,被赋予了感知和记忆,但是其意识的清 晰程度有差别。有些实体例如人,与动物、植物和石头(它们的意识程度是逐次降低的) 相比,具有较大感知和较高程度的意识。甚至上帝也可以植于莱布尼茨的单子论中,它 作为中心单子,对整体具有最高程度的意识和最好的感知,但仍然是一种个体和有差异 的实体。 显然,莱布尼茨没有笛卡尔的相互作用论的形而上学问题。他实际上试图把经典的 力学与传统的亚里士多德自然目的论结合起来,因为他意识到机械论缺少的精神哲学成 份。从现代的观点看,莱布尼茨的类似灵魂的实体显得有些奇怪,它们具有感知和记忆, 具有或多或少的生机。但是,对他来说,在具有或多或少复杂性的自动机框架中,用单 子论来建立模型却毫无困难。莱布尼茨提出,每一实体都可以用一种单子的自动机来建 立模型,单子的不同状态相应于单子的不同的感知。其意识程度是用其复杂性程度来度 量的,标志着单子状态空间和信息处理能力的大小。莱布尼茨的具有不同复杂性的自动 机的状态,都在关联网中相互关联,用他的名言来说就是单子没有“窗户”、没有相互 作用,但是像巴罗克建筑中的镜子一样相互反映。在第五章“复杂系统和人工智能的进 化”中,将更详尽地讨论莱布尼茨的单子之网。总之,莱布尼茨假定了,精神不仅仅属 于人类,而且也是系统的一种特征,这些系统按照其复杂程度表现出不同程度的强度。 英国经验主义哲学家如洛克和休谟批判了笛卡尔-柏拉图的如下信念:精神状态可 以用反省和纯粹思维的方式进行分析,而无需感觉经验。在经验主义哲学家看来,精神 只不过是一块白板,一个接受感觉数据的贮藏室,它是通过联想和抽象而形成概念的。 想像只是感觉印象的不那么生动的复本;感知印象可以形象地结合起来,形成如同独角 兽那样的概念。 从复杂系统探究方式来看,休漠发展了一种著名的联想心理学理论。他主张,自然 中没有因果机制,精神中也没有因果规律,因果关系只不过是对于那些感觉印象的无意 识的联想反映,它们在若干情形如闪电和雷鸣以关联的方式出现。我们可以说,大脑具 有无意识的建造感觉印象模式的能力。概念只不过是标志具有或多或少复杂性的感觉印 象模式的术语。除了数学以外,再没有建立在感知基础上的明确概念,只有一些关于事 件的或多或少概率断言的模糊模式。在《人类的本性》一书中,休谟写道: 在我面前的桌子仅其外表就足以得到广延的观念。于是,这种观念是从印象中获得 并表现的,是在这一时刻显示给感觉的。但是,我的感觉向我传达的印象,不过是有颜 色的点,处于某种方式。如果眼睛可以更进一步地感知事物,我就希望它可以向我揭示 这一切。但如果它不可能进一步显示出任何东西,我们就可以得出有把握的结论,广延 的观念只不过是这些颜色点以及它们的表现方式的复本。 按照笛卡尔的理性主义,人的精神支配着身体机制,如同他所处的专制主义时代的 君主统治着国家。对于休谟来说,不存在脱离的人的精神实体。存在的只不过是一个自 组织的区域,其中不断地发生着新模式的生成和旧模式的消失,这都由强度不同的感觉 印象的联想所引起。休谟的感觉印象的自发结合和分离,可以比做民主社会中的自由公 民,他们以群体或党团形式结合起来,而不是听命于君主。 康德试图把理性主义和经验主义综合起来。经验主义的观点是,认识始于经验和感 觉资料。但是,理性主义是对的,因为我们需要精神结构、认知图式和范畴,以组织经 验和认知。康德试图引人奠定牛顿力学公理的哲学范畴。他的认识论的主要特征是,认 识并不是我们大脑的白板对外部世界的被动印象所引起的。在康德意义上的认识,是一 种主动的过程,由先验的范畴产生着世界的模型。物理事件的空间和时间顺序被归结为 直觉 的几何形式。在康德意义上的感知是主动的信息处理过程,受到先验预期的调控。 通过先验的因果范畴,事件的因果联系在哲学上成为可能。 因果关系是不能感觉在这点上休谟是对的,但是,在休谟看来,为了精确预见和计 算弹子球弹出的路径,只是重复弹出弹子球几次并重复联想感觉印象几次还是不够的。 我们必须预期,原因和结果可以由某种确定论的关系联系起来。康德认识论中的一般 (确定论的)因果图式实现了这一点。但是,哪一种特定的原因作用是合适的,这个问 题要由物理实验来确定和检验。认知图式已经在日常生活中运用着。它们在计算机科学 中甚至用编程语言的数据图式来建立了模型(参见5.2节)。因此,康德的认识论可以 解释为现代认知科学的重要先驱,在认知科学中假定由认知图式整理大量的经验材料。 但是,与康德相反,这些认知图式可以在历史发展中发生变化,正如相对论中从欧几里 得空间转变到非欧几何空间所表明的那样。 斯宾诺莎主张一种精神的一元论,以跳出笛卡尔的二元论,而拉美特利却支持一种 唯物主义一元论。笛卡尔的分离中类似灵魂的实体的假设被认为是多余的,因为所有的 精神状态都应该归结为人体中的机械过程:“人是机器”。拉美特利主张,在人和动物 之间并无根本性差异。智能和反映行为都应该用神经的“冲动”来解释,而不是用“机 械中的幽灵”来解释。但是,在18世纪的力学框架中,拉美特利的革命性观点只是鼓舞 了生理学研究纲领。 著名的数学物理学家和生理学家赫尔曼·冯·赫姆霍兹(1821-1894)是一位后康 德哲学家。他支持一种自然化的认知范畴框架,它是构造任何对世界的特定感知所要求 的。当然,康德以后,范畴也发生了变化。然而,仍然有一些基本的图式如空间、数目、 测量和因果性概念标志着19世纪的物理学理论。例如,赫姆霍兹意识到了非欧几何的数 学可能性。因此,他认为,正确的物理几何必须由物理测量来确定。 在生理学理论方面,赫姆霍兹起初是约翰尼斯·米勒(1801-1858)的学生,约翰 尼斯·米勒常常被人们称作现代生理学之父。米勒坚持一种特殊的神经能定律,它要求 每一神经都具有其自身特定的能量或品质。他发现,感觉是可以由机械影响或化学影响、 热、电等等所激发的。康德有关感知的一面现在自然化了,因为它证明了,脑必须根据 其对于神经的效应来重构世界。然而,米勒坚持一种非物质的动物精气的概念。他相信, 动物精气是不可能测量的,因为它们的速度太快了。 赫姆霍兹从数学方面探讨了能量守恒定律。由于能量可以转化,但是不可能创造或 消灭,生命的非物质的能量超出了守恒定律因而显得没有意义。赫姆霍兹偏向于这样的 理论,即一旦涉及到能量问题,身体就可以看作是把能量从一种形式变换为另一种形式 的机械装置,而无需特殊的力或精气。化学反应可以产生出机体所产生的所有物理活动 和热。肌肉的活动是由肌肉中的化学和物理变化所实现的。赫姆霍兹进一步测量了神经 传导速度,并揭示出,它甚至比声速还要慢。从哲学上看,这些结果被解释为对米勒的 生命力论的驳斥。 埃米尔·德·博伊斯-雷蒙德(1818-1896)是米勒的另一位学生。他认为,神经 效应实际上是一种电活动波。在那时,组织学借助显微镜开始发现独立的细胞体和纤维。 按照这些结果,神经活动和大脑看来是复杂的神经细胞(“神经元”)系统,具有复杂 联结网络。20世纪初,人们首次描述了神经元通信结构,其中一个神经元向另一个神经 元发送信号。但是,对于突触联系的观察,在本世纪中叶左右开始运用电子显微镜之前 是不可能的。 感知、思想和情感的出现如何从这些神经解剖学和神经生理学的描述中得到解释呢? 一位最先用神经网络的细胞集合体来解释精神状态的思想家,是美国哲学家和生理学家 威廉·詹姆士。詹姆士在他的简明教程《生理学》(1890)中,坚持达尔文主义和进化 观点,认为大脑并非是为了进行抽象思维在进化中构造起来的,而是为了保证生存才构 造出来的。他以实用主义的方式假定,大脑具有许多良好的工程求解问题的特征,它们 适用于精神操作: 离开了进行认识的物理环境,精神因素就不可能得到适当的研究……总之,精神和 世界必须一起进化,因此也就是某种相互适合的结果。 大脑组织在进行算术演算和形式逻辑推导时显得十分可怜。但是,形成概念和联想 的能力,作出好的猜想和提出假说,却是大脑的显著特征。詹姆士提出了一种关于联想 的机械模型,它可追溯到休谟的先驱性工作,并启发了我们后来的联想神经网络。以更 定性的方式来看,他提出了某些原理,其中一部分为现代复杂神经网络的数学模型所吸 收: 1.詹姆士相信,联想是机械性的,是大脑皮层的功能。 2.詹姆士的联想原理: 当两个基元脑过程一起被激活或随即相继被激活时,其中之一具有再现出将激发传 播给另一个的趋势。 3.詹姆士的脑活动的加和规律: 脑皮层中任意给定点的活动量,都是所有其他点向它放电的趋势之和,这种趋势 (1)正比于该点伴随的激活次数;(2)正比于这种激发的强度;(3)正比于竞争点 的缺少,这种点与第一个点没有功能联系,向其中放电可能转移。 如果在第二个原理中,用“神经元”代替“脑过程”这个术语,那么我们就获得了 一种突触的描述,突触是霍布后来引入的(参见4.2节)。如果在第三个规则中,用 “神经元”代替“大脑皮层中的点”,我们就获得了突触输入的线性加和规则,这与某 些霍布类型的神经网络模型很接近。詹姆士还讨论了部分联想的网络通过某种特殊的细 胞联结程序将遗失部分重建起来的能力。尽管詹姆士虽然是不熟悉计算机辅助建模的, 但是他已经抓住了复杂系统探究方式的基本见解,即复杂的事件是由大量子联想构成的, 它们是通过诸如突触这样的基本机制联结起来的。 在论述“联想”的一章中,詹姆士讲到了一个人对一个晚宴聚会的思考。此人在考 虑晚宴的所有活动时,首先只是想到第一步具体做什么。这第一步的所有细节的组合又 只是随后提醒下一步,如此等等。对于图4.2,詹姆士概括地描述了这种过程: 例如,如果a、b、c、d、e是由晚宴聚会最后活动所激发的基无神经迹,可将其称 作动作A;l、m、n、o、p是要穿过夜幕回家的基元神经迹,我们将其称作B;因为a、b、 c、d、e的每一个和全部放电都将通过此路径向l放电。类似地,它们向m、n、o、p放电; 这些后来的基元神经迹每一个都将加强另一个动作,因为在经验B中,他们已经共振起 来。图4.2[4.19,图5.7]中的线段示意了放电进入每一个B的组元的加和,这些影响 的组合强化了其中的处于加和的B,使B被唤醒。 詹姆士坚信,“精神质料表现出的有序只是脑生理过程引起的”。在现代的复杂系 统探究方式中,序参量被用来描述精神状态,它们是由宏观的神经元集合体引起的。在 后面的各节中,我们将看到,从前苏格拉底哲学家到康德和詹姆士,他们对于精神操作 的许多基本见解,甚至今天也并没有从根本上被改变。 4.2复杂系统和神经网络 19世纪,生理学家发现了诸如感觉、视觉和肌肉运动等等依赖于个体细胞的神经系 统的宏观效应。这些细胞通过引发电流或对电流作出反应,从而能够接收和传送信号。 显然,神经系统和大脑是自然界进化中的一种最为复杂的系统。人的大脑中至少有100 亿个神经细胞(神经元)。每一个神经元都接受其他细胞的输入,并把输入整合起来, 产生出某种输出,并将它送给其他的神经元。输入由特定的突触所接收,输出由特定的 输出线所发送,这种输出线叫做轴突。 一个神经元自身就是一个复杂的电化学装置,其中包含有连续的内部膜电势。如果 膜电势超过了一定的阈值,神经元就传送一个数字作用电势给另外的神经元。在细胞体 中产生的神经脉冲,沿着一个或数个轴突传播。神经学家通常区分出激发突触和抑制突 触,这使之有些类似于神经元的发放动作电势。围绕着突触的树突可以接收来自数个到 数千个其他神经元发送来的信号。一个神经元的活性是用它的发放频率来度量的。生物 神经元并非二元的,因为输出是连续的。不过,许多神经网络模型都进行了简化,运用 二元计算单位。 大脑是这种细胞的复杂系统。虽然单个神经元没有视觉,不会推理,也不能记忆, 但是大脑却可以具有这些能力。视觉、推理和记忆被理解为较高级的功能。倾向于自下 而上策略的科学家提出,只有每一神经元和突触的特殊性质都得到探讨和解释以后,大 脑的较高级的功能才能得到认识和理解。 复杂系统探究方式的一种重要洞见是揭示了,整体系统的突现效果不可能还原成单 个元素的系统效果。从哲学上看,整体大于其部分之和。因此,对于大脑的纯粹的自下 而上的探索策略是注定要失败的。另一方面,纯粹自上而下策略的拥护者主张认知完全 独立于神经元系统,他们又置身于老笛卡尔的两难境地:“幽灵是如何驱动机器的?” 在精神哲学中传统的做法(参照4.1节)总是或多或少地倾向于其中的一种研究策 略。在18世纪,莱布尼茨和后来的动物学家邦尼特已经指出,自然界中存在着组织发展 程度不同的复杂性。在图4.3中,示意了神经系统中的组织水平。解剖学的组织等级包 括不同的大小尺度,从分子尺度到整个中枢神经系统。 这种尺度考虑了分子、膜、突触、神经元、核、环路、网络、皮层、映射、系统和 整个神经系统。在图的右边底部示意了化学突触,中间的网络模型示意了神经书细胞如 何连接成一个简单的视皮层细胞,在上部示意视皮层的可视区的亚组织,左边是整个的 中枢神经系统。 对这些等级水平的研究透视,可能涉及到这样一些问题,例如,信号是如何在树突 中整合起来的,神经元是如何在网络中相互作用的,网络是如何在例如视觉系统中相互 作用的,系统是如何在中枢神经系统中相互作用的,或者中枢神经系统是如何与其环境 相互作用的。每一层都可以用决定其特定结构的序参量来标志,序参量是相应的特定等 级层次的子系统的复杂的相互作用引起的。例如,从底部出发,我们可以区分出不同次 序:离子运动、通道构型、动作电势、电势波、行进、感觉、行为、情感和推理。 十分显然的是,神经系统的一种重要功能是支配和控制机体在环境中的生活条件。 例如,一个初级可控状态的例子是有机体的温度。在环境状态变化的最高水平上需要有 预先计划和社会相互作用,这就导致了在复杂的文化进化中出现了人类的书面通信功能、 创造艺术、解决数学问题等等。 从达尔文的观点来看,神经系统及其复杂性层次不断增加的进化,表现为受自然界 的最基本目的——适者生存——所推动。一些脑科学家甚至强烈主张:诸如抽象思维这 样的精神现象的形成,也仅仅是某种“副现象”,它并非是自然自身所倾向的。关于自 然的意向性和目的性的信念,当然仅仅是人的一种隐喻,假定了某种世俗化的神性—— 称之为“自然”——在支配着进化。按照复杂系统探究方式,每一中枢神经系统水平都 具有其自身的功能特征,是不可还原为较低层次的功能特征的。因此,从层次透视来看, 抽象思维只能被看作某个层次例如体温控制系统的某种“副现象”。 为了给大脑及其复杂的能力建立模型,区别出如下的范畴是十分合适的。在神经元 水平的模型中,研究集中在每一神经元的动力学性质和适应性质上,以把神经元描述为 单元。在神经网络水平上,均一的神经元相互关联起来展示出突现的系统功能。在神经 系统水平上的模型中,若干个网络结合起来展示出更复杂的感知功能、原动功能、稳定 控制等等。在精神操作水平的模型中,描述的基本的过程是认知、思维和问题求解等等。 它们的模拟与人工智能框架密切相关(参照第5章)。 从方法论的观点看,我们必须意识到,模型决不可能穷尽一切,也不可能是实在的 同构映射。例如,在物理学中,单摆模型忽略了摩擦。在化学中,分子模型将轨道中的 电子看作类似于太阳系中的行星,而不理睬海森伯不确定原理。然而,这些模型在一定 应用条件下都是有用的。大脑模型的条件由大脑组织的水平给出。如果建立起一定水平 上的大脑组织的功能模型,该模型就应该考虑到该水平之上和之下层次的条件。较高水 平的性质常常是无关的。一般地,建立模型的方法论由计算方法的代价和收益来决定。 一个试图在各个方面都是现实的人脑模型就需要过于高昂的分析和建构。它可能永远难 以满足所希望的目的,因此是不实际的。科学家在致力于为大脑组织的一个个水平建立 模型时,对有关的下一层次进行简化,就将更为成功。另一方面,模型必须是富有成果 的,以能揭示大脑组织的根本性的复杂特征。 按照复杂系统探究方式,大脑功能的建模应该采用适当的描述大脑活动的动力学轨 迹的态空间和相图。法国数学家和哲学家勒奈·笛卡尔已经在(欧几里得)几何框架中 描述了感觉、手臂运动和大脑的合作(图4.1)。 今天,神经网络是用矢量空间和神经矩阵来进行几何描述的。神经元的电化学输入 与输出之间有权重联结。在小脑的图式区(图4.4)中,神经矩阵的权重Wij允许网络通 过矩阵相乘从输入矢量计算出输出矢量。 图4.4的例子涉及3×4的神经元矩阵。神经生理学建模要求巨大的灵活性,因为神 经网络可能是相当复杂的。但是,联结矩阵可以有效地将高维态空间变换到其他的不同 维数。在数学上,这些高维的变换可能引起几何问题,使用初等形式分析几何难以求解。 在这种情况下,就需要广义的张量网络理论,以管理复杂的坐标。从历史上看,令人惊 奇的是,从欧几里得几何转变到更一般的拓扑空间和度量空间,不仅仅可以在相对论中 表述外部世界,同时还可以表述神经系统的内部特征。 用笛卡尔早期的方法,让我们涉及一种基本的感知原动坐标,它由矢量或张量变换 来代表。动物如何抓住一个被它的感官所感知的对象(图4.5a)?在一个简化的模型 中,两眼的位置最先在一个感知数据的二维空间进行编码。这个态空间可以形象表示为 一个二维拓扑图。从感知态空间的某一点发出一个脉冲到相应的原动态空间的一个点, 原动态空间也是由一个二维拓扑图来代表的。原动态空间的一个点为相应的手臂位置进 行编码(图4.5b)。 眼前庭反射是另一个感知原动坐标的例子。生物藉此神经排列,通过与头部运动方 向相反的眼球的短弛像运动,从而把影像稳定在视网膜上。在此神经系统中,涉及两种 神经结构,它们可以由中枢神经系统固有的不同的坐标系来代表。首先,我们必须分析 耳前庭器的半圆通道,每一边有3个通道,可由三维坐标系来代表。其次,每一个眼球 都有6条外眼肌,这相应于六维坐标系。因此,眼前庭反射感知原动坐标,用几何方法 由三维(共变)向量的张量变换来描述。这种数学框架可以用来计算任何的由一定前庭 输入造成的眼肌激活。 在神经元和神经网络水平上,人工单元的网络用来模拟和考察大脑组织。这些单元 被假定在0和1之间变化。每一单元接收来自其他单元的信号,其间通过突触以不同的权 重联结起来。接受和发送表示是值的有序集合,输出单元是适当激活了的。数学上,这 种程序可以解释为作为证据的某种输入对于作为功能值的输出的一个映射。功能规则是 由权重的排列所决定的,它们依赖于神经网络的拓扑。 在大脑中,神经元常常构成了作为输入层的群体(图4.6)。这些细胞的轴突发送 到第2层神经元。在这第2层细胞的轴突又可以投射到第3层细胞群体上,如此等等。在 所有输入单元中的自发激活的集合体是作为矢量的输入刺激的网络表示。这种输入矢量 及其活化层次向上面的中间层次传播。结果是一组活化层次,它们由输入层的输入矢量, 以及从输入单元的分枝末端到中间层那些关联权重所决定。这种中间层的活化矢量向上 传播到最高的单元层,在3层网络的情况下产生了一个输出矢量。这个输出矢量由中间 层的活化矢量和处于中间单元到输出单元的分枝的终端的关联权重决定。 一个仅仅具有输入层和输出层的两层网络是一种简单的刺激-反应图式,具有可观 测的、可测量的输入和输出。在3层网络的情况下,中间层的单元及其权重常常难以直 接测量,而只是被假设为某种处于黑箱中的隐藏机制。因此,它们被称为隐含单元。 当然,真实的神经系统显示出多得多的单元和层次。例如,对于人来说,大脑皮层 的结构包含了至少6层各异的神经元。顺便指出,图4.4所示的小脑的神经矩阵的输入 对于输出的映射,可以等价地由具有输入和输出的两层神经网来描述。3层神经网络等 价于顺序相连的两个神经矩阵。但是这种多层的网络不可能推广到整个大脑和神经系统, 因为在实际大脑中细胞群体往往在给定层次中表现出广泛的细胞与细胞的关联。这需要 在某些不同的模型中加以考虑。 按照复杂系统探究方式,特定层的神经元可以被解释为态空间轴线,代表了该层可 能活性状态。状态的发展,即其动力学由轨迹来说明,轨迹可由该特定网络的某种学习 过程所引起。 例如,感知可以用神经网络的矢量处理来解释。最初,来自外部世界的对于输入神 经元的刺激样品(例如,作用于眼睛的电磁光信号、颜色,或者作用于耳朵的声波), 它们在神经网络中被加工,产生出某种输出矢量,代表了例如外部世界的视觉或嗅觉图 像。但是神经网络必须学会在大量的输入信号中区别和识别出正确的形式、颜色、声音 等等。 学习程序只不过是一种对于众多极重的调节,以获得所希望的输出矢量(例如感 知)。学习程序可以由数学算法来加以模拟,这是人工智能研究中的重要课题(参见5. 3节)。它们在每一神经层次上(也是由矢量来代表)产生出权重构型。在任一给定的 时间,突触值的完整集定义了一个权重空间,在每一轴线上的点说明了每一特定权重的 大小。一般来说,学习意味着使得最适解(感知、思想等等)和不适解之间的错误和差 异最小化。因此,学习过程可以形象表示为权重空间的轨迹,轨迹从初始的随机集合位 置出发,到达最终的最小误差位置(图4.7a)。这种建模的关键意味着,可以通过算 法程序使某个函数具体化来获得网络中的权重。业已假定,任何可表示的世界都可以通 过权重的构型在网络中得到表示。 图4.7a示意了学习过程中突触权重空间的轨迹。这个空间进行了简化,只有3个权 重,代表了3层网络中突触的所有权重值的组合(图4.6)。图4.7示意了相应的活化 矢量空间,其轴线是3层网络中的隐含单元(图4.6)。 权重空间和活化空间是类似的空间,因为代表类似事物类似矢量由位置近似来反映。 权重构型把类似的事物集合在一起,考虑了权重空间可能对于事物之间的细微差异的敏 感性。因此,在活化空间,我们可以区分出原型矢量,它们代表了具有细微差异的类似 事物,细微的差异由其到原型矢量的距离来度量。在观察和行为的宏观水平上,这些原 型矢量可以代表特定的范畴,如树木、植物、果实、人物等等,它们都有或多或少的相 似性。在复杂系统动力学的框架中,原型矢量可以被解释为点吸引子,把态空间划分为 若干个区域。 类似的原动行为(诸如抓拿、行走等等)用原动态空间的类似轨迹来表示。正如我 们看见的,学习意味着权重依据某种算法程序重新构型。关键性问题在于:成千上万的 细胞和突触如何知道它们在什么时候应该变化其状态而不需要小妖的指引? 唐纳德·霍布在他的著名的《行为组织》(1943)一书中提出,学习必须被理解为 一种复杂脑模型中的自组织。如同生命有机体的进化,组织“妖”的信念可以去掉,用 复杂系统探究方式的自组织程序来代替。历史上,这是首次清楚地提出了生理学的突触 变化的学习规则。霍布在关于复杂的脑模型中使用了“联结主义”一词。他引入了突触 概念,后来被称为“霍布突触”。如果两个神经元同时发放,两个神经元之间的联结就 得到加强。 当细胞A的轴突充分靠近细胞B使之激发,并可以反复地或持续地向其发放,在细胞 之一或两者之中就发生了某种生长过程或代谢变化,使得A向B的发放效率也就增加了。 “霍布规则”在1949年还只能是一种假设的实体。今天,它的神经生理学上的存在 得到了经验确证。霍布规则并非一种精确的数学陈述。我们在后面还将看到可能霍布类 型的联结主义学习规则。霍布规则的一种简单的数学表述要求,神经元A映射到神经元B 的权重WBA的变化△WBA正比于A的发放速率vsuAsu和B的发放速率vsuBsu的平均值,即△ WBA=εUAUB,其中ε是常数。 在霍布类型的规则主张的图式中,强化神经元的前提倾向于是“毋需[外部〕教 师”。在此意义上,它是一种自组织的方法,使得神经元发放与成群的刺激模式越来越 好地关联起来。霍布意识到,大脑运用相互联结的神经元的整体模式来表示某种事物。 他明确地运用了“细胞集合体”一词,这对于现代神经科学是关键性的。激活的细胞集 合体可以相应于复杂的感觉或思维。哲学上,霍布的细胞集合体的思想使我们想起休谟 的联想概念,但他的联想只具有脑心理学上的基础而没有脑生理学的基础。 霍布的生理学概念是如何溶进现代的神经网络复杂系统之中的呢?这个联想网络的 基本概念要求,一个输入矢量与输出矢量用某种变换而“联结起来”。在数学上,两种 矢量类似性可以由其内积来度量,内积即由两个矢量相乘,其中的元素乘以元素,然后 将这些乘积加起来。在几何上,内积是正比于矢量之间角度的余弦。在两个矢量总相等 的情况下,角度为零,这意味着相似性是完全等同的。 因此,所贮存的原型矢量(例如典型树的原型图)与输入矢量(例如对于特定树的 感觉)之间的相似性,就可以在联想网络中由其内积来计算。原型矢量假定贮存于联结 网络中的输入和输出的权重矩阵之中。图4.8a示意的网络中,有代表着输入元素的水 平输入线、垂直输出线和联结的权重(这里采用二进制,空心圆圈为零,实心圆圈为 1)。 如果一般地,输入矢量(xj)与输出矢量(yj)通过线性变换从yj=EWijXj联结起 来,其中Wij是贮存的权重矢量,于是我们就获得了一种简单的线性联想子。这种联想 网络,能够对于代表某种范畴例子的矢量进行分类,这种范畴是由所贮存的原型矢量实 现的。对于动物的生存,这个任务实际上是关键性的。在现实中,种种或多或少的类似 的感觉(例如怀着敌意的动物)必须进行鉴别并归于某一范畴。 某一种联想网络可以进行矢量完善或矢量校正。所谓的自动联想网络可以产生一种 输出,使之在仅仅给出贮存矢量的一部分作为输入时,尽量地接近预先贮存的矢量。在 现实中有噪声的(例如一个人的图像),必须根据所贮存的图像来加以完善。一个霍布 类型的规则,可以通过加强在神经元之间的相关活性程度的关联权重来完成这一任务。 一种增加这样的复杂网络能力的方法是,对于输出单元引入非线性的阈值。线性的 联想网络(例如图4.8a)具有前向反馈拓扑,信息从输入单元流向输出单元。霍布类 型的学习程序认为,神经单元的局域的相互作用通过自组织而收敛到正确的总输出。网 络中的循环信息意味着某种反馈构造。在图4.8b中,每一单元都接受从外部的输入,同 时也接受网络中内部单元的反馈。权重由水平线和垂直线的交接点来表示。 显然,图4.8b模型的复杂系统是一种非线性的反馈网络,它允许范围广泛的可能 的动力学。约翰·霍普菲尔德讨论了一个著名的例子(1982)。他的非线性反馈网络的 类型具有收敛解的动力学。对于它们的兴趣不仅仅是由于对大脑的建模,而且是由于 (正如我们将在关于人工智能的第6章见到的)发展出新的网络技术。对于我们的复杂 系统探究方式,值得注意的是,霍普菲尔德是一位物理学家,他把运用于自旋玻璃体物 理学的数学方程运用到了神经网络上。 铁磁体的动力学是大家熟知的一个热平衡态的保守自组织的例子。在伊辛模型中, 铁磁体由自旋体点阵构成,每一方向都可以是向上(↑)或向下(↓)的。每一自旋体 都可以与其近邻发生相互作用。在最低能量状态中,所有的自旋体都以相同方向排列。 在高温下,自族体的方向是随机的,因为热能使得涨落大于相互作用能。如果减低温度, 自旋体就变得按照相同方向排列。显然,自族体的行为类似于磁体(参见2.4节)。在 动力学上,它表现为寻求作为某个吸引子状态的最近的局域能量极小值(图4.9a)。 但是,只有所有的相互作用是吸引作用,才有在相同方向上的所有自旋体点的单个能量 极小值。在吸引相互作用和排斥相互作用混合的情形下,复杂系统如自旋玻璃体可以具 有许多局域能量极小值。 霍普菲尔德提出,神经系统的功能是在态空间发展起来的一些局域稳定点。态空间 的其他的点流向作为系统吸引子的稳定点。由于对稳定点的偏离的消失,这种动力学是 一种自校正程序。另一方面,稳定点适当地将一个并不完善的始态矢量丢失的部分弥补 起来。因此,这种动力学可以用来完善有噪声的输入。 霍普菲尔德的模型是相当简单的,包括有阈值的逻辑单元。加和的突触输入并将此 加和与阈值进行比较。如果此加和处于阈值或阈值之上,就产生出1,否则就产生出0。 除了自联结之外,神经元相互联结时,就认为该网络恢复了。数学上,相应的联结矩阵 的主对角线为零。霍普菲尔德提出,运用霍布类型的学习规则来构建联结矩阵元。复杂 系统的演化如自旋玻璃体伊辛模型遵循非线性的反馈动力学。能量差异项逐渐减少,直 到它到达某一个——可能是局域的——极小值。 字符特征识别问题是人们熟悉的一个简单应用。此复杂的网络由2维格子的相互作 用的布尔变量来代表。一个模式(例如字母A)可以被联想到格子中,其中黑点代表激 活态变量(其值为1),空点代表其值为零的变量。这里假定,字母作为所希望的动力 系统状态被联想到吸引子(不动点)。我们可以想像,通过多次看见正确的字母,人的 大脑中贮存了正确的字母形状。如果某个不完善的、部分受损的字母显示给该系统,它 就应该能够重新构造出正确的形状——这是以前已经学会的(图4.9b)。 因此,模式识别就意味着自组织的模式演化。这种过程指向某些吸引子,作为所希 望的系统状态。我们回忆一下,一个吸引子就是从一定条件出发,系统将向其演化的一 种状态。吸引盆由起始条件来定义,起始条件推动着在吸引子方向的系统的轨迹。正如 我们在前面的章节中已看见的,一个吸引子可以是包含不动点的或稳定态的唯一状态, 如同在霍普菲尔德网络和自旋玻璃体系统的例子。但是,一个周期相继的状态(“极限 环”)或几种形式的混沌吸引子(在耗散系统中)也是可能的。因此,霍普菲尔德网络 对于以复杂系统的吸引子来建立神经状态的模型,仅仅是初级的、简化的方式。 霍普菲尔德注意了自旋玻璃体中的局域能量极小值与联想的大脑原型之间的类似性。 在自旋玻璃体的形式网络中,吸引子可以被设计为原型矢量。在图4.10a中,霍普菲尔 德系统的态空间用能量地形图形象地表示出来,这里利用了它与自旅玻璃热力学的类似 性。网络上所有可能的状态都由平面上的点来代表。表面的高度表示相应的网络状态的 能量。 图4.10b中的相图显示,轨迹从不同的起始点向稳定的局域最小值的收敛。平面上 的每一点就是该网络的一种状态。能量地形图具有霍普菲尔德动力学轨迹的吸引盆。稳 定点(“吸引子”)处于盆的底部。在模式识别的例子中,原型字母与稳定点相关联。 因此,模式完善的过程是一种反省形式,在形式上可与保守自组织的退火过程相比较。 在此物理学例子中,终态是自旋玻璃体、磁化的铁磁体或冻结的晶体的有序结构。 一般地说,霍普菲尔德网络仅仅收敛到低能态的局域最小值。在某些应用中,局域 最小值是与特定的贮存项目相联系的,也许是不必要到达某种全局最小值的。不过,在 许多情况下是需要全局最小值的。这种问题的一个解,是由个体单元的随机运动而不是 确定论运动来提供的。 图4.11a中,通过一个沿着能量地形曲线运动的小球很可能最终是落入最深的最小 值,从而显示了问题的求解。从一定的起始状态出发,小球将向能量最小值或曲线的底 部运动。如果能量地形是由多个靠得很近的极小值标志的,结果就取决于最初的起始条 件。如何来阻止网络粘在某个局域极小值上呢?这种想法是以一定的能量增量来动摇能 量地形,该增量是逃离局域极小值B(低谷)而进入全局极小值A所需要的。 于是,在力学上,小球从B进入A比从A进入B的可能性要大。平均来看,小球应该终 止于低谷A。在热力学语言中,动摇地形的动能相应于系统温度的增加。在适当高的温 度情况下,在低谷之间的转移几率不再是可忽略的。在热平衡态,占有不同凹地的几率 仅仅取决于它们的深度。 实际上,模拟退火的方法是人们所熟悉的,并用于全局优化上。正如我们已经提到 的,退火是加热一种材料(例如金属或玻璃)到高温、然后逐步地减低温度的过程。但 是,该材料将仅仅终止于其全局能量最低点,如果退火过程进行得足够慢的话。例如, 金属的突然冷却将留下仅仅有局域极小值的材料,处于易脆状态。模拟退火使得有可能 逃离局域极小值,跳跃到较高的能量状态。 在气体热力学中,气体由其相转移的几率来描述。波耳兹曼对处在均匀温度分布的 气体,推导出来气体状态的几率分布。欣顿、西杰诺夫斯基等人认为,这种分布可以运 用于描述神经相互作用。在这种模型的情形,加进系统中的低温项被解释为小噪声项。 它是神经与气体中分子的随机热运动的类似物。 这种形式上的等价,是上述网络被称为“波耳兹曼机”的原因。但是,这里并非是 物理主义,并非打算把神经相互作用还原为气体分子相互作用。在波耳兹曼的形式表达 式中,可以证明,冷却得充分慢时波耳兹曼机可保证找到所希望的全局极小值。显然, 具有模拟退火动力学的神经网络,是能够通过搜索模式的态空间给出全局最小值的。 一种按照这种动力学的可能的学习规则,是与网络及其环境之间的几率相匹配的。 该网络的所有可能状态在热平衡时都是可能的,具有波耳兹曼分布的相对几率。如网络 中状态的几率与环境状态的几率相同,那么网络便得到一个适当的环境模型。因此,学 习规则必须能够调整波耳兹曼机中的权重,以便减少网络模型与环境之间的差距。 最初,学习规则让系统自由地运行。每一单元的状态几率可以估计出来。然后,输 入和输出单元就被强制或被迫取得适当的值。其次,单元的几率值是估计出来的。局域 的权重变化正比于与该权重耦合的单元的几率的差。 形式上,权重的变化规则要求 △Wij=E(<ssuisussujsu>强制-<ssuisussujsu>自由) 式中E是比例常数(“学习速率”),Si是第i个单元的二进制单元,sisj在网络达 到平衡后的时间的平均值是<sisj>。在强制的条件下,输入和输出单元都固定在其正 确值上。在自由条件下,这些单元都不是固定不变的。于是,学习规则并未受到指示。 如果输入在自由的条件下是固定不变的,学习规则就是受指导的。 在图4.11b中,波耳兹曼机的网络中的单元采取了二进制值,它们之间的联结是相 互的。连接的权重可以进行训练,也就是把模式提供给存在着和不存在输出模式的输入 单元,并应用波耳兹曼学习现则。在学习过程中,网络中的所有的权重都发生了变化。 并不直接接受外界信息的隐含单元,可以使得该网络产生出在输入模式和输出模式之间 的复杂的联想。因此,在其中间层有隐含单元的波耳兹曼机具有内部的对于环境的表示, 而这对于仅仅具有可见(输入和输出)单元的网络则是不可能的。 从神经生理学的观点看,由“教师”指导的学习在自然界看来是颇为不现实的。动 物对感觉输入分析中进行的特征提取或范畴划分必定是自组织的。在输入矢量中出现得 越是频繁的特征,就越是可能归属于一定的范畴。网络的输出必须学会使相应的原型矢 量收敛为吸引子。 如何设计一个网络使得在没有外部教师指导的情况下产生出分类标准呢?一些作者 提出,这种自组织取决于多层系统中的非线性相互作用和有选择地强化联结。这种学习 程序是在选择和竞争的达尔文过程中组织起来的。 图4.12中,所设计的竞争学习系统的多层构造,可产生出诸如分类和范畴划分这 样的突出的认知任务。活性单元由实心点来代表,而惰性单元则由空心点来代表。输入 层与第2层的每一元素的联结是激发的。第2层可以划分为若干组,每组中每一元素都抑 制所有的其他元素。同一组中的元素处于相互竞争之中,以对输入模式作出反响。按照 拉梅尔哈德和奇普塞的法则,在同一组中,一个单元只有在它能够赢得与其他单元的竞 争时才是能够学习的。学习就意味着活性联结的增加和惰性联结的减少。 一个简单的分类任务是小孩的词汇认知。显然,两个字母的词AA,AB,BA和BB可以 划分成几个范畴,例如,以A开头的词汇集合[AA,AB]或以B开头的集合[BA,BB],抑或 是结束于A的[AA,BA]或结束于B的[AB,BB]。在一个计算机辅助的实验中,双字词代表 一个多层的网络,其中一层的竞争单元以两单元一组组织起来。该系统能够检测出字母 的位置。其中的一个单元自发地作为起始字母A的检测器而起作用,而另一个则检验B作 为起始字母。 在进一步的实验中,增加了字母数,改变了网络结构。尽管这些实验看来仅仅是说 明了有限的能力,它们至少是原则上体现了无指导的神经系统中的认知行为的形成。它 们已经开始了某种有趣的研究,在复杂系统的框架中把神经生理学与认知科学联系起来, 4.4节中将更详细地对此加以讨论。另一种通过竞争学习进行的自组织认知系统的研究 方式,是托伊沃·科亨仑提出的。他是一位物理学家,也对于联想记忆进行了生理学的 研究。他的神经系统的数学建模在人工智能的工程应用中已显示出重要性(参见第5 章)。科亨仑的思想是通过自组织特征的映射来给大脑建模,这种想法源于自动化和生 理学上已经确立了的事实。大脑中的大多数神经网络是二维的层状处理单元,它们可以 是细胞或细胞组。这些单元是通过侧面的反馈而相互联结的。例如,在新皮质中,每一 个主要细胞大约有1 个相互联结。 对于神经元与其近邻的突触耦合,只要神经元之间的距离小于一定的临界值,这种 耦合就是激活的。神经元之间的距离大于此临界值则是抑制的。而距离更大一些时,耦 合又是微弱激活的。侧面相互作用的程度在数学建模时使用的曲线,其形状类似于墨西 哥帽子(图4.13a)。 显然,侧面耦合的互相影响倾向于在空间结合成群。图4.13b示意了一个二维成群 的例子,它是由一个21×21个处理单元的方格来模拟的。这种成群现象(“活性泡”) 取决于正反馈或负反馈的程度,它们可能受到神经网络中的化学效应的影响。在神经的 实在中,“活性泡”并不具备计算机辅助模拟的规则形式。图4.13c示意了浣熊的脑皮 层中活性的分布,它并非是一个形状规则的形象,而是相当混乱的图像。 然而,成群现象在大脑的自组织过程中可以是有用的。虽然起初神经网络的活性是 均匀分布的,但根据自组织学习过程我们可以观察到神经区域的逐步的专业化。在提供 了输入模式以后,具有最大活性的神经元及其邻居被选用来进行学习。神 经权重的变化,落在以最大活性神经元为中心的一定半径中的环状邻域中。这种学 习规则可以用来检测和划分输人的图形或说话模式数据的相似性。 在形式上,科亨仑考虑了从输入信号u的空间V到二维映射A上的非线性投影P。图4. 14说明了学习的步骤:输入值u选定一个中心s。在s的邻域中,所有的神经元都在u的方 向上转移其权重Ws。转移的程度随着与中心s的距离的增加而减少,这里用不同的灰度 来表示。 映射通过自组织收敛于某个具有不同活性区域的平衡态。投影应该将输入信号的规 则性映射到神经映射上。因此,P在数学上被称为拓扑不变映射。实际上,由感觉输入 信号规则性所表示的大脑环境的结构,应该被投影到大脑的神经映射上:大脑应该获得 适当的关于世界的模型。 大脑通过自组织映射进行建模的现实性如何?神经区域的数值的变化,取决于物种 生存所感受到的感觉刺激的重要性。在神经区域中,有一些中心,它们能够以比环境更 大的精确性对刺激进行分析并将其再现出来。例如,在哺乳动物的眼睛中,对于视觉信 息的精细分析是由“小凹”进行的,小凹是一个沿视网膜光轴的非常小的区域,其中有 非常高密度的光敏接受子。因此,信号的分解主要在神经区域的这种中心进行,要比在 周围的区域强得多。类似的不成比例的表象,也可以在体感系统和原动皮层中观察到。 手对于人的生存的重要性表现在体感和原动皮层占有相当大的区域,比代表体表的区域 要大。 与这些结果相反,猫、狗和猿的听觉皮层并不将外部世界的频率投影到特定的中心。 蝙蝠具有特殊的定向系统,这对于它的生存是必要的,这是一个例外。蝙蝠能够发出许 多种不同的超声频率,并通过这些信号的反射来测定物体的距离和大小。蝙蝠相对于其 他物体的速度可以用超声波反射中的多普勒效应来测定。甚至是细微的昆虫也能够被这 种灵敏的系统检测出来。 蝙蝠的特性,能够用其听觉皮层上的自组织映射在实验上确证。图4.15a中将蝙蝠 脑中的听觉皮层示意在矩形图中。图4.15b中把该矩形图放大了,示意出听觉皮层中最 佳频率分布。一维频率谱不断地单调地从听觉皮层的后区提供给前区。引起神经元最大 激活的频率称作那个神经元的最佳频率。划线区域是初级听觉皮层。图4.15c显示了图 4.15a中斜线区域中的最佳频率分布。绝大多数测量点都集中在超声回波频率的周围。 前一后区中一半以上用来分析超声回波的多普勒效应。十分显著的是,用自组织映射进 行的计算机辅助模拟中,产生出如图4.15c所示的听觉皮层的实际表象。 灵长目动物的脑由许多区域构成,其中有若干神经网络拓扑。例如,视网膜在个体 发生的早期已经发育起来。它的神经拓扑有5个独立层:光感受器,水平细胞,极性细 胞,无长突神经细胞,视网神经节细胞。人的光感受层大约有120×105个感受细胞。视 网输出,由所有的神经节细胞的脉冲速率的空-时模式来代表,沿着光神经传向丘脑。 对于人,大约有1.2×106个神经节。因此,视网膜的确是一个复杂系统。然而,人们 还没有完全理解大于200×106个视网神经元的复杂性。大脑皮层是系统发育上最年青的 大脑区域。大脑皮层在大脑中的百分数在进化中不断地增加。鱼那样的低等脊椎动物并 没有进化起来大脑皮层。大脑皮层在爬行动物和鸟类中只占小部分,到狗、猫,直到猿 和人,它就越来越多。在灵长目动物中,大脑皮层分化成了不同的多层神经网络拓扑的 区域,例如视觉、感觉、原动和联想皮层。小脑由小脑皮层构成,其中有许多具有特定 感觉原动功能的多层亚区域。 大脑系统的多样性被描述为一个密集的神经元集合,其中具有特殊的网络拓扑,通 过许多神经而相互通信,神经由以千计的轴突构成。与数字计算机有独立的中心处理、 记忆和贮存单元不同,大脑和中枢神经系统可以作为一个多目标平行处理网络的集合体 来建模。每一网络都能够独立进行感觉、原动和联想功能的信息处理和信息贮存。 显然,人们熟悉的程控中心化数字计算机原理并不适用于生物脑。神经网络的自组 织过程对于大脑的结构是十分重要的。在非常长的系统发育过程中,复杂的结构形式产 生出来。我们往往并不完全清楚它们的目的。在宏观尺度上,特定的神经区域联系着特 定信号,具有不同的感觉功能,也可以是不同水平的信息处理操作,还可以是对于人以 及对于有机体的动物性和植物性功能。尽管它们分布在大脑的不同区域,它们却可以理 解为自组织的复杂性或集体效应。 自组织作为一种学习程序,揭示了有机体并非完全由基因所决定,基因中包含了详 细描述有机体的蓝本。大脑组织化的每一阶段都涉及某种自组织。基困难以存贮大脑的 复杂结构。大脑皮层有大约10[14]个突触,个体发育难以从所有可能性中选择出正确的 联结图式,如果这些可能性都是类似的。因此,个体发育必须运用神经系统的自组织去 处理其复杂性。但是,不认识个体发育的原理,就不能理解其大脑皮层的结构。 在前面的章节中,我们已经研究了物理学、化学、生物学、地质学和天文学的复杂 系统中有序模式的形成。整体有序是在其中有大量局部相互作用元素的复杂系统中形成 的。在液体或晶体中有相互作用着的原子或分子,在进化的恒星系统中有相互作用着的 子系统,在如同大脑这样的复杂神经系统中有相互作用着的神经元和突触。我们还向读 者提示了贝纳德涡旋(“滚动柱”),它们是在液体的热涨落中出现的。 整体的有序是如何由局部的相互作用来安排的?例如,分子之间的相互作用力在液 体中发生着非常短距离的相互作用,而由分子相互作用引起的涡旋运动的模式却可以是 大尺度上的有序。这种有序在物理学、化学和生物学进化中出现的原理,对于大脑极其 重要,其中相邻细胞元素之间的局部相互作用,创造出来整体有序的状态,导致有机体 中的相干行为。此种有序模式是由复杂系统中的元素之间的作用力和起始条件、边界条 件所安排的。在贝纳德涡旋的例子中,作用力是流体相互作用、热传导、膨胀和引力。 例如,边界条件是液体的温度。在大脑中,联结的模式是由细胞单元相互作用的若干种 规则安排的。因为神经元往往是由非常长的轴突联结起来的,两个神经元的局部的相互 作用并不意味着它们在脑解剖学上的空间接近,而是它们由轴突的紧密联结。 尽管这种一般结构对于所有类型的神经元和突触都是普遍的,但是也有许多质的和 量的差异。例如,无脊椎动物的神经系统是确定论的,个体神经元的特定部位具有高度 编码的信息。而哺乳动物的新皮层中的联想系统,对于特定输入模式的特定反应,却是 由促进着对于外部信息进行反馈的学习规则实现的。 复杂系统模型对于真实的神经网络适合程度如何呢?从方法论的观点看,我们必须 清醒地意识到,模型不可能朴素地与实在的每一功能和元素相一致。模型是为了特定目 的进行的抽象,它能或多或少地解释和模拟中枢神经系统的某一部分,而对其他部分则 没有涉及。有时,模型网络受到批评,说它们如同黑箱,仅仅在一定程度上正确地实现 了输入-输出功能。但是,关于生物神经网络是怎样实现其功能的,却什么也没有揭示 出来。隐含单元如同量子物理学中的隐变量仅仅是理论概念,被假定是系统实现所观察、 可测量的输入和输出值之间关系的一种内在因素。除了可能的多层网络的构造之外,动 力学和学习程序是模拟中的根本性问题。 模型网络的参数调节程序减少到最小误差的现实性怎样?许多模型网络的学习规则, 对于一组权重收敛到正确地进行分类,需要难以接受的过多的时间。尽管有时也会得到 一个成功的权重调节,但是这决不意味着它的优化。1960年,瓦丘和霍夫提出了一种简 单而优秀的学习规则,它受到技术优化推理的启发,而不是从生物观点来看待大脑。瓦 丘-霍夫规则及其种种翻版,近年来在技术网络中已经得到了广泛的运用(参见第5 章)。 该规则假定,对于一种输入模式,可由适应性神经元对于输入模式的输出进行分类, 它们的取值为a+1或a-1。因此,这里假定了“教师”,他知道对于该输入的答案是什 么。适应性神经元计算出输入活性的加权和乘以突触权重。在假定的输出与计算出来的 和之间,系统可能给出错误的信号。根据它们之间的差,突触的权重进行了调整,重新 计算出和,使得错误的信号变成零。 瓦丘和霍夫策略的目标在于,把错误信号的平方减少到其最小可能值。所有输入权 重系数的可能的值,导致某个误差值。在图4.16中,这种情况由权重空间的误差面表 示出来。 误差面的最小值并不被人精确地知道,因为不可能见到整个误差面。但是,局部的 拓扑图是可以测量的。因此,绝大多数减少误差的调整方向是可以计算的。所谓的梯度 下降方法,在微分几何学和物理学中是大家熟悉的,对于权重的调节总是改变权重使得 系统沿误差面的最陡下降方向运动。 在图4.16中,对误差面的梯度进行了计算,以找到最陡下降方向。权重按增量值 △W沿着这一方向变化。重复该程序,直到权重达到W理想,这相应于最小的误差。对于 非线性的网络,误差面可能有许多个极小值。一般地说,梯度下降的问题涉及落入局部 极小值。然后,凹底也就不代表全局的最小误差。 瓦丘和霍夫证明,存在着一个简单的二次误差面,其中只有一个全局最小值。数学 上,计算出某一点的梯度意味着计算出误差平方对于权重的偏导数。瓦丘和霍夫证明了, 这种导数正比于误差信号。因此,对于误差信号的测量就提供了运动的方向,以能矫正 误差。技术上,具有完整知识的“教师”的存在可以为特定的目标进行调整。但是,假 设自然界中的学习过程是有指导的学习程序却是不妥当的。 在网络模型中,所谓的后向传播是人们最为熟悉的有指导算法。它是简单的瓦丘和 霍夫规则的推广。总之,后向传播是神经网络中一种调节权重的学习算法。每一单元的 误差是预期值减去实际输出值,可以在网络的输出端进行计算,并反复地返向网络中。 这种方法使得系统可以决定如何改变网络中的权重,以改进其总体表现。图4.17示意 了通过整个多层网络的后向传播方法。 尽管后向传播的模型可以像生物学网络一样发挥作用,但它并没有假定真实的大脑 也是由后向传播组织起来的。真实网络中的许多参量值往往都是通过解剖学、生理学和 药理学中的测量和实验获得的。例如,细胞类型和细胞的数目可以大致估计出来。拓扑 和构造可以得到描述,特定的突触究竟是激活的还是抑制的也可以得到确定,如此等等。 但是,特定的权重却是未知的。当它们数以千计时,大脑网络的全局最小值和模型网络 精确一致、权重相等的几率,却是相当低的。 因此,模型网络的误差极小化策略一般说来可能只是一种假设,但是它们对于处理 可能有数千参量的复杂性问题却是必要的。如果模型网络与大脑网络的拓扑、构造和突 触动力学的相似度相当高,它们就允许人们预见大脑网络的某些局域或全局的性质。神 经生理学中的后向传播可以正当地作为一种寻找局域极小值的研究工具,但不是作为对 于神经生理学分析的一种替代,神经生理学分析可以揭示神经网络的真实的学习程序。 误差极小化策略在自然进化中有悠久的传统,而不是在脑的学习程序中首次出现的。 例如,生态群体的自然选择就可以作为一种模型,此过程将误差梯度逐渐减小到代表了 某种环境生存生境的误差极小值。但是,参数调节程序可能仅仅找到了某个局域极小值, 而不必是全局最小值。据我们所知,进化一般并不能找到最好的可能解,而仅仅能找到 某种对于生存是充分好的满意解。在整个进化过程中,只有局部极小值才是可以从经验 上对其进化生存价值进行评价的。这种评价取决于所选择的模型的观察和测量约束。 因此,从方法论的观点看,那样一种总是全局地、完整地优化自然的观念不过是一 种形而上学的虚构。思辨性的叫做“自然”或“进化”的神性观念,产生于乐观主义的 文艺复兴时代,它不过是为了取代带着创世计划的基督教上帝。康德已经批判地指出, 总体自优化的自然只不过是一种人的虚构,在任何意义上都不可能从经验上得到证实。 不可能存在具有独立的中心处理单元,能够将进化策略进行整体、长期优化的超级计算 机,在真实的进化过程中,存在的只是局域性的有一定满意度的解,它甚至带有许多缺 陷,是不完善的。它们的复杂性与拉普拉斯的简化的完备世界模型是相抵触的。 4.3大脑和意识的形成 如何用复杂的脑模型中神经相互作用来解释认知特征呢?莱布尼茨已经提出了一个 问题:如果把大脑解释为只不过是一台机器,意识、思维和感情是不可能在大脑的元素 中找到的。康德强调,要使得一个物理系统具有生气,组织力是必要的。直到这个世纪, 一些物理学家、生物学家和哲学家仍然相信某种非物质的组织生命因素:“生命力” (柏格森)或“隐德来希”(杜里舒)。从复杂系统的观点看,科勒的格式塔心理学是 一种有趣的探索方式,涉及到这样一种物理系统,其中复杂的心灵结构自发地从系统自 己固有的动力学中产生出来。通俗地说,被感知客体的宏观的“格式塔”(形式),大 于其原子组件的加和,不能归结到微 观尺度上。 科勒有这样一种思想,视觉现象的产生不可能在热力学模型的框架中得到解释。但 是在那时,他指的是波耳兹曼的平衡态线性热力学。他提出:“静态视觉场下的物体过 程是稳恒平衡分布的,从光学系统自身固有的动力学中发展起来”。科勒甚至认识到, 有机体并不是封闭系统,并力图把有序态的形成解释成一种直觉理解的协同作用。在这 方面,科勒已经正确地将一个协同系统中的基本相互作用的微观水平和形成有序态的宏 观水平清楚地区分开来了。但是,他仍然缺乏适当的复杂动力学系统框架为远离热平衡 的热力学提供某种形式化处理。 对于微观尺度上脑过程的神经相互作用和宏观尺度上的认知结构的形成,复杂系统 探究方式提供了一种建立模型的可能性。因此,看来有可能填补起来大脑的神经生理学 与精神的认知科学之间的鸿沟,这在传统上被看成是无法解决的难题。 复杂模型包括了描述系统动力学的态空间和非线性演化方程。人的大脑中有大约 1011个非感觉神经元,可以用1011维的空间来表示。甚至典型的子系统中也包含有10[8] 元素。在一个108维的并且只有10层激活神经的态空间,就至少有 个表示激活矢量的不同位置。如果我们假定,每一神经元与另一子系统的10[8]神 经元之间有103个突触联结,那么就必须区别出大约1011个突触。结果,如果每一突触 仅仅有10种相区别的权重,我们在一个子系统中就获得了 个权重这样一个巨大的数字。这种复杂性对于编码、表示和处理信息提供了数目巨 大的可能性,在数学上可以用矢量和张量变换对此进行建模。 在科亨仑的竞争学习网络中,系统的自组织使得近邻矢量映射到近邻的网络点上。 业已假定,类似的印象由类似的矢量来表示,它们与原型矢量之间只有微小的距离。在 复杂系统的框架中,原型矢量被解释为吸引子。因此,两个相区别的范畴或类型就由态 空间的两类不同的吸引子来表示(图4.7b)。认知辨识的学习过程,就由网络的训练 过程来建模,其中包括调节权重使输入矢量(例如某个视觉或听觉模式)以最大相似性 归属于原型矢量。 神经态空间的原型概念,允许某些有趣的认知过程解释。当输入印象只是部分地给 出时,一个网络如何能够认知一个模式呢?对于动物在野外的生存来说,矢量完善的任 务是至关重 要的。让我们想像一下,一只沙漠中的郊狼察觉在草丛中的兔子尾巴(图4.18)。 输入到郊狼的视网膜上的,只是那只兔子的尾巴。郊狼的视觉系统以习得的兔子原型矢 量来完成输入矢量,从而能够假定或“假设”在草丛中有一只兔子。在此意义上,我们 可以认为,郊狼有一个由大脑中相应的原型激活模式来代表的兔子的“概念”。 保罗·丘奇兰德甚至提出将人的高级认知能力用原型矢量探究方式来解释。因此, 解释性的理解就被归结到被充分训练的网络中的特定原型矢量的激活。原型矢量包含巨 大的信息量,对于不同的人来说可能是不同的。原因在于,不同的人并不总是拥有相同 的项来满足某一原型束的约束。的确,人们很可能有不同程度的解释性理解,尽管他们 以几乎相同的方式来划分一种客体或情形。例如,一个细木工人,比起其他绝大多数人 来,对于什么是一把椅子具有更高程度的理解。然而,他们在绝大多数情况下都将有一 致的见解。因此,原型-激活模型是相当现实的,因为它考虑了人的概念和理解的模糊 性。 认识论和认知心理学中,通常都对不同种类的解释进行了区分。分类解释(“为何 鲸鱼是哺乳动物?”)、因果解释(“为何石头下落?”)、功能解释(“为何鸟有翅 膀?”)以及其他的解释,它们相应于集束的因果关系、功能性质等等的原型激活。甚 至把握社会状况也是一个激活社会相互作用原型的过程,这是在生活中受到的训练和教 育。 在复杂系统探究方式中,精神状态是与大脑的神经激活模式相关联的,这里是用复 杂态空间的状态矢量来建模的。涉及对外部世界的感知的外部精神状态,是可以检验的, 并与大脑的神经激活关联起来。我们如何来检验和解释并不涉及外部世界事件,而只是 涉及精神状态自身的意识的内部状态? 众所周知,我们甚至能够反思我们的自我反映,并反思关于我们自我反映的反映, 如此等等,处于某种重复作用过程中,它原则上是没有极限的(图4.18b)。自我体验 和自我反映导致了自我意识的概念,它在传统上被看作精神哲学和认知心理学的基本概 念。自我意识被定义为人格的关键性特征。在历史上已经讨论过的自我意识的定义,并 非只具有哲学上的意义。显然,这些不同程度的思辨性定义,在医学和法律上都有重要 的影响。对于人具有意识——因而应对其行动负责——必须满足何种标准?有没有关于 意识的医学标准?意识是如何受到扰动甚至消失的?动物的意识是怎样的?我们的感受 是否跟我们的邻人或动物的感受相同? 这里的基本问题是:①意识的形成是否由特定的脑过程引起;②是否可以用复杂系 统为脑过程的意识形成建立模型。方法论的困难表现为,像疼痛、气味等等主观感受只 在反省时才是可能的。这些主观感受和意识状态常常被叫做现象状态。一些哲学家批评 过,大脑状态的物理学描述没有抓住什么是现象状态的本质。相反的观点则认为,现象 状态概念可以归结为大脑的神经生理学状态的概念。这些争论只不过是传统的物理主义 和精神主义(或反物理主义)的现代变种。两种立场都是空想的还原论和夸张,它们既 不能得到研究的支持,也不可能对研究有很好的帮助。 按照复杂系统探究方式,神经生理学状态和精神状态都用数学公式来建模,而没有 还原论的雄心。一些哲学家由于对于数学的偏见而出现严重失误,因为他们似乎相信公 式只能标示“物理’狱态。例如,读者可以回想一下,霍普菲尔德系统包含着一个“能 量”公式是用物理自旋系统的能量公式进行的类推。然而,在霍普菲尔德系统的框架中, 不要把所谓的“能量”与固态物理学中的能量混为一谈。数学表达式仅仅决定了网络的 动力学,这是可以由神经生理的脑或硅片的计算机或来自某个未知星系的有机体来模拟 的。 如果数学模型适合于观察到的数据,它是经验上可证实的。在其他的情况下,它必 须要改变或放弃。我们必须意识到,关于精神状态和意识的可检验的、可证实的理论, 并不能使我们与他人有同样的感受。例如,一位内科医生或外科医生,他希望医治一个 病人的胃痛并不需要如同病人那样感受胃痛。他必须拥有良好的关于胃的解剖学、生理 学、生物化学、心理学等等的知识。用复杂系统探究方式的术语来说,他必须知道胃及 其动力学的可能状态。在此意义上,精神和意识状态的模型可以发展起来并经受检验, 而不需要任何的还原主义主张。 显然,在意识的现象状态和大脑的神经生物学功能之间有许多可检验的相关作用。 人们都知道,短时间的缺氧可以导致意识丧失。电刺激、精神病药物、麻醉和身体损害 也都可以影响意识的程度。这不仅仅是可以通过自我实验(自动脑电仪)来体验,而且 还可以通过对功能缺损进行观察和测量来进行临床检验。原因在于,大脑是一个开放系 统,其状态依赖于远离热平衡的与环境之间的物理学、化学和生物学代谢。 意识和无意识状态表现出依赖于相当复杂的神经生理学系统,此系统中包含了各种 水平上的反馈圈和相互关联。图4.19示意了大脑皮层及其初级感知皮层和联想皮层的 网络。来自感官的特定的输人(“传入”),通过特定的传输子系统和途径,达到初级 皮层投影区。来自子系统的非特定的输入达到皮层称作“中脑网络的形成”。网络的形 成标志了一种复杂的神经元和神经纤维的网络,包括广泛分布的突触联结。众所周知, 他在声觉、唤醒和注意中起着根本性作用。 复杂网络中的损害会导致对意识的种种干扰。这种种干扰可以是全局的或局域的, 造成整体唤醒中特定的意识经验缺损。神经生理学可以从实验上表明,意识的程度取决 于大脑皮层中对特定的和非特定的两股不同传入信号流的处理。于是问题便成为,意识 的精神状态是如何从这些网络中形成的。用莱布尼茨的术语说,我们见到了如同碾磨机 嵌齿轮那样相互作用的元素,但是却无法填平神经生理学机制与意识的精神状态之间的 鸿沟。传统的神经生理学持有约定论观点,认为神经网络之间具有突触的严格联结,就 如同莱布尼茨的机械的碾磨机模型中的嵌齿轮的严格联结那样,电脉冲通过神经网络的 传播,就使得大脑功能成为可能。 复杂系统探究方式提供了一种自组织网络改变其突触联结的观点,突触联结的改变 是由突触的激活引起的,并依赖于激活的程度。在神经复杂系统的框架中,相互作用的 神经元的微观水平,与自组织产生的细胞集合体整体模式的宏观水平相互区别。在前面 的章节中,已经提到了,自组织神经细胞集合体的概念是霍布引入的。克里斯多夫·冯 ·德·马尔斯伯、科亨仑和其他人进一步改进了它。如果网络中某些神经元的同时激活 是由具有一定模式的输入所引发的,那么根据霍布类型的学习规则通过同步激活就会形 成集合体。 由马尔斯伯提出的修改是,集合体的生成并非一个缓慢过程,而是由快速的突触变 化产生的。这些所谓的“马尔斯伯突触”被用来建立快速权重调节的动力学的模型。今 天,经验已经表明,大脑中存在霍布型和马尔斯伯型具有高度可塑性的突触,其相互作 用规则可以由分子机制来实现。网络中集合体的形成取决于其神经元的激活程度。 关于意识和无意识状态,假定一个细胞群体的整体激活,如同皮层中的网络组织形 成所造成的情形(图4.19),一般将增加集合体形成的概率。因此,汉斯·弗格尔已 经提出,意识程度的不同在于其生成集合体的速率不同。例如,细胞集合体的生成速率, 决定着表示外部世界的数量、复杂性和持续性的感觉模式。意识是自反映的自参照状态 (图4.18a)。因此,意识状态是以表示内部状态(而不仅仅是外部世界状态)的细胞 集合体为基础的。例如,我不仅仅有一棵绿树的印象,我还意识到我在看着这棵树。而 且,我对于我意识到我在看着这棵绿树的状态可以进行反思,并连续地重复产生出元- 元……表示,终于从现象的印象和感受达到抽象的、高度精致的自反映状态。一旦超过 了产生速率的临界阈值,现象状态就必定出现。意识的缺损出现在临界阈值水平之下。 运用特殊的脑电图变化,即以相应的集合体生成速率的增加来代表注意的一定程度, 可以对这个假说进行检验。由于细胞集合体的生成速率是以特定的改变着权重的突触为 基础的,意识的程度可以由干预突触联结进行检验。实际上,用影响突触可塑性的化学 物质麻醉了的病人,体验了生动梦境、虚幻感觉、视听幻觉以及没有组织起来的思想。 在此意义上,意识可以被看作系统产生表示和元表示的能力的结果。 具有高速率生成集合体的神经网络比低速率生成集合体的神经网络,可以产生出更 为复杂的表示。因此,在生成速率充分大时,复杂系统将发展起自参照和元认知活性。 我们可以设想一种意识程度的尺度,它们相应于生命进化中复杂程度不同的神经系统的 意识程度,包括从昆虫到人。随之而来的是,在复杂系统的框架中,意识的形成决非是 进化的副现象。它是一种合规律的整体状态的出现,即按照复杂系统的动力学,在临界 条件得到满足时,通过其元素的微观相互作用而产生出宏观有序模式。 如果复杂系统探究方式是正确的,那么生物进化的神经系统则不过是自参照系统的 特定实现,其他很可能是以不同于人脑的生物化学的物质材料为基础的具有自参照能力 的技术系统,也就原则上不能排除在外(参照第5章)。我们甚至有能力把一种复杂系 统的表示翻译成另一种不同系统的表示。由于两种系统的表示并不精确地一致,我们可 能难以获得与他人、动物或其他的不同系统完全精确一致的感受。但是,我们会得到关 于它们的感受或思想的某种知识形式的表示或某种理论。在此意义上,主观性保留了下 来,即使在技术模拟的情形下,人类通信中的解释学也保持着宽广领域。 关于传统的心-身问题,复杂系统探究方式表明,认知活动既不完全独立和相异于 脑活动,不是简单地等同,也不是一种附带现象。思维和感受被假定为,既是神经过程 的产物,也是生产者,而它们不必等同。在复杂系统框架中,脑模型是一种自组织系统, 它处在远离热平衡和接近于不稳定点的阈值之处发挥作用。在神经不稳定态,不同的集 体激活模式都向相干宏观模式演化,这样的宏观模式在神经生理学上是以某种细胞集合 体为基础的,在心理学上表示为一定的感受和思想。 我们都有这样的经验,在情绪不稳定态下某种感受可以支配其他实际感受,甚至引 导我们的行动。在协同学中,稳定模和不稳定模的竞争用役使原理来解释。读者可能还 记得,在进行决策时,一种思想或概念开始“役使”其他可能的思想或概念。这些非平 衡的相变,在最小信息的意义上,受非常少的几个序参量所支配。的确,作出决策以后 而行动,意味着巨大复杂性的减少。过多的知识对于行动是阻碍,或如歌德所说:“行 动的人总是肆无忌惮。” 认知现象被当作脑动力学的宏观性质和序参量,序参量支配着其间的微观过程。因 此,所谓的心-脑相互作用,不过是一种不适当的、陈旧的形而上学的过时表述而已, 它们假定了某些诸如力学中的碰撞球那样的相互作用实体。复杂神经系统中相变过程, 从微观的神经相互作用中形成宏观性质,这可用来为脑科学和认知科学的交叠领域建立 模型。 协同学中把相变解释为某种对称破缺,这可以用对称势中粒子的阻尼运动来形象地 说明(图4.20a)。 在势能的极大值,粒子的位置是对称的,但却是不稳定的。微小的涨落决定了粒子 将到达两个同等稳定状态中的一个状态。在复杂系统探究方式中,图4.20a中的两个低 谷被解释为两个吸引子。显然,感觉的模糊性和视觉系统自发地决定采取其中的一种解 释,这是一个人们熟悉的心理学对称破缺的例子。在图4.20b中,存在一种图形的背景 不稳定性。我们是否看见了白色或黑色的交叉?图4.20c显示了一种意义的模糊性。图 中是一位老年妇女还是一位青年妇女? 在心理学中,对称破缺是由复杂系统的非线性因果关系支配的(“蝴蝶效应”), 这大体上意味着,一个小的原因将引出大的结果。起始个体透视方式的微小细节,也是 一种认知的倾向,可以“役使”其他的模式,并导致一种支配性观点。一个神经生理学 的模型,必须模拟相应的细胞集合体的相变。 动物行进例如马的步态中的相变是大家所熟知的。随着速度的增加,马的运动模式 也改变了,从行走变成了小跑再到奔驰,以使能量消耗最小化。这是在非平衡相变中经 常观察到的滞后现象,这种现象被解释为神经系统中稳定态或吸引子的结果。思维中也 出现相变。“啊哈-经历”和突然的“洞见”却是从涨落和不稳定性情形中出现的令人 惊奇的现象。历史上,有许多著名的例子,科学家、工程师、艺术家和作曲家在“创造 性”的不稳定性和困惑情形下,突然发现新的问题答案、作出新的发明、闪现出绘画新 思想、创作新旋律等等。 复杂系统探究方式并未提供封闭的心理学信条,而是提供了一种跨学科研究纲领, 去探索认知科学中的老问题和新问题,并使得它们更靠近经验的和实验的分析。因此, 人们已经提出,要探讨细胞集合体的变化速率和学习、创造性、认知灵活性和形象化能 力之间的相关性。认知不稳定性现象被假定是神经过程的微观不稳定性的宏观性质。思 维和期望被解释为支配着整个系统的活动性的序参量,如果它在接近不稳定点起作用。 在心理学实验中可以见到这种理论的确证,实验通过暗示引起幻觉,并引起相应的可测 量的生理效应。通过记录区域的脑血流量,表明甚至是思维或行动的意向也会增加原动 区的神经活性。 有谁会否认思想可以改变世界而并非仅仅是解释世界?在心理疾病现象领域,例如, 安慰剂效应表明,单纯信念或主导思想就不仅仅可以改变情绪状态,而且还可以改变生 理状态。显然,心理疾病状态是接近不稳定点的。相应的序参量并非只是心理学家的理 论概念,还是控制和支配着(“役使着”)中枢神经系统活性的真实模式。 最后的例子表明,自组织复杂系统在心理学中的应用不能仅仅由它们的预见性和定 量可测量性来进行评价。复杂系统的一种固有性质是,它在微观尺度上的非线性动力学 和对于初始条件的敏感性依赖,不允许人们对于系统的终态作出预见。在大脑和认知研 究中,我们面临着巨大的复杂性,难以进行精确计算和长期预报。然而,复杂系统探究 方式,揭示了心-脑系统的本质特征,比如它对于细微的内在涨落和外在世界变化的高 度敏感性。 4.4意向性和脑爬虫体 除了意识之外,人的精神还有另一个基本特征——意向性,这是历来受到强调的。 意向性是神经状态对于外部世界的事物对象或状态的参照性:我看见了某事物,我 相信某事物,我期望某事物,我害怕某事物,我想要某事物,等等。有意向的精神状态 可以与没有任何参照性的无意向状态区别开来:我紧张,我害怕,我累了,我幸福,我 沮丧,等等。 意向性现象也可以用简单的例子来形象地说明。在图4.21中,每一观察者都看见 一个方块,尽管在此并没有给出任何物理上的方块形状。线条的构型对视觉系统提示了, 存在着一特殊的封闭对象。在观察者和刺激物构型之间出现了意向性参照。 意向性对象或状态可以是虚构的也可以是真实的。显然,人类文化充满着关于意向 性对象或状态的记号和符号,包括从交通信号到宗教符号。甚至从纪念碑和教堂到工厂 这样的建筑物,也可以代表意向性对象。在人类文化的长期发展中,构筑起来语言的意 向性意义。在传统的认识论中,某些哲学家如弗兰茨·布伦特诺甚至主张,意向性是人 的精神指称世界的一种特殊能力。意向性被理解为精神的一种特性,它不可能归结为物 理学的、化学的或生物学的性质。 一些现代哲学家如约翰·西尔斯主张,意向性是人类精神的一种本能特征。但是, 他们也认为人类大脑的生物学进化也发展了精神参照世界的意向性能力。 实际上,意向性并非大脑所独有。它也是某些复杂系统的特性,可以用生命进化中 的吸引子动力学来为其建立模型。社会昆虫的筑巢就是一个集体意向性动力学的例子。 这种复杂系统的特性是自催化机制。通过这种机制,建筑巢穴生态系统——白蚁群体与 其环境——的目标定向的工作得以进行下去。在复杂系统探究方式中,人们假定,这种 社会系统已经说明了诸如大脑和中枢系统那样的较高级发展系统中观察到的规范性质。 巢穴的构筑过程涉及微观水平上500万只以上昆虫的协调,并导致一定的宏观建筑 模式的演化。例如,非洲白蚁构筑的巢穴高度超过15英尺,重量超过10吨。每一白蚁都 是独立于其他白蚁进行工作的。但是,它们的行动局部上由某些化学物质的分布所决定, 这些化学物质是白蚁自己分泌出来的。建筑材料用化学物质打上了标记。最初,建筑材 料是随机分布的,然后以某种不断增加着规则性的方式,直到建筑结构的出现,它是在 受到化学物分布支配的昆虫的局部相互作用中出现的。 此模式决定了几个作为集体活动目标的中心,在数学上这可以解释为扩散场的吸引 子。在前面的章节中,吸引子是作为解引入的,它为从不同初始条件出发的多条轨迹所 共有。局部的轨迹对于吸引子,或是收敛的或是发散的。在物理或化学场的模型中,吸 引子定义了局部区域,其中势能梯度呈现下降趋势,指向零。包围吸引子的区域叫做吸 引盆,由向吸引子收敛或发散的梯度流来定义。昆虫的流的模式总体上是由它们的工作 空间的吸引子的布局来组织的,这是昆虫动力学的相图。众所周知,吸引子并非总能实 现的。如果某些控制参量改变了,一种模式也可能变得不稳定而被破坏,随之又出现新 的吸引子模式。 图4.22a显示了围绕着两个吸引子的化学扩散梯度,它将是两根柱子的基础。因为 两根柱子对于白蚁是两个竞争的吸引子,就决定了它们之间有一个鞍点。在后来的建筑 步骤中,图4.22a的起初的二维场之后出现了三维场(图4.22b),支配了柱状构造的 方向。在图4.22c中,以一个化学扩散梯度的吸引子示意了拱的形成。 显然,在生态尺度上的意向性并不要求其中单个的系统组件必须意识到其行动的总 体后果。意向性仅仅是系统动力学在较长的发展中从总体上展现出来的。图4.22d示意 了筑巢的意向性复杂系统的自催化循环。因为它并非有指导的学习过程,那里也就没有 诸如“上帝”或“自然”那样的指导性权威的“目标”或“计划”。那不过是一种简化 的拟人隐喻,它没有正确地描述所论自组织复杂系统的非线性因果关系。然而,总体上, 从复杂的非线性相互作用中出现了意向性的集体行为。 由于大脑和中枢神经系统都是复杂系统,其非线性的动力学支配着它们的神经元和 突触,它们实现了意向性行为模式也就不奇怪了。意向性并非是从天上掉下来的一种奇 迹,一种引导着人的精神并将其与自然区别开来的奇迹。它是一种整体模式,是特定的 复杂系统在一定条件下形成的。但是,意向性有不同的水平,这取决于增加着的进化复 杂性。 意向并非必定是意识。在图4.21中,我们视觉系统的意向性对象是一块方块,我 们并没有施加有意识的意志。所谓的幻觉也是我们的视觉系统一种意向性模式,它自发 地产生出来而没有加入我们的有意识的意志。图4.23展示了流形的弯曲效应,它显得 是由不同的形象吸引子的排斥于梯度引起的。两条等距平行线显得被左边一对排斥子梯 度和被右边的一个排斥子梯度改变了它们的曲率。观察者视觉系统的态空间,由于不同 视觉梯度场的结果,表现出不同的曲率,尽管线段在物理图形中仍然保持等距和平行。 甚至有意识的意向性模式也并非人所独有。一条狗的跳跃不只是为跳跃,而是为了 捕食、欢迎主人等等。在有意识的目标定向的意义上,意向性在不同程度上是所有动物 的特性。随之而来的问题是,意向性行为如何用复杂系统探究方式来建模,模型又如何 在实验中进行检验。 在这方面,意向性定义为一种有倾向性的行为模式,它可以改变其固有行为模式的 动力学性质,例如稳定性。因此,心理学家可以为行为模式的内在动力学建立模型,尽 管这样的模式可能被其他有倾向行为的动力学模式所改变。这里我们提醒读者,支配着 某些行为模式的内在动力学,是可以用非平衡相变和序参量来建模的。凯尔索、哈肯和 其他人已经分析了如下的简单例子:要求人们平行地运动他们的手指(图4.24a),在 频率低时他们容易做到这一点。当要求受试人增加其手指的运动频率时,手指会突然地 以对称的、反平行的方式运动,失去了有意识的意向性(图4.24b)。 为了给这种行为模式的相变建立模型,频率被解释为一种控制参量,描述手指运动 的宏观变量是相中。该行为可以在与相变化相联系的能量地形中建立模型。该地形必定 是对称的,因为左手指和右手指具有同等的功能。相的角度必定是周期的(图4.25)。 如果频率增加了,地形及其起始形状较陡的低谷就会变形。最初的缓慢运动中,模式是 稳定的,相应于处于x值的稳定相(图4.25a)。最后,处于x值的低谷消失了,起初处 于该低谷的小球也向下滚进到最深的最小值,这相应于手指的对称运动(图4.25c)。 在一些实验中,要求主观上有意向地去实现双手协调的两种模式之间的转变。短暂 的过程所相应的转变时间,已经进行了测量。两种模式的稳定性,用序参量的涨落来度 量。相对的相动力学用非线性演化方程来进行建模。 图4.26a示意了按照这个具有两个势能极小值方程的内在动力学。意向性信息对于 相对相的动力学的贡献,用图4.26b中的势来表示。把内在的和意向性的动力学加和, 得到完整的动力学,结果示意在图4.26c中。在地形中的小球,在O=0时比O=180时沿 着陡峭斜坡要滚动得快一些,这相应于经验上测量的转变时间。显然,意向可以通过使 得其中一种模式失稳而另一种模式稳定化,从而改变内在动力学。意向性信息在此被看 作模式动力学的一部分,吸引着系统向所倾向的模式运动。在此意义上,意向性信息定 义了态空间的一个吸引子,此内在动力学模型就建立在此态空间中。 意向性和语言的意义常常被当作人类思维的根本性特征。意向性状态的例子有疼痛、 酥痒、骚痒、信念、害怕、希望、欲望、感觉经验、行动经验、思维、感受等等。它们 都使用相应的语句来表达,如“我觉得胃疼”、“我希望得到一辆小汽车”、“我相信 上帝”等等。西尔斯提出,精神状态与其他的生物状态如乳汁分泌、光合作用或消化一 样地真实。他认识到,精神状态是生物脑的一种宏观态,由微观尺度上的神经元之间的 神经生理相互作用引起。因此,它们是不可能由单个神经元的神经生理状态来验证的。 在大脑的微观态和宏观态之间的区分,是用例如与液体的微观态和宏观态的比拟来 加以说明的:液体的宏观态不可能还原为单个分子,或换言之,单个分子不可能是液体。 在此意义上,信念、欲望、口渴、视觉经验都是大脑的真实因果特征,如同 桌子的固体性或水的液体性一样真实。意向性状态自身可以由大脑的结构引起并由 大脑的结构来实现。西尔斯主张,对此并不存在形而上学障碍。 然而,他特别指出,任何纯粹的模型都不足以充分地模拟意向性,因为形式性质并 非意向性的组成部分。他持有这种看法的理由是以“中文小屋’思想实验为基础的。把 一个只懂得英文的人锁在一间小屋内,室内贮藏了大量的中文符号,并有一套用英文写 下的复杂的翻译规则,籍以对中文符号序列进行操作。他不断地通过一条窄缝接收中文 符号序列(图4.27)。他应用那些翻译规则,进一步产生出中文符号序列,并通过窄 缝显示出来。 对于小屋中的那个人来说,并不了解储藏的序列中包含了大量的用中文写下的关于 某一主题的信息。通过窄缝输入序列的是关于这些主题的问题或见解。输出的序列的是 对于这些收到的输入见解的反应或建议。所用的翻译规则是一种形式程序,模拟了以中 文为母语的说话人的通常行为。在中文小屋中的那个人,正确地应用此形式翻译规则, 但不理解中文符号序列,这些中文符号序列对于他是无意义的。 西尔斯认为,形式符号的操作本身并没有任何意向性,因为它们对于使用者来说是 完全无意义的。在此情形中,意向性是形式符号如字词、句子等等的特征,它们涉及到 “所指”的事物(符号的语义关系)以及使用者(符号的实用关系)。西尔斯断定,这 种特征仅仅是大脑的精神状态所固有的。 他的论证是针对“计算机模拟”的缺陷的,因为他把模拟限定在由程序控制的图林 计算机的形式算法。但是我们已表明,大脑具有典型的自组织、自参照复杂系统的特征, 这与程序控制的计算机完全不同(参见第6章)。复杂系统的自组织和自参照性并不局 限于人类或哺乳动物的大脑。它们仅仅是特殊的复杂系统的生物化学和神经生理学的实 现,是在生物进化中产生出来的。因此,原则上,不可能排除,这些具有特征动力学的 复杂结构可能通过人的技术以完全不同的材料来实现。结果是,正如自参照和自组织的 特征使得意向性成为可能,那么,用不同于生物脑的复杂模型来加以至少是部分地模拟 意向性,也就是原则上不能排除的。 在传统哲学中,意向性常常以所谓的人的“自我”为基础,被认为能够涉及世界和 自身(作为自参照性的“自我意识”)。但是自我隐藏在大脑的何处?传统的观点,如 种种柏拉图主义或唯灵论或唯物主义,甚至仍然为一些现代的脑研究人员所持有。例如, 在约翰·艾克尔斯爵士看来,自我表现为一种与大脑相互作用的心灵实体,只在本性上 完全不同。但是应该怎样坚持或拒绝这种假设呢?它只是一种以高度形而上学为代价的 假定,人们可以相信它也可以不相信它。 假设也许是该受批判的,可能是虚假的,但是对于进一步的研究是有益的。因此, 形而上学的代价是太高了。哲学上的奥卡姆剃刀要求我们扔掉多余的假设,保留形而上 学实体的经济假定,把看来是经验研究所不可或缺的假设数目限制到最小。复杂系统探 究方式是一种数学的跨学科模型的研究纲领,避免了形而上学教条。从长远看,它可能 失效。但是这种建模策略已经在若干科学和技术中得到许多成功的确证,而且更重要的 是,它为进一步的经验研究提示了一些富有成果的概念。另一方面,传统的唯物论以单 个神经元来解释神经生理学过程的精神状态,则是错误的。 然而,在脑研究中,出现的问题是:大脑中的哪一部分是“自我”中心?皮层是大 脑的一部分,它使我们能够进行学习、记忆和思维,并创造出所有的人类文化和人类文 明。但是,如果皮层主要当作具有一定学习程序的复杂联想记忆存贮来进行建模,那么 它就仅仅是一种复杂的、高度精致的设备,是在生物进化中为增进适者生存而进化起来 的设备而已。 的确,皮层是人的大脑进化中最年青的部分。大脑中有一些老得多的但更为初级的 结构,这样的结构也可以在鸟类、爬行动物、两栖动物和鱼类中找到。一些科学家假定, 基本的感受性如性欲、疼痛和所有的伺服机制,是爬行动物的生存所必要的,从根本上 说是在这些早期的大脑结构中实现的。这种中心将会刺激所有各种活动,把皮层仅仅用 作为巨大而有效的联想装置。因此,在这种解释中,“自我”就被大脑中的小爬虫体代 替了,大脑以某些高度复杂的设施如皮层来发挥作用,从而在越来越复杂的环境中生存 下来。意向性由于皮层而变得可能,但却是由人的大脑中的爬虫体的基本本能激起的。 具有高度有效的神经生存手段的爬虫体的概念,比起上一世纪流行的达尔文信条— —猿是人的祖先,显得更加损伤我们的虚荣心。当然,从科学的观点看,这不是我们自 尊心的受损,而是促使我们对“神经爬虫体”概念进行批判。主要的根据在于,我们的 感受性并不停留在爬虫体水平上,而是在生物和文化的进化中得到了发展。 我们的性欲和疼痛感受性都是相当复杂,因为它们受到由人脑产生出来的相当复杂、 精致的文明的影响。因此,从爬虫体时代直到今天,是某种复杂的反馈改进了我们的感 受性和欲望。文学、艺术和心理学的历史表明,性欲和疼痛都是处于永恒进化中的人脑 的高度精致的状态。因此,甚至传统的人的灵魂的概念,在复杂系统框架中仍然是一个 或多或少有些敏感的问题。但是,我们必须放弃关于人的精神和灵魂的传统观念,它们 被看作某种奇怪实体,以某种原则上不可思议的方式控制着人的身体并与之相互作用。 5复杂系统和人工智能的进化 机器能够思维吗?图林提出的这个著名问题在复杂系统框架中具有新的讨论意义。 本章先对莱布尼茨和他的机器思维纲领(通用数学)以来的计算机科学史作一简短回顾 (5.1节)。现代的可计算性理论使我们能够进行问题的复杂性分类,即划分对它们的 算法或计算程序的计算时间的函数的级别。现代计算机科学感兴趣的,不仅仅是通用问 题求解的复杂性而且还有基于知识程序的复杂性。在特定的领域中模拟人类专家问题求 解行为的专家系统,是一个著名的例子。我们还要进一步问一问,是否可以期待从量子 计算机和量子复杂性理论中得到更有效的问题求解方法(5.2节)。 但是在采用程序控制的计算机算法机械化时遇到几个严重的障碍,是增加计算能力 所不能克服的。例如,模式识别、运动协调和其他复杂的人的学习任务,都是图林类型 计算机程序所难以把握的。人工神经网络实现了复杂动力学系统的原理。它们得到了非 线性动力学在固态物理学、自旋玻璃体物理学、化学平行计算机、光学平行计算机、激 光系统中和对于人脑的成功应用的鼓舞(5.3节)。人工神经网络已经在神经仿生学、 医学和机器人学中得到了一些应用。新技术应用的另一个更为推测性的方面是赛博空间。 虚拟现实在世界范围的远距离通信者的社会中已经成为一个关键词(5.4节)。显然, 图林的“机器能否思维?”这个问题不可能由复杂系统探究方式作出最终的回答,尽管 我们可以运用人工神经网络来完成一些有趣的认知任务。 ------------------ |