朱邦复--智慧之旅--八、秋分　　　自然语言与中文结构 -- 追寻梦想＞文学书苑＞现代文学

您的位置：寻梦网首页＞文学书苑＞现代文学＞朱邦复作品集＞智慧之旅＞八、秋分　　　自然语言与中文结构

智慧之旅

作者: 朱邦复

八、秋分　　　自然语言与中文结构

　　综合前述各项说明，我归纳出了中文文字概念之基本因素。根据这些基本因素，才能将每一个中文字汇明确地界定清楚，并贮存在计算机中。当某一文字输入时，经过程序之基本因素分析，计算机之“意识中枢”便得到所代表的概念。意识中枢亦能反向将基本因素组成概念，并将之转化为语言、文字，以与人沟通。
　　这些基本因素即为各种主观客观现象之根本，透过计算机中的“意识中枢”之“了解”程序，凡与概念结构有交集的，则分别与所设定之概念连通，意识即产生了对此概念的“认知”。有了了解及认知，再加上计算机做为主观个体之“立场”，以预设的“目标”作为“判断”条件，计算机便有了“智能”。在必要时，尚可以赋与“行动”的能力。
　　以下我简单地说明其具体之步骤以及设计之原则。
　　在概念资料中，“基本因素”具备三种特征：
　　一、代表客观、主观等现象最基本且完整的观念：
　　对概念而言，“基本的”并不等于“单纯的”，由于形成概念之联想特性，主观客观交互纠结，没有任何概念能独立存在。因此，我将前表的二百五十六种分类假定为最基本且完整的观念，并视之为分类因素。在实际应用时，尚须利用分类因素作交集定义，才能明确地将每种概念加以界定。
　　二、文法或文字应用之原则：
　　文法是硬性规定的，没有灵活的变通性，虽历经许多语文学家的努力，始终无法整理出一套具有公信力的中文文法来。也幸亏如此，我们得以摸索出一条中文文字应用的原则。基本上我们承认主词、述语之陈述结构方式，但在文字与文字结合时，则采用弹性的始态、终态、连续态，以“达意”为原则。
　　三、有与感应功能机构（即感官）结合之条件：
　　要让计算机达到认知的目的，必须了解计算机之特性，利用数据总线以及软件程序多次选择的功能，每当“概念”资料传送到总线上时，可以选定适当之输出入端口，使“感应功能机构”得到正确的电流脉冲。
　　前两项在前文已解释过，现略分析分类基因与感应功能结合之方式，即得到下列关系。实际上此类结合常涉及知识，而知识系贮存在“知识库”中，除了预设之知识外，尚可以经由学习过程，填入数据结构中。
　　概念是独立的单元，仅能代表静态的事物。而人类处身在四度空时中，面对的事物瞬息万变。因此，人类在认知或表达概念时，必须使之成为动态的形式，这种动态的形式，早在原始时代即被普遍应用为语言。
　　如果以电影为例，一格一格的画面可以视作独立的概念，放映即是将静止的画面连续成为动态的画面，人藉此了解电影所表达之原意。因此电影也是一种语言，而且灵活又有趣。想要了解语言真相的人，最好先由电影分析着手。
　　语言虽然发展得早，但在发展初期人类的智力尚未成熟，对于规律的掌握还在摸索阶段。故越早期的语言，其规律性越低。学习第二种语言的人，常对该语言“不规则”的文法、字词变化等伤透脑筋，偏偏那些最讨厌的部分往往是最常用的习惯语法！由所有不规则的习惯语法，可以看出来人类最初的习惯性行为是什么。奇怪的是中文中并没有“不规则”的观念。
　　中华文化真正的价值，就在中文的概念结构。过去因为对信息认识不足，无法发挥中文的绝对优势。好在真理不辩亦明，中国人亦为人类家属的一员，过去遗留的宝贵资产，尚有待未来人类共同努力，发扬光大。
　　我开始考虑概念分类时，就像做中文输入研究一样，完全是在黑暗中摸索。等到理出一些头绪，有了初步的结果后，才发现美国学者早在二十几年前就考虑过这种方法。但是他们只做了些最表面的分析后，发觉此路不通。自后因为计算机技术的进步，学者专家纷纷改由分析文法及字典着手，仍然没有找到可行的方向。
　　近年来概念分析似乎又有抬头的趋势，可是据我研究的结果，英语在长期发展过程中，倚重发音以表达概念。在录音机未发明之前，声音无法记录，全赖一代一代之间的口口相传。加以人类能辨识的声音有限，必须采用复音节才能有效运用。这一来，一个英语字汇本身就是一组复杂概念的结合，很难从中理出基本概念来。
　　其次，英语有规则严谨的文法结构，虽然有其优点，却因此丧失了语言文字的演进痕迹。我们要想找出人类思维的真相，就必须了解思维所应用的元素，这些元素就是组成原始文字语言的基本概念。既然英语业已经过整理，现代人所用之英语必然与整理前的有所不同，那又如何去找寻那些失去的环节？
　　人类最初发展的概念一定是不完整、简陋不堪的，我们想知道人是怎么了解概念，其途径之一是找到概念的发展原因及过程，此必须有保存良好的原始条件。对英语甚至所有的拚音系统来说，这个机会是非常渺茫的。中文基于视觉符号的发展应用，走向图形文字，每个图形在当初只代表一种具体概念。后来虽然扩大了应用的范围，注入了一些新的认知，但原意还在，而且各种文献一直保持至今。
　　中文最有利于追溯思维因素的一点，就是其单音概念。单音因为不易辨识，所以中文常将单音字组合成“词”、“成语”来使用。这些单音字正好就是各种概念的矿床，只要能有系统、大规模地整理研究，人类思维的历程必然昭然若揭。
　　我在沉红莲的协助下，收集了近二十万个“词组”，花了很久的功夫，把每个词的含义以及组成词的各单字间之关系，一一加以分析，又经过多次的修订，才得到第七章的分类表，以及概念基因和常识结构等。
　　我不厌其烦地说明这点，主要的原因是希望国人了解中华文化的博大精深，绝对不是虚语。尤其我很希望当今从事中国文学以及语言文字学的学者们，千万不要妄自菲薄。风水轮流转，智能之钥已在你们的掌握之中，智能科学就靠各位发扬光大。
　　我很了解自己，创新突破是我的长处，但却缺乏严密周全的细心。智能科学将是人类文明对宇宙进化的最终贡献，唯有大家捐弃私心、成见，精诚合作，截长补短，才可能有真正的成果。至于上述的分类，只是在启蒙时期，个人一点不成熟的心得而已。
　　以下且以使用最频繁、最复杂的“打”字为例，说明我们怎样利用中文的特性，将其前后字义的关键分析出来（其余的文字也是以同样的过程，一一整理归纳出来。）
　　我们所收集有关“打”字的复合词，因数量太多，在此仅抄录具代表性者如次：
　　“打”字在前，后接动词、名词、状态词等：
　　一、动词在后，“打”或指一种行为，或表某种动作或行为之进行。
　　　　打斗，打仗，打劫，打击，打扰，打闹，打猎，打扫，打捞，打造
　　　　打磨，打扮，打赌，打量，打鼾，打盹等。
　　二、名词在后，泛指用手进行之活动（可能有引申义）：
　　　　打球，打牌，打更，打鼓，打锣，打针，打铁，打靶，打拳，打勾
　　　　打油，打水，打酒，打柴，打鱼，打包，打结，打伞，打字等。
　　三、指动作行为，后接终态词、结果词或程度词：
　　　　打定，打成，打下，打住，打完，打好，打坏，打消，打伤，打死
　　　　打破，打穿，打断，打碎，打烂，打倒，打通，打动，打得等。
　　四、典故，或因习惯用法而有他义者：
　　　　打发，打尖，打点，打烊，打折，打算，打雷，打诨，打手，打哑谜等。
　　由上可知，“打”在前时，多以其后之字定义，本身仅作发生、进行及完成助词。
　　“打”字用在后面者较少，除用作单位外，多为“打”之动作。
　　一、前为数字者，“打”作为单位用：
　　　　一打，半打，两打，几打等。
　　二、前为动词，表示打之方式，前为名词，则指用工具之动作:
　　　　扭打，撕打，拍打，拷打，捶打，摔打，抽打，敲打，殴打等。
　　　　鞭打，棒打，锤打，拳打，手打等。
　　三、前为助动词、形容词、副词，则描述“打”的情况：
　　　　能打，肯打，会打，爱打，乱打，狠打，痛打，经打，耐打等。
　　四、专用术语：
　　　　单打，双打，代打，全垒打等。
　　我们一再分析各种单字之组合，发现了中文词组有一定之组合方式，除了一部分习用已久或出自典故难以合理的归类外，绝大多数都有前后顺序之关系。一般说来，同性质之字，前面的字义多为“始态”，后面的则为“终态”（亦即前者为因，后者为果）。形容词、副词多用在前，一旦用在字后，则一定是一种结果的状态。这种发现奠定了我们对中文具有“映画”功能的信念，因此，我们仅以单独的文字概念作为“动画”的元素，再以前后之关系定义之。
　　这种方法不但可以节省文字定义的空间，重要的是应用灵活无比，只要再加上“修辞”模块，中文自然语言就算完成了。
　　举例而言，“逃”是人或动物在某种原因下，因本能反应或意识驱使，以行走或任何交通工具，避开某个特定对象的动作行为。逃的结果，使位置或关系产生了变化。
　　从上述的定义来看，“逃”本字的概念并不完整，难以理解。充其量我们只能肯定这是一个主体所控制的动作。
　　再详细加以定义，以“逃”为述词，如前用一主词或副词，如“他逃”、“快逃”，其意甚明，毌庸细述。其下接名词，或作为“逃”之对象，或以“逃”修饰该名词，是一种最常见的叙述方式：
　　“逃家”：主词通常指人，但凡“家中之成员”均适用。
　　　　　　　（猫狗亦可逃家，但可能性不大。）
　　“逃学”、“逃课”：根据其后名词之限定，主词必为学生。
　　“逃兵”：主词为兵。
　　“逃税”：主词为人，且为有收入、有义务纳税之人。
　　“逃狱”：主词为囚犯，“逃犯”则为专词。
　　“逃难”：主词多半为人，然动物也可能有灾难。
　　“逃命”：主词指有生命、能动作者。
　　如果后接动词或状态词，则表示逃后之结果，如：
　　“逃避”、“逃遁”、“逃匿”：逃后不知所往。
　　“逃离”、“逃走”、“逃脱”、“逃开”、“逃掉”：皆表示逃后，不同程度地达到了逃的目的。
　　如果把上述之词颠倒过来，有些难以理解，有些则产生不同的概念，如：
　　“遁逃”：遁有不使人知之意，表示悄悄地先遁后逃。
　　“匿逃”：匿是静态的，放在逃的前面，无从解释。
　　“避逃”、“离逃”、“掉逃”：由于“避、离、掉”三字皆有结果之意，其后再接动作之词，很难会意。
　　“走逃”、“跑逃”：走及跑皆为全动态，已为逃所涵盖，故不适用。然而走及跑亦具终态之意，故用在逃之后面则可。
　　“脱逃”：指先脱离后，再逃者。
　　“开逃”：开始逃。开在此不是结果词，而是时间词。
　　由上可知，两个单字结合时，其在前在后有一定之语意规则，不然就词不达意。这是中文独具的特色，应用起来异常灵活，奥妙无穷。
　　在我粗浅的分析中，动词有状态词及动作词两种，分别说明如下：
　　一、状态词：又分为始态、连续态及终态，皆表示一种动作在某一时间内之状态。此类词可以用为动词，但却只表示某种动作之状态，与动作无关。如：
　　兼具三种状态者，如“开”、“启”、“发”、“起”等。
　　“开门”、“开罐”、“开幕”、“开山”等词中，如何“开”法并不是概念的主旨，只是表明了一种状况的开始。同理，“打开”、“张开”、“铺开”、“走开”等也只表明了一种终止的状态。“开打”、“开演”、“开讲”、“开跑”等则表示动作之连续态，在这种状态下，“开”之后皆接动词。
　　终态：“满”、“止”、“停”、“住”、“死”、“谢”等，这类概念不能用进行式，多为已经完成者。
　　连续态及终态：“灭”、“消”、“减”等，虽为终态，亦可作连续用。
　　二、动作词：即一般所谓之动词，除文法上之特性外，在字义上可分为动作及行为两大类。动作有自然力的运动，主体驱动之运动，动作之结果与其所产生之终态有关。行为则有动机及起因，环境及效应等因素。
　　以动作为例：“流”为自然力之运动，主体为液态物，因地心引力，由上往下运动。如果引伸为状态词，则表示一种连续态或终态，指自然而然形成者。中文凡属水字旁的字，多有自然现象的涵意，又凡为动词者，多具状态的特质。这是因为古人造字时，先有了事物之形，再观察事物之性质及所产生之状况，遂以事物为分类标准，当作偏旁，故都具有特别的属性，详见后面前缀之分类说明。
　　主体驱动之动作词亦然，凡属自发性动作，皆归类于运动之主体。这种分类法对于字义的了解及运用有极大的优点，譬如说西方的人工智能研究中，由于英文不具这种功能，字义完全依赖字典提供，字与字之间不具依属性。要回答“什么会飞”这类问题时，除了事先建妥庞大的“知识库”外，几乎没有其它简便的解决方案。（要知道类似“什么会飞”这样的问题是无穷无尽的！）
　　对中文而言，“飞”的属性是因能飞的主体而产生，前人在创造文字时已经处理妥当，除了一、两个例外，所有“鸟”旁的字（仓颉码之后三码为“斜日火”者）都是会飞的动物，其余“飞机”、“飞船”、“滑翔机”更不用说了。换句话说，在文字的结构中已经蕴含了字义的分类。如果把字义视作人类经验所得的智能，那么，我们可以大胆的宣称，中文是具有智能的文字，根据中文来发展“人工智能”，将远比英文来得容易。这也是何以我个人胆敢大言不惭，自命了解智能，说穿了，不过拾得前贤一点牙惠罢了。
　　行为词更有规律，缘因人类对行为的认识，多在文化层次发展到某一阶段以后，造字时已有成规可循。如人与人之间的行为，多以“彳”为偏旁；运动位移的行为，则采“辵”旁；思考的行为，为“心”字旁；言语的行为，则为“言”字旁；用手脚的行为，为“手”及“足”字旁，诸如此类，如女、纟、金、木、火等，不胜枚举。
　　所以，我认为中国人未来的前途，完全系于中文专家身上，未来人类的“思维科学”也端视中国语文学家的努力而定。毕竟中国文字不是“快餐”品，历经了几千年，动员了无数不计功利、默默奉献、没有私心的伟大的人类菁英，将人的睿智浓缩在一个小方块中。这种信息是宇宙进化史中最珍贵的宝藏，是至高无上的智能秘籍!
　　炎黄子孙们！“思维科学”必是未来世界的主流，身在宝山，还有什么需要外求的？不自行努力，琢磨这块璞玉，反而一味盲目的“西化”、“简化”，妄把他人的残渣剩滓奉为圣品，那不是愚昧又是什么？
　　我个人学浅才疏，所知万不及一，言尽于此。世人是否能有造化，也非我能揣测，邵康节梅花诗言：“一院奇花春有主，连宵风雨不须愁”。喻之国人，差堪告慰。不过，今天中国需要的是信心，未来之中国则戒之在狂傲。文化属于全体人类，能相互学习切磋，截长补短将是人类之福。褊狭的地域或人种观，必将自陷于绝境，不见容于千秋万世。
　　中文另外一个极有价值的观念，即为“部首”的常识分类。任何一个人绝不可能有足够的能力与时间，认识到所有事物的通则，但是一个绵延不绝的民族则有此可能。尽管可能，也要有必然可行的方式，一代一代沿用这种方式，不断发展下去。
　　在设计仓颉输入法的时候，我就发现了大部分的形声字都以字形偏旁作为字义分类。根据这种现象，我正好将文字取码与字义结合为一。因此仓颉字码不仅仅是索引符号，又是该字的字形及字义分类。目前一般人或许还看不出其功效，一旦进入自然语言的领域，字义分类便是人类认知的成败关键。
　　下面我以仓颉码为序，大略介绍前缀中字义的定义方式，再与前述各概念配合应用，精简异常，当知我强调中国文字之智能绝非虚语了。（部首在上、下、左、右，都有特殊的分类意义，请自行参详。）
　　日：与光有关之各种现象。
　　门：与门有关之词，代表组合之机体。
　　月：即为“肉”字，生理组织类。或为“月”，与光有关之各种现象。
　　骨：生理组织。
　　贝：财物及与财物有关之行为。
　　豸：野兽类。
　　目：眼部之动作及视觉感受。
　　金：金属及其属性等。
　　木：树木类，木制物以及与木有关之特性等。
　　韦：皮革类之器物及其所表示之性质。
　　水：与水有关之自然景物、现象、状态、动作与人造物等。
　　火：与火有关之现象、事物，状态以及炊事行为等。
　　米：与粮食有关之事物。
　　土：地形、地物，与土及地有关之词。
　　走：与行走有关之词。
　　竹：各种竹类，竹之部位及制物。
　　白：光亮洁白之形容词。
　　禾：农事、农作物等。
　　身：身躯及身体之动作等。
　　鬼：鬼怪等名词及形容词。
　　彳：人与人之间之各种行为及事件。
　　辵：与人类动作行为有关之词。
　　牛：与畜牧及生活有关之词。
　　舌：舌部之动作。
　　鼻：与鼻有关者。
　　风：与风有关者。
　　舟：与航行有关之行为、用具等。
　　广：房舍及室内之用具等，或表空间之形容词。
　　示：礼仪及祭祀之行为及用具等。
　　宀：居家生活有关之词。
　　穴：具有穴状特性之词。
　　车：与车辆、运输有关之词。
　　麦：粮食，作物等。
　　疒：生理及疾病等有关之词。
　　犬：与犬类野兽有关之词。
　　衣：与衣着有关之词。
　　巾：衣物，巾状之用物及饰物等。
　　虫：虫类、爬虫类等。
　　片：片状之物。
　　雨：与水气有关之自然景象、现象等。
　　王：玉类物质物品等。
　　歹：与死亡、毁坏有关之现象及行为。
　　豕：家畜有关者。
　　石：矿物、石制物及其性质等。
　　酉：经酦酵之食物及有关之现象等。
　　弓：武器及有关之性质等。
　　角：角之部位、角制品及其功能等。
　　子：人际称谓及关系等。
　　鱼：鱼类与相关之词。
　　矛：武器工具等。
　　阜：与空间、环境有关之词及人类行为等。
　　邑：空间，地域及环境之词。
　　人：人之角色、关系、行为、现象等。
　　食：与食事、食物有关者。
　　气：各种气体。
　　心：心理感受、现象、状况等。左侧的心指状况，下部的心指感受。
　　手：手之动作、人体之动作及行为。
　　耒：农具、农作等。
　　口：口之部位，口部动作，发声等。
　　足：脚部名称、动作、行为、现象等。
　　马：与马有关之词类。
　　髟：体毛类及其性质。
　　耳：与耳以及听觉有关者。
　　廾：草类，菜蔬等植物。
　　革：皮革制品等。
　　羊：与羊有关之词。
　　山：与山有关之形容词、名词等。
　　女：与女性有关之名词，形容词等。
　　纟：与纺织有关之词或具有纠结性之状态词。
　　田：与土地有关之词。
　　黑：与黑暗及黑色有关之词。
　　囗：与空间范围有关之词。
　　言：与语言有关之词。
　　以上仅略述概要，根据字码只需要一个位（开或关），就可以达到分类的目的，全世界大概也只有中文及仓颉码可以做到。如果我们不加以利用，将之发扬光大，岂不是愧对祖先？
　　西方是分裂性的文化，是以假设、分析、求证为思维的指导方针。世事越分越细，细不见得能明，但是细分的结果，派别观念越来越多，彼此之间的相同性反而越来越少。这点可以由知识分类、政治制度、人种区分得到明证。
　　中华文化是综合性的文化，是以假设、归纳、应用为思维的圭臬。中国人只求外表的统一，含糊的认知，不确定的象征。千古以降，读书人但求“读书不求甚解”、“得意而忘言”，以同统异。是以知识上崇儒，政治上忠君，人种上同化。
　　这种分别正是概念的认知问题！今人学了西方的观念，半通不通，便将自己全盘否而定之。谈意识太麻烦，不如举个例，看看西方的菁英是怎么分析语文？又得到什么结果？如果这样还不能拾起文化的自尊心，不妨等西方开始汉化时，再回头也不迟。
　　西方学者经过二十余年的摸索过程和错误经验，自然语言的研究者，由最初利用关键词或纯文法的比对方式，如今已改用概念分析法，其中耶鲁学派的 Roger Schank 所提出的理论，是当前的主流之一。
　　他的目标是设计出一个“会听故事”的程序，也就是说，它所需要知道的常识和字汇，都局限在一个范围内（西方尚无人敢尝试做一个有“一般用途”的自然语言系统）。
　　他的构想是把所有的行为动作词，分析归纳成若干个基本概念。其它则类分为动作者，目标物等。输入的语句经过程序的剖析后，即转化为基本概念。
　　基本概念共有11类（现已扩充，但我在中文结构中归纳出的，已有一千个，包括前章所列举的概念分类），如ATrans 指所有权的转移（给、拿、买等），PTrans 指物体的位移，（走、骑、放等）， MTrans 指信息的传递（说、写、听等），MBuild指信息处理（如想、思考等），INgest 指进食行为（吃、喝、饮等）……, 以下且举一实例说明：
　　输入：他卖给我一本书。
　　内部结构:
　　　　　动作： ATrans
　　　　　动作者：他
　　　　　物：　　书　　　　　　动作： ATrans
　　　　　到：　　我 ------　　动作者：我
　　　　　从：　　他　　　　　　物：　　钱
　　　　　　　　　　　　　　　　到：　　他
　　　　　　　　　　　　　　　　从：　　我
　　输出:
　　　1.分析：我给了他钱，他给我一本书，我买了他的一本书，我付了他书钱。
　　　2.推理：我有了一本书，他有了钱，我想要他那本书，他不再需要那本书，
　　　　　我会看那本书，他需要钱。
　　假设常用的英文字汇有一万一千个，只有十一个类别，这表示每一类中有一千个字汇概念相同，无法区分。就算目前已扩充到一百个类别，只要不是每个字的定义，都有别于其它的字，计算机就无法真正了解和使用自然语言。
　　再看输出有分析，有推理，好象说得很清楚，可是因为字义界定不明，达不到真正的理解。事实上西方学者自己也承认，对“人工智能”还在“学习了解”阶段，尚无可行的理论。（Schank的理论，此处限于篇幅和主题，只做简单说明。坊间有关人工智能书籍中“语意理解”部分，必会介绍他的方法，读者若有兴趣，请自行阅读。）
　　如果以中文概念来分析，“他”是“人”，（人字旁＋定义），“卖”则是一种“商业行为”，（贝字旁＋定义，商业行为之一，即为金钱与物的交易），“给我”是指“受者”，“一”是数量，“本”是形容有信息内容的“量词”，对象物为“书”。
　　输出：“他”收了钱，“我”收了“书”，完成了一桩买卖。（全部资料七个字，共二十八个字符，过程不过用了几百个字符的程序而已）。
　　由此可证，他们的分析虽然不再完全根据文法，却也与概念无直接关系。这种做法，受限于设计者的能力，每一个字都必须辛辛苦苦地重建其结构。中文概念则早已建立在文字的形声结构中，充其量下点功夫整理即可。

　　在这个时代中，不论在经济、军事、文化上，也不管对象是国家、社会或个人，知识的运用都具有决定性的力量。然而，运用知识的仍然是人，人又受限于时、空，所以人类社会尚能保持某种程度的平衡。
　　然而，人类追求“自动化”的努力与梦想，古今中外，未曾一刻停止过。一旦在信息的处理上能成功地使知识运用自动化，则人类的社会结构势将引起空前的变化。
　　这种知识自动化，就是“人工智能”的目的之一。
　　因为人有智能，所以能运用知识，并借着知识的力量，达到人的目的。如果机器也能自动地运用知识，我们必须承认这种机器也同样具有“智能”。只是这种智能的初始是“人工设计”的，所以一般称之为“人工智能”。
　　有了人工智能的机器以后，基于机器记忆能力之强大，永远工作不休，处理事务准确迅速，成本低，效率高，很少发生“错误”。最可怕的，是“它”没有人性，只是忠实不渝地执行交付的任务。万一它在一个或一群人的支使控制下，很可能国际均势消失，对人类社会造成永难弥补的伤害。
　　职是之故，所有的工业先进国家，无不将人工智能当作最重要的攻关项目，全力以赴，唯恐落在他人之后。
　　所幸欧美工业国家之先进基础，建立在物质科技上，而“智能”却与物质无关，是一种“唯心”的、“经验”的领域。尽管多年来他们已经投入了大量的资金、人力，迄今并没有任何实质上的突破。
　　这是一个民族、文化生存或淘汰的竞争时代，今天在物质条件上，我们是弱者，处处落人之后。但是，中国也曾经壮大过、强盛过，这样的说法并不是自我陶醉，而是基于中国文化的特征以及数千年累积的经验。这些正是“人工智能”所缺乏、而西方科学界无从由实验室或工厂中生产出来的。
　　所以，在工业时代，我们的确是瞠乎人后，信息时代却给我们带来了一线曙光。如果我们善于利用，群策群力，将先圣先贤的经验及智能设计成为“人工智能”的产品。则在即将到来的新时代，谁敢轻侮炎黄子孙?
　　我已经决定不再涉足“人工智能”，但是，知识不是任何人的专利，我能看到，别人也有可能做出来。时机一成熟，“人工智能”就难免泛滥成灾。既然已经谈了不少，何妨再稍作解释，让读者多一分了解。
　　人工智能不能离开信息，那是因为人的智能来自于信息。“资”指静态的资料，“讯”指动态的讯息。信息是人将感官所能认知的刺激，以资料及讯息的形式，加以贮存及应用，以代表人所能了解及应用之概念。
　　在第六章我曾谈到感觉讯号与概念的关系，这里我更进一步，略述其在人工智能上的应用。人类的感觉有五种，分别是视、听、味、嗅、触觉。佛家则认为应将“意”加入，成为“六识”，意为人对刺激的六种认识。
　　意识我们称为内在刺激，由人的经验交集所形成，且为个人行为及判断的中枢。外在刺激则有五种，其中视觉感知光影，人可以藉图像及符号等来认知及表达；听觉则接收声波，人并用声带仿真该音调；味、嗅、触三者人仅能接收，除了经验认知外，无法与他人直接沟通，故纯属主观。
　　味、嗅、触觉与反射神经有直接的联系，偏向于“本能”，当此类刺激产生时，反射中枢立即根据利害程度，作出最有利于该个体的反应。听、视觉则接收距离较远之物体、事件所传来的声、光等刺激，最初这些刺激亦是本能的，以判断其对本体之利害，但此判断可以累积成为经验。当某些经验在客观印证下，被同一社会的人公认，遂称之为常识。在智能的理论上，常识是人据以判断选择的标准。
　　图形及符号可以设计成为静态的资料，音调则是动态的讯息，这两者皆具有接收及表达的功能。人的主观经验透过信息的交联，得以互相转换，并以之传达给他人。对于原本没有此类经验的人，信息遂成为最有效的工具，藉之可迅速建立起其常识库及专业知识库，这就是学习。
　　当然，在学习过程中，由于主观及客观的条件，认知效果也有差异，如味嗅触及意识等纯属主观经验，除了在一定的范围及程度外，并无实质的意义。唯有双方具有等效的经验，而且能明确地掌握信息的要素时，才有沟通的可能。至于专业知识则较接近客观，同行者都必须经历相似的体验，学习效率最高。
　　即使是文字语言也面临相同的问题，在学习语言文字的过程中，需要将之与已形成常识的主观经验联结起来。（人在两三岁以前，学习是一种本能，靠记忆将声音与事物相连，渐渐形成常识。）这种过程必须利用感官的效应，一再与客观事件印证，此即为思考、判断。而语言文字所联结的认知即为概念，所以每个人对概念的认知，与其经验的广狭、感官的灵敏度、思考判断的方式及语言文字的接受能力等，都有不可分割的关系。
　　西方对人工智能尚没有统一的定义，在此我仅以设计者的立场，先定义智能，再逐步说明人工智能的可行性。
　　所谓的“智能”，系指一种自发性的机构体所具有的达到其预设目标之能力。
　　根据此定义，智能有四个要素：
　　一、其载体是一种机构体，具有整体性质及功能。
　　二、此机构体是自动的，非外力所操纵。
　　三、有预设的目标。
　　四、能够在变化的时空中适当的因应调整，以迄目标的达成。
　　应该注意所谓“预设的目标”应该只有一个，如果有多重目标，则必有优先级之分，或按照时间订定远程、近程目标，逐步实施，而且不能自相矛盾。因此，在某一时间内，在某一个优先级下，仍然是只有一个预设的目标。
　　一部汽车是一种机构体，其预设目标是代人之步，但汽车不具自发性，故没有智能。人类所设计的各种工具、用具，到目前为止都必须在人的操作、控制下，并需运用人类的智能，以达到预期的目标，所以都不具有智能。
　　如果我们设计一种车辆，以“驾驶服务”为唯一的“预设之目标”。它能自动驾驶，并接受人的命令。在接受人的命令时，即相当于设定短程目标。这时它应该能够判断此一短程目标是否与预设的目标相矛盾？如果是，它将拒绝执行。否则不论在什么情况下，它都能把人送达目的地，具有这种功效的汽车，就可以称为是一智能机构体。
　　同理，我们如能设计一具计算机，自动地为人类收集、处理资料；能与人交谈，了解人的观念、帮助人解决问题，这就是智能计算机。再若将具有感觉器、行动能力的机械人，与智能计算机结合起来，则此机械人即达成“人工智能”的要求。
　　为了要保证安全有用，机器与人之间的沟通，必须藉助概念，人得以对此“智能体”加以控制。故人类所设计的智能机器，必须能“听”及“说”人类惯用的语言，才能达到上述目的。在这种特定的条件下，计算机对语言、概念的理解、运用，才是设计人工智能的成败关键。
　　所谓“设计”是先有了一种观念，利用已知的技术和器材，组成符合构想之事物。计算机专家如果没有智能的观念，不知道所面对的是什么，则无从动手。
　　当今的语言学只研究到语言的演进、结构及应用，至于人体机能与语言之间的接口关系，则尚未能了解。人会模仿学习，也会教导别人，却不知道为什么会有这种能力，当然更不知道如何教导机器去学习及应用语言了。
　　至于观念，更是思考的基础，从古至今，哲学家们争论不休，也未曾有过具体的定论。那么，人如何设计一种连自己都不了解的事物呢？
　　很明显地，我们必须了解语言与思考之间的体用因果，使计算机也和人一般，能够思考，能够运用语言。这样它就可以与人沟通，了解人的观念，进而为人类服务。再换个角度来看，语言（符号）相当于对外在刺激的一种感应，而观念则是经验的积和，一旦这种计算机设计成功，计算机就可以应用其感应资料，增进其观念。更进一步，全世界的计算机可以藉网络的连系，互通讯息，而且以高速处理，永不中止。
　　今天，正当有先见的环境保护人士，正努力挽救濒临绝种的其它生物时，我们可以想见，未来的人类亦将面临需要被保护的一天。进化淘汰绝对是反人道的，今天的人类还不憬悟身处的环境，到了大错铸成时，后悔已是无及了。
　　假如我们能把人性设计到计算机中，让计算机继承人类的感知，无止无尽地薪火相传。当然，这已不仅是技术上可不可能的问题，其中还牵涉到法律、道德以及个人的良知、责任等种种超出我们所能解答的问题。
　　知识早已不是人类掌握在手中的工具了，它的生命力遍布于每一个人的思想中。一道好奇的目光，一个偶发的疑问，在在都是它的影子。不论重不重要，也不论成功失败，只要有人的心中怦然一动，知识就增加了一分力量。
　　当人类走出丛林，远离了那些还在披毛茹血的族亲时，人就与知识歃血为盟，携手创造了一个崭新的时代。不幸人无法将其生命无限延伸，知识却得以借着人类，一代一代的传衍、更新。现在，知识壮大了，壮大到任何个人都无法窥识其全貌，更遑论控制应用。这时，人与知识之间的相互利用价值，端视彼此的需求程度而定。
　　我们能够忽视这个事实吗？拋开了知识，有谁还能声称人为万物之灵？在今天，国家会衰亡，人种会灭绝，可是知识却永远存在。世界上的每一个角落，社会上的每一桩事件，无不深深地受着知识的支配。人类孜孜不倦所追求的，朝朝暮暮所憧憬的，又有哪一件能脱离知识的影响？
　　我认为该是人类自我检讨的时候了，趁着“知识机器”即将问世、我们的盟友快要振翅起飞，而我们这些“知识动物”还在盲目的推波助澜之际。如果能够把握契机，将人类特具的感受以及长年累月体验到的价值观，都一股脑儿交付给它。至少，让它也有“感同身受”的人性和“推己及人”的认知，或许人类还能安享余年。
　　有这种可能吗？没有人怀疑“知识机器”的能耐，但谁都不相信那种无血无肉的机器，会有像人类一样的情感。
　　这是因为科学太重视实验所得的客观知识，忽略了人的主观感受，所以科学家们一直不了解“人性”到底是什么。在他们望洋兴叹之时，是不是应该调整一下实验的手段，利用理性的思维，来剖析一下人性呢？
　　据我的了解，人性在理性的剖析下，并没有什么神秘难测的现象。我们只要掌握住一些基本观念，逐步地探讨，就可以透视全貌。一旦能够理解，自然能按图索骥，用已知的各种观念和技术，将之设计成为附加在知识机器上的感性功能。
　　人类应用语言的原因，是由于人自我的“主观”感受，和外在的“客观”真实之间有所异同。为了要与其它个体沟通，高等动物发展出了以声音表达情绪的机能。人类更进一步，利用声音的各种变化发展出语言，以代表其主观的感受。
　　如果把主观的感受分析成为单纯的因素，而且这些单纯因素的组合，能代表人类所有的观念，我们就能分析语言，了解人类思考的过程。在这种情况下，这些单纯的因素也就是人类思考的基因，甚至可以视为知识的基本元素。
　　原则上说来，人类的感觉器官接受到外界的各种“刺激”，在本能上基于“利害关系”而有了“感受”、产生“反应”。若是仅表达感受的反应，谓之“情绪”，再因为反应的后果，由“观察”刺激得到“认知”。因认知而有了“判断”，这个过程谓之“经验”，经验的贮存，则为“记忆”。由于人类的记忆系统建筑在神经的生化结构上，其效能不高，故对记忆的存贮、取用，很难加以控制，有时对一事件的原委记忆并不明确，我们称之为“印象”。
　　大脑中的内存以神经原连接成网络，神经原会产生生化电流脉冲，在网络中流动。相同的感受因素占有共同的记忆区域，但却与不同的事件相通连。当某一事件所产生的电流脉冲，因共同的感受因素而引发其它事件的记忆，我们称此现象为“联想”。对于某一因素或事件产生的联想，因为电路的导通，遂有全盘的认知，即为人对该一因素或事件的“观念”。
　　当人对事物有了观念以后，基于其本身的利害关系，电流流经记忆区时，在极为明显的利害感受下，身体机构会产生各种内分泌腺素，使神经原处于兴奋状态，而使电流加强。更由于强烈电流的不断导通，神经末梢的离子量增加，电阻系数降低。而任何刺激所产生的电流脉冲，就像水往下流的情况一样，必然有通过电阻系数较低之路线的趋势。久而久之，经常导通之路线便能四通八达，成为全部经验记忆的枢钮。在此枢钮形成后，每当刺激产生时，此区便立刻与意识中枢导通，形成“意识”。
　　抽象的意识以及具象的身体，总称之为“我”，也就是当一个个体感觉到神经传送的刺激，且与过去的经验认知相结合时，所得到的整体意识的“知觉”。换句话说，一个人如果丧失了过去的经验认知，则“我”将毫无意义，只是一尊躯体。再若在某一段时间内，没有任何内在、外界的刺激感受，也相当于“我”不存在。
　　“我”对客观认知的观念，是基于过去的经验，而经验不是独立的单一事件，有时间的过程，有各种感觉器官综合的感受，有利、害以及需求的交集。因此每一个自我对客观认知后所产生的主观观念，或多或少都有差别。但人又不能脱离群体，必须与在同一环境下的人，具备相同或类似的认知，由此而有了学习及观察的动机。
　　学习观察是将个人的观念与客观环境相印证，并据以修正、充实个人观念。在这个印证过程中，必须将自己的主观观念，以感官所能接受的刺激形式，表达给另一个主观体认知。由于观念笼统地涵盖了所有相关的经验，而刺激受到时空的限制，不可能明确地表达清楚。因此必须将观念的若干基本因素，分解成为具有独特性、组合性、表达性的单元，才能较完整有效的传达给另一个主观体，这种单元就是概念。
　　在人脑中，这种概念是以一组联通电路的形式存在，联通于所认知的各种观念之间。每当人因为某种因素，产生了一种复杂的观念时，这些观念之间，通过有关的交集，就有电位电势的产生。这时大脑中枢依循电势，将电路联通，此一联通之电路必有一代表的概念相连。以此概念驱动控制中枢，就可以得到意识的效应。
　　人类发展出概念之初，只是基于实用，并没有一定的法则。随着认知范围逐渐的扩大，概念所涵盖的内容越来越广、界定的因子越来越精细。到现在人所应用的概念一再因应调整，变成了错综复杂的集合。这个结果又导致了我们对概念本身定义的困难，甚至连概念所代表的是什么，都无从了解。
　　如果我们能做到利用现有的知识，反推出概念的基本因子，便能够用符号代表这些基因，并设计成为代码，贮存在计算机中。如此，计算机便可以像人一般地运用概念。
　　人运用概念联接导通大脑中各种观念网络的过程为“思考”，经过思考以后，认知的利害因果刺激了内分泌腺素，流入血液，经过心脏，是为“感受”。有感受便会产生反应，是谓“情绪”，情绪直接影响到“我”的意识，是自我经验的一部分。这部分再与抽象的我混合在一起，经常产生影响情绪的感应，是为“感情”。
　　人因为生命本能的驱使，借助感觉器官对各种变化的认知，而达到趋利避害的目标，此有其行为的必然性。可是又因对主观及客观观念的观察及认知，了解到自我的利害常与环境息息相关，必须对自我的利害作若干妥协，以谋求更大的利益。前者以自我直接的感受为前提，人的行为端视个人当时的利害判断而定，此即“感性”。后者系经过对客观环境的认知，需克制自我，是一种有秩序的反省，故称为“理性”。
　　上述的全部观念就是“人性”，因此，只要仿真人类所具有的感觉器官以及人类已经认知的概念基因，将之设计在一个机器上，使之与人类同样或近似地运作。此机器即可具有“人性”以及人的感觉、知觉，而能感人之感、与人类沟通，达到我们预期的目标。
　　根据上面的分析，我们可以总结出三个步骤，将一种兼具感性及理性的“拟人计算机”描绘出来。第一步是刺激的认知，第二步是概念思考，最后是知识应用。兹以现有的器材及技术，分成下列五项说明：
　　一、硬件结构：控制中枢，分别作反射、判断、运动、记忆及感应中枢等。其中反射中枢独立，余者以判断中枢为主宰。
　　　　内存：可供暂时储存的浅层记忆及永久记忆的装置等。
　　　　感应器：接收视、听、触、味及嗅觉之刺激，供感应中枢分辨。
　　　　外围设备：供动作、行为、发声、显示、电力供应及其它接口。
　　二、输入讯号：各种感应的讯号即相当于人所感受的各种刺激，需先加以分析整理，使与所设计的认知资料相符合。
　　三、内贮资料：将输入的感应讯号，利用二进制的特征，使每一位直接连通到相关的接口上，即可具有神经信道的效能。同时此类相当于刺激的讯号，可以组成各种认知的资料形式，亦即概念，以便加以应用。
　　四、系统程序：由刺激的产生到行为的完成，以及回馈的观察等，可当做系统程序。此外，判断、学习、数据管理、知识库等亦皆需以程序处理。
　　五、接口处理：在人的认知中，各种刺激经常同时存在且互为因果，所以各中枢之间的接口，必须配合人体之结构，做联线处理。

文学书苑首页