您的位置:寻梦网首页文学书苑现代文学朱邦复作品集汉字基因工程>八、机器理解

汉字基因工程

作者: 朱邦复

上一页  目录  下一页
八、机器理解


  为求掌握机器理解的技术,西方工业国家不惜工本、不遗余力,迄今整整研究了五十年,但都没有任何突破。原因很简单,西方所使用的拼音文字中,不具备字义的基因,以致无机可寻。
  人类对语文理解的过程牵涉极广,不可能在此一一详说。为了略释众疑,下面我略举数例,介绍一些相关的应用流程和条件,以供参考。

  1,概念表达:

释文:“表”-会意字,上衣也,引申外层可见
            可示的征象、讯息也。    “达”-前缀:◆,乍行乍止,行为。
           字身:大羊,美也,有福也。
           *行为顺畅,有利,目的完成,
            到也。 定义:以可示的征象完成目的,使知也。

      人类文明史上,仅有两种表达概念的方式:
    一为音符式;一为图形式。因为人类所赖的沟通
    接口,只有声音与图形。声音易学易用,起源自
    动物求偶及宣示领土之本能。而图形繁复难行,
    最近的考古资料显示,克罗马侬人在其居住的洞 穴中,曾制作了大量的壁画,这已是近十万年的
    事了。
      过于简单或复杂都不是理想的结构,简单符
    合人性需求,却牺牲了功能;复杂为人所畏,不
    到不得已,是人所不取者。声音的易学易用发展
    出音符概念,当今泰半的语文属拼音语系,其优
    点为容易使用、利于发展贸易。
      只有中国早就采用较音符复杂、而较图形简
    单的“形声”概念系统。只惜国势未张,中国人
    不自知其福。须知易学易用固为生存之道,然进
    化之过程,必朝向更高的方向发展。而更高的功
    能,则绝非简单的工具所能企及。
      概念是以一些象征性的符号,代表经验认知
    中某些概略的因素,人在思维时,这种代表性的
    符号,就可以透过网络接口,将其经验认知因素
    逐一展开。
      举例而言,飞机为一概念,而此一概念为“
    飞”与“机”所组成。但是飞机所代表的因素极
    多,在网络接口上,仅以体用因果为例,简示如
    下:
    静态体:“形”-巨大,有翼。“质”-金属,
        重而坚。“性”-科技产品 。
    静态用:“形”-能载人、物。“质”-安全可
        靠。“性”运动于远距离。
    动态因:燃烧汽油,动力大,因空气浮力而运动
        于空中。
    动态果:节省时间,代价高,经济价值高,危险
        性大,出事率低。
      假定思维主题为“渡过十天假期”,而由“
    坐飞机去旅行”驱动的认知,根据概念表达的先
    后次序(在此仅分析与飞机有关者),将网络介
    面展开如下:
  坐───◆选择对象及方式 ◆将臀部(身体)置于……◆稳定舒适态 ◆等待
  飞机┬─◆所选择之对象  ◆将臀部置于座位上   ◆稳定舒适  ◆目的地
    ├─选择原因:此交通工具速度快,在空中运动。      (经验)
    │    ├联想性--其它交通工具之经验。       (经验)
    │    ├安全性--危险,查经验资料-死亡机会-小。 (判断)
    │    ├价值性--价值-高,代价-高。       (判断)
    │    ├必要性--仅有十天时间,往返要有效率。   (判断)
    │    ├目的性--旅行-平安,环境变化刺激心态改变。(判断)
    ├判断可行┘
  去─┴─选择飞机可达之处。
  旅行──目的。
      再如把“车”当作一封闭系统,寻找“车”
    与其它概念的构词关系,则可视常识为基因,前
    后承接为接口,分析如次:
    前系统:代表性质,功能分类等。
        如:大军汽火风牛马战机礼专挽轻等。
    本系统:“车”
    后系统:属性分类,定义定性等。
        如:头尾门灯椅身座票牌厢祸店资等。
    上系统:应用处理,控制操纵等。
        如:开驾错倒洗乘租买赛御翻转寄等。
    下系统:所属概念,引申概念等。
        如:如轮辖轴轭辆辙辕轗转轿轖輘等。

      知识具有能量,将其能量分解,即有实用功
    效。知识能量结合成四种模块形式:概念模块、
    结构模块、知识模块、系统模块。分解这四种模
    组,就可以得到知识的能量。
      概念模块,在汉字即为常识结构,如为拼音
    文字,则尚须在概念模块之外,另行建立常识结
    构。常识结构之难度远大于任何一种知识,盖知
    识有一定的范畴,而常识则无从限制。若无常识
    做基础,语言文字只是一些无机的符号,对人毫
    无意义。
      汉字最大的价值,就在于图形符号与“象”
    的常识结构上。只要熟习取象的本旨,以及形声
    的扩充规律,汉字本身就是字典,外加一整部百
    科全书。一般说来,中国人只要略识“之无”,
    就小有常识,正是这种微妙的模块之功。

  2,概念模块:

    释文:“模”-前缀:木,树木。
           字身:莫,草中见日形。
           *初民以木为定形之物,以拟所
            见之形,引申为标准的范式。
       “组”-前缀:纟,细丝。
           字身:且,又也。
           *细丝交互联结,系统间配合为
            一体,量词。
    定义:以一系统之固定形式应用于其它系统者。

      人生有限而宇宙无穷,以有限理解无穷,本
    系不可能的任务。经过人类数十万年的摸索,终
    于发现一种以简驭繁的法则,即以简单的讯息,
    代表含糊的常识经验认知,是称“概念”。若以
    概念为经,常识经验为纬,彼此交错衔接成为一
    个模块,这种模块即为“概念模块”。
      以汉字为例,概念与常识的关系非常密切,
    兹简述如下:
   ◆概念代表多数常识:即将概念做为索引或目录。
   ◆概念代表某一常识:是称等效式,一个概念代表
    一种常识。
   ◆概念等于常识:此观念来自汉字图形文字之“六
    书”法则。
     ◆辨识概念因子:文字中已具辨识之定义:
      如前缀:日月与光热有关;目与视讯有关。
          金木水火土为性质分类。
          牛马犬鸟鱼为生物分类。
          门户车舟穴为机能分类。
          刀矛弓矢贝为用途分类。
          骨肉皮毛髟为组织分类。
          手足口彳走为行为分类。
     ◆认识概念因子:汉字系以少数概念,结合成
      为“词组”,词组产生模块认知,即功能、
      控制、变化、情况、利害等所具有的能量。
      如“火车”是一个概念,而“火车是交通工
      具”则为常识。
      “火车”之概念为:“火”为动力,“车”
      为交通工具。
      而火的动力及交通工具的性质则为知识。

  3,结构模块:
      结构模块由概念模块构成,将概念模块组合
    成“句子”。句子是一系列常识的综合,经常代
    表着某种知识,或者称做有系统的常识。
      句子可以视为一组连结的系统,由本态系统
    、连结系统及终态系统三者构成。
      本态系统可以是任何系统,连结系统则必须
    与本态有接口关系,终态系统多属因果关系,如
    非因果之陈述,则可从缺。
      “句子”=本态系统+连结系统+终态系统
      概念是由基本的、不可分割的因子所组成,
    源自刺激,其中包括外来的能量变化、内在的经
    验认识等等。刺激又有各种不同的性质,在不同
    情况下有不同的认知。句子就是要界定概念所不
    能代表的各种情况,以表达其本态或终态认知。
      概念结构是多层次的组合,纵横结成网络,
    当网络聚合为一“交集”时,人始能认知各概念
    间的关系。聚合有其必然的过程,过程的长短会
    影响网络电势的强弱。时间短效率高,时间长则
    电势减弱,无法聚焦。
      因此,概念最有效的应用方式,必是在电势
    尚未减弱前,聚焦完毕。所以句子不宜太长,人
    对超过十个概念以上的句子,常常要重复思考,
    否则不能理解。
      连续的系列常识,始能组成由简单到复杂的
    知识,唯有整个系统架构完成后,知识才能成为
    一个体系。用“文法学”的术语来说,是以字组
    成词,词组成句,句组成段,各段组成篇章,始
    成知识。
      本态及终态系统各代表一种性质或状态,所
    有的概念皆能适用。连结系统如涉及因果,则属
    动作行为等“主观动态”类概念,否则必为“客
    观-抽象-定义-语法”类。
      在系统观之立场,文句系以本态系统为天,
    终态为地,连结为人。以天为大范围,由人界的
    变化,以与地界合为一体。但在表达中,各系统
    又可细分:
    例一:以“坐飞机去旅行”说明如次:
      天:本态    坐飞机
        天:  (某人)--省略
        人:  坐-----行为,主观认知
        地:  飞机----本态
      人:连结    去
        天:
        人:  去-----行为,主观认知
        地:
      地:终态    旅行
        天:
        人:  旅行--行为终态,主观认知
        地:
    例二:分析“本文之主旨在于阐明知识模块之应
       用”:
      天:本态    本文 之 主旨
        天:  本文----本态
        人:  之-----属性
        地:  主旨----属于本态
      人:连结    在于 阐明
        天:  在于----连结本态
        人:  阐明----主观认知
        地:
      地:终态    知识模块 之 应用
        天:  知识模块--终态之本
        人:  之-----属性
        地:  应用----终态之果
      此外尚有句子的结构关系,略举数例如次:
    ◆代表因、果及体、用关系者:
     “因为,所以”、“故此”表因果关系。
     “得以,可以”兼具因果及体用关系。
     “把,用于”则为体用关系。
    ◆结构的等效关系:
     “是、为、系、等于、相当于……”等概念。
     “你、你、我、他……”等人称代名词,及“
     这个、那些……”等指示代名词。
     “和、及、与……”等连接词。
    ◆结构的从属关系:
     “有、属于、的、之……”等界定前后关系者。
    ◆结构的状态关系:
     如果结构功能为动作表现,则前者为始态,后
     者为终态。
     如“逃脱”及“脱逃”两个概念结构,都由“
     逃”及“脱”所组成,前者为始态,表示开始
     逃,后者为终态,表示脱离了逃的状况。也就
     是逃的目标达成了,这是因为概念“脱”具终
     止因子之故。
     后者以“脱”为始态,开始为“脱离”某一情
     况,终态为逃的动作。脱虽具有终止之概念,
     但在始态时仅表示终止前一状态,逃不具终止
     概念,故而尚在继续“逃”。
     再若“稳不稳”等各种肯定加否定的概念,是
     表示相对状态,代表在此两种相对的认知中,
     任何一个尚不明确的灰色区域。
    ◆结构的程度关系:
     所有的“相对概念”,如“大、小,快、慢,
     软、硬,高、低”等,如果作为始态,表示为
     一时、空、质、量、数等性质的概略程度。如
     :“快”跑,“好”吃,“高”山,“近”利
     等。
     如“死打”及“打死”,“打”无终止概念,
     而“死”具终止概念,且属完全终止。若以“
     死”为始态,则表示严重程度。至于是否已“
     打死”,则必须另行陈述。
     若需要强调此一程度,则再应用其它的程度概
     念如:“很”快,“非常”好,“够”高,“
     不”近,“一味”死打等。
    ◆结构的数量关系:
     为了更明确地表达,则需采用“数量概念”,
     数量概念有二:一为数值,一为性状。概念的
     应用弹性越大,其效率越高,故数值与性状分
     别使用,远比结合为不可分的单一概念有利。
     以“人”为例:
     一“人”--未加性状,单指“人”,数量为
      一,无特殊意义。
     一“个”“人”--性状为“个”,指人的“
      整体”。
     一“群”“人”--性状为“群”,指很多人
      聚集之状。
     一“堆”“人”--性状为“堆”,指很多人
      “堆”在一起状。
     一“车”“人”--性状为“车”,指范围为
      一车之中。
     一“家”“人”--性状为“家”,范围为一
      家。
     一“条”“人命”-性状为“条”,其中之“
      人”用以界定“命”。
     性状类为界定性质、状态的概念,与数值概念
     结合,可表达更多的属性。
    ◆结构的时、空关系:
     如“前、后、左、右、上、下、内、外、中、
     里……”等。
    ◆结构的性质关系:
     物有物性,以物质代表之:
     “木制”为:以“木”质为原料,“人造之”。
     事物有分类,以类性代表之:
     “车厢”为:“车”之“厢”。
    ◆尚有其它多种关系,兹不细列。

  4,凡例:
      下文以“快去把那份资料印出来”为例,说
    明此接口的操作情形:(暂略去情绪累积部份,
    因单独一两句话,不能构成累积条件。另外,汉
    字具有动画的蒙太奇效应,是依视觉顺序进行,
    最宜连续感知)。
    假定计算机之〔立场〕=处于等待指令状况。 则计算机之〔目标〕=完成“快去把那份资料印
     出来”。   计算机之〔判断〕=目标达成为止。
    分析数据库: “我”=计算机 “对方”=谁? 调出“谁”的资料,以供判断
            参考。
    逐字分类:(括号内代表计算机之执行态。) 快=心部,属于心态,夬者决定,心中
          决定需速也。 去=动向。
          (快去=计算机立即执行) 把=手部,手执。
          (下列之执行内容) 那=邑部,空间。
          (指定之对象,与前文有关) 份=人部,人所分者。
          (对象) 资=贝部,有次序之财。
          (有利者) 料=斗部,以斗计米,整理过者。
          (资料=专用词,计算机贮存者) 印=◆部,用爪处理者。
          (计算机功能) 出=动向。使露。
          (使显示) 来=木部,树下见人。
          (计算机使实现)
    再用常识库,参考体用因果关系,根据一定的过
    程,即可逐步进行。
    计算机随时判断,体=资料,是否有用=印出,直
    到完成为止。


上一页  目录  下一页

文学书苑首页