|
组合语言之艺术 作者: 朱邦复 第三节 程序合并
我所见过的各种组合程序虽不算多,但至少有百余个了。毛病最多的当然是缺乏完
整的规划,其次则是信马游缰,一份不折不扣的流水帐!明明大门口在东边,程序硬要
朝西,直到游完了大观园,天黑了,才出东门!
这种程序我收集了一大叠,可是举来做例子,却心有余而力不足。原因无他,实在
不耐烦照抄一遍,一见到就头痛!
计算机最强的功能,便是处理繁杂重复的工作,为什么一般程序员居然存心与计算
机争风吃醋呢?不说别的,光把程序输入到计算机中,就要花上几个月宝贵的光阴,真
值得这样做吗?
有一份程序,足足有四十多页,我只略作调整,便缩小到十页,处理速度则快了五
倍。为什么会差这样远呢?很简单,有些人不喜欢用大脑,久而久之,习惯成自然,大
脑就生了铁锈!除了等因奉此,什么都不会想了。
要想做一个优秀的程序员,第一个条件是不能偷懒,第二个条件则要有分析观察的
习惯,第三个也是最重要的,则是要有追求完美的精神。程序员要像艺术家,不论是自
己的或是别人的程序,都要一而再、再而三地玩味改良。
我曾见过一个扫地的妇人,她不管在哪里,见不得有任何脏乱。这种人才值得尊敬,
这种精神是伟大的,与她的职业丝毫无关!
程序写得不够精简,有三个原因,第一个是程序员无能,这种程序能够写完,可以
运行,已算相当难得了;第二个原因是不懂技巧,硬桥硬马的干, 不知什么是效率,也
不知道如何达成。自己写的程序都不见得看得懂,遑论他人的?第三则是根本缺乏敬业
精神,敷衍塞责,这种人我最瞧不起。
写程序之初,如果把任务了解清楚,然后分析因素,分割模块。所有类似的情况都
合并到一处,再以变量代替,统一执行。这原本是份内的工作,前述的情况根本不可能
发生!
问题是发生了以后怎么办呢?我建议最好重写,如果一定要改,只好采用程序合并
的技巧,浓缩一下。
合并的目的是为了增进效率,而合并的方法则因情况不同而异,就像人生了病,必
须先查出病因,否则无法下药。我试着以所知道的一些例证,简要地解说如后。
一、过程的合并:
要做过程的合并,首先要查明下列各点:
1,首先找出过程类似的,全部移到一堆,如果找不到,那就没救了。
然而,这种程序要就是太小,根本不可能有类似的情况,再不就是写作时杂乱无章,信
马游缰。分明有类似的过程,但没有共通的原则,无从浓缩。当然,也可能有些程序,
因工作量及处理的细节太多,以致无法浓缩。
2,在类似的程序中,找寻相异的指令或流程,再若没有,那就是重复了,正宜合并。
3,把相异的指令或流程用变量取代,或将不同程序之入口放在寄存器里。
4,将各程序在应用该流程前,设好变量及使用的暂存器。
5,合并相似的程序段,不同处应用变量取代之。
下面举一实例,系一绘图程序之片断,兹改变原用标题,并将分散在各处若干不同
之段,列述如下:
189: MASK PROC NEAR
190: MOV DX,3C4H
191: MOV AL,2
192: OUT DX,AL
193: MOV DX,3C5H
194: MOV AL,PCOLOR
195: OUT DX,AL
196: RET
197: MASK ENDP
...
380: MOV DX,03CEH
381: MOV AL,3
382: OUT DX,AL
383: MOV AL,18H
384: INC DX
385: OUT DX,AL
386: RET
...
490: MOV DX,3CEH
491: MOV AL,3
492: OUT DX,AL
493: MOV DX,3CFH
494: MOV AL,0H
495: OUT DX,AL
496: RET
...
589: CROSS PROC NEAR
590: MOV DX,3C4H
591: MOV AL,2
592: OUT DX,AL
593: INC DX
594: MOV AL,0FH
595: OUT DX,AL
596: RET
597: CROSS ENDP
...
这样的段落有十多处,看来每个都略有不同,似乎不能合并。然而仔细分析,显然
是程序员训练不够,把一个非常有规则的程序,安排得非常紊乱,以致到这个地步。
我们先归纳问题,决定如何合并。第一,上述各段程序,应该统一作为子程序;第
二,全部变量只有四个,其中两个是传送值,两个是输出入埠。后者有连续关系,等于
只有一个。因此,在调用此子程序前,应先令DX为输出入埠,再将变量装入AX中,一次
调用即可。此子程序如下:
300: SUB:
301: OUT DX,AL
302: INC DX
303: MOV AL,AH
304: OUT DX,AL
305: RET
这样简短的子程序,有无必要,端视时空的效益而定。不论怎样整理,都远比原来
的要好。
另外有种情况,更为可怕,就是在键盘输入后,用流程方式,一一比较输入码,再
一一分别处理。
比如说,为了检查游标键的左、右、上、下等八个方向的移动,以便作相应的处理,
程序居然写成:
100: PP1: MOV AH,0
101: INT 16H
102: CMP AX,4800H ;↑键
103: JNE NEXT1
104: CALL MOVDATA ;SET BUFFERS
105: CALL SETDLT ;SET INCREMENT
106: NXT01:
107: CALL DOTUP
108: LOOP NXT01
109: CALL XORDOT ;SET NEW DOT
110: CALL XYDISP ;DISP NEW XXX,YYY
: JMP PP1
112: NEXT1:
113: CMP AX,5000H ;↓键
114: JNE NEXT2
115: CALL MOVDATA ;SET BUFFERS
116: CALL SETDLT ;SET INCREMENT
117: NXT02:
118: CALL DOTDOWN
119: LOOP NXT02
120: CALL XORDOT ;SET NEW DOT
121: CALL XYDISP ;DISP NEW XXX,YYY
122: JMP PP1
123: NEXT2:
124: CMP AX,4B00H ;←键
125: JNE NEXT3
...
这段程序总共要检查八次,才能确定是否有游标移动以及哪个游标在移动。然后,
还要一一检查其它变化,共有十八种有效码。我实在佩服这种程序员,不但有无比的耐
性,还有非凡的想象力,居然能把一段极为简单平凡的程序,写得这样的精彩动人!
如果是我,我会写得毫无趣味:
100: PP1: SUB AH,AH
101: INT 16H
102: OR AL,AL
103: JNZ PP1 ;AL 非0无效
104: MOV BH,AL
105: MOV BL,AH
106: SUB BL,47H ;最小之字标键
107: JLE PP1 ;非处理范围
108: SHL BX,1
109: CALL FUNC[BX]
110: JMP PP1
这是主流程,程序短,速度快,维护容易,一眼看过去,有什么错误立刻分明。
...
1000: FUNC DW NEXT02 ;↖
1001: DW NEXT0 ;↑
1002: DW NEXT04 ;↗
1003: DW PT ;无效
1004: DW NEXT2 ;←
1005: DW PT ;无效
1006: DW NEXT4 ;→
1007: DW PT ;无效
1008: DW NEXT12 ;↙
1009: DW NEXT1 ;↓
1010: DW NEXT14 ;↘
...
因为这是子程序,加一段、减一段容易非常。
即使是子程序,也有很大的考究,就以前段来说,在 104至110 之间,就值得三思。
104: CALL MOVDATA ;SET BUFFERS
105: CALL SETDLT ;SET INCREMENT
106: NXT01:
107: CALL DOTUP
108: LOOP NXT01
109: CALL XORDOT ;SET NEW DOT
110: CALL XYDISP ;DISP NEW XXX,YYY
首先,104 和105 会重复多次,109 及110 亦然,为什么不合并为一呢?这也是很
常见的程序合并手法,两次调用合为一次,速度及空间都较为经济。
在子程序 SETDLT 之前,先调用一次 MOVDATA,另XYDISP也是一样,首先备妥:
3000: SETDATA:
3001: CALL MOVDATA ;假设本程序有他用
3002: SETDLT:
3003: ...
...
3100: XYDIDOT:
3101: CALL XORDOT ; 同上
3102: XYDISP:
3103: ...
...
再来设计NEXT0 的子程序:
110: NEXT0:
: CALL SETDATA
112: NXT01:
113: DOTUP 应搬至此,无需设为子程序。
...
120: LOOP NXT01
121: JMP XYDIDOT ; 如有必要,可先
; 设好参数
这样合并一下,效果决不止高上十倍,等到真正学会了程序的技巧,写作时速度也
可以提高数倍。
二、分支的处理:
分支是程序中不可避免的手段,使用得好,整个程序气势一贯,有行云流水之妙。
前面的例子根本不具分支的条件,故不能算是分支不良,而是程序员观念错误。
下面再举一例,由于分支不良,以致程序支离破碎。这是一则计算拋物线的快速程
序,妙在没有用乘除法,也没有任何函数。其中有几段是这样的:
100: BEG00:
101: CMP BP,BUFY
102:? JLE BE7
103: OR CX,CX
104: JG BE20
105: MOV AX,BP
106:? SHL AX,1
107: DEC AX
108: JL BE10
109: BE2:
110: CALL BE1
: JC BEG00
112: CALL BE3
113: JMP BEG00
...
120: BE14:
121:? LODSW
122: CMP AH,1FH
123: JGE BE141
124: LOOP BE14
125: POP DI
126: POP CX
127: MOV SI,DI
128: JMP BE142
129: BE141:
130: POP DI
131: POP CX
132: MOV SI,DI
...
150: BE10:
151: CALL BE1
152: JMP BEG00
153: BE20:
154: MOV AX,CX
155:? SUB AX,DX
156: SHL AX,1
157: DEC AX
158: JLE BE2
159:? CALL BE3
160: JMP BEG00
161: BE1:
162:? INC DX
163: ADD CX,DX
164: ADD CX,DX
165: INC CX
166: ADD DI,BUFX
167: CMP DI,BX
168: JLE BE1RET
169: CALL BE01
170: SUB DI,BX
171: BE1RET:
172: RET
...
190: BE01:
191:? MOV AL,1
192: CMP [SI+1],AL
193: JNZ BE011
194: INC BYTE PTR [SI+1]
195: RET
...
200: BE141:
...
全部程序并不大,不过一百多条指令,但是稍加改进,却可以省却廿多条指令,速
度也会加快。重点在于106 到113 的分支错误,以致于多出BE10 BE20 BE3 BE01等段程
序出来。
照理,BE1 BE3 BE01都不该另设子程序,BE14也应改写,如此,整个程序就完全不
同了。
原来由 105为:
105: MOV AX,BP ;★无必要
106: SHL AX,1 ;★无必要
107: DEC AX ;★无必要
108: JL BE10
109: BE2:
110: CALL BE1 ;★合并后,无需调用
: JC BEG00 ;★另作分支
112: CALL BE3 ;★也无必要调用
113: JMP BEG00
现改为:
107: BE1: ;原为DEC AX分支处理
108: INC DX ;原161子程序作主流程
109: ADD CX,DX
110: ADD CX,DX
: INC CX
112: ADD DI,BUFX
113: CMP DI,BX
114: JLE BE11
115: ; CALL BE01 ;本子程序重写如下:
116: CMP BYTE PTR[SI+1],1
117: JNE BE1A
118: INC BYTE PTR[SI+1]
119: BE1A:
120: SUB DI,BX
121: JC BEG00 ;原
122: ... ;原BE3 程序
...
又 125条三个指令也是分支错误,白白浪费。
120: BE14:
121: LODSW
122: CMP AH,1FH
123: JGE BE141
124: LOOP BE14
125: POP DI ;★可以省略
126: POP CX ;★可以省略
127: MOV SI,DI ;★可以省略
128: JMP BE142 ;★可以省略
129: BE141:
130: POP DI
131: POP CX
132: MOV SI,DI ;127移到此
133: JNZ BE142 ;128移到此
134: ...
|