程式師世界 >> 編程語言 >> 更多編程語言 >> 匯編語言 >> 匯編語言的藝術-基本認識(二)

匯編語言的藝術-基本認識(二)

編輯：匯編語言

四、對指令的認識

指令就是「指揮」、「命令」，用以控制電腦，一步一步地實現程式的計劃。
組合語言的格式為：
( 下行中凡標“[ ] ”者，表有些指令可省略 )
[前置元] 指令 [目的操作元，源始操作元]
1,「前置元」：以下諸例即為前置元的用法。
11段名：表後面的操作元應屬於此臨時前置段。如：
MOV AX,CS:BUF1
12定義：表示其後緩沖器的臨時定義。BYTE PTR表示以一個字元定義的資料; WORD PTR表雙字元資料。
不論緩沖器的原定義為何，凡有前置元者，皆以臨時定義為准，如：
ADD BYTE PTR BUF1,CL
前置元除了定義緩沖器長度外，亦可表示距離，
JMP SHORT ABCD

2,指令：
11使用方法：
1-1 暫存器到暫存器，但限長度相同者。
MOV AH,BL ; 為字元
XCHG AX,BX ; 為二字元
1-2 暫存器到緩沖器，或緩沖器到暫存器。
OR BUF1,AX ; BUF1為緩沖器，WORD
ADD CL,BYTE PTR BUF1
1-3 數值與暫存器或緩沖器之間。
TEST DI,8000H
AND SI,0FFH
SUB BYTE PTR BUF1,3
★數值絕不可作為「目的」操作元
1-4 將記憶區的地址放在暫存器中，以傳送該地址的內容，或傳送變數以便間接調用資料。本法限用於源存器（SI）、終存器（DI）、棧用器(BP)及兼用器（BX）。如：
MOV AL,BYTE PTR [DI]
XOR [BP],DL
MOV AX,[DI][SI]
MOV AX,BUF1[DI]
JMP LAB1[BX]
1-5 執行指令本身，不需源始或目的操作元。
PUSH CS
POP DS
CALL ABCD
JMP ABCD
CLI
STD
LAHF
RET
1-6 執行計數者。
LOOP ABCD
REP MOVSB
SAL DL,CL
ROR AX,1
DEC BX
1-7 暫存器專用指令。
OUT DX,AL
MUL BUF1
DIV CX
STOSB
LODSW
1-8 條件執行者。
JNZ ABCD
JA ABCD
JCXZ ABCD
INT 10H
IRET

12應用功能可分為下列八項：
2-1 資料轉移：1-1,1-2,1-3,1-4皆有可能。
2-2 旗號控制：1-5 涉及旗號者。
2-3 段址處理：1-1,1-2 項可能。
2-4 數學計算：視指令而定，上述各項皆可。
2-5 字串處理：1-6,1-7 項功能。
2-6 控制轉換：1-5。
2-7 條件執行：1-8。
2-8 中斷處理：1-8。

3,操作元：可分成暫存器、緩沖器及數值（Immediate Data）。其書寫方式與習慣的由前到後正好相反，使用時要小心，其余細節請參看有關組合語言手冊。

第二節工作環境

一、系統空間

IBM PC的記憶區定址，是采用倒裝方式 (Big Endian) ，即定址值系由大到小，不同於一般由小而大(Little Endian) 的定址常識。
不論當初如此設計的目的何在，這種與人的習慣相反的觀念，給寫作組合語言者帶來極大的困擾。不僅初學者常莫明其妙，連我個人多年來一直與圖形處理為伍，都感到汗顏。每次在處理圖形時，一定要將原圖畫在紙上，對照參詳，才能瞭解是怎麼回事。
舉例說，有個圖形值在AX中，要寫進 DI 所指記憶區位置中，寫完以後，AX要向右移一位再繼續寫，直到CX＝０。
這是一個非常簡單，而且經常用到的動作，可是在使用「倒裝定址」時，麻煩就來了。
假設AX值為4567H ，DI指向記憶區2000H ，倒裝的放法，是先將AL的值放進2000H 的記憶單位中，再將AH放進2001H 的記憶單位裡。如果從由小到大的定址觀點來看，這就等於是在2000H 中放了一個十六位元的值6745H 。
這倒不打緊，因為再從記憶位址2000H 中放回 AX 時，仍然成為4567H 。問題是在作圖時，一旦4567H 變成了6745H ，圖形就左右顛倒了。補救的方法，是在放進記憶區之前，先將AH及AL交換，放完以後，再重新交換回來。說來不算大事，可是白白浪費了兩個指令的時間及空間。對速度極關緊要的畫圖顯示而言，要畫幾萬個點，所累積的時間就不可小觀了。
除此之外，在寫程式時，對圖形的效應要能掌握，才會有良好的成果，像這樣每次轉來轉去，頭都昏了，自然而然就失去了耐性。
現在，80386 CPU 問世了，且不談效果，讀者可以試想，把32位元的 12345678H轉換成 78563412H要多少道手續?
這種痛苦的手續，也是美國人不願意用組合語言的理由之一。在高階語言中，有編譯器代勞，問題好像不大。但對效率的要求而言，就得不償失了。圖形功能是當今及未來電腦的主流之一，由於當初設計者沒有遠見，導致無窮的後患。
問題尚不止於此，IBM PC/AT 的系統空間，在定址的理論上，可以有 1MB（暫時不必考慮記憶擴充及EMS 等問題），然而真正能提供作為程式執行的空間，卻不足 600KB。

我們且看其系統空間的安排：
0000H 段 0000H－007FH 計 128字元，為32個基本中斷。
0008H 段 0000H－0380H 計 896字元，供系統管理中斷。
0040H 段 0000H－00FFH 計 256字元，為基本程式資料。
0054H 段 0000H－9C00H 約 34K字元，DOS 程式占用。
唯有在 00E1H段－09000H段的前半是使用者可以控制的空間，其後，又被系統占用：
09000H段由0A000H附近直到0FFFFH，為DOS 所用。
0A000H段，為 VGA圖形顯示區。
0A800H段，為 EGA圖形顯示區。
0B000H段，為文字態緩沖區，螢幕處理器6845自動管理。
0B800H段，為圖形態顯示區，螢幕處理器6845自動管理。
0C000H段，至0D000H段，各機種不定，供 EMS擴展記憶。

0C800H段，為唯讀記憶體，其內為硬盤控制程式。
0E000H段，1MB 的主機此處為 RAM，否則此段不能使用。
0F000H段，為唯讀記憶區，其內為基本輸出／入程式。

由上可知，整個系統的規劃不盡理想，尤其受限於8088的CPU 原先錯誤的設計理念（段暫存器現為定址的16倍，即每進一，相當於地址增加16。在最初，如果不考慮與8080兼容，原可輕易地定為 256或更高倍。）所以，當要擴充記憶容量時，便產生了 EMS這種無可奈何的高科技畸形兒。

二、周邊設備

所謂周邊設備，率指須透過系統的輸出／入匯流埠（I/O Port），及其管理程式所控制的外部各種設置。
在此定義下，鍵盤就是一種周邊設備，除此之外，螢幕顯示器、印表機、磁盤機等，均屬周邊設備。顯然，程式師必須瞭解每一種周邊設備的性質，否則無法下手。
由於周邊設備種類繁多，且各有其使用規格，可以說毫無技巧可言，故本書不擬一一介紹。要之，把各種設備所定義的規格條件，抄錄在記事簿中，以便隨時查閱。
此外，為求程式能有效地應用於各種不同規格的周邊設備上，千萬不可在應用程式中統一處理，最好定妥各種介面，作為附屬程式，由使用者自行設定。
這樣規劃的第一個原因，是無人能預知到底未來需要多少種不同的設備，掛一漏萬，以後程式增改不易，可能導致功能不足，或程式松散的後果。
第二個原因在，使用者經常使用的設備是固定不變的，將一些永遠用不到的程式放在一起，是無謂地浪費空間。
第三個原因為技術雖在進步，程式應用觀念則難以改變，主導程式與周邊設備之介面程式不應糾結在一起。一個沒有渣滓、精心雕琢的程式才有永恆的價值。終有一天，當電腦技術成熟時，原應用程式無需改動，僅將處理周邊設備的附屬程式換成新的即可。
這就是生命，就是新陳代謝，有了這些認識，才能理解組合語言的精義。

三、系統程式

在 ibm pc/at系統中，只有兩種系統程式，一是磁盤作業系統程式 (ms-dos 或 pc-dos )，負責系統啟動、記憶區管理以及部份輸出／入處理等工作。此系統程式原貯存在系統磁盤中，開機時才調入系統中，所以容易修改。由最初推出的版本1.0 ，到現在已是4.01，其功能還在不斷地改進中。
另一種為基本中斷服務程式（BIOS），貯存在唯讀記憶體中，除非機種易動，否則永遠不會改變。基本中斷程式的主要功能為便利程式師，把所有的周邊設備所需要的參數，統一由暫存器代為傳輸。程式師可按照規定，把正確的值，放到規定的暫存器中，基本中斷便會優先執行。
這兩種系統程式，程式師必須熟悉，至少，應知道何種功能要用哪一個中斷。
這兩種系統程式，都因瞻前顧後，速度不夠理想。因之有些程式師，根本不用這些中斷，自行控制輸出／入埠。這種做法確實能提高速度，自由控制。而相對的，程式的通用性也減低了。是否值得，設計前應先考慮清楚。
此外，這兩種中斷程式有些相互重復之處，如鍵盤輸入及螢幕輸出等，經常令人不知如何選用。有人建議用磁盤作業的中斷，我則認為該用基本中斷。
因為系統容許程式改變基本中斷的入口值，所有利用基本中斷的程式，都可修改入口，以增加其應用功能。磁盤作業系統則不然，雖然該程式在磁盤上，且在不斷地改進中，但在改進之時，又必須兼顧過去的客戶。時間一久，問題就發生了。且改進越大，越顯得過去的作業方式落伍，兼容就是保留過去渣滓的代名詞。兼容性越高，包袱就越重，空間浪費越大。
建築在這種基礎上的程式，必須冒種風險：是否有一天，磁盤作業系統會面臨運轉困難或遭解體的厄運?O/S2的問世已經表明了，此系統的大限業已到來。
基本中斷可以改變，意思是說，除了一部份BIOS空間的浪費無可避免外，在PC系列中，系統中斷的觀念不會再改變。只要程式師能把握基本中斷程式的技巧，則不論未來的系統變化到任何地步，一個具有實用價值的程式，理論上其生命期應該是很長的。

四、配備程式

配備程式指的是一些非必要的基本程式，只因為特殊需要而調用。通常，它是由某些系統提供，配備給某些程式的。
配備程式包括各種計算的函數及繪圖公式，特殊處理用的lib.等，在某些情況下，也可以將之視為環境，例如視窗管理ms-dos window，記憶擴充裝置 ems等。
配備程式的產生，證明了電腦軟體發展的迂回歷程，同時也表示出軟體的靈活性。在我個人的觀念中，配備程式如果能有一定的設計方式，有統一的規格，很可能在大量的、不斷發展下，成為一個個「公用模組」，並可專門提供模組，以供用戶應用，使得軟件的制作變得輕而易舉。
寫作或應用這些程式，別無其他法門，唯有熟記於胸，才能得心應手。

五、公用模組

模組應是未來電腦軟件發展的主流，每一類模組的功能，代表了各行各業的經驗及訣竅。使用者無需瞭解模組的制作技巧，只要知道如何調用，就可以完成工作。
目前尚無廠商提供「公用模組」，但是隨著觀念的拓廣，一旦有了理論，有人先行一步，這種潮流即將形成。我們即將推出的“聚珍整合模組”，第一階段尚限於程式師使用，再下一步，當客戶直接調用的介面完成後，程式的發展方向又將改弦易轍了。
第三節處理對象

一、數據資料

數據資料率指可以輸入、處理及計算的二進位資料，在工作過程中，安全性為第一考慮因素，同時要兼顧精確以及完整性。此類資料一般說來數量都相當大，要妥善規劃資料長度，否則存貯空間會成為執行程式時的主要課題。
寫作此類程式時，各種進位制的轉換，顯示區的定位，計算公式的處理等都應該作為子程式，以便任意調用。
而真正關鍵問題卻在於：數據的極限是否能夠明確得知，在有限的范圍中，絕對可以設計一種「結構化」的規格，符合效率的需求。否則也應根據其規則性，配合程式的特性，有效地加以處理。

二、文字資料

文字資料多為字符態，拼音文字所應該注意的是，字與字間的空間調整，齊頭、齊尾、齊中等變化，行末斷字的規定，以及字體、字形、字號等。
中文尚有輸入碼、內碼等處理問題。原則上，如果要考慮中、英文兼容，則應注意螢幕上的字形顯示與字碼記憶區的位置，應占相同的比例。
目前，由於英文字、碼不分，皆占一字元，螢幕上標准格式為25行80字，即采用所謂「文字狀態」。而中文字形至少要有16x 16點陣，且需用圖形方式（也有采用文字態，再加特殊硬體者，但成本偏高，有礙中文電腦未來發展）。因此，當采用640x 400或近似規格時，中文字形與英文之比，約為2:1。

在此基礎上，以二字元為中文的內碼長度，是最常用的結構。但是隨著技術及觀念的進步，有些英文系統已在使用二字元碼，是則，中文有使用四字元的必要。
從另一方面來看，大陸所用的「國標碼」，系抄自日本五十年代的 JIS CODE －日本工業標准，最多僅能容納8836個符號，其中「漢字」尚不足八千。而國標碼更為精簡，收字6763個。中文源自中國，現在卻借鏡東洋的「工業標准」，且搖身一變，竟成為十余億人口的「國家標准」，真可謂每下愈況。無獨有偶，台灣也有所謂的標准，BIG-5 的13,053字，雖然是國標碼的兩倍，二者終究是五十與百步之差而已。
為什麼要訂定這種「辱及先祖」的文字標准呢？誰又夠資格訂定中文標准呢？從事電腦工作者不過是些「技術專家」，連電腦這一行所有的技術尚未必精通，更何況隔行如隔山，竟然撈過界，撈到文字界這個相離十萬八千裡的領域去了。
文字是人類思想、文化的載具，先賢先聖們殚精竭慮所創造的文字，就是用來傳達他們對宇宙、人生的認知。我們後代子孫不肖，不能領悟其微言大義倒也罷了。對電腦技術瞭解不足，沒有能力令電腦應用中文，這也可以理解。但自以為是，依權仗勢，妄想偷天換日，僅用少數認識的文字，定為整個國家的「文字標准」，並強制國人接受，這種颟顸就難以令人苟同了。
在運用中文時，由於各家發展的系統觀念不一，有的甚至違法盜襲國外軟件，為了兼容起見，必須「削足適履」。原則上，中文內碼將第一字元中第八位位元設為一，得以與「美國工業標准碼」的ASCII (American Standard Code for Infor-mation Interchange)有別。
文字資料處理上最重要的工作，是排序的技術問題，國標碼僅六千多字，卻分為二集，把常用字放在前集，次常用字在後部。但是這種順序與使用人的觀念毫無關連。除了統計這種使用頻率的學者專家外，不可能有幾個人理解何字是常用字，何字不是。
於是，當我們要利用電腦的高速效率，將輸入的中文加以排序整理時，國標碼完全起不了作用。也就是說，編碼原為提高效率，而我們的編碼只為了編碼，與效率毫不相干。
唯一的補救辦法是，再建一個排序表，與國標碼一一對照使用。
高科技界因為利潤高、地位高，故而高論、高見特多，只是動起手來就難免「眼高手低」，再不然則是「高論調、低效率」。
相信人人都有查字典或電話簿的經驗，對用英文來說，是輕而易舉，中文則麻煩多多。國人只知抱殘守缺，自卑自憐，而不求瞭解其因果原理。一般人如此倒也罷了，高科技界倘如此，就有點說不通，甚至令人懷疑是否別具用心。
英文所以方便無他，因其字母具有直接索引的功能！中文則有前人訂定了一套「部首、筆畫」的索引觀念。這在過去資訊不發達的時代，的確是個創見，也足敷應用，但是現代與字母的直接索引相較，在效率上究竟差了一大截。
也有人認為，我們要維護中華文化，就應該死抱著古人所定的索引觀念。這種說法只有一點不足，就是忘了把大漢衣冠也穿得整整齊齊，甚至用文房四寶取代現代化事務工具！
麻煩的是，「部首、筆畫」是兩種不同的索引觀念，當沒有時間因素介入時，孰先孰後關系不大。可是用到電腦上，就必須定先後次序，否則礙難執行。
對姓氏筆畫少的人，當然主張「筆畫」優先，姓氏部首明顯的，則主張先排「部首」。這點不難理解，出席一個重要的慶典，或在報上亮相，人數一多，排名先後所涉及的利益，至關重大，不能不爭！問題在於，除了私利外，部首筆畫這種沒有效率的索引觀念，還有什麼實用的價值？如果一定要保存，作為一種特例，當然可以。可是電腦所追求的是效率，每個中文的部首和筆畫，都需要建對照表，才能應用，字集越大，空間需求越大，時間消耗也越長。
這還不說，索引不僅是提供給電腦用的，人更需要。僅以查電話本為例，「張偉雄」這個名字，我們憑什麼知道其前後的「定位」關系呢？表面上看來，只要查三次部首及其筆畫、以及數三次這三個字的筆畫。而事實上，在查找的過程中，每遇到一個名字，都要重覆前述的手續，才能加以比較。
有人振振有詞說，有些字一眼看過去就知道是幾畫！至少我個人沒有這種本事。而且根據統計，中文平均以十四畫的居多，由九至十八畫，就很難靠視覺分辨！再若人名一多，視覺就很容易疲勞。
又有人說話了，現在是給電腦排序，與人不相干！殊不知字母排序可以立即執行，而部首、筆畫排序要多作三至六次動作，茲以先部首後筆畫為例：

1,查本字之部首序值。
2,查對照字之部首序值。
3,比較兩者之大小，決定是否需要再比。
4,再比時，查本字筆畫數。
5,查對照字之筆畫數。
6,比較兩者之大小，以決定序位。
把這些步驟寫成程式，以中文兩個字元的內碼計，（意思是說中文收字在兩萬以下）如果用對照表的方式，空間當在64KB以上，速度則較英文慢約50倍。再若采用公式計算，空間或能節省，但速度將慢上千、百倍之多。
這還是指兩萬字以下的情況，若采用漢字全字集，後果將不堪設想。所以「專家」們一致認為，為了效率，字收得越少越好！

怎樣才能算是真正的「中文電腦」？我十多年前所面對的「敵人」，是主張將中文字埋葬掉。這種人不難對付，因為到底他們還是中國人，在民族大義的旗幟下，多多少少心中也存著樂見中文電腦成功的意願。所不同的，只是他們不相信有此可能罷。
現今的「敵人」則頑強得多，他們同樣喊著民族大義的口號，又是公認的中文電腦「專家」。更可怕的，目前使用中文電腦的人，不見得對中國文化有什麼明確的認識，有個工具列印一些文件，就相當知足了。於是，這些客戶也在其主觀的立場，認定目前這種「市場占有率高」的半調子，就是「中文電腦」的標准！
是嗎？如果中文字有六、七萬字，而目前只能用幾千、甚至一萬多字，那麼其他的字呢？算不算是中文，如果算，為什麼「中文電腦」中沒有？這種電腦能說是「中文電腦」嗎？
有人又說了，沒有關系，以後再說。怎麼說呢？有一種方法，是將文字「分集」，分成：常用字、次常用字、次次常用字、罕用字、罕罕用字等等。且不管是哪位學者有這麼大的學問去「分集」，我所知道的只是用這種方法，人無從記憶，中文排序的難度又一倍一倍地加了上去。也難怪當初有人認為中文不科學，這不是明證嗎？

其實，中文排序根本沒有問題，我們利用倉颉字母作為索引，效率與英文相等，而且收字可以高達千萬個。至於記憶空間，一個字元都不需要。更有利的是，用作字典、電話簿等的索引，一查即得。
內碼是各個系統、根據其不同的需求、所訂的一種資料形式，沒有任何理由強制規定。當然，如果內碼種類多了，姑不論其編碼的好壞，各個中文系統之間，自然會形成難以溝通的障礙。於是有必要建立一種「交換碼」，供不同系統的內碼，統一交換應用。
這種交換碼才有標准化的必要，而且訂定之時，應該謹慎從事，要能容納所有各家系統所收的字，否則無從交換。
不論是哪種碼，必然會有其特殊規定，在寫作之前，程式師一定要設法找到該系統所用的「碼表」，否則無法處理。

三、圖形資料

在電腦圖形資料的處理方面，目前只有點陣及向量兩種形式，前者即二進位資料 (Digital Data) ，後者則是繪圖用的公式值。實際上，還有所謂「概念資料」的形式，將視覺效應經過分析後，整理成為人能夠理解的「概念」。這種概念資料非常精簡，便於貯存，取出後，再通過「概念作圖」的過程，還原成為圖形。
一個優秀的畫家，必然有這種概念作圖的能力，只要把畫家的經驗寫成程式，將其記憶的特征設計為資料，電腦必將忠實地執行，而且每次都畫得一模一樣。
如果是處理二進位點陣資料，不外乎是壓縮、還原、截取及綜合等幾種簡單功能。繪圖向量值則比較復雜，涉及計算、調整、變數、層次等多種技巧。
簡單地說，繪圖資料所考慮的，比文字資料難度高，要想得到理想的效率，最重要的應是資料結構的定義，其次是層次的安排，以及特征性質的描述等。此外，輸入變數處理涉及人的應用方式，除了專業人員外，多數人尚未能適應這種新的繪圖觀念，經驗的不足，以致迄今尚未制作出理想的程式來。
概念繪圖必將成為未來的主流，它不僅符合人類的認知習慣，且易於應用。只要概念資料建得周全、完整，略為改變其中一些概念元素，就能得到各種結果。

四、概念資料

人類系以概念進行思考，並透過概念來認識外界。所以，對人而言，最有效的應用方式，就是人已經熟知的概念。
概念並不是語言，而是組成語言的最基本因素。每一個人對外在世界的認知，都是獨一無二的，由於人類生存在群體空間裡，需要經常彼此交換經驗，於是利用聽覺效應表達概念，便產生了語言；利用視覺符號，則產生了文字。
前述的圖象概念資料屬於「具象」資料，除了具象以外，還有抽象的，包括主觀的感受、認知、欲望等等，因與主題無關，這裡不加討論。總之，這些概念資料的結構，在電腦中必然是二進制的形式，只是因每一個設計者觀點的不同，性能有所區別罷了。
直到如今，尚未見到實際應用概念資料的程式，但是它將成為電腦的基本結構，卻是指日可待的。
作為程式師，天天與電腦為伍，不能不知道電腦未來的趨勢，更不能不多加努力，掌握技術發展的機先。正因為概念資料尚未定形，人人都有相同的機會，做一個開創時代的先河。否則，等到大局底定時，只有在後面苦苦追趕，由不得己了。

五、綜合資料

功能較強的程式，很少僅具有單一的資料。尤其是「整合軟件」越來越受到重視，各種資料最終都將綜合在一起。
綜合資料有兩種意義，一是人所認識的輸入資料，一是電腦貯存的處理資料。
輸入資料又可分指令及字符兩種，在傳統的觀念裡，不將指令視為資料，因為指令一旦執行以後，即不再發生作用。可是，在桌上型排版軟件廣泛流行以後，為了控制版面，必須將相關指令隨資料同時貯存起來。而排版已經成為電腦重要的功能之一，所以在未來的發展上，輸入資料必須考慮到指令。
在整合觀念中，輸入資料應有統一的規定，亦即不論是何種性質的軟件，其鍵盤的應用、字符的定義等，都應該有全面的考慮。
關於資料內容，也有 ASCII字符及「世界字符」之爭，對早期的英文系統而言，其他文字無關緊要，所以沒有適當的「世界字碼」可供應用。然而，資訊時代究竟不是英文使用國家的專利，在各國覺醒之際，都憬悟到字碼的重要。不論 ISO國際組織如何面對問題，我個人不相信世界文字在其保留的、極為有限的「編碼平面」上，能夠發揮多大的效益。充其量，可供一段時間內、某些商業上的應用而已。
我認為真正的資訊標准，將是以各國文字為根本的自然語言，而目前最理想的方式，則為多字元的字碼方案。拼音文字系統以二字元為宜，除了可以同時應用世界各國文字以外，並且符合當前微電腦的發展趨勢。
在中文系統上，我們采用四字元的「自然碼」，即將倉颉輸入碼壓縮的方案。如此，我們可以使用上千萬個中文字，有人會說沒有人需要那麼多字，但事實上有誰能預料呢？當初倉颉造字時，相信不會超過一千，如果他武斷地訂定「標准」限制後人用字，很難想像我們的民族還會有什麼文化？
台灣曾有專家對我這種意見，表示是「不合乎潮流，注定要失敗」，然而到底是誰不合潮流呢？四字元的微電腦已經到來了，而且被公認為今後的主流。在四字元的硬體結構上，自以一次讀取四字元、其次為二字元最為有效。所以這些觀念已經落伍的專家，還是去撈些鈔票，把研究發展的工作，交給夠資格的人去做吧！

第四節指令應用

組合語言可以說是未經整理的、原始的電腦語言，讀者們大可下一番功夫，找出其應用的規則，以發揮最高的效率。在下面，我僅就個人的經驗，提供一些淺見，以供切磋研討。
要寫好程式，首先應熟記8088指令的時鐘脈沖（Clock ）及指令長度，一般組合語言手冊中，都詳列了與各指令相關的資料。「工欲善其事，必先利其器」，此之謂也。
本節所討論的，是一般程式師容易忽略的細節，所有的例子都是從我所看過的一些程式中摘錄下來的。看來沒什麼大了不起，可是程式的效率，受到這些小地方的影響很大。更重要的是，任何一個人，只要有「小事不做，小善不為」的習慣，我敢斷言，這個人不會有什麼大成就！
我最近才查到 Effective Address (EA) 的時鐘值，我覺得沒有必要死記。原則上，以暫存器為變數，做間接定址時為５個時鐘，用直接定址則為６個；若用了兩組變數，則為７至９個，三組則為11或12個。
為了便於敘述，下面以“Ｔ”表「時鐘脈沖」; “Ｂ”表字元。其中

時鐘脈沖T = 1 / 振蕩頻率

一、避免浪費速度及空間

組合語言的效率建立在指令的運用上，如果不用心體會下列指令的有效用法，組合語言的優點就難以發揮。
1, CALL ABCD
RET
這種寫法，是沒有用心的結果，共用了 4B，23T+20T，完全相同的功能，如：
JMP ABCD 或
JMP SHORT ABCD
卻只要 2-3B，15T。
此外，上述的CALL XXXX 是調用子程式的格式，在直覺認知上，與JMP XXXX完全不同。對整體設計而言，是不可原諒的錯誤，偵錯的時候，也很難掌握全盤的理念。
尤其是在精簡程式的時候，很可能會遇到 ABCD 這個子程式完全獨立，是則把這段程式直接移到 ABCD 前，不僅能節省空間，而且使程式具有連貫性，易讀易用。

2, MOV AX,0
同樣，這條指令要 3B，4T,如果用：
SUB AX,AX 或
XOR AX,AX
只要 2B，3T，唯一要注意的是，後者會影響旗號，所以不要用在有旗號判斷的指令前面。
在程式寫作中，經常需要將暫存器或緩沖器清為０，有效的方法，是使某暫存器保持為０，以便隨時應用。
因為，MOV [暫存器]，[暫存器] 只要 2B,2T，即使是清緩沖器，也比直接填０為佳。
只是，如何令暫存器保持０，則要下一番功夫了。
還有一種情況，就是在一回路中，每次都需要將 AH 清０，此時對速度要求很嚴，有一個指令 CBW 原為將一個字元轉換為雙字元，只需 1B，2T 最有效率。可是應該注意，此時 AL 必須小於 80H，否則 AH 將成為負數。
3, ADD AX,AX
需要 2B,3T不如用：
SHL AX,1
只要2B,2T。

4, MOV AX,4
除非這時 AH 必為０，否則，應該用：
MOV AL,4
這樣會少一個字元。

5, MOV AL,46H
MOV AH,0FFH
為什麼不寫成：
MOV AX,0FF46H
不僅省了一個字元，四個時鐘，而且少打幾個字母！

6, CMP CX,0
需要 4B，4T，但若用：
OR CX,CX
完全相同的功能，但只要 2B，3T。再若用：
JCXZ XXXX
則一條指令可以替代兩條，時空都省。不幸這條指令限用於CX ，對其他暫器無效。

7, SUB BX,1
這更不能原諒，4B，4T無端浪費。
DEC BX
現成的指令，1B，2T為何不用？
如果是
SUB BL,1
也應該考慮此時 BH 的情況，若可以用
DEC BX
取代，且不影響後果，亦不妨用之。

8, MOV AX,[SI]
INC SI
INC SI
這該挨罵了，一定是沒有記熟指令，全部共4B，21T。
LODSW
正是為這個目的設計，卻只要 1B,16T。

9, MOV CX,8
MUL CX
寫這段程式之時應先養成習慣，每遇到乘、除法，就該打一下算盤。因為它們太浪費時間。８位元的要七十多個時鐘，16位元則要一百多。所以若有可能，盡量設法用簡單的指令取代。
SHL AX,1
SHL AX,1
SHL AX,1
原來要 5B，137T，現在只要 6B，6T。如果CX能夠動用的話，則寫成：
MOV CL,3
SHL AX,CL
這樣更佳，而且CL之值越大越有利。用CL作為計數專用暫存器，不僅節省空間，且因指令系在 CPU中執行，速度也快。
可是究竟快了多少? 我們做了些測試，以 SHL為例，在10MHZ 頻率的機器上，作了3072 ×14270次，所測得時間為：
指令：SHL AX,CL SHL AX,n
CL = 0 ， 23 秒 n = 0 ，無效
CL = 1 ， 27 秒 n = 1 ， 14 秒
CL = 2 ， 32 秒 n = 2 ， 28 秒
CL = 3 ， 36 秒 n = 3 ， 42 秒
CL = 4 ， 40 秒 n = 4 ， 56 秒
CL = 5 ， 44 秒 n = 5 ， 71 秒
CL = 6 ， 49 秒 n = 6 ， 85 秒
CL = 7 ， 54 秒 n = 7 ， 99 秒
由此可知，用CL在大於２時即較分別執行有效。
此外，亦可利用回路做加減法，但要算算值不值得，且應注意是否有調整余數的需要。

10, MOV WORD PTR BUF1,0
MOV WORD PTR BUF2,0
MOV WORD PTR BUF3,0
MOV BYTE PTR BUF4,0
..
我見過太多這種程式，一見就無名火起! 在程式中，最好經常保留一個暫存器為０，以便應付這種情況。即使沒有，也要設法使一暫存器為０，以節省時、空。
SUB AX,AX
MOV BUF1,AX
MOV BUF2,AX
MOV BUF3,AX
MOV BUF4,AL

14B，59T取代了 24B，76T,當然值得。只是，還是不如事先有組織，考慮清楚各個緩沖器間的應用關系。以前面舉的例來說，假定各緩沖器內數字，即為其實際位置關系，則可以寫成：
MOV CX,3
如已知 CH 為０，則用：
MOV CL,3
SUB AX,AX
MOV DI,OFFSET BUF1
REP STOSW
STOSB
這段程式越長越占便宜，現在用10B，37T，一樣劃算。

11,子程式之連續調用：
CALL ABCD
CALL EFGH
如果 ABCD，EFGH 都是子程式，且調用的次數甚多，則上述調用的方式就有待商榷了。因為連續兩次調用，不僅時間上不劃算，空間也浪費。

若ABCD一定與EFGH連用，應將ABCD放在EFGH之前：
ABCD:
..
EFGH:
..
像這樣，只要調用ABCD就夠了，但這種情形多半是程式師的疏忽所致，如兩個子程式必需獨立使用，而上述連續調用的機會超過兩次以上，則應該改為：
CALL ABCDEF
而ABCDEF則應為：
ABCDEF:
CALL ABCD
EFGH:
..
這樣的寫法速度不會變慢，而空間的節省則與調用的次數成正比。

12,常有些程式，當從緩沖器中取資料時，必須將暫存器高位置為０。如：
SUB AH,AH
MOV AL,BUFFER
這時應該將 BUFFER 先設為：
BUFFER DB ?,0
然後用：
MOV AX,WORD PTR BUFFER
如此，不但速度快了，空間也省了。

13,有時看來多了一個指令，但因為指令的特性，反而更為精簡。如：
OR ES:[DI],BH
OR ES:[DI+1],BL
這樣需要8B,32T，如果改用下面的指令：
XCHG BL,BH
OR ES:[DI],BX
XCHG BH,BL
則需7B,28T。

14,PUSH 及 POP 是保存暫存器原值的指令，都只需一個字元，但卻很費時間。
PUSH 占 15T，POP 占12T,除非不得已，不可隨便使用。有時由於子程式說明不清楚，程式師為了安全，又懶得檢查，便把暫存器統統堆在堆棧上。尤其是在系統程式或子程式中，經常有到堆棧上堆、取的動作。實際上，花點功夫，把暫存器應用查清楚，就可以增進不少效率。
要知道，系統程式及某些子程式常常應用，有關速度的效率甚大，如果掉以輕心，就是不負責任！
保存原值的方法很多，其中較有效率的是放到一些不用的暫存器裡。以我的經驗，堆棧器用途最少，正好用作臨時倉庫。但最好的辦法，還是把程式中暫存器的應用安排得合情合理，不要浪費，以免堆得太多。
還有一種方法，是在該子程式中，不用堆棧的手續，但另設一個入口，先將暫存器堆起，再來調用不用堆棧的子程式。這兩個不同的入口，可以分別提供給希望快速處理，或需要保留暫存器原值者調用。
當然，更簡單有效的方法，則是說明本段程式中某些暫存器將被破壞，而由調用者自行保存之。