程序師世界是廣大編程愛好者互助、分享、學習的平台,程序師世界有你更精彩!
首頁
編程語言
C語言|JAVA編程
Python編程
網頁編程
ASP編程|PHP編程
JSP編程
數據庫知識
MYSQL數據庫|SqlServer數據庫
Oracle數據庫|DB2數據庫
 程式師世界 >> 編程語言 >> 更多編程語言 >> 匯編語言 >> AT&T x86 asm語法

AT&T x86 asm語法

編輯:匯編語言

DJGPP 使用AT&T格式的匯編語法。和一般的intel格式的語法有點不同。主要不同點如下:

AT&T 語法顛倒了源和目的操作數的位置, 目的操作數在源操作數之後。寄存器操作數要有個%的前綴, 立即數操作數要有個$符號的前綴。 存儲器操作數的大小取決於操作碼的最後一個字符。 它們是b (8-bit), w (16-bit), 和 l (32-bit).

這裡有一些例子。 左邊部分是intel指令格式,右邊是at&t格式。

movw %bx, %ax // mov ax, bx
xorl %eax, %eax // xor eax, eax
movw $1, %ax // mov ax,1
moVB X, %ah // mov ah, byte ptr X
movw X, %ax // mov ax, word ptr X
movl X, %eax // mov eax, X

大部分操作指令,at%t和intel都是差不多的,除了這些:

movsSD // movsx
movzSD // movz

S和D分辨代表源和目的操作數後綴。

movswl %ax, %ecx // movsx ecx, ax
cbtw // cbw
cwtl // cwde
cwtd // cwd
cltd // cdq
lcall $S,$O // call far S:O
ljmp $S,$O // jump far S:O
lret $V // ret far V

操作嘛前綴不能與他們作用的指令寫在同一行。 例如, rep 和stosd應該是兩個相互獨立的指令, 存儲器的情況也有一點不同。通常intel格式的如下:

section:[base + index*scale + disp]

被寫成:

section:disp(base, index, scale)

這裡有些例子:

movl 4(%ebp), %eax // mov eax, [ebp+4])
addl (%eax,%eax,4), %ecx // add ecx, [eax + eax*4])
movb $4, %fs:(%eax) // mov fs:eax, 4)
movl _array(,%eax,4), %eax // mov eax, [4*eax + array])
movw _array(%ebx,%eax,4), %cx // mov cx, [ebx + 4*eax + array])

Jump 指令通常是個短跳轉。 可是, 下面這些指令都是只能在一個字節的范圍內跳轉: jcxz, jecxz, loop, loopz, loope, loopnz 和loopne。象在線文檔所說的那樣,一個jcxz foo可以擴展成以下工作:

jcxz cx_zero
jmp cx_nonzero
cx_zero:
jmp foo
cx_nonzero:

文檔也注意到了mul和imul指令。 擴展的乘法指令只用一個操作數,例如, imul $ebx, $ebx將不會把結果放入edx:eax。使用imul %ebx中的單操作數來獲得擴展結果。

Inline Asm

我將首先開始inline asm, 因為似乎關於這方面的疑問非常多。這是最基本的語法了, 就象在線幫助信息中描述的:

__asm__(asm statements : outputs : inputs : reGISters-modified);

這四個字段的含義是:

asm statements - AT&T 的結構, 每新行都是分開的。
outputs - 修飾符一定要用引號引起來, 用逗號分隔
inputs - 修飾符一定要用引號引起來, 用逗號分隔
registers-modified - 名字用逗號分隔
一個小小的例子:
__asm__("
pushl %eax\n
movl $1, %eax\n
popl %eax"
);

假如你不用到特別的輸入輸出變量或者修改任何寄存器的值,一般來說是不會使用到其他的三個字段的,

讓我們來分析一下輸入變量。

int i = 0;
__asm__("
pushl %%eax\n
movl %0, %%eax\n
addl $1, %%eax\n
movl %%eax, %0\n
popl %%eax"
:
: "g" (i)
); // increment i

不要為上面的代碼所困擾! 我將盡力來解釋它。我們想讓輸入變量i加1,我們沒有任何輸出變量, 也沒有改變寄存器值(我們保存了eax值)。 因此,第二個和最後一個字段是空的。 因為指定了輸入字段, 我們仍需要保留一個空的輸出字段, 但是沒有最後一個字段, 因為它沒被使用。在兩個空冒號之間留下一個新行或者至少一個空格。

下面讓我們來看看輸入字段。 附加描述符可以修正指令來讓你給定的編譯器來正確處理這些變量。他們一般被附上雙引號。 那麼這個"g"是用來做什麼的呢? 只要是合法的匯編指令,"g"就讓編譯器決定該在哪裡加載i的值。一般來說,你的大部分輸入變量都可以被賦予"g", 讓編譯器決定如何去加載它們 (gcc甚至可以優化它們!)。 其他描述符使用"r" (加載到任何可用的寄存器去), "a" (ax/eax), "b" (bx/ebx), "c" (cx/ecx), "d" (dx/edx), "D" (di/edi), "S" (si/esi), 等等。

我們將要提到一個在asm代碼裡面的如%0的輸入變量。如果我們有兩個輸入, 他們會一個是%0一個是%1, 在輸入段裡按順序排列 (如下一個例子)。假如N個輸入變量且沒有輸出變量, 從%0 到%N-1將和輸入字段裡的變量相對應, 按順序排列。

如果任何的輸入, 輸出, 寄存器修改字段被使用, 匯編代碼裡的寄存器名必須用兩個%來代替一個%。對應於第一個沒有使用最後三個字段的例子。

讓我們看看兩個輸入變量且引入了"volatile"的例子:

int i=0, j=1;
__asm__ __volatile__("
pushl %%eax\n
movl %0, %%eax\n
addl %1, %%eax\n
movl %%eax, %0\n
popl %%eax"
:
: "g" (i), "g" (j)
); // increment i by j

Okay, 現在我們已經有了兩個輸入變量了。沒問題了, 我們只需要記住%0對應第一個輸入變量(在這個例子中是i), %1對應在i後面的列出的j。

Oh yeah, 這個volatile到底是什麼意思呢? 它防止你的編譯器修改你的匯編代碼,就是不進行優化(紀錄, 刪除, 結合,等等優化手段。), 不改變代碼原樣來匯編它們。建議一般情況下使用volatile選項。

讓我們來看看輸出字段:

int i=0;
__asm__ __volatile__("
pushl %%eax\n
movl $1, %%eax\n
movl %%eax, %0\n
popl %%eax"
: "=g" (i)
); // assign 1 to i

這看起來非常象我們前面提到的輸入字段的例子; 確實也沒有很大的不同。所有的輸出修飾符前面都應該加上=字符,他們同樣在匯編代碼裡面用%0到%N-1來表示, 在輸出字段按順序排列。你一定會問如果同時有輸入和輸出字段會怎麼排序的呢? 好,下面一個例子就是讓大家知道如何同時處理輸入輸出字段的。

int i=0, j=1, k=0;
__asm__ __volatile__("
pushl %%eax\n
movl %1, %%eax\n
addl %2, %%eax\n
movl %%eax, %0\n
popl %%eax"
: "=g" (k)
: "g" (i), "g" (j)
); // k = i + j

Okay, 唯一個不清楚的地方就是匯編代碼中的變量的個數。我馬上來解釋一下。

當同時使用輸入字段和輸出字段的時候:

%0 ... %K 是輸出變量

%K+1 ... %N 是輸入變量

在我們的例子中, %0 對應k, %1 對應i, %2對應j。很簡單,是吧?

到現在為止我們都沒有使用最後一個字段(registers-modified)。如果我們要在我們的匯編代碼裡使用任何寄存器, 我們要明確的用push和pop指令來保存它們, 或者列到最後一個字段裡面讓gcc來處理它們。

這是前面的一個例子, 沒有明確的保留和存貯eax。

int i=0, j=1, k=0; __asm__ __volatile__("
pushl %%eax\n /*譯者注:好像原文說的有點問題,明明是保存了eax的值,:(*/
movl %1, %%eax\n
addl %2, %%eax\n
movl %%eax, %0\n
popl %%eax"
: "=g" (k)
: "g" (i), "g" (j)
: "ax", "memory"
); // k = i + j

我們讓gcc來保存和存貯eax, 如果必要的話。一個16-bit寄存器名代表了32-, 16-或8-bit寄存器。 如果我們要改寫內存 (寫入一個變量等。), 建議在register-modified字段裡面來指定"memroy"修飾符。這意味著除了第一個例子我們都應該加上這個修飾符, 但是直到現在我才提出來, 是為了更簡單易懂。

在你的內聯匯編裡面定位標號應該使用b或f來作為終止符, 尤其是向後向前的跳轉。(譯者注:b代表向後跳轉,f代表向前跳轉)

For example,
__asm__ __volatile__("
0:\n
...
jmp 0b\n
...
jmp 1f\n
...
1:\n
...
);

這裡有個用c代碼和內聯匯編代碼混合寫的跳轉程序的例子(thanks to Srikanth B.R for this tip).

void MyFunction( int x, int y )
{
__asm__( "Start:" );
__asm__( ...do some comparison... );
__asm__( "jl Label_1" );
CallFunction( &x, &y );
__asm__("jmp Start");
Label_1:
return;
}
External Asm

Blah... Okay fine. Here's a clue: Get some of your C/C++ files, 且用gcc -S file.c來編譯。然後查看file.S文件。基本結構如下:

.file "myasm.S"
.data
somedata: .word 0
...
.text
.globl __myasmfunc
__myasmfunc:
...
ret

Macros, macros! 頭文件libc/asmdefs.h便於你寫asm。 在你的匯編代碼最前面包含此頭文件然後就可以使用宏了。一個例子: myasm.S:

#include
.file "myasm.S"
.data
.align 2
somedata: .word 0
...
.text
.align 4
FUNC(__MyExternalAsmFunc)
ENTER
movl ARG1, %eax
...
jmp mylabel
...
mylabel:
...
LEAVE

這是一個好的純粹的匯編代碼框架。

  1. 上一頁:
  2. 下一頁:
Copyright © 程式師世界 All Rights Reserved