Linux 匯編語言開發(fā)指南

作者：時間：2010-04-30 來源：網(wǎng)絡

加入技術交流群
- 掃碼加入
  和技術大咖面對面交流
  海量資料庫查詢

匯編語言的優(yōu)點是速度快，可以直接對硬件進行操作，這對諸如圖形處理等關鍵應用是非常重要的。Linux 是一個用 C 語言開發(fā)的操作系統(tǒng)，這使得很多程序員開始忘記在 Linux 中還可以直接使用匯編這一底層語言來優(yōu)化程序的性能。本文為那些在Linux 平臺上編寫匯編代碼的程序員提供指南，介紹 Linux 匯編語言的語法格式和開發(fā)工具，并輔以具體的例子講述如何開發(fā)實用的Linux 匯編程序。

一、簡介

本文引用地址：http://www.ex-cimer.com/article/257976.htm

作為最基本的編程語言之一，匯編語言雖然應用的范圍不算很廣，但重要性卻勿庸置疑，因為它能夠完成許多其它語言所無法完成的功能。就拿 Linux 內(nèi)核來講，雖然絕大部分代碼是用 C 語言編寫的，但仍然不可避免地在某些關鍵地方使用了匯編代碼，其中主要是在 Linux 的啟動部分。由于這部分代碼與硬件的關系非常密切，即使是 C 語言也會有些力不從心，而匯編語言則能夠很好揚長避短，最大限度地發(fā)揮硬件的性能。

大多數(shù)情況下 Linux 程序員不需要使用匯編語言，因為即便是硬件驅動這樣的底層程序在 Linux 操作系統(tǒng)中也可以用完全用 C 語言來實現(xiàn)，再加上 GCC 這一優(yōu)秀的編譯器目前已經(jīng)能夠對最終生成的代碼進行很好的優(yōu)化，的確有足夠的理由讓我們可以暫時將匯編語言拋在一邊了。但實現(xiàn)情況是 Linux 程序員有時還是需要使用匯編，或者不得不使用匯編，理由很簡單：精簡、高效和 libc 無關性。假設要移植 Linux 到某一特定的嵌入式硬件環(huán)境下，首先必然面臨如何減少系統(tǒng)大小、提高執(zhí)行效率等問題，此時或許只有匯編語言能幫上忙了。

匯編語言直接同計算機的底層軟件甚至硬件進行交互，它具有如下一些優(yōu)點：

能夠直接訪問與硬件相關的存儲器或 I/O 端口；
能夠不受編譯器的限制，對生成的二進制代碼進行完全的控制；
能夠對關鍵代碼進行更準確的控制，避免因線程共同訪問或者硬件設備共享引起的死鎖；
能夠根據(jù)特定的應用對代碼做最佳的優(yōu)化，提高運行速度；
能夠最大限度地發(fā)揮硬件的功能。

同時還應該認識到，匯編語言是一種層次非常低的語言，它僅僅高于直接手工編寫二進制的機器指令碼，因此不可避免地存在一些缺點：

編寫的代碼非常難懂，不好維護；
很容易產(chǎn)生 bug，難于調(diào)試；
只能針對特定的體系結構和處理器進行優(yōu)化；
開發(fā)效率很低，時間長且單調(diào)。

Linux 下用匯編語言編寫的代碼具有兩種不同的形式。第一種是完全的匯編代碼，指的是整個程序全部用匯編語言編寫。盡管是完全的匯編代碼，Linux 平臺下的匯編工具也吸收了 C 語言的長處，使得程序員可以使用 #include、#ifdef 等預處理指令，并能夠通過宏定義來簡化代碼。第二種是內(nèi)嵌的匯編代碼，指的是可以嵌入到C語言程序中的匯編代碼片段。雖然 ANSI 的 C 語言標準中沒有關于內(nèi)嵌匯編代碼的相應規(guī)定，但各種實際使用的 C 編譯器都做了這方面的擴充，這其中當然就包括 Linux 平臺下的 GCC。

二、Linux 匯編語法格式

絕大多數(shù) Linux 程序員以前只接觸過DOS/Windows 下的匯編語言，這些匯編代碼都是 Intel 風格的。但在 Unix 和 Linux 系統(tǒng)中，更多采用的還是 ATT 格式，兩者在語法格式上有著很大的不同：

在 ATT 匯編格式中，寄存器名要加上 '%' 作為前綴；而在 Intel 匯編格式中，寄存器名不需要加前綴。例如：
ATT 格式 Intel 格式
pushl %eax push eax
在 ATT 匯編格式中，用 '$' 前綴表示一個立即操作數(shù)；而在 Intel 匯編格式中，立即數(shù)的表示不用帶任何前綴。例如：
ATT 格式 Intel 格式
pushl $1 push 1
ATT 和 Intel 格式中的源操作數(shù)和目標操作數(shù)的位置正好相反。在 Intel 匯編格式中，目標操作數(shù)在源操作數(shù)的左邊；而在 ATT 匯編格式中，目標操作數(shù)在源操作數(shù)的右邊。例如：
ATT 格式 Intel 格式
addl $1, %eax add eax, 1
在 ATT 匯編格式中，操作數(shù)的字長由操作符的最后一個字母決定，后綴'b'、'w'、'l'分別表示操作數(shù)為字節(jié)（byte，8 比特）、字（word，16 比特）和長字（long，32比特）；而在 Intel 匯編格式中，操作數(shù)的字長是用 byte ptr 和 word ptr 等前綴來表示的。例如：
ATT 格式 Intel 格式
movb val, %al mov al, byte ptr val
在 ATT 匯編格式中，絕對轉移和調(diào)用指令（jump/call）的操作數(shù)前要加上'*'作為前綴，而在 Intel 格式中則不需要。
遠程轉移指令和遠程子調(diào)用指令的操作碼，在 ATT 匯編格式中為 ljump 和 lcall，而在 Intel 匯編格式中則為 jmp far 和 call far，即：
ATT 格式 Intel 格式
ljump $section, $offset jmp far section:offset
lcall $section, $offset call far section:offset
與之相應的遠程返回指令則為：
ATT 格式 Intel 格式
lret $stack_adjust ret far stack_adjust

在 ATT 匯編格式中，內(nèi)存操作數(shù)的尋址方式是

section:disp(base, index, scale)

而在 Intel 匯編格式中，內(nèi)存操作數(shù)的尋址方式為：

section:[base + index*scale + disp]

由于 Linux 工作在保護模式下，用的是 32 位線性地址，所以在計算地址時不用考慮段基址和偏移量，而是采用如下的地址計算方法：

disp + base + index * scale

下面是一些內(nèi)存操作數(shù)的例子：

ATT 格式	Intel 格式
movl -4(%ebp), %eax	mov eax, [ebp - 4]
movl array(, %eax, 4), %eax	mov eax, [eax*4 + array]
movw array(%ebx, %eax, 4), %cx	mov cx, [ebx + 4*eax + array]
movb $4, %fs:(%eax)	mov fs:eax, 4

三、Hello World!

真不知道打破這個傳統(tǒng)會帶來什么樣的后果，但既然所有程序設計語言的第一個例子都是在屏幕上打印一個字符串 Hello World!，那我們也以這種方式來開始介紹 Linux 下的匯編語言程序設計。

在 Linux 操作系統(tǒng)中，你有很多辦法可以實現(xiàn)在屏幕上顯示一個字符串，但最簡潔的方式是使用 Linux 內(nèi)核提供的系統(tǒng)調(diào)用。使用這種方法最大的好處是可以直接和操作系統(tǒng)的內(nèi)核進行通訊，不需要鏈接諸如 libc 這樣的函數(shù)庫，也不需要使用 ELF 解釋器，因而代碼尺寸小且執(zhí)行速度快。

Linux 是一個運行在保護模式下的 32 位操作系統(tǒng)，采用 flat memory 模式，目前最常用到的是 ELF 格式的二進制代碼。一個 ELF 格式的可執(zhí)行程序通常劃分為如下幾個部分：.text、.data 和 .bss，其中 .text 是只讀的代碼區(qū)，.data 是可讀可寫的數(shù)據(jù)區(qū)，而 .bss 則是可讀可寫且沒有初始化的數(shù)據(jù)區(qū)。代碼區(qū)和數(shù)據(jù)區(qū)在 ELF 中統(tǒng)稱為 section，根據(jù)實際需要你可以使用其它標準的 section，也可以添加自定義 section，但一個 ELF 可執(zhí)行程序至少應該有一個 .text 部分。下面給出我們的第一個匯編程序，用的是 ATT 匯編語言格式：

例1. ATT 格式

#hello.s .data                    # 數(shù)據(jù)段聲明msg : .string Hello, world!\n # 要輸出的字符串len = . - msg                   # 字串長度.text                    # 代碼段聲明.global _start           # 指定入口函數(shù)_start:                  # 在屏幕上顯示一個字符串movl $len, %edx  # 參數(shù)三：字符串長度movl $msg, %ecx  # 參數(shù)二：要顯示的字符串movl $1, %ebx    # 參數(shù)一：文件描述符(stdout) movl $4, %eax    # 系統(tǒng)調(diào)用號(sys_write) int  $0x80       # 調(diào)用內(nèi)核功能# 退出程序movl $0,%ebx     # 參數(shù)一：退出代碼movl $1,%eax     # 系統(tǒng)調(diào)用號(sys_exit) int  $0x80       # 調(diào)用內(nèi)核功能

初次接觸到 ATT 格式的匯編代碼時，很多程序員都認為太晦澀難懂了，沒有關系，在 Linux 平臺上你同樣可以使用 Intel 格式來編寫匯編程序：

例2. Intel 格式

; hello.asm section .data            ; 數(shù)據(jù)段聲明msg db Hello, world!, 0xA     ; 要輸出的字符串len equ $ - msg                 ; 字串長度section .text            ; 代碼段聲明global _start            ; 指定入口函數(shù)_start:                  ; 在屏幕上顯示一個字符串mov edx, len     ; 參數(shù)三：字符串長度mov ecx, msg     ; 參數(shù)二：要顯示的字符串mov ebx, 1       ; 參數(shù)一：文件描述符(stdout) mov eax, 4       ; 系統(tǒng)調(diào)用號(sys_write) int 0x80         ; 調(diào)用內(nèi)核功能; 退出程序mov ebx, 0       ; 參數(shù)一：退出代碼mov eax, 1       ; 系統(tǒng)調(diào)用號(sys_exit) int 0x80         ; 調(diào)用內(nèi)核功能

上面兩個匯編程序采用的語法雖然完全不同，但功能卻都是調(diào)用 Linux 內(nèi)核提供的 sys_write 來顯示一個字符串，然后再調(diào)用 sys_exit 退出程序。在 Linux 內(nèi)核源文件 include/asm-i386/unistd.h 中，可以找到所有系統(tǒng)調(diào)用的定義。

四、Linux 匯編工具

Linux 平臺下的匯編工具雖然種類很多，但同 DOS/Windows 一樣，最基本的仍然是匯編器、連接器和調(diào)試器。

1.匯編器

匯編器（assembler）的作用是將用匯編語言編寫的源程序轉換成二進制形式的目標代碼。Linux 平臺的標準匯編器是 GAS，它是 GCC 所依賴的后臺匯編工具，通常包含在 binutils 軟件包中。GAS 使用標準的 ATT 匯編語法，可以用來匯編用 ATT 格式編寫的程序：

[xiaowp@gary code]$ as -o hello.o hello.s

Linux 平臺上另一個經(jīng)常用到的匯編器是 NASM，它提供了很好的宏指令功能，并能夠支持相當多的目標代碼格式，包括 bin、a.out、coff、elf、rdf 等。NASM 采用的是人工編寫的語法分析器，因而執(zhí)行速度要比 GAS 快很多，更重要的是它使用的是 Intel 匯編語法，可以用來編譯用 Intel 語法格式編寫的匯編程序：

[xiaowp@gary code]$ nasm -f elf hello.asm

2.鏈接器

由匯編器產(chǎn)生的目標代碼是不能直接在計算機上運行的，它必須經(jīng)過鏈接器的處理才能生成可執(zhí)行代碼。鏈接器通常用來將多個目標代碼連接成一個可執(zhí)行代碼，這樣可以先將整個程序分成幾個模塊來單獨開發(fā)，然后才將它們組合(鏈接)成一個應用程序。 Linux 使用 ld 作為標準的鏈接程序，它同樣也包含在 binutils 軟件包中。匯編程序在成功通過 GAS 或 NASM 的編譯并生成目標代碼后，就可以使用 ld 將其鏈接成可執(zhí)行程序了：

[xiaowp@gary code]$ ld -s -o hello hello.o

3.調(diào)試器

有人說程序不是編出來而是調(diào)出來的，足見調(diào)試在軟件開發(fā)中的重要作用，在用匯編語言編寫程序時尤其如此。Linux 下調(diào)試匯編代碼既可以用 GDB、DDD 這類通用的調(diào)試器，也可以使用專門用來調(diào)試匯編代碼的 ALD(Assembly Language Debugger)。

從調(diào)試的角度來看，使用 GAS 的好處是可以在生成的目標代碼中包含符號表(symbol table)，這樣就可以使用 GDB 和 DDD 來進行源碼級的調(diào)試了。要在生成的可執(zhí)行程序中包含符號表，可以采用下面的方式進行編譯和鏈接：

[xiaowp@gary code]$ as --gstabs -o hello.o hello.s[xiaowp@gary code]$ ld -o hello hello.o

執(zhí)行 as 命令時帶上參數(shù) --gstabs 可以告訴匯編器在生成的目標代碼中加上符號表，同時需要注意的是，在用 ld 命令進行鏈接時不要加上 -s 參數(shù)，否則目標代碼中的符號表在鏈接時將被刪去。

在 GDB 和 DDD 中調(diào)試匯編代碼和調(diào)試 C 語言代碼是一樣的，你可以通過設置斷點來中斷程序的運行，查看變量和寄存器的當前值，并可以對代碼進行單步跟蹤。圖1 是在 DDD 中調(diào)試匯編代碼時的情景：

圖1 用 DDD 中調(diào)試匯編程序

匯編程序員通常面對的都是一些比較苛刻的軟硬件環(huán)境，短小精悍的ALD可能更能符合實際的需要，因此下面主要介紹一下如何用ALD來調(diào)試匯編程序。首先在命令行方式下執(zhí)行ald命令來啟動調(diào)試器，該命令的參數(shù)是將要被調(diào)試的可執(zhí)行程序：

[xiaowp@gary doc]$ ald helloAssembly Language Debugger 0.1.3Copyright (C) 2000-2002 Patrick Alkenhello: ELF Intel 80386 (32 bit), LSB, Executable, Version 1 (current)Loading debugging symbols...(15 symbols loaded)ald>

當 ALD 的提示符出現(xiàn)之后，用 disassemble 命令對代碼段進行反匯編：

ald> disassemble -s .textDisassembling section .text (0x08048074 - 0x08048096)08048074  BA0F000000                 mov edx, 0xf08048079  B998900408                 mov ecx, 0x80490980804807E  BB01000000                 mov ebx, 0x108048083  B804000000                 mov eax, 0x408048088  CD80                       int 0x800804808A  BB00000000                 mov ebx, 0x00804808F  B801000000                 mov eax, 0x108048094  CD80                       int 0x80

上述輸出信息的第一列是指令對應的地址碼，利用它可以設置在程序執(zhí)行時的斷點：

ald> break 0x08048088Breakpoint 1 set for 0x08048088

斷點設置好后，使用 run 命令開始執(zhí)行程序。ALD 在遇到斷點時將自動暫停程序的運行，同時會顯示所有寄存器的當前值：

ald> runStarting program: helloBreakpoint 1 encountered at 0x08048088eax = 0x00000004 ebx = 0x00000001 ecx = 0x08049098 edx = 0x0000000Fesp = 0xBFFFF6C0 ebp = 0x00000000 esi = 0x00000000 edi = 0x00000000ds  = 0x0000002B es  = 0x0000002B fs  = 0x00000000 gs  = 0x00000000ss  = 0x0000002B cs  = 0x00000023 eip = 0x08048088 eflags = 0x00000246Flags: PF ZF IF08048088  CD80                       int 0x80

如果需要對匯編代碼進行單步調(diào)試，可以使用 next 命令：

ald> nextHello, world!eax = 0x0000000F ebx = 0x00000000 ecx = 0x08049098 edx = 0x0000000Fesp = 0xBFFFF6C0 ebp = 0x00000000 esi = 0x00000000 edi = 0x00000000ds  = 0x0000002B es  = 0x0000002B fs  = 0x00000000 gs  = 0x00000000ss  = 0x0000002B cs  = 0x00000023 eip = 0x0804808F eflags = 0x00000346Flags: PF ZF TF IF0804808F  B801000000                 mov eax, 0x1

若想獲得 ALD 支持的所有調(diào)試命令的詳細列表，可以使用 help 命令：

ald> helpCommands may be abbreviated.If a blank command is entered, the last command is repeated.Type `help command>' for more specific information on command>.General commandsattach         clear          continue       detach         disassembleenter          examine        file           help           loadnext           quit           register       run            setstep           unload         window         writeBreakpoint related commandsbreak          delete         disable        enable         ignorelbreak         tbreak

五、系統(tǒng)調(diào)用

即便是最簡單的匯編程序，也難免要用到諸如輸入、輸出以及退出等操作，而要進行這些操作則需要調(diào)用操作系統(tǒng)所提供的服務，也就是系統(tǒng)調(diào)用。除非你的程序只完成加減乘除等數(shù)學運算，否則將很難避免使用系統(tǒng)調(diào)用，事實上除了系統(tǒng)調(diào)用不同之外，各種操作系統(tǒng)的匯編編程往往都是很類似的。

在 Linux 平臺下有兩種方式來使用系統(tǒng)調(diào)用：利用封裝后的 C 庫（libc）或者通過匯編直接調(diào)用。其中通過匯編語言來直接調(diào)用系統(tǒng)調(diào)用，是最高效地使用 Linux 內(nèi)核服務的方法，因為最終生成的程序不需要與任何庫進行鏈接，而是直接和內(nèi)核通信。

和 DOS 一樣，Linux 下的系統(tǒng)調(diào)用也是通過中斷（int 0x80）來實現(xiàn)的。在執(zhí)行 int 80 指令時，寄存器 eax 中存放的是系統(tǒng)調(diào)用的功能號，而傳給系統(tǒng)調(diào)用的參數(shù)則必須按順序放到寄存器 ebx，ecx，edx，esi，edi 中，當系統(tǒng)調(diào)用完成之后，返回值可以在寄存器 eax 中獲得。

所有的系統(tǒng)調(diào)用功能號都可以在文件 /usr/include/bits/syscall.h 中找到，為了便于使用，它們是用 SYS_name> 這樣的宏來定義的，如 SYS_write、SYS_exit 等。例如，經(jīng)常用到的 write 函數(shù)是如下定義的：

ssize_t write(int fd, const void *buf, size_t count);

該函數(shù)的功能最終是通過 SYS_write 這一系統(tǒng)調(diào)用來實現(xiàn)的。根據(jù)上面的約定，參數(shù) fb、buf 和 count 分別存在寄存器 ebx、ecx 和 edx 中，而系統(tǒng)調(diào)用號 SYS_write 則放在寄存器 eax 中，當 int 0x80 指令執(zhí)行完畢后，返回值可以從寄存器 eax 中獲得。

或許你已經(jīng)發(fā)現(xiàn)，在進行系統(tǒng)調(diào)用時至多只有 5 個寄存器能夠用來保存參數(shù)，難道所有系統(tǒng)調(diào)用的參數(shù)個數(shù)都不超過 5 嗎？當然不是，例如 mmap 函數(shù)就有 6 個參數(shù)，這些參數(shù)最后都需要傳遞給系統(tǒng)調(diào)用 SYS_mmap：

void  *  mmap(void *start, size_t length, int prot , int flags, int fd, off_t offset);

當一個系統(tǒng)調(diào)用所需的參數(shù)個數(shù)大于 5 時，執(zhí)行int 0x80 指令時仍需將系統(tǒng)調(diào)用功能號保存在寄存器 eax 中，所不同的只是全部參數(shù)應該依次放在一塊連續(xù)的內(nèi)存區(qū)域里，同時在寄存器 ebx 中保存指向該內(nèi)存區(qū)域的指針。系統(tǒng)調(diào)用完成之后，返回值仍將保存在寄存器 eax 中。

由于只是需要一塊連續(xù)的內(nèi)存區(qū)域來保存系統(tǒng)調(diào)用的參數(shù)，因此完全可以像普通的函數(shù)調(diào)用一樣使用棧(stack)來傳遞系統(tǒng)調(diào)用所需的參數(shù)。但要注意一點，Linux 采用的是 C 語言的調(diào)用模式，這就意味著所有參數(shù)必須以相反的順序進棧，即最后一個參數(shù)先入棧，而第一個參數(shù)則最后入棧。如果采用棧來傳遞系統(tǒng)調(diào)用所需的參數(shù)，在執(zhí)行int 0x80 指令時還應該將棧指針的當前值復制到寄存器 ebx中。

六、命令行參數(shù)

在 Linux 操作系統(tǒng)中，當一個可執(zhí)行程序通過命令行啟動時，其所需的參數(shù)將被保存到棧中：首先是 argc，然后是指向各個命令行參數(shù)的指針數(shù)組 argv，最后是指向環(huán)境變量的指針數(shù)據(jù) envp。在編寫匯編語言程序時，很多時候需要對這些參數(shù)進行處理，下面的代碼示范了如何在匯編代碼中進行命令行參數(shù)的處理：

例3. 處理命令行參數(shù)

# args.s.text.globl _start_start:popl	%ecx		# argcvnext:popl	%ecx		# argvtest 	%ecx, %ecx      # 空指針表明結束jz	exitmovl	%ecx, %ebxxorl	%edx, %edxstrlen:movb	(%ebx), %alinc	%edxinc	%ebxtest	%al, %aljnz	strlenmovb	$10, -1(%ebx)movl	$4, %eax        # 系統(tǒng)調(diào)用號(sys_write) movl	$1, %ebx        # 文件描述符(stdout) int	$0x80jmp	vnextexit:movl	$1,%eax         # 系統(tǒng)調(diào)用號(sys_exit) xorl	%ebx, %ebx      # 退出代碼int 	$0x80ret

七、GCC 內(nèi)聯(lián)匯編

用匯編編寫的程序雖然運行速度快，但開發(fā)速度非常慢，效率也很低。如果只是想對關鍵代碼段進行優(yōu)化，或許更好的辦法是將匯編指令嵌入到 C 語言程序中，從而充分利用高級語言和匯編語言各自的特點。但一般來講，在 C 代碼中嵌入?yún)R編語句要比純粹的匯編語言代碼復雜得多，因為需要解決如何分配寄存器，以及如何與C代碼中的變量相結合等問題。

GCC 提供了很好的內(nèi)聯(lián)匯編支持，最基本的格式是：

__asm__(asm statements);

例如：

__asm__(nop);

如果需要同時執(zhí)行多條匯編語句，則應該用\n\t將各個語句分隔開，例如：

__asm__( pushl %%eax \n\tmovl $0, %%eax \n\tpopl %eax);

通常嵌入到 C 代碼中的匯編語句很難做到與其它部分沒有任何關系，因此更多時候需要用到完整的內(nèi)聯(lián)匯編格式：

__asm__(asm statements : outputs : inputs : registers-modified);

插入到 C 代碼中的匯編語句是以:分隔的四個部分，其中第一部分就是匯編代碼本身，通常稱為指令部，其格式和在匯編語言中使用的格式基本相同。指令部分是必須的，而其它部分則可以根據(jù)實際情況而省略。

在將匯編語句嵌入到C代碼中時，操作數(shù)如何與C代碼中的變量相結合是個很大的問題。GCC采用如下方法來解決這個問題：程序員提供具體的指令，而對寄存器的使用則只需給出樣板和約束條件就可以了，具體如何將寄存器與變量結合起來完全由GCC和GAS來負責。

在GCC內(nèi)聯(lián)匯編語句的指令部中，加上前綴'%'的數(shù)字(如%0，%1)表示的就是需要使用寄存器的樣板操作數(shù)。指令部中使用了幾個樣板操作數(shù)，就表明有幾個變量需要與寄存器相結合，這樣GCC和GAS在編譯和匯編時會根據(jù)后面給定的約束條件進行恰當?shù)奶幚?。由于樣板操作?shù)也使用'%'作為前綴，因此在涉及到具體的寄存器時，寄存器名前面應該加上兩個'%'，以免產(chǎn)生混淆。

緊跟在指令部后面的是輸出部，是規(guī)定輸出變量如何與樣板操作數(shù)進行結合的條件，每個條件稱為一個約束，必要時可以包含多個約束，相互之間用逗號分隔開就可以了。每個輸出約束都以'='號開始，然后緊跟一個對操作數(shù)類型進行說明的字后，最后是如何與變量相結合的約束。凡是與輸出部中說明的操作數(shù)相結合的寄存器或操作數(shù)本身，在執(zhí)行完嵌入的匯編代碼后均不保留執(zhí)行之前的內(nèi)容，這是GCC在調(diào)度寄存器時所使用的依據(jù)。

輸出部后面是輸入部，輸入約束的格式和輸出約束相似，但不帶'='號。如果一個輸入約束要求使用寄存器，則GCC在預處理時就會為之分配一個寄存器，并插入必要的指令將操作數(shù)裝入該寄存器。與輸入部中說明的操作數(shù)結合的寄存器或操作數(shù)本身，在執(zhí)行完嵌入的匯編代碼后也不保留執(zhí)行之前的內(nèi)容。

有時在進行某些操作時，除了要用到進行數(shù)據(jù)輸入和輸出的寄存器外，還要使用多個寄存器來保存中間計算結果，這樣就難免會破壞原有寄存器的內(nèi)容。在GCC內(nèi)聯(lián)匯編格式中的最后一個部分中，可以對將產(chǎn)生副作用的寄存器進行說明，以便GCC能夠采用相應的措施。

下面是一個內(nèi)聯(lián)匯編的簡單例子：

例4.內(nèi)聯(lián)匯編

/* inline.c */int main(){int a = 10, b = 0;__asm__ __volatile__(movl %1, %%eax;\n\rmovl %%eax, %0;:=r(b)      /* 輸出 */    :r(a)       /* 輸入 */:%eax);     /* 不受影響的寄存器 */printf(Result: %d, %d\n, a, b);}

上面的程序完成將變量a的值賦予變量b，有幾點需要說明：

變量b是輸出操作數(shù)，通過%0來引用，而變量a是輸入操作數(shù)，通過%1來引用。
輸入操作數(shù)和輸出操作數(shù)都使用r進行約束，表示將變量a和變量b存儲在寄存器中。輸入約束和輸出約束的不同點在于輸出約束多一個約束修飾符'='。
在內(nèi)聯(lián)匯編語句中使用寄存器eax時，寄存器名前應該加兩個'%'，即%%eax。內(nèi)聯(lián)匯編中使用%0、%1等來標識變量，任何只帶一個'%'的標識符都看成是操作數(shù)，而不是寄存器。
內(nèi)聯(lián)匯編語句的最后一個部分告訴GCC它將改變寄存器eax中的值，GCC在處理時不應使用該寄存器來存儲任何其它的值。
由于變量b被指定成輸出操作數(shù)，當內(nèi)聯(lián)匯編語句執(zhí)行完畢后，它所保存的值將被更新。

在內(nèi)聯(lián)匯編中用到的操作數(shù)從輸出部的第一個約束開始編號，序號從0開始，每個約束記數(shù)一次，指令部要引用這些操作數(shù)時，只需在序號前加上'%'作為前綴就可以了。需要注意的是，內(nèi)聯(lián)匯編語句的指令部在引用一個操作數(shù)時總是將其作為32位的長字使用，但實際情況可能需要的是字或字節(jié)，因此應該在約束中指明正確的限定符：

限定符	意義
m、v、o	內(nèi)存單元
r	任何寄存器
q	寄存器eax、ebx、ecx、edx之一
i、h	直接操作數(shù)
E和F	浮點數(shù)
g	任意
a、b、c、d	分別表示寄存器eax、ebx、ecx和edx
S和D	寄存器esi、edi
I	常數(shù)（0至31）

八、小結

Linux操作系統(tǒng)是用C語言編寫的，匯編只在必要的時候才被人們想到，但它卻是減少代碼尺寸和優(yōu)化代碼性能的一種非常重要的手段，特別是在與硬件直接交互的時候，匯編可以說是最佳的選擇。Linux提供了非常優(yōu)秀的工具來支持匯編程序的開發(fā)，使用GCC的內(nèi)聯(lián)匯編能夠充分地發(fā)揮C語言和匯編語言各自的優(yōu)點。

參考資料

在網(wǎng)站 http://linuxassembly.org上可以找到大量的Linux匯編資源。
軟件包binutils提供了as和ld等實用工具，其相關信息可以在網(wǎng)站 http://sources.redhat.com/binutils/上找到。
NASM是Intel格式的匯編器，其相關信息可以在網(wǎng)站 http://nasm.sourceforge.net上找到。
ALD是一個短小精悍的匯編調(diào)試器，其相關信息可以在網(wǎng)站 http://dunx1.irt.drexel.edu/~psa22/ald.html上找到。
intel2gas是一個能夠將Intel匯編格式轉換成ATT匯編格式的小工具，其相關信息可以在網(wǎng)站 http://www.niksula.cs.hut.fi/~mtiihone/intel2gas/上找到。
IBM developerWorks上有一篇介紹GCC內(nèi)聯(lián)匯編的文章( http://www.ibm.com/developerworks/cn/linux/sdk/assemble/inline/index.shtml)。
本文代碼下載：代碼。