<meter id="pryje"><nav id="pryje"><delect id="pryje"></delect></nav></meter>

<label id="pryje"></label>

新聞中心

EEPW首頁(yè) > 設(shè)計(jì)應(yīng)用 > 理解計(jì)算機(jī)編程基礎(chǔ) —— 匯編語(yǔ)言

理解計(jì)算機(jī)編程基礎(chǔ) —— 匯編語(yǔ)言

作者：時(shí)間：2024-09-03 來源：

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對(duì)面交流
  海量資料庫(kù)查詢

收藏

學(xué)習(xí)編程其實(shí)就是學(xué)高級(jí)語(yǔ)言，即那些為人類設(shè)計(jì)的計(jì)算機(jī)語(yǔ)言。但是，計(jì)算機(jī)不理解高級(jí)語(yǔ)言，必須通過編譯器轉(zhuǎn)成二進(jìn)制代碼，才能運(yùn)行。學(xué)會(huì)高級(jí)語(yǔ)言，并不等于理解計(jì)算機(jī)實(shí)際的運(yùn)行步驟。

本文引用地址：http://www.ex-cimer.com/article/202409/462605.htm

計(jì)算機(jī)真正能夠理解的是低級(jí)語(yǔ)言，它專門用來控制硬件。匯編語(yǔ)言就是低級(jí)語(yǔ)言，直接描述/控制 CPU 的運(yùn)行。如果你想了解 CPU 到底干了些什么，以及代碼的運(yùn)行步驟，就一定要學(xué)習(xí)匯編語(yǔ)言。

匯編語(yǔ)言不容易學(xué)習(xí)，就連簡(jiǎn)明扼要的介紹都很難找到。下面就是一篇最好懂的匯編語(yǔ)言教程，解釋 CPU 如何執(zhí)行代碼。

一、匯編語(yǔ)言是什么？

我們知道，CPU 只負(fù)責(zé)計(jì)算，本身不具備智能。你輸入一條指令（instruction），它就運(yùn)行一次，然后停下來，等待下一條指令。

這些指令都是二進(jìn)制的，稱為操作碼（opcode），比如加法指令就是00000011。編譯器的作用，就是將高級(jí)語(yǔ)言寫好的程序，翻譯成一條條操作碼。

對(duì)于人類來說，二進(jìn)制程序是不可讀的，根本看不出來機(jī)器干了什么。為了解決可讀性的問題，以及偶爾的編輯需求，就誕生了匯編語(yǔ)言。

「匯編語(yǔ)言是二進(jìn)制指令的文本形式」，與指令是一一對(duì)應(yīng)的關(guān)系。比如，加法指令00000011寫成匯編語(yǔ)言就是 ADD。只要還原成二進(jìn)制，匯編語(yǔ)言就可以被 CPU 直接執(zhí)行，所以它是最底層的低級(jí)語(yǔ)言。

二、源起

最早的時(shí)候，編寫程序就是手寫二進(jìn)制指令，然后通過各種開關(guān)輸入計(jì)算機(jī)，比如要做加法了，就按一下加法開關(guān)。后來，發(fā)明了紙帶打孔機(jī)，通過在紙帶上打孔，將二進(jìn)制指令自動(dòng)輸入計(jì)算機(jī)。

為了解決二進(jìn)制指令的可讀性問題，工程師將那些指令寫成了八進(jìn)制。二進(jìn)制轉(zhuǎn)八進(jìn)制是輕而易舉的，但是八進(jìn)制的可讀性也不行。

很自然地，最后還是用文字表達(dá)，加法指令寫成 ADD。內(nèi)存地址也不再直接引用，而是用標(biāo)簽表示。

這樣的話，就多出一個(gè)步驟，要把這些文字指令翻譯成二進(jìn)制，這個(gè)步驟就稱為 assembling，完成這個(gè)步驟的程序就叫做 assembler。它處理的文本，自然就叫做 aseembly code。標(biāo)準(zhǔn)化以后，稱為 assembly language，縮寫為 asm，中文譯為匯編語(yǔ)言。

每一種 CPU 的機(jī)器指令都是不一樣的，因此對(duì)應(yīng)的匯編語(yǔ)言也不一樣。本文介紹的是目前最常見的 x86 匯編語(yǔ)言，即 Intel 公司的 CPU 使用的那一種。

三、寄存器

學(xué)習(xí)匯編語(yǔ)言，首先必須了解兩個(gè)知識(shí)點(diǎn)：寄存器和內(nèi)存模型。

先來看寄存器。CPU 本身只負(fù)責(zé)運(yùn)算，不負(fù)責(zé)儲(chǔ)存數(shù)據(jù)。數(shù)據(jù)一般都儲(chǔ)存在內(nèi)存之中，CPU 要用的時(shí)候就去內(nèi)存讀寫數(shù)據(jù)。

但是，CPU 的運(yùn)算速度遠(yuǎn)高于內(nèi)存的讀寫速度，為了避免被拖慢，CPU 都自帶一級(jí)緩存和二級(jí)緩存。基本上，CPU 緩存可以看作是讀寫速度較快的內(nèi)存。

但是，CPU 緩存還是不夠快，另外數(shù)據(jù)在緩存里面的地址是不固定的，CPU 每次讀寫都要尋址也會(huì)拖慢速度。

因此，除了緩存之外，CPU 還自帶了寄存器（register），用來儲(chǔ)存最常用的數(shù)據(jù)。也就是說，那些最頻繁讀寫的數(shù)據(jù)（比如循環(huán)變量），都會(huì)放在寄存器里面，CPU 優(yōu)先讀寫寄存器，再由寄存器跟內(nèi)存交換數(shù)據(jù)。

寄存器不依靠地址區(qū)分?jǐn)?shù)據(jù)，而依靠名稱。每一個(gè)寄存器都有自己的名稱，我們告訴 CPU 去具體的哪一個(gè)寄存器拿數(shù)據(jù)，這樣的速度是最快的。有人比喻寄存器是 CPU 的零級(jí)緩存。

四、寄存器的種類

早期的 x86 CPU 只有8個(gè)寄存器，而且每個(gè)都有不同的用途?，F(xiàn)在的寄存器已經(jīng)有100多個(gè)了，都變成通用寄存器，不特別指定用途了，但是早期寄存器的名字都被保存了下來。

· EAX

· EBX

· ECX

· EDX

· EDI

· ESI

· EBP

· ESP

上面這8個(gè)寄存器之中，前面七個(gè)都是通用的。ESP 寄存器有特定用途，保存當(dāng)前 Stack 的地址（詳見下一節(jié)）。

我們常?？吹?32位 CPU、64位 CPU 這樣的名稱，其實(shí)指的就是寄存器的大小。32 位 CPU 的寄存器大小就是4個(gè)字節(jié)。

五、內(nèi)存模型：Heap

寄存器只能存放很少量的數(shù)據(jù)，大多數(shù)時(shí)候，CPU 要指揮寄存器，直接跟內(nèi)存交換數(shù)據(jù)。所以，除了寄存器，還必須了解內(nèi)存怎么儲(chǔ)存數(shù)據(jù)。

程序運(yùn)行的時(shí)候，操作系統(tǒng)會(huì)給它分配一段內(nèi)存，用來儲(chǔ)存程序和運(yùn)行產(chǎn)生的數(shù)據(jù)。這段內(nèi)存有起始地址和結(jié)束地址，比如從0x1000到0x8000，起始地址是較小的那個(gè)地址，結(jié)束地址是較大的那個(gè)地址。

程序運(yùn)行過程中，對(duì)于動(dòng)態(tài)的內(nèi)存占用請(qǐng)求（比如新建對(duì)象，或者使用malloc命令），系統(tǒng)就會(huì)從預(yù)先分配好的那段內(nèi)存之中，劃出一部分給用戶，具體規(guī)則是從起始地址開始劃分（實(shí)際上，起始地址會(huì)有一段靜態(tài)數(shù)據(jù)，這里忽略）。

舉例來說，用戶要求得到10個(gè)字節(jié)內(nèi)存，那么從起始地址0x1000開始給他分配，一直分配到地址0x100A，如果再要求得到22個(gè)字節(jié)，那么就分配到0x1020。

這種因?yàn)橛脩糁鲃?dòng)請(qǐng)求而劃分出來的內(nèi)存區(qū)域，叫做 Heap（堆）。它由起始地址開始，從低位（地址）向高位（地址）增長(zhǎng)。Heap 的一個(gè)重要特點(diǎn)就是不會(huì)自動(dòng)消失，必須手動(dòng)釋放，或者由垃圾回收機(jī)制來回收。

六、內(nèi)存模型：Stack

除了 Heap 以外，其他的內(nèi)存占用叫做 Stack（棧）。簡(jiǎn)單說，Stack 是由于函數(shù)運(yùn)行而臨時(shí)占用的內(nèi)存區(qū)域。

請(qǐng)看下面的例子。

int main() 
{
    int a = 2;
    int b = 3;
}

上面代碼中，系統(tǒng)開始執(zhí)行main函數(shù)時(shí)，會(huì)為它在內(nèi)存里面建立一個(gè)幀（frame），所有main的內(nèi)部變量（比如a和b）都保存在這個(gè)幀里面。main函數(shù)執(zhí)行結(jié)束后，該幀就會(huì)被回收，釋放所有的內(nèi)部變量，不再占用空間。

如果函數(shù)內(nèi)部調(diào)用了其他函數(shù)，會(huì)發(fā)生什么情況？

int main() 
{
   int a = 2;
   int b = 3;
   return add_a_and_b(a, b);
}

上面代碼中，main函數(shù)內(nèi)部調(diào)用了add_a_and_b函數(shù)。執(zhí)行到這一行的時(shí)候，系統(tǒng)也會(huì)為add_a_and_b新建一個(gè)幀，用來儲(chǔ)存它的內(nèi)部變量。也就是說，此時(shí)同時(shí)存在兩個(gè)幀：main和add_a_and_b。一般來說，調(diào)用棧有多少層，就有多少幀。

等到add_a_and_b運(yùn)行結(jié)束，它的幀就會(huì)被回收，系統(tǒng)會(huì)回到函數(shù)main剛才中斷執(zhí)行的地方，繼續(xù)往下執(zhí)行。通過這種機(jī)制，就實(shí)現(xiàn)了函數(shù)的層層調(diào)用，并且每一層都能使用自己的本地變量。

所有的幀都存放在 Stack，由于幀是一層層疊加的，所以 Stack 叫做棧。生成新的幀，叫做"入棧"，英文是 push；棧的回收叫做"出棧"，英文是 pop。Stack 的特點(diǎn)就是，最晚入棧的幀最早出棧（因?yàn)樽顑?nèi)層的函數(shù)調(diào)用，最先結(jié)束運(yùn)行），這就叫做"后進(jìn)先出"的數(shù)據(jù)結(jié)構(gòu)。

每一次函數(shù)執(zhí)行結(jié)束，就自動(dòng)釋放一個(gè)幀，所有函數(shù)執(zhí)行結(jié)束，整個(gè) Stack 就都釋放了。

Stack 是由內(nèi)存區(qū)域的結(jié)束地址開始，從高位（地址）向低位（地址）分配。比如，內(nèi)存區(qū)域的結(jié)束地址是0x8000，第一幀假定是16字節(jié)，那么下一次分配的地址就會(huì)從0x7FF0開始；第二幀假定需要64字節(jié)，那么地址就會(huì)移動(dòng)到0x7FB0。

七、CPU 指令

7.1 一個(gè)實(shí)例

了解寄存器和內(nèi)存模型以后，就可以來看匯編語(yǔ)言到底是什么了。下面是一個(gè)簡(jiǎn)單的程序example.c。

int add_a_and_b(int a, int b) {
   return a + b;
}
int main() {
   return add_a_and_b(2, 3);
}

gcc 將這個(gè)程序轉(zhuǎn)成匯編語(yǔ)言。

$ gcc -S example.c

上面的命令執(zhí)行以后，會(huì)生成一個(gè)文本文件example.s，里面就是匯編語(yǔ)言，包含了幾十行指令。這么說吧，一個(gè)高級(jí)語(yǔ)言的簡(jiǎn)單操作，底層可能由幾個(gè)，甚至幾十個(gè) CPU 指令構(gòu)成。CPU 依次執(zhí)行這些指令，完成這一步操作。

example.s經(jīng)過簡(jiǎn)化以后，大概是下面的樣子。

_add_a_and_b:
   push   %ebx
   mov    %eax, [%esp+8] 
   mov    %ebx, [%esp+12]
   add    %eax, %ebx 
   pop    %ebx 
   ret  
_main:
   push   3
   push   2
   call   _add_a_and_b 
   add    %esp, 8
   ret

可以看到，原程序的兩個(gè)函數(shù)add_a_and_b和main，對(duì)應(yīng)兩個(gè)標(biāo)簽_add_a_and_b和_main。每個(gè)標(biāo)簽里面是該函數(shù)所轉(zhuǎn)成的 CPU 運(yùn)行流程。

每一行就是 CPU 執(zhí)行的一次操作。它又分成兩部分，就以其中一行為例。

push   %ebx

這一行里面，push是 CPU 指令，%ebx是該指令要用到的運(yùn)算子。一個(gè) CPU 指令可以有零個(gè)到多個(gè)運(yùn)算子。

下面我就一行一行講解這個(gè)匯編程序，建議讀者最好把這個(gè)程序，在另一個(gè)窗口拷貝一份，省得閱讀的時(shí)候再把頁(yè)面滾動(dòng)上來。

7.2 push 指令

根據(jù)約定，程序從_main標(biāo)簽開始執(zhí)行，這時(shí)會(huì)在 Stack 上為main建立一個(gè)幀，并將 Stack 所指向的地址，寫入 ESP 寄存器。后面如果有數(shù)據(jù)要寫入main這個(gè)幀，就會(huì)寫在 ESP 寄存器所保存的地址。

然后，開始執(zhí)行第一行代碼。

push   3

push指令用于將運(yùn)算子放入 Stack，這里就是將3寫入main這個(gè)幀。

雖然看上去很簡(jiǎn)單，push指令其實(shí)有一個(gè)前置操作。它會(huì)先取出 ESP 寄存器里面的地址，將其減去4個(gè)字節(jié)，然后將新地址寫入 ESP 寄存器。

使用減法是因?yàn)?Stack 從高位向低位發(fā)展，4個(gè)字節(jié)則是因?yàn)?span style="caret-color: rgba(0, 0, 0, 0.9); color: rgba(0, 0, 0, 0.9); letter-spacing: 0.5440000295639038px; text-align: justify; word-spacing: 2px; background-color: rgba(27, 31, 35, 0.05);">3的類型是int，占用4個(gè)字節(jié)。得到新地址以后， 3 就會(huì)寫入這個(gè)地址開始的四個(gè)字節(jié)。

push   2

第二行也是一樣，push指令將2寫入main這個(gè)幀，位置緊貼著前面寫入的3。這時(shí)，ESP 寄存器會(huì)再減去 4個(gè)字節(jié)（累計(jì)減去8）。

7.3 call 指令

第三行的call指令用來調(diào)用函數(shù)。

call   _add_a_and_b

上面的代碼表示調(diào)用add_a_and_b函數(shù)。這時(shí)，程序就會(huì)去找_add_a_and_b標(biāo)簽，并為該函數(shù)建立一個(gè)新的幀。

下面就開始執(zhí)行_add_a_and_b的代碼。

push   %ebx

這一行表示將 EBX 寄存器里面的值，寫入_add_a_and_b這個(gè)幀。這是因?yàn)楹竺嬉玫竭@個(gè)寄存器，就先把里面的值取出來，用完后再寫回去。

這時(shí)，push指令會(huì)再將 ESP 寄存器里面的地址減去4個(gè)字節(jié)（累計(jì)減去12）。

7.4 mov 指令

mov指令用于將一個(gè)值寫入某個(gè)寄存器。

mov    %eax, [%esp+8]

這一行代碼表示，先將 ESP 寄存器里面的地址加上8個(gè)字節(jié)，得到一個(gè)新的地址，然后按照這個(gè)地址在 Stack 取出數(shù)據(jù)。根據(jù)前面的步驟，可以推算出這里取出的是2，再將2寫入 EAX 寄存器。

下一行代碼也是干同樣的事情。

mov    %ebx, [%esp+12]

上面的代碼將 ESP 寄存器的值加12個(gè)字節(jié)，再按照這個(gè)地址在 Stack 取出數(shù)據(jù)，這次取出的是3，將其寫入 EBX 寄存器。

7.5 add 指令

add指令用于將兩個(gè)運(yùn)算子相加，并將結(jié)果寫入第一個(gè)運(yùn)算子。

add    %eax, %ebx

上面的代碼將 EAX 寄存器的值（即2）加上 EBX 寄存器的值（即3），得到結(jié)果5，再將這個(gè)結(jié)果寫入第一個(gè)運(yùn)算子 EAX 寄存器。

7.6 pop 指令

pop指令用于取出 Stack 最近一個(gè)寫入的值（即最低位地址的值），并將這個(gè)值寫入運(yùn)算子指定的位置。

pop    %ebx

上面的代碼表示，取出 Stack 最近寫入的值（即 EBX 寄存器的原始值），再將這個(gè)值寫回 EBX 寄存器（因?yàn)榧臃ㄒ呀?jīng)做完了，EBX 寄存器用不到了）。

注意，pop指令還會(huì)將 ESP 寄存器里面的地址加4，即回收4個(gè)字節(jié)。

7.7 ret 指令

ret指令用于終止當(dāng)前函數(shù)的執(zhí)行，將運(yùn)行權(quán)交還給上層函數(shù)。也就是，當(dāng)前函數(shù)的幀將被回收。

ret

可以看到，該指令沒有運(yùn)算子。

隨著add_a_and_b函數(shù)終止執(zhí)行，系統(tǒng)就回到剛才main函數(shù)中斷的地方，繼續(xù)往下執(zhí)行。

add    %esp, 8

上面的代碼表示，將 ESP 寄存器里面的地址，手動(dòng)加上8個(gè)字節(jié)，再寫回 ESP 寄存器。這是因?yàn)?ESP 寄存器的是 Stack 的寫入開始地址，前面的ret操作已經(jīng)回收了4個(gè)字節(jié)，這里再回收8個(gè)字節(jié)，等于全部回收。

ret

最后，main函數(shù)運(yùn)行結(jié)束，ret指令退出程序執(zhí)行。

八、參考鏈接

· Introduction to reverse engineering and Assembly, by Youness Alaoui

· x86 Assembly Guide, by University of Virginia Computer Science

聲明：本文素材來源網(wǎng)絡(luò)，版權(quán)歸原作者所有。如涉及作品版權(quán)問題，請(qǐng)與我聯(lián)系刪除。

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

關(guān)鍵詞： 計(jì)算機(jī) 編程匯編

評(píng)論

相關(guān)推薦

VxWork介紹及編程

jackwang | 2002-05-15

第四講網(wǎng)絡(luò)數(shù)據(jù)獲取和顯示

視頻 Android 計(jì)算機(jī) | 2012-07-18

DK04監(jiān)控模塊與計(jì)算機(jī)通信接口電路

設(shè)計(jì)方案監(jiān)控模塊計(jì)算機(jī) 通信接口 | 2009-07-06

TL5001構(gòu)成計(jì)算機(jī)LCD顯示器的高壓電源的應(yīng)用電路

設(shè)計(jì)方案 TL5001 構(gòu)成計(jì)算機(jī) 顯示器高壓電源應(yīng)用電路 | 2009-07-06

數(shù)控增益編程儀器放大器PGA202／203原理及應(yīng)用

設(shè)計(jì)方案數(shù)控增益編程儀器放大器 PGA202 原理應(yīng)用 | 2009-07-06

計(jì)算機(jī)音頻工作站總論--音頻工作站與硬盤錄音機(jī)同類比較(轉(zhuǎn)載）

hpnet | 2002-05-15

理解計(jì)算機(jī)編程基礎(chǔ) —— 匯編語(yǔ)言

計(jì)算機(jī) 編程匯編 | 2024-09-03

模擬大腦突觸的液體電路如何實(shí)現(xiàn)計(jì)算機(jī)的邏輯運(yùn)算

電路計(jì)算機(jī) 邏輯運(yùn)算 | 2024-04-18

人機(jī)接口與協(xié)議自適應(yīng)

資源下載計(jì)算機(jī) 普適網(wǎng)絡(luò)協(xié)議接口自適應(yīng) | 2008-01-06

第一講安卓應(yīng)用開發(fā)介紹

視頻 Android 計(jì)算機(jī) | 2012-07-18

使用Verilog來編程FPGA

嵌入式系統(tǒng) Verilog 編程 FPGA | 2023-12-21

如何編寫可讀性高的C代碼？

代碼編程 C語(yǔ)言 UNIX | 2024-04-16

電腦串口、并口連接線大全

資源下載計(jì)算機(jī) 串口并口連接線 | 2008-01-06

增益或編程放大電路

設(shè)計(jì)方案增益編程放大 | 2009-07-06

很好的一篇入門文章，特別推薦(老站轉(zhuǎn))

amine | 2002-05-28

BIOS是什么？

嵌入式系統(tǒng) BIOS 計(jì)算機(jī) | 2024-03-11

帶光隔離的計(jì)算機(jī)彩燈控制器

資源下載計(jì)算機(jī) 計(jì)算機(jī)彩燈控制器 | 2007-12-25

我國(guó)設(shè)立計(jì)算機(jī)創(chuàng)新獎(jiǎng)勵(lì)基金

hpnet | 2002-05-17

利用計(jì)算機(jī)并口和MAX7221驅(qū)動(dòng)LED程序

資源下載計(jì)算機(jī) 并口 LED驅(qū)動(dòng) MAX7221 | 2007-02-09

軟件代碼幾種常見命名規(guī)則

軟件代碼編程工程師 | 2024-04-11

汽車電子行業(yè)的C語(yǔ)言編程標(biāo)準(zhǔn)

汽車電子 C語(yǔ)言編程 MISRA | 2024-01-16

STM32 微控制器 GPIO 編程指南

嵌入式系統(tǒng) 嵌入式 GPIO STM32 編程 | 2024-07-30

計(jì)算機(jī)麥克風(fēng)電路圖

設(shè)計(jì)方案計(jì)算機(jī) 麥克風(fēng) 電路圖 | 2009-07-06

第二講 Hello World

視頻 Android 計(jì)算機(jī) | 2012-07-18

谷歌云計(jì)算部門再裁員，至少100名員工受影響

國(guó)際視野谷歌計(jì)算機(jī) 國(guó)際 | 2024-06-04

ARM簡(jiǎn)介及編程

jackwang | 2002-05-15

第三講用戶界面基礎(chǔ)

視頻 Android 計(jì)算機(jī) | 2012-07-18

7個(gè)底層數(shù)據(jù)結(jié)構(gòu)，幾乎撐起了整個(gè)上層數(shù)字世界！

數(shù)據(jù)結(jié)構(gòu) 編程 | 2024-03-27

第五講用戶界面改進(jìn)

視頻 Android 計(jì)算機(jī) | 2012-07-18

arm學(xué)習(xí)資料

資源下載 ARM 基礎(chǔ) 編程調(diào)試開發(fā) ARM7 | 2007-12-03

焦點(diǎn)

推薦視頻

技術(shù)專區(qū)

看屁屁www成人影院,亚洲人妻成人图片,亚洲精品成人午夜在线,日韩在线欧美成人 (function(){ var bp = document.createElement('script'); var curProtocol = window.location.protocol.split(':')[0]; if (curProtocol === 'https') { bp.src = 'https://zz.bdstatic.com/linksubmit/push.js'; } else { bp.src = 'http://push.zhanzhang.baidu.com/push.js'; } var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(bp, s); })();