GNU風格 ARM匯編語法指南
1、GNU匯編語言語句格式
本文引用地址:http://www.ex-cimer.com/article/201611/318762.htm任何Linux匯編行都是如下結構:[
linstruction為指令
ldirective為偽操作
lpseudo-instruction為偽指令
l
lcomment為語句的注釋
下面定義一個"add"的函數(shù),最終返回兩個參數(shù)的和:
.section .text, “x”
.global add @ give the symbol “add” external linkage
add:
ADD r0, r0, r1 @ add input arguments
MOV pc, lr @ return from subroutine
@ end of program
注意:
lARM指令,偽指令,偽操作,寄存器名可以全部為大寫字母,也可全部為小寫字母,但不可大小寫混用。
l如果語句太長,可以將一條語句分幾行來書寫,在行末用“”表示換行(即下一行與本行為同一語句)。“”后不能有任何字符,包含空格和制表符(Tab)。
2、GNU匯編程序中的標號symbol(或label)
標號只能由a~z,A~Z,0~9,“.”,_等(由點、字母、數(shù)字、下劃線等組成,除局部標號外,不能以數(shù)字開頭)字符組成。
Symbol的本質:代表它所在的地址,因此也可以當作變量或者函數(shù)來使用。
l段內標號的地址值在匯編時確定;
l段外標號的地址值在連接時確定。
Symbol的分類:3類(依據(jù)標號的生成方式)。
<1>基于PC的標號?;赑C的標號是位于目標指令前的標號或者程序中數(shù)據(jù)定義偽操作前的標號。這種標號在匯編時將被處理成PC值加上(或減去)一個數(shù)字常量,常用于表示跳轉指令”b”等的目標地址,或者代碼段中所嵌入的少量數(shù)據(jù)。
<2>基于寄存器的標號。基于寄存器的標號常用MAP和FIELD來定義,也可以用EQU來定義。這種標號在匯編時將被處理成寄存器的值加上(或減去)一個數(shù)字常量,常用于訪問數(shù)據(jù)段中的數(shù)據(jù)。
<3>絕對地址。絕對地址是一個32位數(shù)據(jù)。它可以尋址的范圍為[0,232-1]即可以直接尋址整個內存空間。
特別說明:局部標號Symbol
局部標號主要在局部范圍內使用,而且局部標號可以重復出現(xiàn)。它由兩部組成:開頭是一個0-99直接的數(shù)字,后面緊接一個通常表示該局部變量作用范圍的符號。局部變量的作用范圍通常為當前段,也可以用ROUT來定義局部變量的作用范圍。
局部變量定義的語法格式:N{routname}
lN:為0~99之間的數(shù)字。
lroutname:當前局部范圍的名稱(為符號),通常為該變量作用范圍的名稱(用ROUT偽操作定義的)。
局部變量引用的語法格式:%{F|B}{A|T}N{routname}
l%:表示引用操作
lN:為局部變量的數(shù)字號
lroutname:為當前作用范圍的名稱(用ROUT偽操作定義的)
lF:指示編譯器只向前搜索
lB:指示編譯器只向后搜索
lA:指示編譯器搜索宏的所有嵌套層次
lT:指示編譯器搜索宏的當前層次
例:使用局部符號的例子,一段循環(huán)程序
1:
subs r0, r0, #1 @每次循環(huán)使r0=r0-1
bne 1F @跳轉到1標號去執(zhí)行
注意:
l如果F和B都沒有指定,編譯器先向前搜索,再向后搜索
l如果A和T都沒有指定,編譯器搜索所有從當前層次到宏的最高層次,比當前層次低的層次不再搜索。
l如果指定了routname,編譯器向前搜索最近的ROUT偽操作,若routname與該ROUT偽操作定義的名稱不匹配,編譯器報告錯誤,匯編失敗。
3、GNU匯編程序中的分段
<1>.section偽操作
.section
Starts a new code or data section. Sections in GNU are called .text, a code section, .data, an initialized data section, and .bss, an uninitialized data section.
These sections have default flags, and the linker understands the default names(similar directive to the armasm directive AREA).The following are allowable.section flagsfor ELF format files:
a allowable section
w writable section
x executable section
中文解釋:
用戶可以通過.section偽操作來自定義一個段,格式如下:
.section section_name [, "flags"[, %type[,flag_specific_arguments]]]
每一個段以段名為開始, 以下一個段名或者文件結尾為結束。這些段都有缺省的標志(flags),連接器可以識別這些標志。(與arm asm中的AREA相同)。下面是ELF格式允許的段標志flags:
<標志> 含義
a 允許段
w 可寫段
x 執(zhí)行段
例:定義一個“段”
.section .mysection @自定義數(shù)據(jù)段,段名為 “.mysection”
.align 2
strtemp:
.ascii "Temp string n" @對這一句的理解,我覺得應該是:將"Temp string n"這個字符串存儲在以標號strtemp:
@為起始地址的一段內存空間里
<2>匯編系統(tǒng)預定義的段名
l.text @代碼段
l.data @初始化數(shù)據(jù)段.data Read-write initialized long data.
l.bss @未初始化數(shù)據(jù)段
l.sdata @ .sdata Read-write initialized short data.
l.sbss @
注意:源程序中.bss段應該在.text段之前。
4、GNU匯編語言定義入口點
匯編程序的缺省入口是_start標號,用戶也可以在連接腳本文件中用ENTRY標志指明其它入口點。
例:定義入口點
.section .data
< initialized data here>
.section .bss
< uninitialized data here>
.section .text
.globl _start
_start:
5、GNU匯編程序中的宏定義
格式如下:
.macro 宏名參數(shù)名列表 @偽指令.macro定義一個宏
宏體
.endm @.endm表示宏結束
如果宏使用參數(shù),那么在宏體中使用該參數(shù)時添加前綴“”。宏定義時的參數(shù)還可以使用默認值??梢允褂?exitm偽指令來退出宏。
例:宏定義
.macro SHIFTLEFT a, b
.if b < 0
MOV a, a, ASR #-b
.exitm
.endif
MOV a, a, LSL #b
.endm
6、GNU匯編程序中的常數(shù)
<1>十進制數(shù)以非0數(shù)字開頭,如:123和9876;
<2>二進制數(shù)以0b開頭,其中字母也可以為大寫;
<3>八進制數(shù)以0開始,如:0456,0123;
<4>十六進制數(shù)以0x開頭,如:0xabcd,0X123f;
<5>字符串常量需要用引號括起來,中間也可以使用轉義字符,如: “You are welcome!n”;
<6>當前地址以“.”表示,在GNU匯編程序中可以使用這個符號代表當前指令的地址;
<7>表達式:在匯編程序中的表達式可以使用常數(shù)或者數(shù)值, “-”表示取負數(shù), “~”表示取補,“<>”表示不相等,其他的符號如:+、-、*、 /、%、<、<<、>、>>、|、&、^、!、==、>=、<=、&&、|| 跟C語言中的用法相似。
7、GNU ARM匯編的常用偽操作
在前面已經(jīng)提到過了一些為操作,還有下面一些為操作:
l數(shù)據(jù)定義偽操作: .byte,.short,.long,.quad,.float,.string/.asciz/.ascii,重復定義偽操作.rept,賦值語句.equ/.set ;
l函數(shù)的定義;
l對齊方式偽操作 .align;
l源文件結束偽操作.end;
l.include偽操作;
lif偽操作;
l.global/ .globl 偽操作;
l.type偽操作;
l列表控制語句;
別于GNUAS匯編的通用偽操作,下面是ARM特有的偽操作:
.reg ,.unreq ,.code ,.thumb ,.thumb_func ,.thumb_set, .ltorg ,.pool
<1>數(shù)據(jù)定義偽操作
l.byte:單字節(jié)定義,如:.byte 1,2,0b01,0x34,072,s ;
l.short:定義雙字節(jié)數(shù)據(jù),如:.short 0x1234,60000 ;
l.long:定義4字節(jié)數(shù)據(jù),如:.long 0x12345678,23876565
l.quad:定義8字節(jié),如:.quad 0x1234567890abcd
l.float:定義浮點數(shù),如:.float0f-314159265358979323846264338327
95028841971.693993751E-40 @- pi
l.string/.asciz/.ascii:定義多個字符串,如:
.string "abcd", "efgh", "hello!"
.asciz "qwer", "sun", "world!"
.ascii "welcome"
注意:ascii偽操作定義的字符串需要自行添加結尾字符。
l.rept:重復定義偽操作, 格式如下:
.rept 重復次數(shù)
數(shù)據(jù)定義
.endr @結束重復定義
例:
.rept 3
.byte 0x23
.endr
l.equ/.set: 賦值語句, 格式如下:
.equ(.set) 變量名,表達式
例:
.equ abc, 3 @讓abc=3
<2>函數(shù)的定義偽操作
l函數(shù)的定義,格式如下:
函數(shù)名:
函數(shù)體
返回語句
一般的,函數(shù)如果需要在其他文件中調用,需要用到.global偽操作將函數(shù)聲明為全局函數(shù)。為了不至于在其他程序在調用某個C函數(shù)時發(fā)生混亂,對寄存器的使用我們需要遵循APCS準則。函數(shù)編譯器將處理函數(shù)代碼為一段.global的匯編碼。
l函數(shù)的編寫應當遵循如下規(guī)則:
a.a1-a4寄存器(參數(shù)、結果或暫存寄存器,r0到r3 的同義字)以及浮點寄存器f0-f3(如果存在浮點協(xié)處理器)在函數(shù)中是不必保存的;
b.如果函數(shù)返回一個不大于一個字大小的值,則在函數(shù)結束時應該把這個值送到 r0 中;
c.如果函數(shù)返回一個浮點數(shù),則在函數(shù)結束時把它放入浮點寄存器f0中;
d.如果函數(shù)的過程改動了sp(堆棧指針,r13)、fp(框架指針,r11)、sl(堆棧限制,r10)、lr(連接寄存器,r14)、v1-v8(變量寄存器,r4 到 r11)和 f4-f7,那么函數(shù)結束時這些寄存器應當被恢復為包含在進入函數(shù)時它所持有的值。
<3>.align .end .include .incbin偽操作
l.align:用來指定數(shù)據(jù)的對齊方式,格式如下:
.align [absexpr1, absexpr2]
以某種對齊方式,在未使用的存儲區(qū)域填充值.第一個值表示對齊方式,4, 8,16或32.第二個表達式值表示填充的值。
l.end:表明源文件的結束。
l.include:可以將指定的文件在使用.include 的地方展開,一般是頭文件,例如:
.include “myarmasm.h”
l.incbin偽操作可以將原封不動的一個二進制文件編譯到當前文件中,使用方法如下:
.incbin "file"[,skip[,count]]
skip表明是從文件開始跳過skip個字節(jié)開始讀取文件,count是讀取的字數(shù).
<4>..if偽操作
根據(jù)一個表達式的值來決定是否要編譯下面的代碼, 用.endif偽操作來表示條件判斷的結束,中間可以使用.else來決定.if的條件不滿足的情況下應該編譯哪一部分代碼。
.if有多個變種:
.ifdef symbol @判斷symbol是否定義
.ifc string1,string2 @字符串string1和string2是否相等,字符串可以用單引號括起來
.ifeq expression @判斷expression的值是否為0
.ifeqs string1,string2 @判斷string1和string2是否相等,字符串必須用雙引號括起來
.ifge expression @判斷expression的值是否大于等于0
.ifgt absolute expression @判斷expression的值是否大于0
.ifle expression @判斷expression的值是否小于等于0
.iflt absolute expression @判斷expression的值是否小于0
.ifnc string1,string2 @判斷string1和string2是否不相等, 其用法跟.ifc恰好相反。
.ifndef symbol, .ifnotdef symbol @判斷是否沒有定義symbol, 跟.ifdef恰好相反
.ifne expression @如果expression的值不是0, 那么編譯器將編譯下面的代碼
.ifnes string1,string2 @如果字符串string1和string2不相等, 那么編譯器將編譯下面的代碼.
<5>.global .type .title .list
l.global/ .globl :用來定義一個全局的符號,格式如下:
.global symbol 或者 .globl symbol
l.type:用來指定一個符號的類型是函數(shù)類型或者是對象類型, 對象類型一般是數(shù)據(jù), 格式如下:
.type 符號, 類型描述
例:
.globl a
.data
.align 4
.type a, @object
.size a, 4
a:
.long 10
例:
.section .text
.type asmfunc, @function
.globl asmfunc
asmfunc:
mov pc, lr
<6>列表控制語句:
.title:用來指定匯編列表的標題,例如:
.title “my program”
.list:用來輸出列表文件.
<7>ARM特有的偽操作
l.reg: 用來給寄存器賦予別名,格式如下:
別名 .req 寄存器名
l.unreq: 用來取消一個寄存器的別名,格式如下:
.unreq 寄存器別名
注意被取消的別名必須事先定義過,否則編譯器就會報錯,這個偽操作也可以用來取消系統(tǒng)預制的別名, 例如r0, 但如果沒有必要的話不推薦那樣做。
l.code偽操作用來選擇ARM或者Thumb指令集,格式如下:
.code 表達式
如果表達式的值為16則表明下面的指令為Thumb指令,如果表達式的值為32則表明下面的指令為ARM指令.
l.thumb偽操作等同于.code 16, 表明使用Thumb指令, 類似的.arm等同于.code 32
l.force_thumb偽操作用來強制目標處理器選擇thumb的指令集而不管處理器是否支持
l.thumb_func偽操作用來指明一個函數(shù)是thumb指令集的函數(shù)
l.thumb_set偽操作的作用類似于.set, 可以用來給一個標志起一個別名, 比.set功能增加的一點是可以把一個標志標記為thumb函數(shù)的入口, 這點功能等同于.thumb_func
l.ltorg用于聲明一個數(shù)據(jù)緩沖池(literal pool)的開始,它可以分配很大的空間。
l.pool的作用等同.ltorg
l.space
分配number_of_bytes字節(jié)的數(shù)據(jù)空間,并填充其值為fill_byte,若未指定該值,缺省填充0。(與armasm中的SPACE功能相同)
l.word
插入一個32-bit的數(shù)據(jù)隊列。(與armasm中的DCD功能相同)??梢允褂?word把標識符作為常量使用。
例:
Start:
valueOfStart:
.word Start
這樣程序的開頭Start便被存入了內存變量valueOfStart中。
l.hword
插入一個16-bit的數(shù)據(jù)隊列。(與armasm中的DCW相同)
8、GNU ARM匯編特殊字符和語法
<1>代碼行中的注釋符號:‘@’
<2>整行注釋符號: ‘#’
<3>語句分離符號: ‘;’
<4>立即數(shù)前綴: ‘#’ 或 ‘$’
評論