微控制器的開發(fā)方案
微控制器開發(fā)團(tuán)隊(duì)與編譯器開發(fā)人員的合作成果是生成的代碼效率更高,性能更好。本文介紹的是為了使ATMEL AVR微控制器系列更適合C編譯器,開發(fā)者在編譯器開發(fā)階段對微控制器架構(gòu)和指令集所進(jìn)行的調(diào)整。
本文引用地址:http://www.ex-cimer.com/article/173343.htmAVR架構(gòu)的核心是一個(gè)可快速訪問RISC寄存器文件。該文件由32個(gè)8位通用寄存器構(gòu)成。微控制器可在一個(gè)單時(shí)鐘周期內(nèi)加載該文件中的任意兩個(gè)寄存器到算術(shù)邏輯單元(Arithmetic Logical Unit, ALU),完成所要求的操作,將結(jié)果寫回到任意一個(gè)寄存器。ALU支持寄存器間或某一寄存器與一個(gè)常數(shù)之間的運(yùn)算和邏輯功能,單寄存器操作也是在ALU中執(zhí)行的。微控制器使用一個(gè)哈佛(Harvard)架構(gòu),在該架構(gòu)中,程序存儲器空間與數(shù)據(jù)存儲器空間是相互隔離的。程序存儲器采用單級管道訪問技術(shù),當(dāng)一條指令被執(zhí)行的同時(shí),下一條指令已從程序存儲器中被預(yù)先提取。由于其算術(shù)和邏輯操作都真正地在單周期內(nèi)完成,因此AVR微控制器的性能達(dá)到每MHz一個(gè)MIPS。
圖1 AVR 架構(gòu)
細(xì)調(diào)微控制器
采用高級語言(High Level Languange, HLL)代替匯編語言來開發(fā)微控制器應(yīng)用程序有許多優(yōu)勢,但一直都有一個(gè)重大缺點(diǎn),即代碼量不斷增加。我們在開發(fā)AVR微控制器時(shí)考慮了使用C語言來開發(fā)應(yīng)用,使得我們有可能為器件構(gòu)建出一個(gè)高效C編譯器。為了進(jìn)一步提升這項(xiàng)特性,我們在AVR的架構(gòu)和指令集未完成前就開始著手C編譯器的開發(fā)。我們先讓瑞典 IAR Systems的編譯器專業(yè)開發(fā)人員對我們的AVR架構(gòu)和指令集進(jìn)行評測,最后開發(fā)出非常適合運(yùn)行C編譯器生成代碼的微控制器。
尋址模式
為讓編譯器生成高效的代碼,重要的是讓尋址模式匹配C語言的需要。AVR架構(gòu)原來配了兩個(gè)指針寄存器(Pointer Register)。這兩個(gè)指針可用于間接尋址、算后增量(post increment)間接尋址、算前減量(pre-decrement)間接尋址,以及帶位移(displacement)的間接尋址,能夠很好地支持指針操作。此外,還有一個(gè)用于訪問數(shù)據(jù)存儲器中變量的頁面直接尋址模式。
指針位移
帶位移的間接尋址是一種非常有用的尋址模式,即使從C編譯器的角度亦如此。例如,將指針指向某一結(jié)構(gòu)(struct)的第一個(gè)成員,就可以訪問該結(jié)構(gòu)內(nèi)位移量所允許的其他任何位置,無須變更16位指針。帶位移的間接尋址模式也常常用于訪問軟件堆棧上的變量。函數(shù)參數(shù)和autos常常放在軟件堆棧上,這樣,不用變更指針就可進(jìn)行讀寫操作。位移尋址在定位數(shù)組成員(addressing elements in an array)時(shí)也非常有用。
盡管位移模式在許多情況下非常有用,但仍存在一個(gè)位移受限的問題。位移原本被限制在16個(gè)位置以內(nèi),而實(shí)際應(yīng)用往往超出該數(shù)量。這樣,在位移模式無法訪問的位置,就必須加載一個(gè)新的指針。為擴(kuò)展位移模式的訪問范圍,我們不得不改變指令集的其他部分,以獲得足夠的編碼空間。同時(shí),我們還得知,C編譯器很難使用頁面直接尋址模式。于是,取消了頁面直接尋址模式,使用騰出的空間將位移模式擴(kuò)展為64個(gè)位置,足以滿足大多數(shù)間接尋址的要求。原來的頁面直接尋址模式變成一個(gè)兩個(gè)字長的非頁面直接尋址模式。
存儲器指針數(shù)
AVR微控制器原來配置了兩個(gè)16位存儲器指針。如要采用C編譯器,那么其中一個(gè)指針必須專門用作軟件堆棧,這樣,就只剩一個(gè)存儲器指針。在許多情況下,需要將存儲器從一個(gè)區(qū)域復(fù)制到另一個(gè)區(qū)域。但由于只有一個(gè)指針,需要讀1字節(jié),設(shè)置指針,確定寫入目標(biāo)位置,寫入這字節(jié),然后再將指針設(shè)回?cái)?shù)據(jù)源位置。如果增加第三個(gè)存儲器指針(精簡功能),完成存儲器區(qū)域復(fù)制就不需要設(shè)置指針。如下例所示,只要使用算后增量間接尋址模式就可構(gòu)建非常高效的存儲器讀寫循環(huán)(假設(shè):將指針Z指向源的第一字節(jié),X指向目標(biāo)的第一字節(jié)):
LDI R16,0x60 ;Load byte count
loop: LD R17,Z+ ;Load byte,
increment pointer
ST X+,R17 ;Store
byte, increment pointer
SUBI R16,1;Decrement
counter
BRNE loop; Branch
if more bytes
具備指針?biāo)愫笤隽?post increment)、算前減量(pre-decrement) (+1、-1)操作的可能性對于實(shí)現(xiàn)堆棧也非常有效。這當(dāng)然也可用于軟件運(yùn)行時(shí)間堆棧。
直接尋址
如在指針位移一節(jié)所述, AVR原來有一個(gè)頁面直接尋址模式,但是,對于編譯器該模式難于使用,且效率較低。由于我們需要更多的編碼空間來增加位移量,因此取消了頁面直接尋址模式。不過,如果完全沒有直接尋址模式,代碼效率也會降低,因?yàn)樵谟行┣闆r下需要訪問存放在數(shù)據(jù)存儲器中的變量。尤其是處理靜態(tài)字符時(shí),代碼開銷將會很大(達(dá)到50%),因?yàn)殪o態(tài)變量必須保存在數(shù)據(jù)存儲器中,不能自動放置到寄存器中。為了克服代碼效率低下的問題,我們占用一個(gè)16位地址來增加一些非頁面直接尋址指令。這樣,就可用一條指令來完成64KB數(shù)據(jù)空間的尋址。要訪問如此大的一個(gè)存儲器區(qū)域,訪問指令必須是兩個(gè)16位字。
如果訪問的字節(jié)數(shù)少(例如讀取一個(gè)字符),使用這種尋址方式的效率高于指針方式。對于較大的區(qū)域,可能仍然是使用間接尋址比較有效(參見下面的示例)。
Loading of a character:
Indirect addressing (6 Bytes): Direct addressing (4 Bytes):
LDI R30,LOW(CHARVAR) LDS R16,CHARVAR
LDI R31,HIGH(CHARVAR)
LD R16, Z
Loading of a long integer:
Indirect addressing (12 Bytes) Direct addressing (16 Bytes)
LDI R30,LOW(LONGVAR) LDS R0,LONGVAR
LDI R31,HIGH(LONGVAR) LDS R1,LONGVAR+1
LDD R0,Z LDS R2,LONGVAR+2
LDD R1,Z+1 LDS R3,LONGVAR+3
LDD R2,Z+2
LDD R3,Z+3
零標(biāo)志傳播
為實(shí)現(xiàn)條件轉(zhuǎn)移,需要使用一些指令來操作由一些標(biāo)志(flag)構(gòu)成的AVR狀態(tài)寄存器。跟在這類指令之后的條件轉(zhuǎn)移指令(conditional branch instruction)是否執(zhí)行轉(zhuǎn)移,取決于這些標(biāo)志的設(shè)置。使用運(yùn)算指令操作這些標(biāo)志,就可檢查一個(gè)數(shù)A與另一個(gè)數(shù)B之間的大小關(guān)系。當(dāng)被檢查的數(shù)為8位的數(shù)時(shí),不存在什么問題,因?yàn)樗袠?biāo)志都依賴一條指令設(shè)置的標(biāo)志值。當(dāng)被檢查的數(shù)為16位或32位的數(shù)時(shí)(這在C語言中是常有的情況),問題就有點(diǎn)棘手了,例如一個(gè)32位減法操作就相當(dāng)于要連續(xù)進(jìn)行4個(gè)8位減法操作,而每做一次8位減法,就會產(chǎn)生一組新的標(biāo)志。
為傳播進(jìn)位標(biāo)志,大多數(shù)處理器都包含一些能處理進(jìn)位標(biāo)志先前設(shè)置值的指令。例如,帶進(jìn)位的減法(SBC)指令;執(zhí)行SBC A,B語句就相當(dāng)于將A變成進(jìn)位位。但要正確完成所有的條件轉(zhuǎn)移操作,這里還有另一個(gè)標(biāo)志需要傳播,即零標(biāo)志。
示例:
A=R3:R2:R1:R0,
B=R7:R6:R5:R4
我們打算從A中減去B,并如果A=B就跳轉(zhuǎn)到一個(gè)指定位置。如果這個(gè)零標(biāo)志只依賴于最后的運(yùn)算指令,那么下面的指令將不會執(zhí)行:
SUB R0,R4
SBC R1,R5
SBC R2,R6
SBC R3,R7 ; R3=R7
=> Zero flag set
BREQ destination
這是因?yàn)锽REQ指令使用的標(biāo)志值只取決于最后的SBC指令設(shè)置的標(biāo)志值。如果大多數(shù)高位直接相等,即便32位數(shù)不相等,零標(biāo)志也將被置位,而轉(zhuǎn)移也會被執(zhí)行。這種問題也會出現(xiàn)在其他的條件轉(zhuǎn)移上。
有兩種辦法可以解決這個(gè)問題。一是保存每個(gè)指令產(chǎn)生的標(biāo)志,然后在第四個(gè)減法完成后檢查所有的零標(biāo)志。另一個(gè)更精細(xì)的方法是在進(jìn)位指令中傳播零標(biāo)志(參見下面方式):
Znew =Not(R7) AND
Not(R6) AND
...
Not(R0) AND
Zold
使用這種方式傳播零標(biāo)志,所有條件轉(zhuǎn)移在最后一個(gè)減法操作完成后都會被執(zhí)行,因?yàn)閰⑴c標(biāo)志(溢出和正數(shù)標(biāo)志)所剩部分只取決于最高位字節(jié)。
評論