通過(guò)FLIX指令結(jié)構(gòu)提高可配置處理器計(jì)算性能
解決長(zhǎng)指令字體系結(jié)構(gòu)代碼膨脹的一種有效方法是采用更加靈活的指令長(zhǎng)度。如果處理器允許多種不同的指令長(zhǎng)度,包括各種對(duì)單一操作進(jìn)行編碼的短指令,那么與傳統(tǒng)長(zhǎng)指令字VLIW處理器相比,編譯器就可以獲得更加有效的指令代碼大小和更加有效的指令存儲(chǔ)效率。對(duì)長(zhǎng)指令字處理器而言,減少代碼大小還意味著減少所要求的總線帶寬,并且減少了與取指令相關(guān)的功耗。例如,Tensilica的 Xtensa LX處理器采用了靈活的指令擴(kuò)展技術(shù)(FLIX)。該體系結(jié)構(gòu)的指令代碼尋址可以提供16位、24位和選擇一種32位或者64位的指令長(zhǎng)度。設(shè)計(jì)人員定義的指令可以使用24位、32位和64位的指令格式。
長(zhǎng)指令允許用戶更加自由地進(jìn)行編碼。在這種情況下,用戶可以根據(jù)每個(gè)指令槽指令操作的多少來(lái)定義(雖然在通常情況下有3到6個(gè)獨(dú)立的指令操作槽)大量的子指令和操作。各個(gè)指令槽的大小不需要相等。大的指令槽(20到30位)可以放置各種不同的操作碼、寄存器個(gè)數(shù)相對(duì)多的寄存器文件(16 到32個(gè)寄存器)以及3個(gè)或者4個(gè)寄存器操作數(shù)標(biāo)志符。系統(tǒng)開發(fā)人員應(yīng)當(dāng)考慮到建立具有大指令槽的處理器,這種大指令槽針對(duì)應(yīng)用,具有適度的并行性,但是在應(yīng)用領(lǐng)域內(nèi)應(yīng)當(dāng)具有較強(qiáng)的靈活性和一般性。
小的指令槽(8~16位)讓用戶可以直接說(shuō)明小寄存器集之間數(shù)據(jù)的移動(dòng),并且允許用戶將大量的獨(dú)立指令槽打包成一個(gè)長(zhǎng)指令字。每一個(gè)指令槽提供更有限的操作范圍、更少的操作標(biāo)志符(或更多隱含的操作數(shù))及使用更少寄存器的文件。開發(fā)人員應(yīng)當(dāng)考慮根據(jù)不同應(yīng)用建立許多小的指令槽,這些應(yīng)用在許多專用功能部件之間具有高度的并行性。
長(zhǎng)指令字和自動(dòng)處理器生成
長(zhǎng)指令字非常適合處理器硬件和軟件的自動(dòng)生成。高級(jí)指令描述可以說(shuō)明適合每個(gè)指令槽的子指令集。從這些指令描述中,處理器產(chǎn)生器確定每個(gè)指令槽中每個(gè)編碼域的編碼要求、分配操作碼并建立針對(duì)所有必需的指令格式的指令譯碼硬件。而且處理器產(chǎn)生器還建立與長(zhǎng)指令字處理器相應(yīng)的編譯器和匯編器。對(duì)于長(zhǎng)指令字體系結(jié)構(gòu)而言,將子指令打包成長(zhǎng)指令是一項(xiàng)非常復(fù)雜的任務(wù)。匯編器可以處理這種指令包,因此程序員寫的匯編語(yǔ)言源代碼程序只需要指定不同操作或者子指令,不必過(guò)分關(guān)注打包的約束。編譯器在滿足系統(tǒng)具有最大性能和最小代碼容量的前提下產(chǎn)生適合指令槽的程序代碼,因此通常需要自己將各類操作打包成長(zhǎng)指令。
圖4表示用FLIX技術(shù)中的TIE語(yǔ)言描述的一個(gè)簡(jiǎn)短且完整的長(zhǎng)指令字處理器。該處理器完全建立在32位的整數(shù)操作的基礎(chǔ)上,并沒(méi)有定義新的操作。此描述建立了一個(gè)具有高度潛在指令級(jí)并行性的處理器,其應(yīng)用完全用標(biāo)準(zhǔn)C整數(shù)操作和數(shù)據(jù)類型寫成。三個(gè)指令槽中的第一個(gè)指令槽支持全部常用的整數(shù)操作,包括ALU操作、加載、存儲(chǔ)、跳轉(zhuǎn)和分支指令操作。第二個(gè)指令槽提供加載和存儲(chǔ)操作,另外還包括大多數(shù)常用的ALU操作。第三個(gè)指令槽補(bǔ)充全部 ALU操作,但是不包括加載和存儲(chǔ)操作。
圖3中的第一行說(shuō)明了一個(gè)新的64位指令長(zhǎng)度,并指定了確定指令長(zhǎng)度的前4位編碼。第二行說(shuō)明了指令長(zhǎng)度格式為format1,它包括 3個(gè)指令槽,分別為base_slot、ldst_slot和alu_slot,并且在新指令格式中對(duì)這三個(gè)指令槽進(jìn)行了命名。第四行列出了第一個(gè)指令槽 base_slot所有可能包含的TIE指令。在這種情況下,所有在Xtensa LX處理器中的指令(除了新指令)都可能包含在這個(gè)指令槽中。處理器產(chǎn)生器還為每個(gè)指令槽產(chǎn)生一個(gè)空操作NOP,因此軟件工具總是可以產(chǎn)生完整的指令,即使找不到可以封裝到長(zhǎng)指令字中的合適操作。第四行和第五行指定可以包含在其它兩個(gè)指令槽中的指令子集.
評(píng)論