一種高性能32位移位寄存器單元的設(shè)計
3.1.2 樹狀結(jié)構(gòu)(Tree Style)移位器
這種結(jié)構(gòu)M位移位器所需的級數(shù)是log 2M每一級都由兩根信號線(shn和sh n#)控制數(shù)據(jù)的傳輸,數(shù)據(jù)在第i級要么移動2 i位或者不移動。 樹狀移位器如圖3所示。
本文引用地址:http://www.ex-cimer.com/article/201612/324813.htm |
這種結(jié)構(gòu)的優(yōu)點是:(1)晶體管數(shù)目少, n位移器所需晶體管數(shù)目為2×n×log n(傳輸門部分采用CMOS實現(xiàn)),版圖面積小于矩陣移位器;(2)控制信號shN~sh0本身就是二進(jìn)制表示,不需要額外的譯碼單元。缺點是:數(shù)據(jù)通路所需經(jīng)過的開關(guān)管數(shù)目太多,M位移位器所需的級數(shù)是log 2M,因此導(dǎo)致延時太大。
3.2 矩陣-樹狀結(jié)構(gòu)移位器
由上面的分析我們可以看出,如果所設(shè)計的處理器為16位以下CPU,那其移位器不管采用上述哪種方案都能達(dá)到要求,但當(dāng)數(shù)據(jù)寬度到32位以上,從功耗,速度及版圖面積考慮以上方案的固有缺點就會顯得非常突出。在本設(shè)計中,移位寄存器的實際輸入為64位,為結(jié)合矩陣結(jié)構(gòu)的優(yōu)點(速度快、版圖規(guī)整)和樹狀結(jié)構(gòu)的優(yōu)點(晶體管數(shù)目少、譯碼簡單),我們在設(shè)計中采用矩陣-樹狀結(jié)構(gòu)整個移位寄存器的是由雙總線輸入,即輸入64位,表1中列舉了不同級別比例的矩陣-樹狀結(jié)構(gòu)所需晶體管數(shù)目(n1為tree的級數(shù),n2為matrix的控制線,n3為matrix中用的晶體管數(shù)目)。經(jīng)過綜合考慮,我們采用第2行的矩陣-樹狀級別比例,即矩陣部分最大能實現(xiàn)8位移位,樹狀部分最大能實現(xiàn)4位移位。
經(jīng)過各方面綜合考慮,我們所設(shè)計的移位寄存器的前級為矩陣結(jié)構(gòu)部分(輸入數(shù)據(jù)為64位,控制信號8位),由這一部分形成一36位的數(shù)據(jù)送入下一級樹狀結(jié)構(gòu)(輸入數(shù)據(jù)為36位,控制信號2位)部分再完成剩余的4位移位,形成32位輸出數(shù)據(jù)。結(jié)構(gòu)簡圖如圖4所示。
在這個結(jié)構(gòu)中,后級的樹狀移位器最高實現(xiàn)3 位移位。輸入的2bit信號為2進(jìn)制碼,這兩位由移位計數(shù)器sh4~sh0直接將最低兩位送入(在后一節(jié)將介紹)。前級的矩陣結(jié)構(gòu)完成64位輸入36位輸出,我們設(shè)64位數(shù)據(jù)輸入由Abus,Bbus提供,如圖5所示。每一小格代表4位數(shù)據(jù)。這64位數(shù)據(jù)送入矩陣移位器后,根據(jù)計數(shù)器的高三位sh4~sh2 進(jìn)行譯碼對其進(jìn)行4,8,12,16,20,24,28,32中的一種移位(對應(yīng)8bits中的一位為高)。形成36位的數(shù)據(jù)輸出送入下級樹狀移位器以完成剩余位數(shù)的移位。36位數(shù)據(jù)輸出格式如圖6所示。其中COUNT表示總共移位數(shù)。
4 指令的預(yù)處理及移位類指令的實現(xiàn)
在我們設(shè)計的這片CPU中,需要對INTEL的 X86系列移位類指令進(jìn)行兼容。因此移位寄存器單元需要在周圍譯碼和鎖存單元的配合下,要能在一個指令節(jié)拍內(nèi)實現(xiàn)ROL,ROR,RCL,RCR, SHL,SHR,SAR,其中RCL,RCR實現(xiàn)了帶標(biāo)志位C的移位(指令說明見文獻(xiàn)[4])。因此需由處理器的控制單元在每類移位指令移位之前進(jìn)行指令的預(yù)處理。
評論