高性能32位移位寄存器單元的設(shè)計(jì)
這種結(jié)構(gòu)M位移位器所需的級(jí)數(shù)是log 2M每一級(jí)都由兩根信號(hào)線(shn和sh n#)控制數(shù)據(jù)的傳輸,數(shù)據(jù)在第i級(jí)要么移動(dòng)2 i位或者不移動(dòng)。 樹(shù)狀移位器如圖3所示。
這種結(jié)構(gòu)的優(yōu)點(diǎn)是:(1)晶體管數(shù)目少, n位移器所需晶體管數(shù)目為2×n×log n(傳輸門(mén)部分采用CMOS實(shí)現(xiàn)),版圖面積小于矩陣移位器;(2)控制信號(hào)shN~sh0本身就是二進(jìn)制表示,不需要額外的譯碼單元。缺點(diǎn)是:數(shù)據(jù)通路所需經(jīng)過(guò)的開(kāi)關(guān)管數(shù)目太多,M位移位器所需的級(jí)數(shù)是log 2M,因此導(dǎo)致延時(shí)太大。
3.2 矩陣-樹(shù)狀結(jié)構(gòu)移位器
由上面的分析我們可以看出,如果所設(shè)計(jì)的處理器為16位以下CPU,那其移位器不管采用上述哪種方案都能達(dá)到要求,但當(dāng)數(shù)據(jù)寬度到32位以上,從功耗,速度及版圖面積考慮以上方案的固有缺點(diǎn)就會(huì)顯得非常突出。在本設(shè)計(jì)中,移位寄存器的實(shí)際輸入為64位,為結(jié)合矩陣結(jié)構(gòu)的優(yōu)點(diǎn)(速度快、版圖規(guī)整)和樹(shù)狀結(jié)構(gòu)的優(yōu)點(diǎn)(晶體管數(shù)目少、譯碼簡(jiǎn)單),我們?cè)?a class="contentlabel" href="http://www.ex-cimer.com/news/listbylabel/label/設(shè)計(jì)">設(shè)計(jì)中采用矩陣-樹(shù)狀結(jié)構(gòu)整個(gè)移位寄存器的是由雙總線輸入,即輸入64位,表1中列舉了不同級(jí)別比例的矩陣-樹(shù)狀結(jié)構(gòu)所需晶體管數(shù)目(n1為tree的級(jí)數(shù),n2為matrix的控制線,n3為matrix中用的晶體管數(shù)目)。經(jīng)過(guò)綜合考慮,我們采用第2行的矩陣-樹(shù)狀級(jí)別比例,即矩陣部分最大能實(shí)現(xiàn)8位移位,樹(shù)狀部分最大能實(shí)現(xiàn)4位移位。
經(jīng)過(guò)各方面綜合考慮,我們所設(shè)計(jì)的移位寄存器的前級(jí)為矩陣結(jié)構(gòu)部分(輸入數(shù)據(jù)為64位,控制信號(hào)8位),由這一部分形成一36位的數(shù)據(jù)送入下一級(jí)樹(shù)狀結(jié)構(gòu)(輸入數(shù)據(jù)為36位,控制信號(hào)2位)部分再完成剩余的4位移位,形成32位輸出數(shù)據(jù)。結(jié)構(gòu)簡(jiǎn)圖如圖4所示。
在這個(gè)結(jié)構(gòu)中,后級(jí)的樹(shù)狀移位器最高實(shí)現(xiàn)3 位移位。輸入的2bit信號(hào)為2進(jìn)制碼,這兩位由移位計(jì)數(shù)器sh4~sh0直接將最低兩位送入(在后一節(jié)將介紹)。前級(jí)的矩陣結(jié)構(gòu)完成64位輸入36位輸出,我們?cè)O(shè)64位數(shù)據(jù)輸入由Abus,Bbus提供,如圖5所示。每一小格代表4位數(shù)據(jù)。這64位數(shù)據(jù)送入矩陣移位器后,根據(jù)計(jì)數(shù)器的高三位sh4~sh2 進(jìn)行譯碼對(duì)其進(jìn)行4,8,12,16,20,24,28,32中的一種移位(對(duì)應(yīng)8bits中的一位為高)。形成36位的數(shù)據(jù)輸出送入下級(jí)樹(shù)狀移位器以完成剩余位數(shù)的移位。36位數(shù)據(jù)輸出格式如圖6所示。其中COUNT表示總共移位數(shù)。
4 指令的預(yù)處理及移位類指令的實(shí)現(xiàn)
在我們?cè)O(shè)計(jì)的這片CPU中,需要對(duì)INTEL的 X86系列移位類指令進(jìn)行兼容。因此移位寄存器單元需要在周圍譯碼和鎖存單元的配合下,要能在一個(gè)指令節(jié)拍內(nèi)實(shí)現(xiàn)ROL,ROR,RCL,RCR, SHL,SHR,SAR,其中RCL,RCR實(shí)現(xiàn)了帶標(biāo)志位C的移位(指令說(shuō)明見(jiàn)文獻(xiàn)[4])。因此需由處理器的控制單元在每類移位指令移位之前進(jìn)行指令的預(yù)處理。
4.1 移位寄存器單元總體結(jié)構(gòu)
最終設(shè)計(jì)出的移位寄存器單元總體結(jié)構(gòu)如圖7 所示,其中其核心部分的矩陣-樹(shù)狀結(jié)構(gòu)的移位寄存器就是使用上一節(jié)所描述的結(jié)構(gòu)。記數(shù)器中的數(shù)據(jù)(sh4~sh0)在移位上一拍由Bbus寫(xiě)入,并進(jìn)行譯碼,其中低兩位(sh1,sh0)直接送樹(shù)狀結(jié)構(gòu)移位部分,高三位(sh4,sh3,sh2)經(jīng)過(guò)譯碼產(chǎn)生8位控制信號(hào)送入矩陣移位部分。Abus和Bbus輸入鎖存器能鎖存32位數(shù)據(jù)輸入,并根據(jù)不同指令的要求進(jìn)行操作,對(duì)指令進(jìn)行預(yù)處理。移位結(jié)果送ALU輸出鎖存器,并對(duì)CF寄存器進(jìn)行設(shè)置。
評(píng)論