系統(tǒng)設(shè)計(jì)工程師不可不知的DRAM控制器核心結(jié)論(一)
DRAM控制器能否正常工作會(huì)使得系統(tǒng)有很大的不同,有的系統(tǒng)能夠滿足其設(shè)計(jì)要求,而有的系統(tǒng)則運(yùn)行緩慢,過(guò)熱,甚至失敗。不論哪種情況,最終是由系統(tǒng)設(shè)計(jì)團(tuán)隊(duì)承擔(dān)責(zé)任,他們一般很少掌握控制器的信息。
成功還是失敗都源自我們要求DRAM控制器所做的工作。模塊不僅僅是一個(gè)接口。在高級(jí)系統(tǒng)設(shè)計(jì)中,DRAM控制器必須很好的處理SoC體系結(jié)構(gòu)復(fù)雜而又難以預(yù)測(cè)的存儲(chǔ)器申請(qǐng),以及一側(cè)的系統(tǒng)軟件申請(qǐng),還有另一側(cè)DRAM芯片設(shè)計(jì)復(fù)雜的時(shí)序和約束要求。能否處理好這些關(guān)系會(huì)在多個(gè)方面影響DRAM吞吐量:這很容易在系統(tǒng)性能上體現(xiàn)出來(lái)。
為解釋這些問(wèn)題,以及系統(tǒng)設(shè)計(jì)人員能夠?qū)Υ俗鍪裁矗覀冃枰卮鹑齻€(gè)主要問(wèn)題。首先,我們應(yīng)檢查DRAM芯片提出的要求。然后,需要討論SoC體系結(jié)構(gòu)對(duì)存儲(chǔ)器訪問(wèn)模式的影響,第三,研究一個(gè)高級(jí)DRAM控制器的結(jié)構(gòu)和功能。通過(guò)這三部分,我們得出系統(tǒng)設(shè)計(jì)的一些結(jié)論。
DRAM需要什么
系統(tǒng)規(guī)劃對(duì)外部存儲(chǔ)器的要求是確定性隨機(jī)訪問(wèn):任何時(shí)候來(lái)自任何位置的任意字,具有固定延時(shí)。但是,確定性隨機(jī)訪問(wèn)恰恰是現(xiàn)代DDR3 DRAM所不能提供的。
相反,DRAM提供任何您需要的字,但是具有復(fù)雜的時(shí)序約束,因此,很難知道數(shù)據(jù)究竟什么時(shí)候出現(xiàn)。 圖1 中“簡(jiǎn)化的”狀態(tài)轉(zhuǎn)換圖簡(jiǎn)單解釋了為什么會(huì)這么復(fù)雜。這種復(fù)雜度也意味著,命令到達(dá)DRAM芯片的順序會(huì)對(duì)時(shí)序以及帶寬有很大的影響。要理解這一點(diǎn),我們需要深入了解DDR3 DRAM。
圖1.DDR DRAM芯片“簡(jiǎn)化的”狀態(tài)圖顯示了控制器設(shè)計(jì)人員所面臨的復(fù)雜問(wèn)題
DRAM芯片將數(shù)據(jù)存儲(chǔ)在電容陣列中。當(dāng)您讀寫(xiě)數(shù)據(jù)時(shí),您并不會(huì)直接訪問(wèn)陣列。而是在讀寫(xiě)之前,您激活陣列中的某一行。激活命令使得DRAM讀取該行中的所有列的所有比特,將其送入傳感放大器塊,它實(shí)際上用作該行的本地寄存器文件。然后,您可以對(duì)傳感放大器上的數(shù)據(jù)發(fā)出讀寫(xiě)命令。通過(guò)這種方式,能夠非常快的讀寫(xiě)已經(jīng)激活的行:一般是三到五個(gè)時(shí)鐘來(lái)開(kāi)始一次突發(fā)傳送,然后,在突發(fā)期間傳送每個(gè)字節(jié)需要一個(gè)時(shí)鐘。例如,這種時(shí)序安排使得DDR3 DRAM非常適合L2高速緩存數(shù)據(jù)交換。
但是,如果您不使用已經(jīng)激活的行,那么會(huì)非常復(fù)雜。改變行時(shí),即使是一個(gè)字節(jié),您也必須對(duì)當(dāng)前行去激活,然后激活一個(gè)新行。這一過(guò)程需要確定已經(jīng)在一段時(shí)間內(nèi)激活了當(dāng)前行。由于讀取DRAM單元是破壞性的,因此需要最小延時(shí):您激活了一行后,DRAM實(shí)際上是將最新到達(dá)傳感放大器上的數(shù)據(jù)復(fù)制回比特單元陣列中,然后刷新行。您可以在此期間讀寫(xiě)當(dāng)前行,但是,要確定在您改變行之前完成了這一過(guò)程。
即使?jié)M足了這一要求,也還有其他問(wèn)題。您必須對(duì)陣列預(yù)充電。預(yù)充電命令使得傳感放大器中的數(shù)據(jù)無(wú)效,提升陣列和傳感放大器輸入之間導(dǎo)線上的電壓,使得電壓值位于邏輯0和邏輯1電平之間。這種準(zhǔn)備是必要的,比特單元電容上很小的電荷都會(huì)傳送到導(dǎo)線上,以某種方式提示傳感放大器。
對(duì)導(dǎo)線進(jìn)行預(yù)充電之后,您必須向新行發(fā)送一個(gè)激活命令,等待操作完成,然后,您最終可以發(fā)送一個(gè)讀操作新命令。加上所有涉及到的延時(shí)后,即,讀取字節(jié)序列的最差情況,每一字節(jié)都來(lái)自不同的行,這要比讀取來(lái)自一個(gè)新行連續(xù)位置相同數(shù)量字節(jié)的時(shí)間慢十倍。
這種不同還只是部分問(wèn)題。如圖2 所示,DDR DRAM有多個(gè)塊:與比特單元無(wú)關(guān)的陣列。DDR3 DRAM中有八個(gè)塊,每一塊都有自己排列成行的傳感放大器。因此,原理上,您可以通過(guò)激活每一個(gè)塊中的一行,讀寫(xiě)較長(zhǎng)的突發(fā),然后,對(duì)每一激活后的行進(jìn)行讀寫(xiě)操作——實(shí)際上是對(duì)塊進(jìn)行間插操作。唯一增加的延時(shí)是連接每一塊的傳感放大器和芯片內(nèi)部總線的緩沖的切換時(shí)間。這一延時(shí)要比對(duì)相同塊中一個(gè)新行進(jìn)行預(yù)充電和激活的時(shí)間短得多。
圖2.一個(gè)典型的DDR DRAM結(jié)構(gòu)圖。一個(gè)DDR3器件會(huì)有8個(gè)塊,而不是4個(gè)
這就是原理。實(shí)際中,您可以對(duì)塊進(jìn)行間插處理,但是有一個(gè)限制,不是基于DRAM邏輯,而是芯片能夠承受的熱量。這種限制可以通過(guò)著名的“滾動(dòng)四塊訪問(wèn)窗口”,即,tRAW來(lái)表達(dá):您一次能夠有四個(gè)激活塊的最長(zhǎng)時(shí)間。這一規(guī)則實(shí)際上有例外,只要您從一個(gè)塊轉(zhuǎn)向下一塊之前,在一個(gè)塊上保持一定的時(shí)間,那么,您可以有連續(xù)激活的8個(gè)塊。但是您應(yīng)該知道:這比較復(fù)雜。
評(píng)論