<meter id="pryje"><nav id="pryje"><delect id="pryje"></delect></nav></meter>
          <label id="pryje"></label>

          新聞中心

          EEPW首頁 > 嵌入式系統(tǒng) > 設(shè)計應(yīng)用 > ARM核920T性能優(yōu)化之Cache

          ARM核920T性能優(yōu)化之Cache

          作者: 時間:2011-05-09 來源:網(wǎng)絡(luò) 收藏
          三.邏輯MMU與物理MMU

          本文引用地址:http://www.ex-cimer.com/article/150785.htm

            如果帶cache的處理器核支持虛擬存儲,那么cache就可以放在處理器內(nèi)核和存儲管理單元MMU之間或者MMU與物理存儲器之間。

            邏輯cache在虛擬地址空間存儲數(shù)據(jù),它位于處理器和MMU之間。處理器可以直接通過邏輯cache訪問數(shù)據(jù)而無需通過MMU。

            物理cache使用物理地址存儲數(shù)據(jù),它位于MMU和主存之間。當(dāng)處理器訪問存儲器時,MMU必須先把虛擬地址轉(zhuǎn)化為物理地址,cache存儲器才可向內(nèi)核提供數(shù)據(jù)。

            從arm7~arm10都是使用邏輯cache,arm11使用物理cache。

            

            四.的結(jié)構(gòu)

            

            帶有cache的內(nèi)核采用了2種總線結(jié)構(gòu):馮諾依曼結(jié)構(gòu)和哈佛結(jié)構(gòu)。在使用馮諾依曼結(jié)構(gòu)的處理器內(nèi)核中,只有一個數(shù)據(jù)和指令公用的cache,這種cache被稱作統(tǒng)一cache。哈佛結(jié)構(gòu)將指令總線和數(shù)據(jù)總線分離,存在指令cache(I-cache)和數(shù)據(jù)cache(D-cache),這種類型的cache被稱作分離cache。上邊的圖是統(tǒng)一cache,cache的兩個主要組成部分cache控制器和cache存儲器。存儲器是一個專用的存儲器陣列,其訪問單元稱為cache行。有3個主要的部分:目錄存儲段(directory store),狀態(tài)信息段(status information),數(shù)據(jù)項段(data section)。每一個cache行都由這3部分組成。Cache使用目錄存儲段來記錄每個cache行是由主存的什么地方拷貝而來。該目錄項被稱為“cache標(biāo)簽”。狀態(tài)位用來記錄狀態(tài)信息,2個常見的狀態(tài)位是有效位(valid bit)和臟位(dirty bit)。Cache存儲器必須存儲來自主存的信息,這些信息被放在數(shù)據(jù)項段里。

            五.Cache與主存的關(guān)系

            1)直接映射

            

            主存的每個地址都對應(yīng)著cache存儲器的唯一的一行。如圖,組索引(set index)可以確切的指出所有以0x824結(jié)尾的內(nèi)存地址在cache中所唯一對應(yīng)的存儲地址;數(shù)據(jù)索引域可以確定字,半字或者字節(jié)在該cache行中的位置;標(biāo)簽域用來與cache行中的cache-tag相比較。

            

            直接映射這種設(shè)計使每個主存塊在cache中只有一個特定的行可以存放,那么如果程序同時用到對應(yīng)于cache同一行的2個主存塊,那么就會發(fā)生沖突。沖突的結(jié)果就是導(dǎo)致cache行的頻繁置換。這就是直接映射cache的顛簸問題(Thrashing)。重復(fù)的cache失效導(dǎo)致cache控制器連續(xù)不斷的將當(dāng)前不用的過程置換出cache,這就是cache顛簸。

            2)組相聯(lián)

            

            為了減少cache的顛簸頻率,某些cache使用了其他設(shè)計。將cache分成一些容量相同的小單元,稱作路(way)。這里一個組索引對應(yīng)多個cache行,即在每一路里都有一個cache行與之對應(yīng),組索引相同的cache行被稱作處于同一個組(set)里,這也是組索引命令的由來。擁有相同組索引的cache行稱為組相聯(lián)的。在cache的同一個組當(dāng)中,數(shù)據(jù)放置的位置具有排他性,可以防止同樣的數(shù)據(jù)被重復(fù)放在一個組的不同的cache行。

            

            3)全聯(lián)

            隨著cache控制器的相聯(lián)度提高,沖突的可能性減小了。理想的目標(biāo)是,盡量提高組相聯(lián)程度,使主存地址能夠映射到任意cache行,這樣的cache被稱為全相聯(lián)cache。

            

            硬件設(shè)計者提高相聯(lián)度的一種方法就是使用內(nèi)容尋址存儲器CAM(Content Addressable Memory)。在處理器核中,使用了CAM來定位cache-tag。ARM中的cache是64路組相聯(lián)的。CAM使用一組比較器,以比較輸入的標(biāo)簽地址和存儲在每一個有效cache行中的cache-tag。CAM采用了與RAM相反的工作方式:RAM是得到一個地址后再給出數(shù)據(jù);而CAM則是在檢測到給定的數(shù)據(jù)值在存儲器中后,再給出該數(shù)據(jù)的地址。如圖是ARM940T的cache結(jié)構(gòu)圖。訪問地址的tag部分被作為4個CAM的輸入,輸入標(biāo)簽同時與存儲在64路中的所有cache標(biāo)簽相比較。如果有一個匹配,那么數(shù)據(jù)就由cache存儲器提供;如果沒有匹配,存儲器控制器就會產(chǎn)生一個失效(miss)信號。

          六.Cache策略

            Cache策略包括寫策略,替換策略及分配策略。

            1)寫策略

            寫策略包括直寫法(writethrough)和回寫法(writeback)。

            直寫法:

            如果cache控制器使用直寫策略,那么處理器核寫cache命中時,將同時修改cache和主存中的內(nèi)容,以確保cache和主存數(shù)據(jù)的一致性。

            回寫法:

            如果cache控制器使用回寫策略,那么處理器核寫cache命中時,只向cache存儲器寫數(shù)據(jù)而不立即寫入主存。配置成回寫法的cache要使用到cache行的狀態(tài)信息塊中的一個或多個臟位(dirty bit)。當(dāng)回寫cache控制器向cache存儲器中某一行寫入數(shù)據(jù)時,它會將臟位設(shè)置為1。如果cache控制器要將一個臟位被置位的cache行替換出cache存儲器,那么該cache行數(shù)據(jù)會自動被寫到主存單元中去。

            2)替換策略

            帶cache的ARM核支持兩種替換策略:偽隨機替換法和輪轉(zhuǎn)法。當(dāng)一個cache訪問失效時,cache控制器必須從當(dāng)前有效的組中選擇一個cache行來存儲從主存中取得的新信息。被選中的cache行被稱為丟棄者(victim)。如果丟棄者中包含有效的臟數(shù)據(jù),那么在該cache行被寫入新數(shù)據(jù)之前,控制器必須把該行的數(shù)據(jù)寫入到主存。選擇和替換丟棄cache行的過程被稱作淘汰(eviction)。

            3)分配策略

            在cache失效發(fā)生時,ARM的cache可以采取兩種策略來分配cache行:第一種叫做讀操作分配(read-allocate)策略;第二種叫做讀/寫操作分配(read-write-allocate)策略。如果cache未命中,那么對于讀操作分配策略,只有進行存儲器讀操作時,才分配cache行。如果被替換的cache行包含有效數(shù)據(jù),那么在該行被新的數(shù)據(jù)替換之前,要先把原來的內(nèi)容寫入主存中。

            采用讀/寫操作分配策略時,不管是存儲器讀操作,還是存儲器寫操作,在cache未命中時,都將分配cache行。

            七.清除(flush)和清理(clean)cache

            清除cache的意思是清除cache中存儲的全部數(shù)據(jù),對處理器而言,清除操作只要清零相應(yīng)cache的有效位即可。然而,對于采用回寫策略的D-cache,就需要使用清理(clean)操作。

            八.Cache鎖定

            Cache鎖定是將cache中的部分代碼和數(shù)據(jù)標(biāo)記為非替換(exempt of eviction)的。被鎖定的代碼和數(shù)據(jù)有更快的系統(tǒng)反應(yīng)能力,因為這些數(shù)據(jù)和代碼一直存放在cache中。Cache在正常操作時,經(jīng)常會涉及到行替換,這種替換會帶來代碼執(zhí)行時間不確定的問題,而cache鎖定會避免這種不確定性。ARM內(nèi)核為cache鎖定分配固定的cache單元。一般來講,分配cache鎖定的cache單元是一個路(way)。


          上一頁 1 2 下一頁

          關(guān)鍵詞: Cache 優(yōu)化 性能 920T ARM

          評論


          相關(guān)推薦

          技術(shù)專區(qū)

          關(guān)閉
          看屁屁www成人影院,亚洲人妻成人图片,亚洲精品成人午夜在线,日韩在线 欧美成人 (function(){ var bp = document.createElement('script'); var curProtocol = window.location.protocol.split(':')[0]; if (curProtocol === 'https') { bp.src = 'https://zz.bdstatic.com/linksubmit/push.js'; } else { bp.src = 'http://push.zhanzhang.baidu.com/push.js'; } var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(bp, s); })();