<meter id="pryje"><nav id="pryje"><delect id="pryje"></delect></nav></meter>

<label id="pryje"></label>

新聞中心

EEPW首頁(yè) > 嵌入式系統(tǒng) > 設(shè)計(jì)應(yīng)用 > ARM核920T性能優(yōu)化之Cache

ARM核920T性能優(yōu)化之Cache

作者：時(shí)間：2011-05-09 來(lái)源：網(wǎng)絡(luò)

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對(duì)面交流
  海量資料庫(kù)查詢

收藏

三.邏輯MMU與物理MMU

本文引用地址：http://www.ex-cimer.com/article/150785.htm

　　如果帶cache的處理器核支持虛擬存儲(chǔ)，那么cache就可以放在處理器內(nèi)核和存儲(chǔ)管理單元MMU之間或者M(jìn)MU與物理存儲(chǔ)器之間。

　　邏輯cache在虛擬地址空間存儲(chǔ)數(shù)據(jù)，它位于處理器和MMU之間。處理器可以直接通過(guò)邏輯cache訪問(wèn)數(shù)據(jù)而無(wú)需通過(guò)MMU。

　　物理cache使用物理地址存儲(chǔ)數(shù)據(jù)，它位于MMU和主存之間。當(dāng)處理器訪問(wèn)存儲(chǔ)器時(shí)，MMU必須先把虛擬地址轉(zhuǎn)化為物理地址，cache存儲(chǔ)器才可向內(nèi)核提供數(shù)據(jù)。

　　從arm7～arm10都是使用邏輯cache，arm11使用物理cache。

　　

　　四.Cache的結(jié)構(gòu)

　　

　　帶有cache的ARM內(nèi)核采用了2種總線結(jié)構(gòu)：馮諾依曼結(jié)構(gòu)和哈佛結(jié)構(gòu)。在使用馮諾依曼結(jié)構(gòu)的處理器內(nèi)核中，只有一個(gè)數(shù)據(jù)和指令公用的cache，這種cache被稱作統(tǒng)一cache。哈佛結(jié)構(gòu)將指令總線和數(shù)據(jù)總線分離，存在指令cache(I-cache)和數(shù)據(jù)cache(D-cache)，這種類型的cache被稱作分離cache。上邊的圖是統(tǒng)一cache，cache的兩個(gè)主要組成部分cache控制器和cache存儲(chǔ)器。Cache存儲(chǔ)器是一個(gè)專用的存儲(chǔ)器陣列，其訪問(wèn)單元稱為cache行。Cache有3個(gè)主要的部分：目錄存儲(chǔ)段(directory store)，狀態(tài)信息段(status information)，數(shù)據(jù)項(xiàng)段(data section)。每一個(gè)cache行都由這3部分組成。Cache使用目錄存儲(chǔ)段來(lái)記錄每個(gè)cache行是由主存的什么地方拷貝而來(lái)。該目錄項(xiàng)被稱為“cache標(biāo)簽”。狀態(tài)位用來(lái)記錄狀態(tài)信息，2個(gè)常見(jiàn)的狀態(tài)位是有效位(valid bit)和臟位(dirty bit)。Cache存儲(chǔ)器必須存儲(chǔ)來(lái)自主存的信息，這些信息被放在數(shù)據(jù)項(xiàng)段里。

　　五.Cache與主存的關(guān)系

　　1)直接映射

　　

　　主存的每個(gè)地址都對(duì)應(yīng)著cache存儲(chǔ)器的唯一的一行。如圖，組索引(set index)可以確切的指出所有以0x824結(jié)尾的內(nèi)存地址在cache中所唯一對(duì)應(yīng)的存儲(chǔ)地址;數(shù)據(jù)索引域可以確定字，半字或者字節(jié)在該cache行中的位置;標(biāo)簽域用來(lái)與cache行中的cache-tag相比較。

　　

　　直接映射這種設(shè)計(jì)使每個(gè)主存塊在cache中只有一個(gè)特定的行可以存放，那么如果程序同時(shí)用到對(duì)應(yīng)于cache同一行的2個(gè)主存塊，那么就會(huì)發(fā)生沖突。沖突的結(jié)果就是導(dǎo)致cache行的頻繁置換。這就是直接映射cache的顛簸問(wèn)題(Thrashing)。重復(fù)的cache失效導(dǎo)致cache控制器連續(xù)不斷的將當(dāng)前不用的過(guò)程置換出cache，這就是cache顛簸。

　　2)組相聯(lián)

　　

　　為了減少cache的顛簸頻率，某些cache使用了其他設(shè)計(jì)。將cache分成一些容量相同的小單元，稱作路(way)。這里一個(gè)組索引對(duì)應(yīng)多個(gè)cache行，即在每一路里都有一個(gè)cache行與之對(duì)應(yīng)，組索引相同的cache行被稱作處于同一個(gè)組(set)里，這也是組索引命令的由來(lái)。擁有相同組索引的cache行稱為組相聯(lián)的。在cache的同一個(gè)組當(dāng)中，數(shù)據(jù)放置的位置具有排他性，可以防止同樣的數(shù)據(jù)被重復(fù)放在一個(gè)組的不同的cache行。

　　

　　3)全聯(lián)

　　隨著cache控制器的相聯(lián)度提高，沖突的可能性減小了。理想的目標(biāo)是，盡量提高組相聯(lián)程度，使主存地址能夠映射到任意cache行，這樣的cache被稱為全相聯(lián)cache。

　　

　　硬件設(shè)計(jì)者提高相聯(lián)度的一種方法就是使用內(nèi)容尋址存儲(chǔ)器CAM(Content Addressable Memory)。在ARM920T處理器核中，ARM使用了CAM來(lái)定位cache-tag。ARM920T中的cache是64路組相聯(lián)的。CAM使用一組比較器，以比較輸入的標(biāo)簽地址和存儲(chǔ)在每一個(gè)有效cache行中的cache-tag。CAM采用了與RAM相反的工作方式：RAM是得到一個(gè)地址后再給出數(shù)據(jù);而CAM則是在檢測(cè)到給定的數(shù)據(jù)值在存儲(chǔ)器中后，再給出該數(shù)據(jù)的地址。如圖是ARM940T的cache結(jié)構(gòu)圖。訪問(wèn)地址的tag部分被作為4個(gè)CAM的輸入，輸入標(biāo)簽同時(shí)與存儲(chǔ)在64路中的所有cache標(biāo)簽相比較。如果有一個(gè)匹配，那么數(shù)據(jù)就由cache存儲(chǔ)器提供;如果沒(méi)有匹配，存儲(chǔ)器控制器就會(huì)產(chǎn)生一個(gè)失效(miss)信號(hào)。

六.Cache策略

　　Cache策略包括寫(xiě)策略，替換策略及分配策略。

　　1)寫(xiě)策略

　　寫(xiě)策略包括直寫(xiě)法(writethrough)和回寫(xiě)法(writeback)。

　　直寫(xiě)法：

　　如果cache控制器使用直寫(xiě)策略，那么處理器核寫(xiě)cache命中時(shí)，將同時(shí)修改cache和主存中的內(nèi)容，以確保cache和主存數(shù)據(jù)的一致性。

　　回寫(xiě)法：

　　如果cache控制器使用回寫(xiě)策略，那么處理器核寫(xiě)cache命中時(shí)，只向cache存儲(chǔ)器寫(xiě)數(shù)據(jù)而不立即寫(xiě)入主存。配置成回寫(xiě)法的cache要使用到cache行的狀態(tài)信息塊中的一個(gè)或多個(gè)臟位(dirty bit)。當(dāng)回寫(xiě)cache控制器向cache存儲(chǔ)器中某一行寫(xiě)入數(shù)據(jù)時(shí)，它會(huì)將臟位設(shè)置為1。如果cache控制器要將一個(gè)臟位被置位的cache行替換出cache存儲(chǔ)器，那么該cache行數(shù)據(jù)會(huì)自動(dòng)被寫(xiě)到主存單元中去。

　　2)替換策略

　　帶cache的ARM核支持兩種替換策略：偽隨機(jī)替換法和輪轉(zhuǎn)法。當(dāng)一個(gè)cache訪問(wèn)失效時(shí)，cache控制器必須從當(dāng)前有效的組中選擇一個(gè)cache行來(lái)存儲(chǔ)從主存中取得的新信息。被選中的cache行被稱為丟棄者(victim)。如果丟棄者中包含有效的臟數(shù)據(jù)，那么在該cache行被寫(xiě)入新數(shù)據(jù)之前，控制器必須把該行的數(shù)據(jù)寫(xiě)入到主存。選擇和替換丟棄cache行的過(guò)程被稱作淘汰(eviction)。

　　3)分配策略

　　在cache失效發(fā)生時(shí)，ARM的cache可以采取兩種策略來(lái)分配cache行：第一種叫做讀操作分配(read-allocate)策略;第二種叫做讀/寫(xiě)操作分配(read-write-allocate)策略。如果cache未命中，那么對(duì)于讀操作分配策略，只有進(jìn)行存儲(chǔ)器讀操作時(shí),才分配cache行。如果被替換的cache行包含有效數(shù)據(jù)，那么在該行被新的數(shù)據(jù)替換之前，要先把原來(lái)的內(nèi)容寫(xiě)入主存中。

　　采用讀/寫(xiě)操作分配策略時(shí)，不管是存儲(chǔ)器讀操作，還是存儲(chǔ)器寫(xiě)操作，在cache未命中時(shí)，都將分配cache行。

　　七.清除(flush)和清理(clean)cache

　　清除cache的意思是清除cache中存儲(chǔ)的全部數(shù)據(jù)，對(duì)處理器而言，清除操作只要清零相應(yīng)cache的有效位即可。然而，對(duì)于采用回寫(xiě)策略的D-cache，就需要使用清理(clean)操作。

　　八.Cache鎖定

　　Cache鎖定是將cache中的部分代碼和數(shù)據(jù)標(biāo)記為非替換(exempt of eviction)的。被鎖定的代碼和數(shù)據(jù)有更快的系統(tǒng)反應(yīng)能力，因?yàn)檫@些數(shù)據(jù)和代碼一直存放在cache中。Cache在正常操作時(shí)，經(jīng)常會(huì)涉及到行替換，這種替換會(huì)帶來(lái)代碼執(zhí)行時(shí)間不確定的問(wèn)題，而cache鎖定會(huì)避免這種不確定性。ARM內(nèi)核為cache鎖定分配固定的cache單元。一般來(lái)講，分配cache鎖定的cache單元是一個(gè)路(way)。

上一頁(yè) 1 2 下一頁(yè)

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

關(guān)鍵詞： Cache 優(yōu)化 性能 920T ARM

評(píng)論

相關(guān)推薦

Windows on Arm 繼續(xù)存在高通拯救了Microsoft

消費(fèi)電子 Windows on Arm 高通 Microsoft Copilot Plus | 2024-07-11

性能優(yōu)異的雙聲道重低音電路

設(shè)計(jì)方案性能優(yōu)異聲道低音 | 2009-07-06

ARM開(kāi)發(fā)詳解

資源下載 ARM 開(kāi)發(fā)資料 ADS仿真 | 2007-12-02

Arm 攜手三星，共同開(kāi)拓新一代通信技術(shù)

手機(jī)與無(wú)線通信 Arm 通信技術(shù) | 2024-07-17

Arm 旗下熱門開(kāi)源嵌入式操作系統(tǒng) Mbed OS 將于 2026 年 7 月結(jié)束官方維護(hù)

嵌入式系統(tǒng) Arm Mbed OS 操作系統(tǒng) | 2024-07-17

英偉達(dá)H20現(xiàn)身基準(zhǔn)測(cè)試：內(nèi)核數(shù)量相比H100減少41%，性能降低28%

智能計(jì)算英偉達(dá) H20 基準(zhǔn)測(cè)試內(nèi)核性能 | 2024-07-10

本站成立e-ARM開(kāi)發(fā)工作室！

Gao | 2002-06-26

WinCE+ARM開(kāi)發(fā)及關(guān)鍵技術(shù) 上

視頻嵌入式 ARM WinCE | 2009-10-22

簡(jiǎn)約之美：移動(dòng)端渲染技術(shù)創(chuàng)新 NanoMesh

手機(jī)與無(wú)線通信 Arm NanoMesh | 2024-07-17

我國(guó)無(wú)線網(wǎng)絡(luò)規(guī)劃、優(yōu)化和管理的現(xiàn)狀與發(fā)展

hpnet | 2002-05-17

MIC2951構(gòu)成的具有電性能狀態(tài)指示器的穩(wěn)壓器電路

設(shè)計(jì)方案 MIC2951 構(gòu)成具有性能狀態(tài) 指示器穩(wěn)壓器電路 | 2009-07-06

網(wǎng)絡(luò)維護(hù)幾種優(yōu)化工具

hpnet | 2002-05-17

C64+ 系列DSP上Cache 的應(yīng)用（第二部分）

視頻 TI DSP C64+ Cache | 2009-10-16

WinCE+ARM開(kāi)發(fā)及關(guān)鍵技術(shù) 下

視頻嵌入式 ARM WinCE | 2009-10-22

大咖觀點(diǎn) | AI 大模型邁向多模態(tài)，助力具身智能與機(jī)器人實(shí)現(xiàn)創(chuàng)新

Arm AI 機(jī)器人 | 2024-07-17

安捷倫(Agilent)科技公司的網(wǎng)絡(luò)優(yōu)化測(cè)試儀

hpnet | 2002-05-17

ARM嵌入式系統(tǒng)開(kāi)發(fā)

資源下載 ARM ARM 嵌入式系統(tǒng)開(kāi)發(fā) | 2007-12-03

arm學(xué)習(xí)資料

資源下載 ARM 基礎(chǔ) 編程調(diào)試開(kāi)發(fā) ARM7 | 2007-12-03

Arm 驅(qū)動(dòng)汽車行業(yè)芯粒開(kāi)發(fā)與部署

汽車電子 Arm | 2024-07-09

ARM嵌入式系統(tǒng)開(kāi)發(fā)：軟件設(shè)計(jì)與優(yōu)化

資源下載 ARM 軟件設(shè)計(jì)優(yōu)化 ARM處理器 | 2007-12-03

加速基于 Arm Neoverse N2 的大語(yǔ)言模型推理

智能計(jì)算 Arm Neoverse 大語(yǔ)言模型 | 2024-07-09

ARM嵌入式軟件編程經(jīng)驗(yàn)談

資源下載 ARM 編程經(jīng)驗(yàn) ARM嵌入式軟件 | 2007-11-29

關(guān)于cache的初始化問(wèn)題？

jackwang | 2002-05-15

ARM 展示小型低功耗上網(wǎng)本樣品

視頻 ARM netbook | 2009-03-16

性能可靠的電子變壓器

設(shè)計(jì)方案性能靠的電子變壓器 | 2009-07-06

Arm 推出精銳超級(jí)分辨率技術(shù)

消費(fèi)電子 Arm 超級(jí)分辨率 | 2024-07-17

一款性能極佳的JFET-MOSFET耳機(jī)功放

設(shè)計(jì)方案一款性能極佳 JFET-MOSFET 耳機(jī) 功放 | 2009-07-06

TOPSwitch―Ⅱ的性能特點(diǎn)

設(shè)計(jì)方案 TOPSwitch 性能特點(diǎn) | 2009-07-06

C64+ 系列DSP上Cache 的應(yīng)用（第一部分）

視頻 TI DSP C64+ Cache | 2009-10-16

借助小語(yǔ)言模型，高效 Arm 計(jì)算賦能定制化 AI 未來(lái)

智能計(jì)算 Arm | 2024-07-09

焦點(diǎn)

推薦視頻

技術(shù)專區(qū)

看屁屁www成人影院,亚洲人妻成人图片,亚洲精品成人午夜在线,日韩在线欧美成人 (function(){ var bp = document.createElement('script'); var curProtocol = window.location.protocol.split(':')[0]; if (curProtocol === 'https') { bp.src = 'https://zz.bdstatic.com/linksubmit/push.js'; } else { bp.src = 'http://push.zhanzhang.baidu.com/push.js'; } var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(bp, s); })();