<meter id="pryje"><nav id="pryje"><delect id="pryje"></delect></nav></meter>

<label id="pryje"></label>

新聞中心

EEPW首頁 > 嵌入式系統(tǒng) > 設(shè)計(jì)應(yīng)用 > TMS320C6678存儲(chǔ)器訪問性能（上）

TMS320C6678存儲(chǔ)器訪問性能（上）

—— TMS320C6678存儲(chǔ)器訪問性能

作者：時(shí)間：2015-06-27 來源：網(wǎng)絡(luò)

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對(duì)面交流
  海量資料庫查詢

收藏

　　DSP核讀SL2通常會(huì)通過L1D cache，所以，和訪問LL2一樣，DSP核訪問SL2的性能高度依賴cache。

本文引用地址：http://www.ex-cimer.com/article/276392.htm

　　XMC中還有一個(gè)prefetch buffer(8x128bytes)，它可以被看作是一個(gè)額外的只對(duì)讀操作可用的cache。DSP核之外的每16-MB存儲(chǔ)器塊都可以通過MAR(Memory Attribute Register)的PFX(PreFetchable eXternally)bit 被配置為是否通過prefetch buffer讀，使能它會(huì)對(duì)多個(gè)主模塊共享存儲(chǔ)器的效率有很大幫助;它也能顯著地改善對(duì)SL2連續(xù)讀的性能。不過，prefetch buffer對(duì)寫操作沒有任何作用。

　　SL2可以通過從0x0C000000開始的缺省的地址空間訪問，這個(gè)空間總是cacheable，通常它也被配置為prefetchable。SL2可以通過XMC的配置被重映射到其它地址空間，通常重映射空間被用作non-cacheable, nonprefetchable 訪問(當(dāng)然它也可以被設(shè)置為cacheable而且prefetchable)。通過缺省地址空間訪問比通過重映射空間訪問稍微快一點(diǎn)，因?yàn)榈刂分赜成湫枰粋€(gè)額外的時(shí)鐘周期。

　　由于L1D cache不會(huì)在寫操作時(shí)被分配，并且這里的測(cè)試之前cache都被清空了，所以任何對(duì)SL2的寫操作都通過L1D write buffer(4x16bytes)。對(duì)多個(gè)寫操作，如果地址偏移小于16bytes，這些操作可能在write buffer中被合并成一個(gè)對(duì)SL2的寫操作，從而獲得比較高的效率。XMC也有類似的寫合并buffer，它可以合并兩個(gè)在32 bytes內(nèi)的寫操作，所以，對(duì)偏移小于32bytes的寫操作，XMC的寫buffer改善了寫操作的性能。

　　當(dāng)寫偏移是N*256 bytes時(shí)，每個(gè)寫操作總是訪問SL2相同的bank(SL2存儲(chǔ)器組織結(jié)構(gòu)是4 bankx2sub-bankx 32 bytes)，對(duì)相同bank的連續(xù)訪問間隔是4個(gè)時(shí)鐘周期。對(duì)其它的訪問偏移量，連續(xù)的寫操作會(huì)訪問SL2不同的bank，這樣的多個(gè)訪問的在流水線上可以被重疊起來，從而使平均的訪問時(shí)延比較小。

　　圖5 比較了DSP核訪問SL2和LL2的訪問時(shí)延。對(duì)地址偏移小于16bytes的連續(xù)訪問，訪問SL2的性能和LL2幾乎相同。而對(duì)地址偏移比較大的連續(xù)訪問，訪問SL2的性能比LL2差。因此，SL2最適合于存放代碼。

　　

　　圖5 DSP核訪問SL2和LL2的性能比較

　　3.3 DSP核訪問外部DDR存儲(chǔ)器的時(shí)延

　　DSP核訪問外部DDR存儲(chǔ)器高度依賴cache。當(dāng)DSP核訪問外部存儲(chǔ)器時(shí)，一個(gè)傳輸請(qǐng)求會(huì)被發(fā)給XMC。根據(jù)cacheable和prefetchable的設(shè)置，傳輸請(qǐng)求可能是下列情況中的一種:

　　一個(gè)數(shù)據(jù)單元–如果存儲(chǔ)器空間是non-cacheable，nonprefetchable

　　一個(gè)L1 cache line-如果存儲(chǔ)器空間是cacheable而沒有L2 cache，

　　一個(gè)L2 cache line-如果存儲(chǔ)器空間是cacheable并且設(shè)置了L2 cache。

　　如果要訪問的數(shù)據(jù)在L1/L2 cache或prefetch buffer中，則不會(huì)有傳輸請(qǐng)求發(fā)出。

　　如果被訪問的空間是prefetchable的，可能還會(huì)產(chǎn)生額外的prefetch請(qǐng)求。

　　外部存儲(chǔ)器的內(nèi)容可以被緩存在L1 cache或/和L2 cache，或者都不用。DSP核之外的每16-MB存儲(chǔ)器塊都可以通過MAR(Memory Attribute Register)的PC(Permit Copy)bit被配置為是否通過cache訪問。如果PC比特為0，這段空間就不是cacheable的。如果PC比特是1而L2 cache大小為0(所有LL2都被用作普通SRAM)，那外部存儲(chǔ)器的內(nèi)容只會(huì)被L1 cache緩存。如果PC比特是1并且L2 cache大于0，則外部存儲(chǔ)器的內(nèi)容可以被L1和L2 cache同時(shí)緩存。

　　像訪問SL2一樣，對(duì)外部存儲(chǔ)器的讀操作也可以利用XMC里的prefetch buffer。它可以通過MAR(Memory Attribute Register)的PFX(PreFetchable eXternally)bit來配置。

　　多個(gè)訪問之間的地址偏移(stride)顯著地影響訪問效率，地址連續(xù)的訪問可以充分地利用cache和prefetch buffer;大于或等于64字節(jié)的地址偏移導(dǎo)致每次訪問都miss L1 cache因?yàn)長(zhǎng)1D cache行大小是64 bytes;大于或等于128字節(jié)的地址偏移導(dǎo)致每次訪問都miss L2 cache因?yàn)長(zhǎng)2 cache行大小是128 bytes。

　　如果發(fā)生cache miss，DSP需要等待外部數(shù)據(jù)傳輸完成。等待的時(shí)間是請(qǐng)求發(fā)出時(shí)間，數(shù)據(jù)傳輸時(shí)間或數(shù)據(jù)返回時(shí)間的總和。

　　圖6是在1GHz C6678 EVM(64-bit 1333MTS DDR)上測(cè)得的DSP核訪問DDR的時(shí)延。DSP核執(zhí)行512個(gè)連續(xù)的LDDW(LoaD Double Word)或STDW(STore Double Word)指令所花的時(shí)間被測(cè)量，平均下來每個(gè)操作所花的時(shí)間被畫在圖中。測(cè)試中，L1D被配置成32KB cache，LL2的256KB被設(shè)置為cache。

　　對(duì)LDB/STB和LDW/STW的測(cè)試表明，它們的時(shí)延與LDDW/STDW相同。

　　注意，下面第二和第三個(gè)圖實(shí)際上是第一個(gè)圖左邊的放大。

　　

　　

　　圖6 DSP核對(duì)DDR Load/Store的時(shí)延

　　對(duì)地址偏移小于128 bytes的訪問，性能主要受cache的影響。

　　L2 cache會(huì)在寫操作時(shí)被分配，對(duì)任何寫操作，cache控制器總是先把被訪問的數(shù)據(jù)所在的cache行(128 bytes)讀進(jìn)L2 cache，然后在cache中改寫數(shù)據(jù)。被改寫是數(shù)據(jù)會(huì)在發(fā)生cache沖突或手工cache回寫操作時(shí)被最終寫到外部存儲(chǔ)里。當(dāng)寫操作的地址偏移是1024 bytes的整數(shù)倍時(shí)，多個(gè)訪問在L2 cache中發(fā)生沖突的概率很大，所以L2 cacheable寫操作的時(shí)延會(huì)顯著地增加。最壞的情況下，每個(gè)寫操作都會(huì)導(dǎo)致一個(gè)cache行的回寫 (之前的數(shù)據(jù)因?yàn)闆_突而被替換/回寫)和一個(gè)cache行的讀入(新的數(shù)據(jù)被分配到cache中)。

　　當(dāng)?shù)刂菲拼笥?12bytes時(shí)，DDR頁(行)切換開銷成為性能下降的主要因素。C6678 EVM上的DDR頁(行)大小或bank寬度是8KB，而DDR3存儲(chǔ)器包含8個(gè)banks。最壞的情況是，當(dāng)訪問地址偏移量是64KB時(shí)，每個(gè)讀或?qū)懖僮鞫紩?huì)訪問相同bank中一個(gè)新的行，而這種行切換會(huì)增加大約40個(gè)時(shí)鐘周期的時(shí)延。請(qǐng)注意，不同的DDR存儲(chǔ)器的時(shí)延可能會(huì)不一樣。

存儲(chǔ)器相關(guān)文章:存儲(chǔ)器原理

上一頁 1 2 3 下一頁

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

關(guān)鍵詞： TMS320C6678 存儲(chǔ)器

評(píng)論

相關(guān)推薦

基于Android平臺(tái)的手機(jī)的存儲(chǔ)器優(yōu)化

視頻 Numonyx 存儲(chǔ)器 TMO Android | 2010-01-14

SN75370雙MOS存儲(chǔ)器接口

設(shè)計(jì)方案 SN75370 存儲(chǔ)器接口 | 2009-07-06

HBM之后存儲(chǔ)器市場(chǎng)掀起新風(fēng)暴

網(wǎng)絡(luò)與存儲(chǔ) HBM 存儲(chǔ)器 | 2024-06-27

中國(guó)科學(xué)家研究鐵電隧道結(jié)存儲(chǔ)器獲新進(jìn)展

網(wǎng)絡(luò)與存儲(chǔ) 存儲(chǔ)器存儲(chǔ)技術(shù) | 2024-03-18

Intro to TechTalk

視頻 Numonyx 存儲(chǔ)器 | 2010-01-14

存儲(chǔ)器最新發(fā)展路線圖

網(wǎng)絡(luò)與存儲(chǔ) 存儲(chǔ)器 | 2024-05-24

C語言程序設(shè)計(jì)及應(yīng)用實(shí)例

資源下載 atmel 單片機(jī) AD DA 存儲(chǔ)器中斷 | 2008-01-02

合約價(jià)勁漲護(hù)身 DRAM不怕淡季 Q1營(yíng)收季增

網(wǎng)絡(luò)與存儲(chǔ) 存儲(chǔ)器 DRAM TrendForce | 2024-06-17

AI激發(fā)存儲(chǔ)市場(chǎng)潛能，SSD主控芯片國(guó)產(chǎn)化浪潮提速

網(wǎng)絡(luò)與存儲(chǔ) 存儲(chǔ)器 AI | 2024-04-02

異步SDRAM存儲(chǔ)器接口電路設(shè)計(jì)

設(shè)計(jì)方案異步 SDRAM 存儲(chǔ)器接口電路設(shè)計(jì) | 2009-07-17

讀／寫存儲(chǔ)器RAM7489組成的延時(shí)電路

設(shè)計(jì)方案存儲(chǔ)器 RAM7489 組成延時(shí) | 2009-07-06

請(qǐng)問S3C44B0x的存儲(chǔ)器空間可以從新劃分嗎？

dabao | 2005-05-27

高速PCB設(shè)計(jì)指南之三

資源下載 PCB 可測(cè)試性存儲(chǔ)器 JTAG 混合信號(hào) 信號(hào)完整性 | 2007-12-29

存儲(chǔ)大廠技術(shù)之爭(zhēng)愈演愈烈

網(wǎng)絡(luò)與存儲(chǔ) 存儲(chǔ)器 DRAM TrendForce | 2024-04-15

北京大學(xué)公開存儲(chǔ)器專利

網(wǎng)絡(luò)與存儲(chǔ) 存儲(chǔ)器存儲(chǔ)技術(shù) | 2024-03-12

AI PC一觸即發(fā)，存儲(chǔ)器、NPU等大放異彩！

消費(fèi)電子 AI PC 存儲(chǔ)器 NPU | 2024-04-15

[求助]怎么選擇S3C4510B的存儲(chǔ)器？？

ambercctv | 2004-01-06

用于UI創(chuàng)新的存儲(chǔ)器

視頻 Spansion 存儲(chǔ)器 Flash | 2012-05-21

EEPROM 和 flash 這樣講，早就懂了！

網(wǎng)絡(luò)與存儲(chǔ) 存儲(chǔ)器 flash EEPROM | 2024-04-26

介紹DSP外部電路設(shè)計(jì)的經(jīng)典著作

資源下載 TI Dsp 外圍電路 AD\DA 數(shù)字上\下變頻存儲(chǔ)器 | 2007-12-25

閃速存儲(chǔ)器技術(shù)現(xiàn)狀及發(fā)展趨勢(shì)

hpnet | 2002-08-27

[求助]怎么選擇S3C4510B的存儲(chǔ)器？？

ambercctv | 2004-01-06

小霸王SB-818型復(fù)讀機(jī)DRAM存儲(chǔ)器電路

設(shè)計(jì)方案小霸王 SB-818 復(fù)讀機(jī) 存儲(chǔ)器 | 2009-07-06

存儲(chǔ)器的混亂

視頻 Numonyx 存儲(chǔ)器 | 2010-01-14

搞嵌入式，不懂DMA？笑死人

嵌入式系統(tǒng) DMA CPU 存儲(chǔ)器 | 2024-04-08

大型皮帶機(jī)智能保護(hù)系統(tǒng)

視頻信息技術(shù)大賽單片機(jī) STC15F2K61S2 A/D D/A 存儲(chǔ)器 | 2013-01-11

[求助]有誰知道MT58L256L32是什么存儲(chǔ)器嗎？

asak_1 | 2005-03-18

1兆位5伏閃速電擦除存儲(chǔ)器AT29C010A及其應(yīng)用

資源下載存儲(chǔ)器閃速電擦除 AT29C010A 1兆位5伏 | 2007-12-25

高速SDRAM存儲(chǔ)器接口電路設(shè)計(jì)

設(shè)計(jì)方案高速 SDRAM 存儲(chǔ)器接口電路設(shè)計(jì) | 2009-07-17

Motorola M68HC11單片機(jī)原理、應(yīng)用及技術(shù)手冊(cè)

資源下載 Motorola 單片機(jī) 存儲(chǔ)器中斷定時(shí)器 M68HC11 | 2008-01-02

焦點(diǎn)

推薦視頻

技術(shù)專區(qū)

看屁屁www成人影院,亚洲人妻成人图片,亚洲精品成人午夜在线,日韩在线欧美成人 (function(){ var bp = document.createElement('script'); var curProtocol = window.location.protocol.split(':')[0]; if (curProtocol === 'https') { bp.src = 'https://zz.bdstatic.com/linksubmit/push.js'; } else { bp.src = 'http://push.zhanzhang.baidu.com/push.js'; } var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(bp, s); })();