<meter id="pryje"><nav id="pryje"><delect id="pryje"></delect></nav></meter>

<label id="pryje"></label>

新聞中心

EEPW首頁 > 嵌入式系統(tǒng) > 設(shè)計(jì)應(yīng)用 > FAE講堂：如何加快處理器的正弦計(jì)算

FAE講堂：如何加快處理器的正弦計(jì)算

作者：時間：2011-05-06 來源：電子產(chǎn)品世界

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢

收藏

　　我們使用一些Slice和乘法器，對這些硬件模塊中的兩個進(jìn)行例化。兩個內(nèi)核都要求4到5個周期的延遲，以匹配我們設(shè)計(jì)的時序要求。延遲在此不是什么問題，我們將在下面的步驟中進(jìn)行討論。

本文引用地址：http://www.ex-cimer.com/article/119301.htm

　　我們將最終的IP以MicroBlaze的快速單工鏈路 (FSL) IP 的形式進(jìn)行實(shí)現(xiàn)。對時序的第一次估算結(jié)果表明：

　　• 將數(shù)據(jù)從MicroBlaze傳輸?shù)紽SL總線需用一個時鐘周期

　　• 將數(shù)據(jù)從FSL總線傳輸至FSL IP(當(dāng)正弦計(jì)算的自變量從FSL總線讀出時，將立即從BRAM讀取數(shù)據(jù)，因而無需時鐘周期)需用一個時鐘周期

　　• 完成MUL運(yùn)算 (cos(x)*sin(d)) 需用四個時鐘周期

　　• 將方程的結(jié)果存儲到寄存器中需用一個時鐘周期

　　• 完成ADD運(yùn)算需用四個時鐘周期

　　• 將數(shù)據(jù)發(fā)送回FSL總線需用一個時鐘周期

　　• MicroBlaze從FSL IP讀取數(shù)據(jù)需用一個時鐘周期。

　　請注意，在沒有使用任何額外流水線(我們將在下一步驟中討論這一點(diǎn))的情況下，自變量數(shù)據(jù)在整個過程中必須保持穩(wěn)定。這就意味著MicroBlaze僅能請求一次正弦計(jì)算，且必須讀取該值，然后至少要等上13個時鐘周期，才能請求下一次計(jì)算。

　　因此，我們估計(jì)進(jìn)行該實(shí)現(xiàn)需要13個時鐘周期。當(dāng)然，要處理軟件上的函數(shù)調(diào)用以及某些其他運(yùn)算，還需要更多的時鐘周期。

　　我們簡單地把一些標(biāo)準(zhǔn)時鐘組合在一起，不到一天就實(shí)現(xiàn)了該IP，隨即在硬件中對該算法進(jìn)行測量。整個算法(軟硬件混合)耗用了360個時鐘周期(包括所有的函數(shù)調(diào)用)。雖然這已是顯著的進(jìn)步，但是仍不足以充分滿足客戶的需求。

　　在我們的加速器IP處理所有數(shù)據(jù)之前，我們使用一個SRL16來延遲信號的寫入。

　　雖然該算法現(xiàn)在可與我們的MicroBlaze并行運(yùn)行，但它每次只能計(jì)算一個值。

　　步驟六：添加流水線和適配客戶代碼

　　設(shè)計(jì)到了這一步，我們就可以開始向我們的內(nèi)核添加流水線。浮點(diǎn)ADD和浮點(diǎn)MUL的CORE Generator模塊已采用流水線實(shí)現(xiàn)，因而我們在此無需再做什么。第一個版本的算法要求自變量保持恒定，直至計(jì)算完成。在開始新計(jì)算之前(自變量數(shù)據(jù)到達(dá)FSL IP內(nèi)部)，立刻讀取兩個BRAM并執(zhí)行浮點(diǎn)MUL。運(yùn)算的結(jié)果在數(shù)個時鐘周期后生效。

　　我們的 sin(xi) 的自變量 xi 是一個20位寬的整數(shù)，它分為 x 和 d 兩個部分。因此，我們必須對自變量 xi的MSB部分 x 進(jìn)行幾個時鐘周期的延遲，以讀取 BRAM 的內(nèi)容，存儲自變量xi，并將其與MUL運(yùn)算的結(jié)果相匹配。

　　我們?yōu)槲覀兊?0位寬數(shù)值使用了少量SRL16元件(總共 10 個)，共占用了10個LUT(但由于Spartan-6具有LUT組合功能，如果采用該器件較寬的LUT6結(jié)構(gòu)，則僅需 5 個 LUT 即可)。

　　最后的工作量相當(dāng)小。在圖4中已對增加的SRL16x10位用紅圈進(jìn)行了標(biāo)注。

　　

　　然后我們使用EDK向?qū)硇薷奈覀兊腇SL總線FIFO，以便存儲多個值(我們確定能夠存儲8個值就足以達(dá)到我們的目的，但可根據(jù)需要輕松增加更多)。

　　這就意味著我們的客戶甚至在請求第一個結(jié)果之前即能獲得多達(dá)8個值。這足以滿足我們客戶當(dāng)前的需求，但如果想請求更多正弦值的話，則可以輕松將FIFO緩沖參數(shù)擴(kuò)展為較大的值。

　　我們在與客戶討論這種新的方案時，發(fā)現(xiàn)可將正弦計(jì)算進(jìn)一步劃分為兩個部分：

　　1. 請求正弦計(jì)算(fslput 運(yùn)算)

　　2. 請求正弦計(jì)算的結(jié)果(fslget運(yùn)算)

　　由于我們在運(yùn)算中有一個固定時延，所以如果這兩個運(yùn)算依次銜接、緊密地按順序執(zhí)行，那么MicroBlaze將停頓，并等待FSL IP完成對請求的處理。如果能夠?qū)⑦@兩組運(yùn)算分開(這在客戶的算法中是可以的)，那么我們即可進(jìn)一步提

　　升運(yùn)算的總體速度。通過增加流水線，在MicroBlaze上執(zhí)行的最終代碼如下：

　　putfsl(arg1,fsl1_id);

　　putfsl(arg2,fsl1_id);

　　putfsl(arg3,fsl1_id);

　　putfsl(arg4,fsl1_id);

　　putfsl(arg5,fsl1_id);

　　putfsl(arg6,fsl1_id);

　　putfsl(arg7,fsl1_id);

　　putfsl(arg8,fsl1_id);

　　...

　　getfsl(result1,fsl1_id);

　　getfsl(result2,fsl1_id);

　　getfsl(result3,fsl1_id);

　　getfsl(result4,fsl1_id);

　　getfsl(result5,fsl1_id);

　　getfsl(result6,fsl1_id);

　　getfsl(result7,fsl1_id);

　　getfsl(result8,fsl1_id);

　　這給我們帶來了顯著的優(yōu)勢。內(nèi)核不僅可完全實(shí)現(xiàn)流水線功能，而且還能夠?qū)⒄矣?jì)算的兩個調(diào)用分開。IP核的時延依然存在，但不再明顯。MicroBlaze也不再發(fā)生停頓和等待未完成的IP計(jì)算的情況，從而提高了整體性能。

　　客戶同意對代碼進(jìn)行相應(yīng)調(diào)整，這對客戶來說只是小量工作。通過使用C語言的宏命令取代函數(shù)調(diào)用，我們就能夠把所有要求的調(diào)用插入代碼庫中。

上一頁 1 2 3 下一頁

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

關(guān)鍵詞： Xilinx 處理器 FAE

評論

相關(guān)推薦

最新的ARM技術(shù)以及嵌入式發(fā)展動態(tài) 下

視頻 ARM Cortex RISC 處理器 | 2009-11-25

最新智能手機(jī)芯片數(shù)據(jù)：聯(lián)發(fā)科市場份額第一，蘋果同比下降16%

智能手機(jī) 高通聯(lián)發(fā)科蘋果處理器紫光展銳 | 2024-05-23

[轉(zhuǎn)帖]IBM可編程網(wǎng)絡(luò)處理器

amine | 2002-05-17

米爾基于NXP i.MX 93開發(fā)板的M33處理器應(yīng)用開發(fā)筆記

嵌入式系統(tǒng) 米爾 NXP .MX 93 M33 處理器 | 2024-07-03

封閉沒有前途！Intel打造開放AI生態(tài) 誓要虎口奪食

智能計(jì)算英特爾 AI 處理器 Lunar Lake | 2024-04-16

SRS效果處理器

設(shè)計(jì)方案效果處理器 | 2009-07-06

5分鐘學(xué)會使用CPLD

資源下載 xilinx pld 可編程邏輯器件與門或門 | 2008-01-03

透視麒麟9010：博采眾長但依舊任重道遠(yuǎn)

手機(jī)與無線通信麒麟9010 Pura 70 處理器 Arm TCS23 Firestorm 鴻蒙NEXT | 2024-04-23

高通被曝開發(fā)低成本驍龍 WoA 芯片：AI 算力 40 TOPS、2025Q4 推出

智能計(jì)算高通 WoA 處理器 | 2024-06-18

英特爾先進(jìn)封裝產(chǎn)能也吃緊，影響第二季AI PC處理器供應(yīng)

消費(fèi)電子英特爾先進(jìn)封裝 AI PC 處理器 | 2024-05-01

基于GP4020的GPS接收機(jī)基帶處理器電路

設(shè)計(jì)方案基于 GP4020 接收機(jī) 基帶處理器 | 2009-07-06

嵌入式系統(tǒng)綜述之二(老站轉(zhuǎn))

amine | 2002-05-18

運(yùn)放型BBE處理器

設(shè)計(jì)方案運(yùn)放型處理器 | 2009-07-06

嵌入式處理器選型上

視頻嵌入式 ARM 處理器 CN896 MIPS | 2009-10-27

《用CPLD配置Spartan II器件》的附加說明

資源下載 Xilinx Spartan II CPLD配置 | 2007-12-13

中國臺灣AI關(guān)鍵組件的發(fā)展現(xiàn)況與布局

智能計(jì)算 IC設(shè)計(jì) PCB 散熱處理器內(nèi)存 AI | 2024-06-13

嵌入式系統(tǒng)綜述之三(老站轉(zhuǎn))

amine | 2002-05-18

嵌入式系統(tǒng)硬件接口設(shè)計(jì) 上

視頻嵌入式 Xscale 處理器 S3C2410 | 2009-10-27

拆解：三星Galaxy Watch 7中的Exynos W1000處理器3nm GAA工藝

消費(fèi)電子三星 Galaxy Watch 7 Exynos W1000 處理器 3nm GAA | 2024-07-19

嵌入式處理器選型下

視頻嵌入式 ARM 處理器 MIPS PXA27x | 2009-10-27

3-DES算法的FPGA高速實(shí)現(xiàn)(Xilinx)

資源下載 Xilinx FPGA 3-DES算法 | 2007-12-13

德州儀器推出用于OMAPTM無線處理器的新型開發(fā)套件

hpnet | 2002-06-03

貿(mào)澤開售AMD / Xilinx Alveo MA35D媒體加速器

智能計(jì)算貿(mào)澤 Xilinx Alveo 媒體加速器 | 2024-07-11

對數(shù)壓縮方式數(shù)字音頻處理器(DAC76、MN5110)

設(shè)計(jì)方案對數(shù) 壓縮方式數(shù)字音頻處理器 DAC76 MN511 | 2009-07-06

Microchip發(fā)布多核64位微處理器系列產(chǎn)品進(jìn)一步擴(kuò)展處理器產(chǎn)品線

嵌入式系統(tǒng) Microchip 64位微處理器處理器 | 2024-07-10

程控開關(guān)電源用于片心邏輯―Pentium Pro處理器

設(shè)計(jì)方案程控開關(guān)電源用于片心邏輯 Pentium 處理器 | 2009-07-06

Lisatek推出嵌入式處理器設(shè)計(jì)工具（摘自www.embed.com.cn）

xiaohua | 2002-06-17

中文文章：怎樣寫testbench（xilinx的）

資源下載 xilinx testbench 書寫技巧 | 2007-12-13

嵌入式系統(tǒng)硬件接口設(shè)計(jì) 下

視頻嵌入式處理器 SPI EP9315 S3C2410 | 2009-10-27

Nios II 處理器中文小冊子（altera）

資源下載 altera Nios II 處理器中文小冊子 | 2007-12-12

焦點(diǎn)

推薦視頻

技術(shù)專區(qū)

看屁屁www成人影院,亚洲人妻成人图片,亚洲精品成人午夜在线,日韩在线欧美成人 (function(){ var bp = document.createElement('script'); var curProtocol = window.location.protocol.split(':')[0]; if (curProtocol === 'https') { bp.src = 'https://zz.bdstatic.com/linksubmit/push.js'; } else { bp.src = 'http://push.zhanzhang.baidu.com/push.js'; } var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(bp, s); })();