<meter id="pryje"><nav id="pryje"><delect id="pryje"></delect></nav></meter>
          <label id="pryje"></label>

          新聞中心

          EEPW首頁 > EDA/PCB > 設(shè)計應(yīng)用 > 充分發(fā)揮FPGA浮點(diǎn)IP內(nèi)核的優(yōu)勢

          充分發(fā)揮FPGA浮點(diǎn)IP內(nèi)核的優(yōu)勢

          作者: 時間:2009-12-07 來源:網(wǎng)絡(luò) 收藏

          表 1. 單精度矩陣乘法性能結(jié)果

          MatrixAA大小
          MatrixBB大小
          Vectorsize
          使用的邏輯
          GFLOPSf MAX (MHz)
          功耗 (mW)
          ALM (1)
          DSP使用 (2)
          M9KM144K
          存儲器 (bits)
          靜態(tài)
          動態(tài)
          I/O
          總計
          36x112 112x36 8 4,604 32 43 2 576,200 4 291 2,008 1,063 300 3,334
          36x224 224x36 16 7,882 64 77 4 1,101,920 9 291 2,045 1,821 300 4,165
          36x448 448x36 32 14,257 128 137 8 2,153,040 18 291 2,110 3,448 300 5,858
          64x64 64x64 32 13,154 128 41 8 1,333,233 18 292 2,112 2,604 306 5,023
          128x128 128x128 64 25,636 256 141 16 3,173,189 37 293 2,244 5,384 306 7,934

          注釋:

          (1) 自適應(yīng)邏輯模塊
          (2) 18x18 DSP模塊
          使用 Quartus II功耗估算器,很容易計算得到實(shí)際的每瓦每秒 giga結(jié)果 (GFLOPS/W)。使用 Altera.
          Stratix. IV EP4SE230 部分資源時,結(jié)果達(dá)到了 5 GFLOPS/W。使用 Stratix IV EP4SE530器件中更大的
          矩陣乘法內(nèi)核,結(jié)果大約為 7 GFLOPS/W,計算密度為 200 GFLOPS。利用整個器件實(shí)現(xiàn)大規(guī)模算法
          時,分散了 靜態(tài)功耗,效率非常高。

          Altera開發(fā)的技術(shù)大大降低了實(shí)現(xiàn)大規(guī)模浮點(diǎn)數(shù)據(jù)通路的邏輯和布線資源要求。使用浮點(diǎn)數(shù)據(jù)通路優(yōu)化
          工具非常關(guān)鍵,對資源要求的降低使得單位浮點(diǎn)邏輯/布線運(yùn)算比達(dá)到了高端 的水平。這反映在工
          具能夠?qū)崿F(xiàn)接近 300 MHz的 fMAX,與例化的矩陣乘法規(guī)模無關(guān)。通過這種方式,在大規(guī)模浮點(diǎn)設(shè)計中,用
          戶能夠可靠的使用 FPGA 80%以上的資源,實(shí)現(xiàn)大于 200-MHz的 fMAX性能。

          矩陣求逆
          FPGA中浮點(diǎn)算法最常見的應(yīng)用是矩陣求逆。大部分無線多輸入多輸出 (MIMO)算法、雷達(dá) STAP系統(tǒng)、醫(yī)療
          成像聚束和很多高性能計算應(yīng)用都需要進(jìn)行矩陣求逆。參數(shù)賦值矩陣求逆浮點(diǎn) 的實(shí)例性能 (表2)
          顯示了非常高的矩陣吞吐量。 4x4矩陣求逆內(nèi)核能夠進(jìn)行每秒 2千萬次矩陣求逆運(yùn)算,速度足以支持 LTE
          無線 MIMO應(yīng)用。

          表 2. 單精度浮點(diǎn)矩陣求逆 (Cholesky算法 )性能

          快速傅立葉變換
          FFT是另一種大動態(tài)范圍應(yīng)用實(shí)例。由于 FFT算法的內(nèi)在特性,位精度一般會隨著 FFT長度增加而增大。某些應(yīng)用使用級聯(lián) FFT,需要更大的動態(tài)范圍。很多雷達(dá)應(yīng)用使用 FFT進(jìn)行定點(diǎn)算法,裝入測距數(shù)據(jù)。這一般還需要第二次 FFT,裝入多普勒測距數(shù)據(jù),動態(tài)范圍足夠高,需要采用浮點(diǎn)算法。如圖3和圖4所示,相對于定點(diǎn)算法,需要增加邏輯以實(shí)現(xiàn)單精度浮點(diǎn)算法,而電路 fMAX、存儲器和乘法器基本相似。


          充分發(fā)揮 FPGA浮點(diǎn) 的優(yōu)勢 Altera公司

          圖3. FFT邏輯和寄存器使用對比

          結(jié)論
          Altera新的浮點(diǎn)電路優(yōu)化技術(shù)集成到浮點(diǎn) 中,同時提高了密度,并提供更多的邏輯資源,實(shí)現(xiàn)了優(yōu)異
          的 FPGA浮點(diǎn)性能。其他供應(yīng)商提供專用浮點(diǎn)處理器解決方案,但是,大部分都達(dá)不到 Altera FPGA解決
          方案的 GFLOPS高性能水平,而且沒有一個能夠?qū)崿F(xiàn) Stratix IV FPGA解決方案的 GFLOP/W性能。國家科
          學(xué)基金會 (NSF)高性能配置計算中心 (CHREC)的獨(dú)立基準(zhǔn)測試證明了這一點(diǎn),認(rèn)為 Stratix IV EP4SE530雙
          精度浮點(diǎn)處理的性能最好。

          Altera FPGA的其他優(yōu)點(diǎn)包括業(yè)界領(lǐng)先的外部存儲器帶寬資源以及性能達(dá)到 12.5 Gbps的SERDES收發(fā)器等。
          FPGA平臺還提供性能最好的定點(diǎn)數(shù)據(jù)通路,實(shí)現(xiàn)了非常靈活的 I/O和存儲器接口。通過這些功能, Stratix
          IV FPGA成為構(gòu)建高性能浮點(diǎn)數(shù)據(jù)通路的理想平臺,可以用在多種應(yīng)用中,從高性能計算到雷達(dá)和電子戰(zhàn),
          直至基于 MIMO的 SDR/無線系統(tǒng),以及無線聚束應(yīng)用等。



          上一頁 1 2 下一頁

          關(guān)鍵詞: FPGA 浮點(diǎn) IP內(nèi)核

          評論


          相關(guān)推薦

          技術(shù)專區(qū)

          關(guān)閉
          看屁屁www成人影院,亚洲人妻成人图片,亚洲精品成人午夜在线,日韩在线 欧美成人 (function(){ var bp = document.createElement('script'); var curProtocol = window.location.protocol.split(':')[0]; if (curProtocol === 'https') { bp.src = 'https://zz.bdstatic.com/linksubmit/push.js'; } else { bp.src = 'http://push.zhanzhang.baidu.com/push.js'; } var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(bp, s); })();