<meter id="pryje"><nav id="pryje"><delect id="pryje"></delect></nav></meter>

<label id="pryje"></label>

新聞中心

EEPW首頁 > 嵌入式系統(tǒng) > 設(shè)計應(yīng)用 > 雷達(dá)信號處理：FPGA還是GPU?

雷達(dá)信號處理：FPGA還是GPU?

作者：時間：2015-06-22 來源：網(wǎng)絡(luò)

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢

收藏

　　FPGA和CPU一直是雷達(dá)信號處理不可分割的組成部分。傳統(tǒng)上FPGA用于前端處理，CPU用于后端處理。隨著雷達(dá)系統(tǒng)的處理能力越來越強(qiáng)，越來越復(fù)雜，對信息處理的需求也急劇增長。為此，FPGA不斷在提高處理能力和吞吐量，CPU也在發(fā)展以滿足下一代雷達(dá)的信號處理性能需求。這種努力發(fā)展的趨勢導(dǎo)致越來越多的使用CPU加速器，如圖形處理單元(GPU)等，以支持較重的處理負(fù)載。

本文引用地址：http://www.ex-cimer.com/article/276090.htm

　　本文對比了FPGA和GPU浮點性能和設(shè)計流程。最近幾年，GPU已經(jīng)不僅能完成圖形處理功能，而且成為強(qiáng)大的浮點處理平臺，被稱之為GP-GPU，具有很高的峰值FLOP指標(biāo)。FPGA傳統(tǒng)上用于定點數(shù)字信號處理器(DSP)，而現(xiàn)在足以競爭完成浮點處理功能，也成為后端雷達(dá)處理加速功能的有力競爭者。

　　在FPGA前端，40 nm和28 nm均報道了很多可驗證的浮點基準(zhǔn)測試結(jié)果。Altera的下一代高性能FPGA將采用Intel的14 nm三柵極技術(shù)，性能至少達(dá)到5 TFLOP.使用這種先進(jìn)的半導(dǎo)體工藝，性能可實現(xiàn)100 GFLOPs/W.而且，Altera FPGA現(xiàn)在支持OpenCL，這是GPU使用的一款優(yōu)秀的編程語言。

　　峰值GFLOPS指標(biāo)

　　目前的FPGA性能可達(dá)到1TFLOP以上峰值，AMD和Nvidia最新的GPU甚至更高，接近4 TFLOP.但在某些應(yīng)用中，峰值GFLOP，即TFLOP，提供的器件性能信息有限。它只表示了每秒能完成的理論浮點加法或乘法總數(shù)。這一分析表示，在雷達(dá)應(yīng)用中，很多情況下，F(xiàn)PGA在算法和數(shù)據(jù)規(guī)模上超過了GPU吞吐量。

　　一種中等復(fù)雜且常用的算法是快速傅里葉變換(FFT)。大部分雷達(dá)系統(tǒng)由于在頻域完成大量處理工作，因此會經(jīng)常用到FFT算法。例如，使用單精度浮點處理實現(xiàn)一個4，096點FFT.它能在每個時鐘周期輸入輸出四個復(fù)數(shù)采樣。每個FFT內(nèi)核運行速度超過80 GFLOP，大容量28 nm FPGA的資源支持實現(xiàn)7個此類內(nèi)核。

　　但如圖1所示，該FPGA的FFT算法接近400 GFLOP.這一結(jié)果基于“按鍵式”OpenCL編譯，無需FPGA專業(yè)知識。使用邏輯鎖定和設(shè)計空間管理器(DSE)進(jìn)行優(yōu)化，7內(nèi)核設(shè)計接近單內(nèi)核設(shè)計的fMAX，使用28 nm FPGA，將其提升至500 GFLOP，超過了10 GFLOPs/W.

　　

　　圖1.Stratix V 5SGSD8 FPGA浮點FFT性能

　　這一GFLOPs/W結(jié)果要比CPU或者GPU功效高很多。對比GPU，GPU在這些FFT長度上效率并不高，因此沒有進(jìn)行基準(zhǔn)測試。當(dāng)FFT長度達(dá)到幾十萬個點時，GPU效率才比較高，能夠為CPU提供有效的加速功能。但是，雷達(dá)處理應(yīng)用一般是長度較短的FFT，F(xiàn)FT長度通常在512至8，192之間。

　　總之，實際的GFLOP一般只達(dá)到峰值或者理論GFLOP的一小部分。出于這一原因，更好的方法是采用算法來對比性能，這種算法能夠合理的表示典型應(yīng)用的特性。隨著基準(zhǔn)測試算法復(fù)雜度的提高，其更能代表實際雷達(dá)系統(tǒng)性能。

　　算法基準(zhǔn)測試

　　相比依靠供應(yīng)商的峰值GFLOP指標(biāo)來驅(qū)動處理技術(shù)決策，另一方法是使用比較復(fù)雜的第三方評估。空時自適應(yīng)處理(STAP)雷達(dá)常用的算法是Cholesky分解。這一算法經(jīng)常用于線性代數(shù)，高效的解出多個方程，可以用在相關(guān)矩陣上。

　　Cholesky算法在數(shù)值上非常復(fù)雜，要獲得合理的結(jié)果總是要求浮點數(shù)值表示。計算需求與N3成正比，N是矩陣維度，因此，一般對處理要求很高。雷達(dá)系統(tǒng)一般是實時工作，因此，要求有較高的吞吐量。結(jié)果取決于矩陣大小以及所要求的矩陣處理吞吐量，通常會超過100 GFLOP.

　　表1顯示了基于Nvidia GPU指標(biāo)1.35 TFLOP的基準(zhǔn)測試結(jié)果，使用了各種庫，以及Xilinx Virtex6 XC6VSX475T，其密度達(dá)到475K LC，這種FPGA針對DSP處理進(jìn)行了優(yōu)化。用于Cholesky基準(zhǔn)測試時，這些器件在密度上與Altera FPGA相似。LAPACK和MAGMA是商用庫，而GPU GFLOP則是采用田納西州大學(xué)開發(fā)的OpenCL實現(xiàn)的(2)。對于小規(guī)模矩陣，后者更優(yōu)化一些。

　　表1.GPU和Xilinx FPGA Cholesky基準(zhǔn)測試(2)

　　

　　Altera測試了容量中等的Altera Stratix? V FPGA(460K邏輯單元(LE))，使用了單精度浮點處理的Cholesky算法。如表2所示，在Stratix V FPGA上進(jìn)行Cholesky算法的性能要比Xilinx結(jié)果高很多。Altera基準(zhǔn)測試還包括QR分解，這是不太復(fù)雜的另一矩陣處理算法。Altera以可參數(shù)賦值內(nèi)核的形式提供Cholesky和QRD算法。

　　表2.Altera FPGA Cholesky和QR基準(zhǔn)測試

　　

　　應(yīng)指出，基準(zhǔn)測試的矩陣大小并不相同。田納西州大學(xué)的結(jié)果來自[512×512]的矩陣，而Altera基準(zhǔn)測試的Cholesky是[360x360]，QRD則高達(dá)[450x450]。原因是，矩陣規(guī)模較小時，GPU效率非常低，因此，在這些應(yīng)用中，不應(yīng)該使用它們來加速CPU.作為對比，在規(guī)模較小的矩陣時，F(xiàn)PGA的工作效率非常高。雷達(dá)系統(tǒng)對吞吐量的要求很高，每秒數(shù)千個矩陣，因此，效率非常關(guān)鍵。采用了小矩陣，甚至要求把大矩陣分解成小矩陣以便進(jìn)行處理。

　　而且，Altera基準(zhǔn)測試是基于每個Cholesky內(nèi)核的。每個可參數(shù)賦值的Cholesky內(nèi)核支持選擇矩陣大小，矢量大小和通道數(shù)量。矢量大小大致決定了FPGA資源。較大的[360×360]矩陣使用了較長的矢量，支持FPGA中實現(xiàn)一個內(nèi)核，達(dá)到91 GFLOP.較小的[60×60]矩陣使用的資源更少，因此，可以實現(xiàn)兩個內(nèi)核，總共是2×42 = 84 GFLOP.最小的[30×30]矩陣支持實現(xiàn)三個內(nèi)核，總共是3×25 = 75 GFLOP.

　　FPGA看起來更適合解決數(shù)據(jù)規(guī)模較小的問題，很多雷達(dá)系統(tǒng)都是這種情況。GPU之所以效率低，是因為計算負(fù)載隨N3而增大，數(shù)據(jù)I/O隨N2增大，最終，隨著數(shù)據(jù)的增加，GPU的I/O瓶頸不再是問題。此外，隨著矩陣規(guī)模的增大，由于每個矩陣的處理量增大，矩陣每秒吞吐量會大幅度下降。在某些點，吞吐量變得非常低，以至于無法滿足雷達(dá)系統(tǒng)的實時要求。

　　對于FFT，計算負(fù)載增加至N log2 N，而數(shù)據(jù)I/O隨N增大而增大。對于規(guī)模較大的數(shù)據(jù)，GPU是高效的計算引擎。作為對比，對于所有規(guī)模的數(shù)據(jù)，F(xiàn)PGA都是高效的計算引擎，更適合大部分雷達(dá)應(yīng)用，這些應(yīng)用中，F(xiàn)FT長度適中，但是吞吐量很大。

fpga相關(guān)文章:fpga是什么

矢量控制相關(guān)文章:矢量控制原理

上一頁 1 2 3 下一頁

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

關(guān)鍵詞： FPGA GPU

評論

相關(guān)推薦

萊迪思全新推出邏輯優(yōu)化的通用FPGA拓展其小型FPGA產(chǎn)品組合

嵌入式系統(tǒng) 萊迪思 FPGA 小型FPGA | 2024-07-23

FPGA如何同DDR3存儲器進(jìn)行接口?

視頻 Altera FPGA DDR3 | 2008-06-18

ALTERA的PCI_IP Core問答集

資源下載 Altera FPGA PCI_IP Core | 2007-12-13

Altera: 采用全系列40-nm收發(fā)器FPGA和ASIC實現(xiàn)創(chuàng)新

視頻 Altera FPGA ASIC | 2009-07-13

基于SD7502構(gòu)成的FPGA-ASK電路圖

設(shè)計方案基于 SD7502 構(gòu)成 FPGA-ASK 電路圖 | 2011-07-13

FOPLP導(dǎo)入AI GPU 估2027年量產(chǎn)

EDA/PCB FOPLP AI GPU 臺積電 | 2024-07-04

LatticeECP3設(shè)計的視頻協(xié)議板電路圖-FPGA配置

設(shè)計方案 LatticeECP3 設(shè)計視頻協(xié)議電路圖 -FPGA | 2011-06-27

help, 44b0+fpga拖死cpu

sandman555 | 2005-02-05

實時的噪聲源定位系統(tǒng)

視頻 NI LabVIEW FPGA | 2009-03-25

基于FPGA的鎖相環(huán)位同步提取電路

設(shè)計方案電子電路圖，F(xiàn)PGA 鎖相環(huán) | 2012-07-27

高速ADC與內(nèi)置嵌入式串行收發(fā)器的FPGA接口

視頻 Altera FPGA ADC Linear 串行收發(fā)器 | 2009-05-19

Altera公司cyclone系列FPGA-1C6電路圖

設(shè)計方案 Altera 公司 cyclone 系列 FPGA-1C6 | 2009-07-17

打破NVIDIA壟斷！英國公司實現(xiàn)CUDA軟件在AMD GPU上無縫運行

智能計算 NVIDIA CUDA軟件 AMD GPU | 2024-07-22

利用強(qiáng)大的軟件設(shè)計工具為FPGA開發(fā)者賦能

嵌入式系統(tǒng) 軟件設(shè)計工具 FPGA 萊迪思 | 2024-07-17

Altera的FPGA下載常見問題經(jīng)驗小結(jié)

資源下載 Altera FPGA 常見問題經(jīng)驗 | 2007-12-13

基于FPGA的可編程數(shù)字濾波器系統(tǒng)

資源下載 Max FPGA 可編程數(shù)字濾波器 | 2007-12-14

用C/C++語言開發(fā)大規(guī)模FPGA [轉(zhuǎn)載于www.fpga.com.cn]

xiaohua | 2002-09-24

視頻協(xié)議板-FPGA配置基于LatticeECP3的設(shè)計

設(shè)計方案視頻協(xié)議 -FPGA 配置基于 LatticeECP3 | 2014-05-20

help, 44b0+fpga拖死cpu

sandman555 | 2005-02-05

消息稱臺積電代工英特爾下代 AI HPC 用 GPU 芯片 Falcon Shores

EDA/PCB 臺積電英特爾 AI HPC GPU 芯片 Falcon Shores | 2024-07-17

help, 44b0+fpga拖死cpu

sandman555 | 2005-02-05

LabVIEW FPGA 模塊簡介

視頻 NI LabVIEW FPGA | 2009-04-01

高通新中端芯片驍龍7s Gen 3曝光：采用Adreno 810 GPU，下月發(fā)布

EDA/PCB 高通中端芯片驍龍7s Gen 3 Adreno 810 GPU | 2024-07-23

消息稱英偉達(dá)曾向臺積電詢問建設(shè)廠外 CoWoS 先進(jìn)封裝專線可能，遭拒絕

EDA/PCB 英偉達(dá) GPU 封裝工藝臺積電 | 2024-07-23

LabVIEW 8.20技術(shù)資料大全簡介

資源下載 NI LabVIEW 射頻和通信 FPGA | 2007-12-11

s3c2410+fpga 做視頻無線傳輸

herbertwj | 2004-08-15

中國科學(xué)院院士：CPU、GPU架構(gòu)上國人沒貢獻(xiàn)很遺憾應(yīng)加強(qiáng)創(chuàng)新

嵌入式系統(tǒng) CPU GPU 架構(gòu) | 2024-07-12

什么是 DLSS，值得嗎？

智能計算 DLSS gpu NVIDIA | 2024-07-17

目標(biāo)完全替代閉源驅(qū)動，英偉達(dá)宣布全面轉(zhuǎn)向開源 GPU 內(nèi)核模塊

嵌入式系統(tǒng) 閉源驅(qū)動英偉達(dá) 開源 GPU 內(nèi)核模塊 Linux | 2024-07-22

3-DES算法的FPGA高速實現(xiàn)(Xilinx)

資源下載 Xilinx FPGA 3-DES算法 | 2007-12-13

焦點

推薦視頻

技術(shù)專區(qū)

看屁屁www成人影院,亚洲人妻成人图片,亚洲精品成人午夜在线,日韩在线欧美成人 (function(){ var bp = document.createElement('script'); var curProtocol = window.location.protocol.split(':')[0]; if (curProtocol === 'https') { bp.src = 'https://zz.bdstatic.com/linksubmit/push.js'; } else { bp.src = 'http://push.zhanzhang.baidu.com/push.js'; } var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(bp, s); })();