<meter id="pryje"><nav id="pryje"><delect id="pryje"></delect></nav></meter>

<label id="pryje"></label>

新聞中心

EEPW首頁 > 嵌入式系統(tǒng) > 設(shè)計應(yīng)用 > 雷達信號處理：FPGA還是GPU?

雷達信號處理：FPGA還是GPU?

作者：時間：2015-06-22 來源：網(wǎng)絡(luò)

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢

收藏

　　GPU和FPGA設(shè)計方法

本文引用地址：http://www.ex-cimer.com/article/276090.htm

　　GPU可以通過使用Nvidia專用CUDA語言或開放標準OpenCL語言來編程。這些語言在能力上非常相似，最大的不同在于CUDA只能用在Nvidia GPU上。

　　FPGA通常使用HDL語言Verilog或VHDL進行編程。這些語言的最新版雖然采用了浮點數(shù)定義，但都不太適合支持浮點設(shè)計。例如，在System Verilog中，短實數(shù)變量對應(yīng)于IEEE單精度(浮點)，實數(shù)變量對應(yīng)于IEEE雙精度。

　　DSP Builder高級模塊庫

　　使用傳統(tǒng)的方法將浮點數(shù)據(jù)通路綜合到FPGA的效率非常低，如Xilinx FPGA在Cholesky算法上使用了Xilinx浮點內(nèi)核產(chǎn)生函數(shù)的低性能顯示，。而Altera采兩種不同的方法。首先是使用DSP Builder高級模塊庫，這是基于Mathworks的設(shè)計輸入方法。這一工具支持定點和浮點數(shù)，支持7種不同精度的浮點處理，包括IEEE半、單和雙精度實現(xiàn)。它還支持矢量化，這是高效實現(xiàn)線性代數(shù)所需要的。最重要的是，它能夠?qū)⒏↑c電路高效的映射到目前的定點FPGA體系結(jié)構(gòu)中，如基準測試所示，規(guī)模中等的28 nm FPGA，Cholesky算法接近了100 GFLOP.作為對比，在不具有綜合能力的規(guī)模相似的Xilinx FPGA上，實現(xiàn)Cholesky相同算法，性能只有20 GFLOP.

　　面向FPGA的OpenCL

　　GPU編程人員較為熟悉OpenCL.面向FPGA的OpenCL編譯意味著，面向AMD或Nvidia GPU編寫的OpenCL代碼可以編譯到FPGA中。而且，Altera的OpenCL編譯器支持GPU程序使用FPGA，無需具備典型的FPGA設(shè)計技巧。

　　使用支持FPGA的OpenCL，相對于GPU有幾個關(guān)鍵優(yōu)勢。首先，GPU的I/O是有限制的。所有輸入和輸出數(shù)據(jù)必須由主CPU通過PCI Express?(PCIe?)接口進行傳輸。結(jié)果延時會讓GPU處理引擎暫停，因此，降低了性能。

　　面向FPGA的OpenCL擴展

　　FPGA以各種寬帶I/O功能而知名。這些功能支持數(shù)據(jù)通過千兆以太網(wǎng)(GbE)和Serial RapidIO?(SRIO)，或直接從模數(shù)轉(zhuǎn)換器(ADC)和數(shù)模轉(zhuǎn)換器(DAC)輸入輸出FPGA.Altera定義了OpenCL標準的供應(yīng)商專用擴展，以支持流操作。這種擴展對于雷達系統(tǒng)非常關(guān)鍵，數(shù)據(jù)能夠從定點前端波束成形直接輸出，支持浮點處理階段的數(shù)字下變頻處理，實現(xiàn)脈沖壓縮，多普勒，STAP，動目標顯示(MTI)，以及圖2所示的其他功能。通過這種方法，數(shù)據(jù)流在通過GPU加速器之前，避免了CPU瓶頸問題，從而降低了總處理延時。

　　

　　圖2.通用雷達信號處理圖

　　即使與I/O瓶頸無關(guān)，F(xiàn)PGA的處理延時也要比GPU低很多。眾所周知，GPU必須有數(shù)千個線程才能高效工作，這是由于存儲器讀取很長的延時，以及GPU大量的處理內(nèi)核之間的延時。實際上，GPU必須有很多任務(wù)才能使得處理內(nèi)核不會暫停等待數(shù)據(jù)，否則會導(dǎo)致任務(wù)很長的延時。

　　而FPGA使用了“粗粒度并行”體系結(jié)構(gòu)。它建立了多個經(jīng)過優(yōu)化的并行數(shù)據(jù)通路，每一通路在每個時鐘周期輸出一個結(jié)果。數(shù)據(jù)通路的例化數(shù)取決于FPGA資源，但一般要比GPU內(nèi)核數(shù)少很多。但是，每一數(shù)據(jù)通路例化的吞吐量要比GPU內(nèi)核高得多。這一方法的主要優(yōu)勢是低延時，這在很多應(yīng)用中都是關(guān)鍵的性能優(yōu)勢。

　　FPGA的另一優(yōu)勢是很低的功耗，極大的降低了GFLOPs/W.使用開發(fā)板測量FPGA功耗，表明Cholesky和QRD等算法是5-6 GFLOPs/W，而FFT等簡單算法則是10 GFLOPs/W.一般很難進行GPU能效測量，但是，Cholesky的GPU性能達到50 GFLOP，典型功耗是200 W，得到的結(jié)果是0.25 GFLOPs/W，單位FLOP的功率比FPGA高20倍。

　　對于機載或車載雷達裝備，系統(tǒng)體積、重量和功耗(SWaP)都非常重要。在未來的系統(tǒng)中，雷達工作很容易達到數(shù)十個TFLOP.總處理能力與現(xiàn)代雷達系統(tǒng)的分辨率和覆蓋范圍相關(guān)。

　　融合數(shù)據(jù)通路

　　OpenCL和DSP Builder都依靠“融合數(shù)據(jù)通路”這種技術(shù)(圖3)，以這種技術(shù)實現(xiàn)浮點處理，能大幅度減少桶形移位電路，支持使用FPGA開發(fā)大規(guī)模高性能浮點設(shè)計。

　　

　　圖3.采用融合數(shù)據(jù)通路實現(xiàn)浮點處理

　　為降低桶形移位頻率，綜合過程盡可能使用較大的尾數(shù)寬度，從而不需要頻率歸一化和去歸一化。27×27和36×36硬核乘法器支持比單精度實現(xiàn)所要求的23位更大的乘法計算，54×54和72×72結(jié)構(gòu)的乘法器支持比52位更大的雙精度計算，這通常是雙精度實現(xiàn)所要求的。FPGA邏輯已經(jīng)針對大規(guī)模定點加法器電路進行了優(yōu)化，包括了內(nèi)置進位超前電路。

fpga相關(guān)文章:fpga是什么

矢量控制相關(guān)文章:矢量控制原理

上一頁 1 2 3 下一頁

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

關(guān)鍵詞： FPGA GPU

評論

相關(guān)推薦

s3c2410+fpga 做視頻無線傳輸

herbertwj | 2004-08-15

萊迪思全新推出邏輯優(yōu)化的通用FPGA拓展其小型FPGA產(chǎn)品組合

嵌入式系統(tǒng) 萊迪思 FPGA 小型FPGA | 2024-07-23

什么是 DLSS，值得嗎？

智能計算 DLSS gpu NVIDIA | 2024-07-17

help, 44b0+fpga拖死cpu

sandman555 | 2005-02-05

打破NVIDIA壟斷！英國公司實現(xiàn)CUDA軟件在AMD GPU上無縫運行

智能計算 NVIDIA CUDA軟件 AMD GPU | 2024-07-22

3-DES算法的FPGA高速實現(xiàn)(Xilinx)

資源下載 Xilinx FPGA 3-DES算法 | 2007-12-13

LabVIEW 8.20技術(shù)資料大全簡介

資源下載 NI LabVIEW 射頻和通信 FPGA | 2007-12-11

用C/C++語言開發(fā)大規(guī)模FPGA [轉(zhuǎn)載于www.fpga.com.cn]

xiaohua | 2002-09-24

視頻協(xié)議板-FPGA配置基于LatticeECP3的設(shè)計

設(shè)計方案視頻協(xié)議 -FPGA 配置基于 LatticeECP3 | 2014-05-20

ALTERA的PCI_IP Core問答集

資源下載 Altera FPGA PCI_IP Core | 2007-12-13

FPGA如何同DDR3存儲器進行接口?

視頻 Altera FPGA DDR3 | 2008-06-18

實時的噪聲源定位系統(tǒng)

視頻 NI LabVIEW FPGA | 2009-03-25

高速ADC與內(nèi)置嵌入式串行收發(fā)器的FPGA接口

視頻 Altera FPGA ADC Linear 串行收發(fā)器 | 2009-05-19

利用強大的軟件設(shè)計工具為FPGA開發(fā)者賦能

嵌入式系統(tǒng) 軟件設(shè)計工具 FPGA 萊迪思 | 2024-07-17

FOPLP導(dǎo)入AI GPU 估2027年量產(chǎn)

EDA/PCB FOPLP AI GPU 臺積電 | 2024-07-04

基于FPGA的可編程數(shù)字濾波器系統(tǒng)

資源下載 Max FPGA 可編程數(shù)字濾波器 | 2007-12-14

消息稱臺積電代工英特爾下代 AI HPC 用 GPU 芯片 Falcon Shores

EDA/PCB 臺積電英特爾 AI HPC GPU 芯片 Falcon Shores | 2024-07-17

LabVIEW FPGA 模塊簡介

視頻 NI LabVIEW FPGA | 2009-04-01

help, 44b0+fpga拖死cpu

sandman555 | 2005-02-05

help, 44b0+fpga拖死cpu

sandman555 | 2005-02-05

LatticeECP3設(shè)計的視頻協(xié)議板電路圖-FPGA配置

設(shè)計方案 LatticeECP3 設(shè)計視頻協(xié)議電路圖 -FPGA | 2011-06-27

消息稱英偉達曾向臺積電詢問建設(shè)廠外 CoWoS 先進封裝專線可能，遭拒絕

EDA/PCB 英偉達 GPU 封裝工藝臺積電 | 2024-07-23

高通新中端芯片驍龍7s Gen 3曝光：采用Adreno 810 GPU，下月發(fā)布

EDA/PCB 高通中端芯片驍龍7s Gen 3 Adreno 810 GPU | 2024-07-23

Altera公司cyclone系列FPGA-1C6電路圖

設(shè)計方案 Altera 公司 cyclone 系列 FPGA-1C6 | 2009-07-17

Altera: 采用全系列40-nm收發(fā)器FPGA和ASIC實現(xiàn)創(chuàng)新

視頻 Altera FPGA ASIC | 2009-07-13

基于SD7502構(gòu)成的FPGA-ASK電路圖

設(shè)計方案基于 SD7502 構(gòu)成 FPGA-ASK 電路圖 | 2011-07-13

中國科學(xué)院院士：CPU、GPU架構(gòu)上國人沒貢獻很遺憾應(yīng)加強創(chuàng)新

嵌入式系統(tǒng) CPU GPU 架構(gòu) | 2024-07-12

基于FPGA的鎖相環(huán)位同步提取電路

設(shè)計方案電子電路圖，F(xiàn)PGA 鎖相環(huán) | 2012-07-27

Altera的FPGA下載常見問題經(jīng)驗小結(jié)

資源下載 Altera FPGA 常見問題經(jīng)驗 | 2007-12-13

目標完全替代閉源驅(qū)動，英偉達宣布全面轉(zhuǎn)向開源 GPU 內(nèi)核模塊

嵌入式系統(tǒng) 閉源驅(qū)動英偉達開源 GPU 內(nèi)核模塊 Linux | 2024-07-22

焦點

推薦視頻

技術(shù)專區(qū)

看屁屁www成人影院,亚洲人妻成人图片,亚洲精品成人午夜在线,日韩在线欧美成人 (function(){ var bp = document.createElement('script'); var curProtocol = window.location.protocol.split(':')[0]; if (curProtocol === 'https') { bp.src = 'https://zz.bdstatic.com/linksubmit/push.js'; } else { bp.src = 'http://push.zhanzhang.baidu.com/push.js'; } var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(bp, s); })();