<meter id="pryje"><nav id="pryje"><delect id="pryje"></delect></nav></meter>

<label id="pryje"></label>

新聞中心

EEPW首頁 > 嵌入式系統(tǒng) > 設(shè)計(jì)應(yīng)用 > 雷達(dá)信號(hào)處理：FPGA還是GPU?

雷達(dá)信號(hào)處理：FPGA還是GPU?

作者：時(shí)間：2015-06-22 來源：網(wǎng)絡(luò)

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對(duì)面交流
  海量資料庫查詢

收藏

　　當(dāng)需要進(jìn)行歸一化和去歸一化時(shí)，另一種可以避免低性能和過度布線的方法是使用乘法器。對(duì)于一個(gè)24位單精度尾數(shù)(包括符號(hào)位)，24×24乘法器通過乘以2n對(duì)輸入移位。27×27和36×36硬核乘法器支持單精度擴(kuò)展尾數(shù)，可以用于構(gòu)建雙精度乘法器。

本文引用地址：http://www.ex-cimer.com/article/276090.htm

　　在很多線性代數(shù)算法中，矢量點(diǎn)乘是占用大量FLOP的底層運(yùn)算。單精度實(shí)現(xiàn)長度是64的長矢量點(diǎn)乘需要64個(gè)浮點(diǎn)乘法器，以及隨后由63個(gè)浮點(diǎn)加法器構(gòu)成的加法樹。這類實(shí)現(xiàn)需要很多桶形移位電路。

　　相反，可以對(duì)64個(gè)乘法器的輸出進(jìn)行去歸一化，成為公共指數(shù)，最大是64位指數(shù)?？梢允褂枚c(diǎn)加法器電路對(duì)這些64路輸出求和，在加法樹的最后進(jìn)行最終的歸一化。如圖4所示，這一本地模塊浮點(diǎn)處理過程省掉了每一加法器所需要的中間歸一化和去歸一化。即使是IEEE 754浮點(diǎn)處理，最大指數(shù)決定了最終的指數(shù)，因此，這種改變只是在計(jì)算早期進(jìn)行指數(shù)調(diào)整。

　　

　　圖4.矢量點(diǎn)乘優(yōu)化

　　但進(jìn)行信號(hào)處理時(shí)，在計(jì)算最后盡可能以高精度來截?cái)嘟Y(jié)果才能獲得最佳結(jié)果。這種方法傳遞除單精度浮點(diǎn)處理所需要尾數(shù)位寬之外的額外的尾數(shù)位寬，一般從27位到36位補(bǔ)償了單精度浮點(diǎn)處理所需要的早期去歸一化這種次優(yōu)方法，。采用浮點(diǎn)乘法器進(jìn)行尾數(shù)擴(kuò)展，因此，在每一步消除了對(duì)乘積進(jìn)行歸一化的要求。

　　這一方法每個(gè)時(shí)鐘周期也會(huì)產(chǎn)生一個(gè)結(jié)果。GPU體系結(jié)構(gòu)可以并行產(chǎn)生所有浮點(diǎn)乘法，但不能高效并行進(jìn)行加法。原因是因?yàn)椴煌膬?nèi)核必須通過本地存儲(chǔ)器傳輸數(shù)據(jù)實(shí)現(xiàn)通信，因此缺乏FPGA架構(gòu)的連接的靈活特性。

　　融合數(shù)據(jù)通路方法產(chǎn)生的結(jié)果比傳統(tǒng)IEEE 754浮點(diǎn)結(jié)果更加精確，如表3所示。

　　表3.Cholesky分解準(zhǔn)確性(單精度)

　　

　　使用Cholesky分解算法，實(shí)現(xiàn)大規(guī)模矩陣求逆，獲得了這些結(jié)果。相同的算法以三種不同的方法實(shí)現(xiàn)：

　　n在MATLAB/Simulink中，采用IEEE 754單精度浮點(diǎn)處理。

　　n在RTL單精度浮點(diǎn)處理中，使用融合數(shù)據(jù)通路方法。

　　n在MATLAB中，采用雙精度浮點(diǎn)處理。

　　雙精度實(shí)現(xiàn)要比單精度實(shí)現(xiàn)精度高十億倍(109)。

　　MATLAB單精度誤差、RTL單精度誤差和MATLAB雙精度誤差對(duì)比確認(rèn)了融合數(shù)據(jù)通路方法的完整性。采用了這一方法來獲得輸出矩陣中所有復(fù)數(shù)元素的歸一化誤差以及矩陣元素的最大誤差。使用Frobenius范數(shù)計(jì)算了總誤差：

　　

　　由于范數(shù)包括了所有元素的誤差，因此比單一誤差大很多。

　　此外，DSP Builder高級(jí)模塊庫和OpenCL工具流程都針對(duì)下一代FPGA體系結(jié)構(gòu)，支持并優(yōu)化目前的設(shè)計(jì)。由于體系結(jié)構(gòu)創(chuàng)新和工藝技術(shù)創(chuàng)新，性能可以達(dá)到100峰值GFLOPs/W.

　　結(jié)論

　　高性能雷達(dá)系統(tǒng)現(xiàn)在有新的處理平臺(tái)選擇。除了更好的SWaP，與基于處理器的解決方案相比，FPGA能提供低延時(shí)和高GFLOP.隨著下一代高性能計(jì)算優(yōu)化FPGA的推出，這種優(yōu)勢(shì)會(huì)更明顯。

　　Altera的OpenCL編譯器為GPU編程人員提供了幾乎無縫的通路來評(píng)估這一新處理體系結(jié)構(gòu)的指標(biāo)。Altera OpenCL符合1.2規(guī)范，提供全面的數(shù)學(xué)庫支持。它解決了傳統(tǒng)FPGA遇到的時(shí)序收斂、DDR存儲(chǔ)器管理以及PCIe主處理器接口等難題。

　　對(duì)于非GPU開發(fā)人員，Altera提供DSP Builder高級(jí)模塊庫工具流程，支持開發(fā)人員開發(fā)高fMAX定點(diǎn)或浮點(diǎn)DSP設(shè)計(jì)，同時(shí)保持基于Mathworks的仿真和開發(fā)環(huán)境的優(yōu)點(diǎn)。使用FPGA的雷達(dá)開發(fā)人員多年以來一直使用該產(chǎn)品，實(shí)現(xiàn)更高效的工作流程和仿真，其fMAX性能與手動(dòng)編碼HDL相同。

fpga相關(guān)文章:fpga是什么

矢量控制相關(guān)文章:矢量控制原理

上一頁 1 2 3 下一頁

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

關(guān)鍵詞： FPGA GPU

評(píng)論

相關(guān)推薦

Altera: 采用全系列40-nm收發(fā)器FPGA和ASIC實(shí)現(xiàn)創(chuàng)新

視頻 Altera FPGA ASIC | 2009-07-13

用C/C++語言開發(fā)大規(guī)模FPGA [轉(zhuǎn)載于www.fpga.com.cn]

xiaohua | 2002-09-24

基于FPGA的鎖相環(huán)位同步提取電路

設(shè)計(jì)方案電子電路圖，F(xiàn)PGA 鎖相環(huán) | 2012-07-27

高通新中端芯片驍龍7s Gen 3曝光：采用Adreno 810 GPU，下月發(fā)布

EDA/PCB 高通中端芯片驍龍7s Gen 3 Adreno 810 GPU | 2024-07-23

FPGA如何同DDR3存儲(chǔ)器進(jìn)行接口?

視頻 Altera FPGA DDR3 | 2008-06-18

Altera的FPGA下載常見問題經(jīng)驗(yàn)小結(jié)

資源下載 Altera FPGA 常見問題經(jīng)驗(yàn) | 2007-12-13

基于SD7502構(gòu)成的FPGA-ASK電路圖

設(shè)計(jì)方案基于 SD7502 構(gòu)成 FPGA-ASK 電路圖 | 2011-07-13

ALTERA的PCI_IP Core問答集

資源下載 Altera FPGA PCI_IP Core | 2007-12-13

FOPLP導(dǎo)入AI GPU 估2027年量產(chǎn)

EDA/PCB FOPLP AI GPU 臺(tái)積電 | 2024-07-04

什么是 DLSS，值得嗎？

智能計(jì)算 DLSS gpu NVIDIA | 2024-07-17

Altera公司cyclone系列FPGA-1C6電路圖

設(shè)計(jì)方案 Altera 公司 cyclone 系列 FPGA-1C6 | 2009-07-17

help, 44b0+fpga拖死cpu

sandman555 | 2005-02-05

消息稱臺(tái)積電代工英特爾下代 AI HPC 用 GPU 芯片 Falcon Shores

EDA/PCB 臺(tái)積電英特爾 AI HPC GPU 芯片 Falcon Shores | 2024-07-17

打破NVIDIA壟斷！英國公司實(shí)現(xiàn)CUDA軟件在AMD GPU上無縫運(yùn)行

智能計(jì)算 NVIDIA CUDA軟件 AMD GPU | 2024-07-22

LabVIEW 8.20技術(shù)資料大全簡介

資源下載 NI LabVIEW 射頻和通信 FPGA | 2007-12-11

視頻協(xié)議板-FPGA配置基于LatticeECP3的設(shè)計(jì)

設(shè)計(jì)方案視頻協(xié)議 -FPGA 配置基于 LatticeECP3 | 2014-05-20

利用強(qiáng)大的軟件設(shè)計(jì)工具為FPGA開發(fā)者賦能

嵌入式系統(tǒng) 軟件設(shè)計(jì)工具 FPGA 萊迪思 | 2024-07-17

目標(biāo)完全替代閉源驅(qū)動(dòng)，英偉達(dá)宣布全面轉(zhuǎn)向開源 GPU 內(nèi)核模塊

嵌入式系統(tǒng) 閉源驅(qū)動(dòng) 英偉達(dá) 開源 GPU 內(nèi)核模塊 Linux | 2024-07-22

LabVIEW FPGA 模塊簡介

視頻 NI LabVIEW FPGA | 2009-04-01

3-DES算法的FPGA高速實(shí)現(xiàn)(Xilinx)

資源下載 Xilinx FPGA 3-DES算法 | 2007-12-13

萊迪思全新推出邏輯優(yōu)化的通用FPGA拓展其小型FPGA產(chǎn)品組合

嵌入式系統(tǒng) 萊迪思 FPGA 小型FPGA | 2024-07-23

實(shí)時(shí)的噪聲源定位系統(tǒng)

視頻 NI LabVIEW FPGA | 2009-03-25

基于FPGA的可編程數(shù)字濾波器系統(tǒng)

資源下載 Max FPGA 可編程數(shù)字濾波器 | 2007-12-14

高速ADC與內(nèi)置嵌入式串行收發(fā)器的FPGA接口

視頻 Altera FPGA ADC Linear 串行收發(fā)器 | 2009-05-19

help, 44b0+fpga拖死cpu

sandman555 | 2005-02-05

LatticeECP3設(shè)計(jì)的視頻協(xié)議板電路圖-FPGA配置

設(shè)計(jì)方案 LatticeECP3 設(shè)計(jì) 視頻協(xié)議電路圖 -FPGA | 2011-06-27

中國科學(xué)院院士：CPU、GPU架構(gòu)上國人沒貢獻(xiàn)很遺憾應(yīng)加強(qiáng)創(chuàng)新

嵌入式系統(tǒng) CPU GPU 架構(gòu) | 2024-07-12

消息稱英偉達(dá)曾向臺(tái)積電詢問建設(shè)廠外 CoWoS 先進(jìn)封裝專線可能，遭拒絕

EDA/PCB 英偉達(dá) GPU 封裝工藝臺(tái)積電 | 2024-07-23

help, 44b0+fpga拖死cpu

sandman555 | 2005-02-05

s3c2410+fpga 做視頻無線傳輸

herbertwj | 2004-08-15

焦點(diǎn)

推薦視頻

技術(shù)專區(qū)

看屁屁www成人影院,亚洲人妻成人图片,亚洲精品成人午夜在线,日韩在线欧美成人 (function(){ var bp = document.createElement('script'); var curProtocol = window.location.protocol.split(':')[0]; if (curProtocol === 'https') { bp.src = 'https://zz.bdstatic.com/linksubmit/push.js'; } else { bp.src = 'http://push.zhanzhang.baidu.com/push.js'; } var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(bp, s); })();