<meter id="pryje"><nav id="pryje"><delect id="pryje"></delect></nav></meter>

<label id="pryje"></label>

新聞中心

EEPW首頁 > 設(shè)計(jì)應(yīng)用 > 使用面向FPGA的OpenCL設(shè)計(jì)兩百萬點(diǎn)頻域?yàn)V波器

使用面向FPGA的OpenCL設(shè)計(jì)兩百萬點(diǎn)頻域?yàn)V波器

作者：Dmitry Denisenko 時(shí)間：2015-11-09 來源：電子產(chǎn)品世界

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢

收藏

編者按：快速傅里葉變換(FFT)是信號處理應(yīng)用的基礎(chǔ)。FPGA供應(yīng)商一直以來提供了運(yùn)行良好的FFT庫，處理適配到FPGA片內(nèi)存儲器中的大量數(shù)據(jù)。但是，如果數(shù)據(jù)規(guī)模太大，應(yīng)該如何應(yīng)對? 為解決這一問題，F(xiàn)PGA設(shè)計(jì)人員現(xiàn)在必須要做出設(shè)計(jì)決定，這些決定互相糾纏在一起，例如，片內(nèi)FFT內(nèi)核的配置選擇，其數(shù)量，它們怎樣連接并訪問外部存儲器，多個內(nèi)核之間的同步等。分析所有這類設(shè)計(jì)決定就是要能夠很好的結(jié)合現(xiàn)有產(chǎn)品，在HDL中編程，這會非常耗時(shí)，而且?guī)砹诵阅軉栴}。采用OpenCL等高級編程語言，能夠很快的完成系統(tǒng)設(shè)計(jì)分析。本

摘要：快速傅里葉變換(FFT)是信號處理應(yīng)用的基礎(chǔ)。FPGA供應(yīng)商一直以來提供了運(yùn)行良好的FFT庫，處理適配到FPGA片內(nèi)存儲器中的大量數(shù)據(jù)。但是，如果數(shù)據(jù)規(guī)模太大，應(yīng)該如何應(yīng)對? 為解決這一問題，FPGA設(shè)計(jì)人員現(xiàn)在必須要做出設(shè)計(jì)決定，這些決定互相糾纏在一起，例如，片內(nèi)FFT內(nèi)核的配置選擇，其數(shù)量，它們怎樣連接并訪問外部存儲器，多個內(nèi)核之間的同步等。分析所有這類設(shè)計(jì)決定就是要能夠很好的結(jié)合現(xiàn)有產(chǎn)品，在HDL中編程，這會非常耗時(shí)，而且?guī)砹诵阅軉栴}。采用OpenCL等高級編程語言，能夠很快的完成系統(tǒng)設(shè)計(jì)分析。本文將研究在目前FPGA體系結(jié)構(gòu)上實(shí)現(xiàn)1M和16M點(diǎn)數(shù)的頻域?yàn)V波器，支持從每秒120到240百萬采樣的不同采樣率。本文研究一個2M點(diǎn)數(shù)單精度頻域?yàn)V波器的示例，該示例選擇OpenCL作為其設(shè)計(jì)決定。假設(shè)讀者熟悉FPGA設(shè)計(jì)，掌握OpenCL的基本概念。

本文引用地址：http://www.ex-cimer.com/article/281882.htm

引言

　　本文介紹構(gòu)建一個百萬點(diǎn)數(shù)單精度頻域?yàn)V波器。這類濾波器使用百萬點(diǎn)數(shù)1D FFT，將每一個頻率和相位分量與用戶提供的數(shù)值相乘，使其輸入轉(zhuǎn)換到頻域，并通過FFT反變換，再把結(jié)果轉(zhuǎn)換回時(shí)域。在目前一代FPGA和兩個DDR3外部存儲器塊平臺上，對于兩百萬點(diǎn)采樣，整個系統(tǒng)的性能總要求是每秒處理1.50億點(diǎn)(MSPS)。輸入和輸出通過萬兆以太網(wǎng)直接傳送給FPGA。

　　對于這一設(shè)計(jì)，本文選擇使用Altera OpenCL SDK，在安裝了Stratix V GSD8 FPGA的BittWare S5-PCIe-HQ電路板上運(yùn)行FPGA編譯器。出于兩個原因，選用OpenCL而不是更底層的語言。第一個原因是設(shè)計(jì)幾百萬點(diǎn)數(shù)的濾波器需要構(gòu)建復(fù)雜而且非常高效的外部存儲器系統(tǒng)。采用底層設(shè)計(jì)工具，建立片內(nèi)FFT或者進(jìn)行對角旋轉(zhuǎn)的獨(dú)立模塊相對簡單(特別是因?yàn)樗蠪PGA供應(yīng)商已經(jīng)提供了含有這類模塊的庫)。但是，建立外部存儲器系統(tǒng)通常需要付出大量的HDL工作。由于在開始時(shí)并不知道整個系統(tǒng)的配置，因此這特別難，在后面會看到。選擇OpenCL的第二個原因是通過主機(jī)控制FPGA邏輯。從開始時(shí)就清楚兩個完整的幾百萬點(diǎn)的FFT內(nèi)核副本無法適配到一個器件中，因此，在獲得最終輸出之前，一組數(shù)據(jù)至少要通過FPGA邏輯兩次。協(xié)調(diào)這類共享同時(shí)還要實(shí)現(xiàn)動態(tài)修改數(shù)據(jù)規(guī)模、乘法系數(shù)，甚至完全修改FPGA功能等，這些工作最好留給CPU。為FPGA提供的OpenCL編譯器解決了所有這些難題——它開發(fā)可定制的高效的外部存儲器系統(tǒng)，能夠精確地控制FPGA邏輯。

1 片內(nèi)FFT

　　假設(shè)已經(jīng)有一個FFT內(nèi)核，處理的數(shù)據(jù)長度完全能夠適配到FPGA中(將其稱之為“片內(nèi)FFT”)，每一家FPGA供應(yīng)商都會提供此類內(nèi)核。至少可以采用以下方式對這些內(nèi)核配置參數(shù)：

　　1. 數(shù)據(jù)類型(定點(diǎn)或者單精度浮點(diǎn));2. 要處理的點(diǎn)數(shù)，N; 3.要并行處理的點(diǎn)數(shù)，POINTS;4. 動態(tài)支持修改要處理的點(diǎn)數(shù)。

　　有了這類片內(nèi)FFT內(nèi)核后，需要兩個步驟來構(gòu)建整個系統(tǒng)：開發(fā)一個能夠處理幾百萬點(diǎn)數(shù)的FFT內(nèi)核，然后，把兩個這類內(nèi)核連接在一起，它們之間是復(fù)數(shù)乘法，從而建立完整的系統(tǒng)。

2 幾百萬點(diǎn)FFT

　　采用外部存儲來實(shí)現(xiàn)FFT的傳統(tǒng)方法是六步算法^[1]，把一個一維數(shù)組當(dāng)做兩維來處理(2M = 2K x 1K)，如圖1所示。

使用面向-1.jpg

　　圖1畫出了六步算法，顯示了單獨(dú)的計(jì)算內(nèi)核以及外部存儲器緩沖。“獲取”內(nèi)核讀取來自外部存儲器的數(shù)據(jù)，以選擇對其進(jìn)行轉(zhuǎn)置，將其輸出至通道(在OpenCL 2.0術(shù)語中，也稱之為“管道”)。在硬件中，以FIFO來實(shí)現(xiàn)通道，其深度由編譯器計(jì)算。“片內(nèi)1D FFT”是未經(jīng)修改的供應(yīng)商的FFT內(nèi)核，接收輸入，使用通道產(chǎn)生比特反轉(zhuǎn)輸出。“轉(zhuǎn)置”是將從輸入通道讀取的數(shù)據(jù)轉(zhuǎn)置，可以選擇將其與特殊的旋轉(zhuǎn)因子相乘，以自然順序把輸出寫入到外部存儲器。

　　正如您從圖1中所看到的，數(shù)據(jù)兩次通過獲取→1D FFT→轉(zhuǎn)置(F1T)流水線，產(chǎn)生最終輸出。留給第一個最重要的設(shè)計(jì)選擇——采用一個F1T流水線副本以節(jié)省面積，或者兩個副本以盡可能的提高吞吐量。

　　在仿真器中對這一算法進(jìn)行原型設(shè)計(jì)，以便能夠正確的處理轉(zhuǎn)置地址以及旋轉(zhuǎn)因子。仿真器將OpenCL內(nèi)核編譯至x86-64二進(jìn)制文件，可以運(yùn)行在沒有FPGA的開發(fā)板上。從仿真器到硬件編譯是比較簡單的步驟——仿真器中功能正確的代碼在硬件中也是正確的，不需要仿真。出于性能和面積的原因，唯一要修改的是獲取和轉(zhuǎn)置內(nèi)核所使用的本地存儲器系統(tǒng)。高效的轉(zhuǎn)置需要在本地存儲器中對數(shù)據(jù)POINTS列/行進(jìn)行緩沖。OpenCL編譯器分析您OpenCL代碼中對本地存儲器的所有訪問，并通過創(chuàng)建一個定制的片內(nèi)存儲系統(tǒng)來優(yōu)化你的代碼。對于POINTS=4的情況，最初的轉(zhuǎn)置內(nèi)核有四次寫和四次讀操作。一個雙泵的片內(nèi)RAM模塊最多可以服務(wù)四個獨(dú)立的申請，其中最多兩次寫操作。為支持四次寫和四次讀操作，需要復(fù)制片內(nèi)存儲器，含有申請仲裁邏輯，導(dǎo)致面積增大，性能下降。當(dāng)認(rèn)識到可以通過修改寫模式，來連續(xù)進(jìn)行所有四次寫操作后，這四次寫操作被OpenCL編譯器分成一組，成為一次寬寫操作，這樣，只需要對本地存儲器系統(tǒng)訪問五次：一次寫操作，四次讀操作。進(jìn)行了這一修改后，編譯器自動為構(gòu)建一個小很多的五端口存儲器系統(tǒng)，在每一時(shí)鐘周期可以服務(wù)所有五個申請，不會出現(xiàn)停頓。

　　設(shè)計(jì)被編譯到硬件中后，可以進(jìn)行性能測量。在FPGA上有一個F1T流水線副本，對于四百萬點(diǎn)FFT，測得了POINTS=4時(shí)，217 MSPS，POINTS=8時(shí)，457 MSPS[2]。POINTS=8版本使用了兩次，因?yàn)檫@一配置中大量的片內(nèi)模塊RAM和兩個副本無法適配。這就是要研究的第一個設(shè)計(jì)范圍——要并行處理的點(diǎn)數(shù)和面積。

3 全濾波器設(shè)計(jì)

　　現(xiàn)在，有了一個幾百萬點(diǎn)的FFT，準(zhǔn)備好將整個設(shè)計(jì)合在一起。把兩個片外FFT連接在一起，得到圖2所示的流水線邏輯視圖。

使用面向-2.jpg

上一頁 1 2 下一頁

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

關(guān)鍵詞： FPGA 頻域?yàn)V波器 OpenCL 201511

評論

相關(guān)推薦

s3c2410+fpga 做視頻無線傳輸

herbertwj | 2004-08-15

Altera的FPGA下載常見問題經(jīng)驗(yàn)小結(jié)

資源下載 Altera FPGA 常見問題經(jīng)驗(yàn) | 2007-12-13

LatticeECP3設(shè)計(jì)的視頻協(xié)議板電路圖-FPGA配置

設(shè)計(jì)方案 LatticeECP3 設(shè)計(jì) 視頻協(xié)議電路圖 -FPGA | 2011-06-27

LabVIEW 8.20技術(shù)資料大全簡介

資源下載 NI LabVIEW 射頻和通信 FPGA | 2007-12-11

采用創(chuàng)新的FPGA 器件來實(shí)現(xiàn)更經(jīng)濟(jì)且更高能效的大模型推理解決方案

嵌入式系統(tǒng) Achronix FPGA | 2024-06-18

FPGA比單片機(jī)厲害嗎？

嵌入式系統(tǒng) FPGA 單片機(jī) | 2024-06-13

Altera公司cyclone系列FPGA-1C6電路圖

設(shè)計(jì)方案 Altera 公司 cyclone 系列 FPGA-1C6 | 2009-07-17

LabVIEW FPGA 模塊簡介

視頻 NI LabVIEW FPGA | 2009-04-01

9種單片機(jī)常用的軟件架構(gòu)

嵌入式系統(tǒng) PCB FPGA 架構(gòu) | 2024-05-21

基于FPGA的可編程數(shù)字濾波器系統(tǒng)

資源下載 Max FPGA 可編程數(shù)字濾波器 | 2007-12-14

FPGA是實(shí)現(xiàn)敏捷、安全的工業(yè)4.0發(fā)展的關(guān)鍵

嵌入式系統(tǒng) FPGA 工業(yè)4.0 Lattice 萊迪思 | 2024-05-06

實(shí)時(shí)的噪聲源定位系統(tǒng)

視頻 NI LabVIEW FPGA | 2009-03-25

3-DES算法的FPGA高速實(shí)現(xiàn)(Xilinx)

資源下載 Xilinx FPGA 3-DES算法 | 2007-12-13

用C/C++語言開發(fā)大規(guī)模FPGA [轉(zhuǎn)載于www.fpga.com.cn]

xiaohua | 2002-09-24

ALTERA的PCI_IP Core問答集

資源下載 Altera FPGA PCI_IP Core | 2007-12-13

FPGA如何同DDR3存儲器進(jìn)行接口?

視頻 Altera FPGA DDR3 | 2008-06-18

萊迪思全新推出邏輯優(yōu)化的通用FPGA拓展其小型FPGA產(chǎn)品組合

嵌入式系統(tǒng) 萊迪思 FPGA 小型FPGA | 2024-07-23

help, 44b0+fpga拖死cpu

sandman555 | 2005-02-05

iCE40 LP/HX系列FPGA：萊迪思的創(chuàng)新可編程解決方案

嵌入式系統(tǒng) iCE40 LP/HX FPGA 萊迪思可編程解決方案 | 2024-06-07

基于FPGA的鎖相環(huán)位同步提取電路

設(shè)計(jì)方案電子電路圖，F(xiàn)PGA 鎖相環(huán) | 2012-07-27

基于SD7502構(gòu)成的FPGA-ASK電路圖

設(shè)計(jì)方案基于 SD7502 構(gòu)成 FPGA-ASK 電路圖 | 2011-07-13

help, 44b0+fpga拖死cpu

sandman555 | 2005-02-05

視頻協(xié)議板-FPGA配置基于LatticeECP3的設(shè)計(jì)

設(shè)計(jì)方案視頻協(xié)議 -FPGA 配置基于 LatticeECP3 | 2014-05-20

help, 44b0+fpga拖死cpu

sandman555 | 2005-02-05

Altera: 采用全系列40-nm收發(fā)器FPGA和ASIC實(shí)現(xiàn)創(chuàng)新

視頻 Altera FPGA ASIC | 2009-07-13

國產(chǎn)28納米FPGA流片

嵌入式系統(tǒng) FPGA EDA 芯片 | 2024-05-31

基于FPGA的數(shù)字信號處理--什么是定點(diǎn)數(shù)？

嵌入式系統(tǒng) FPGA 數(shù)字信號定點(diǎn)數(shù) | 2024-05-11

利用強(qiáng)大的軟件設(shè)計(jì)工具為FPGA開發(fā)者賦能

嵌入式系統(tǒng) 軟件設(shè)計(jì)工具 FPGA 萊迪思 | 2024-07-17

萊迪思推出全新安全控制FPGA系列產(chǎn)品，具備先進(jìn)的加密敏捷性和硬件可信根

嵌入式系統(tǒng) 萊迪思安全控制 FPGA 加密敏捷性硬件可信根 | 2024-06-27

高速ADC與內(nèi)置嵌入式串行收發(fā)器的FPGA接口

視頻 Altera FPGA ADC Linear 串行收發(fā)器 | 2009-05-19

焦點(diǎn)

推薦視頻

技術(shù)專區(qū)

看屁屁www成人影院,亚洲人妻成人图片,亚洲精品成人午夜在线,日韩在线欧美成人 (function(){ var bp = document.createElement('script'); var curProtocol = window.location.protocol.split(':')[0]; if (curProtocol === 'https') { bp.src = 'https://zz.bdstatic.com/linksubmit/push.js'; } else { bp.src = 'http://push.zhanzhang.baidu.com/push.js'; } var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(bp, s); })();