<meter id="pryje"><nav id="pryje"><delect id="pryje"></delect></nav></meter>

<label id="pryje"></label>

新聞中心

EEPW首頁(yè) > EDA/PCB > 設(shè)計(jì)應(yīng)用 > 基于OpenCL標(biāo)準(zhǔn)的FPGA設(shè)計(jì)

基于OpenCL標(biāo)準(zhǔn)的FPGA設(shè)計(jì)

作者：時(shí)間：2016-10-18 來(lái)源：網(wǎng)絡(luò)

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對(duì)面交流
  海量資料庫(kù)查詢

收藏

在可編程技術(shù)發(fā)展的最初階段，可編程能力出現(xiàn)了兩個(gè)極端。一個(gè)極端的代表是單核CPU和DSP單元。這些器件使用含有一系列可執(zhí)行指令的軟件來(lái)進(jìn)行編程。對(duì)于編程人員，在概念上以連續(xù)的方式來(lái)開(kāi)發(fā)這些指令，而高級(jí)處理器能夠?qū)χ噶钪匦屡判颍谶\(yùn)行時(shí)從這些連續(xù)程序中提取出指令級(jí)并行處理操作。作為對(duì)比，可編程技術(shù)另一極端的代表是FPGA。通過(guò)開(kāi)發(fā)可配置硬件電路對(duì)這些器件編程，完全并行執(zhí)行。使用FPGA的設(shè)計(jì)人員實(shí)際上是大規(guī)模開(kāi)發(fā)粒度非常精細(xì)的并行應(yīng)用。多年以來(lái)，這兩個(gè)極端同時(shí)存在，每一類型的可編程功能適用于不同的應(yīng)用領(lǐng)域。但是，最近的技術(shù)發(fā)展趨勢(shì)表明，有更好的技術(shù)同時(shí)實(shí)現(xiàn)了可編程和并行處理操作。

本文引用地址：http://www.ex-cimer.com/article/201610/308458.htm

軟件可編程器件的第二種趨勢(shì)是復(fù)雜硬件的出現(xiàn)，從順序程序中提取出指令級(jí)并行處理操作。單核體系結(jié)構(gòu)輸入指令流，在器件中執(zhí)行它們，這些器件會(huì)有很多并行功能單元。處理器硬件的很大一部分必須專門(mén)用于從順序代碼中動(dòng)態(tài)提取出并行處理操作。此外，硬件還會(huì)嘗試去補(bǔ)償存儲(chǔ)器延時(shí)。一般而言，編程人員開(kāi)發(fā)程序時(shí)沒(méi)有考慮處理器的底層存儲(chǔ)器結(jié)構(gòu)，好像只有大規(guī)模的統(tǒng)一快速存儲(chǔ)器。相比較而言，處理器必須處理實(shí)際延時(shí)，以及與外部存儲(chǔ)器的有限帶寬鏈接。為保持功能單元能夠傳送數(shù)據(jù)，處理器必須從外部存儲(chǔ)器中預(yù)先獲取數(shù)據(jù)，放入片內(nèi)高速緩存中，這樣，數(shù)據(jù)更接近要進(jìn)行計(jì)算的地方。使用這些技術(shù)，性能經(jīng)過(guò)多年的提高后，這類體系結(jié)構(gòu)的改動(dòng)已經(jīng)不大了。

圖1.可編程和并行技術(shù)最近的發(fā)展趨勢(shì)

在傳統(tǒng)處理器體系結(jié)構(gòu)上，這兩種趨勢(shì)的優(yōu)勢(shì)日益減小，我們開(kāi)始尋找各種軟件可編程器件，這些器件的發(fā)展非?？欤鐖D1所示。重點(diǎn)是從運(yùn)行時(shí)自動(dòng)提取指令級(jí)并行處理操作，發(fā)展到在編碼時(shí)明確的找到線程級(jí)并行處理操作。開(kāi)始出現(xiàn)高度并行的多核器件，一般趨勢(shì)是含有多個(gè)簡(jiǎn)單處理器，很多晶體管專門(mén)用于計(jì)算，而不是采用高速緩存，提取并行處理操作。這些器件一般包括含有2、4或者8個(gè)內(nèi)核的多核CPU，以及含有數(shù)百個(gè)適用于數(shù)據(jù)并行計(jì)算的簡(jiǎn)單內(nèi)核的GPU等。為能夠在這些多核器件上實(shí)現(xiàn)高性能，編程人員必須以并行方式清晰的對(duì)實(shí)際應(yīng)用進(jìn)行編程。每一內(nèi)核都必須分配一定的工作，這樣，所有內(nèi)核能夠協(xié)同工作，執(zhí)行某一計(jì)算。這也是FPGA設(shè)計(jì)人員在開(kāi)發(fā)其高級(jí)系統(tǒng)體系結(jié)構(gòu)時(shí)所做的工作。

考慮到多核新時(shí)代開(kāi)發(fā)并行程序的需求，開(kāi)發(fā)了OpenCL (開(kāi)放計(jì)算語(yǔ)言)，以便開(kāi)發(fā)跨平臺(tái)并行編程標(biāo)準(zhǔn)。OpenCL標(biāo)準(zhǔn)還能夠自然的描述在FPGA中實(shí)現(xiàn)的并行算法，其抽象級(jí)要比VHDL或者Verilog等硬件描述語(yǔ)言(HDL)高得多。雖然有很多高級(jí)綜合工具能夠?qū)崿F(xiàn)高等級(jí)的抽象功能，但是都存在同樣的基本問(wèn)題。這些工具會(huì)采用連續(xù)C程序，產(chǎn)生并行HDL實(shí)現(xiàn)。在開(kāi)發(fā)HDL時(shí)，困難還不是很明顯，但是，提取出線程級(jí)并行處理操作在FPGA中實(shí)現(xiàn)以提高性能時(shí)，困難卻非常大。而FPGA的并行功能非常強(qiáng)大，與其他器件相比，在盡可能提取并行功能時(shí)出現(xiàn)任何失敗的后果都非常嚴(yán)重。OpenCL標(biāo)準(zhǔn)能夠解決很多這類問(wèn)題，它支持編程人員明確的設(shè)定并控制并行處理操作。與純C語(yǔ)言描述的連續(xù)程序相比，OpenCL標(biāo)準(zhǔn)能夠更自然的匹配FPGA的高度并行特性。

OpenCL應(yīng)用程序含有兩部分。OpenCL主程序是純軟件例程，以標(biāo)準(zhǔn)C/C++編寫(xiě)，可以運(yùn)行在任何類型的微處理器上。例如，這類處理器可以是FPGA中的嵌入式軟核處理器、硬核ARM處理器或者外置x86處理器。

在這一主軟件例程執(zhí)行期間的某一點(diǎn)，某一功能有可能需要進(jìn)行大量的計(jì)算，這就可以受益于并行器件的高度并行加速功能，例如CPU、GPU、FPGA等器件。要加速的功能被稱為OpenCL內(nèi)核。采用標(biāo)準(zhǔn)C編寫(xiě)這些內(nèi)核;但是，采用結(jié)構(gòu)對(duì)其進(jìn)行注釋，以設(shè)定并行處理操作和存儲(chǔ)器等級(jí)。圖2中的例子對(duì)兩個(gè)數(shù)組a和b進(jìn)行矢量加法，將結(jié)果寫(xiě)回輸出數(shù)組應(yīng)答中。矢量的每一元素都采用了并行線程，當(dāng)采用像FPGA這類具有大量精細(xì)粒度并行單元的器件進(jìn)行加速時(shí)，能夠很快的計(jì)算出結(jié)果。主程序使用標(biāo)準(zhǔn)OpenCL API，支持將數(shù)據(jù)傳送至FPGA，調(diào)用FPGA內(nèi)核，傳回得到的數(shù)據(jù)。

圖2.在FPGA上實(shí)現(xiàn)的OpenCL例子

在FPGA中，可以把內(nèi)核功能傳送到專用深度流水線硬件電路中，它使用了流水線并行處理概念，在本質(zhì)上就是多線程的。這些流水線的每一條都可以復(fù)制多次，與一條流水線相比，提供更強(qiáng)的并行處理功能。

在FPGA上實(shí)現(xiàn)OpenCL標(biāo)準(zhǔn)的優(yōu)勢(shì)

使用OpenCL描述來(lái)開(kāi)發(fā)FPGA設(shè)計(jì)，與基于HDL設(shè)計(jì)的傳統(tǒng)方法相比，具有很多優(yōu)勢(shì)。開(kāi)發(fā)軟件可編程器件的流程一般包括進(jìn)行構(gòu)思、在C等高級(jí)語(yǔ)言中對(duì)算法編程，然后使用自動(dòng)編譯器來(lái)建立指令流。面向OpenCL的Altera SDK提供了設(shè)計(jì)環(huán)境，很容易在FPGA上實(shí)現(xiàn)OpenCL應(yīng)用。如圖3所示。

圖3.面向OpenCL的Altera SDK簡(jiǎn)介

可以把這一方法與傳統(tǒng)的FPGA設(shè)計(jì)方法相比較，在傳統(tǒng)方法中，設(shè)計(jì)人員的主要工作是對(duì)硬件按照每個(gè)周期進(jìn)行描述，用于實(shí)現(xiàn)其算法。傳統(tǒng)流程涉及到建立數(shù)據(jù)通路，通過(guò)狀態(tài)機(jī)來(lái)控制這些數(shù)據(jù)通路，使用系統(tǒng)級(jí)工具連接至底層IP內(nèi)核，由于必須要滿足外部接口帶來(lái)的約束，因此，需要處理時(shí)序收斂問(wèn)題。面向OpenCL的Altera SDK幫助設(shè)計(jì)人員自動(dòng)完成所有這些步驟，使他們能夠集中精力定義算法，而不是重點(diǎn)關(guān)注乏味的硬件設(shè)計(jì)。以這種方式進(jìn)行設(shè)計(jì)，設(shè)計(jì)人員很容易移植到新FPGA，性能更好，功能更強(qiáng)，這是因?yàn)镺penCL編譯器將相同的高級(jí)描述轉(zhuǎn)換為流水線，從而發(fā)揮了FPGA新器件的優(yōu)勢(shì)。

在FPGA上使用OpenCL標(biāo)準(zhǔn)，與目前的硬件體系結(jié)構(gòu)(CPU、GPU，等)相比，能夠大幅度提高性能，同時(shí)降低了功耗。此外，與使用Verilog或者VHDL等底層硬件描述語(yǔ)言(HDL)的傳統(tǒng)FPGA開(kāi)發(fā)方法相比，使用OpenCL標(biāo)準(zhǔn)、基于FPGA的混合系統(tǒng)(CPU + FPGA)具有明顯的產(chǎn)品及時(shí)面市優(yōu)勢(shì)。

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

關(guān)鍵詞： OpenCL FPGA

評(píng)論

相關(guān)推薦

高速ADC與內(nèi)置嵌入式串行收發(fā)器的FPGA接口

視頻 Altera FPGA ADC Linear 串行收發(fā)器 | 2009-05-19

國(guó)產(chǎn)28納米FPGA流片

嵌入式系統(tǒng) FPGA EDA 芯片 | 2024-05-31

s3c2410+fpga 做視頻無(wú)線傳輸

herbertwj | 2004-08-15

help, 44b0+fpga拖死cpu

sandman555 | 2005-02-05

萊迪思全新推出邏輯優(yōu)化的通用FPGA拓展其小型FPGA產(chǎn)品組合

嵌入式系統(tǒng) 萊迪思 FPGA 小型FPGA | 2024-07-23

利用強(qiáng)大的軟件設(shè)計(jì)工具為FPGA開(kāi)發(fā)者賦能

嵌入式系統(tǒng) 軟件設(shè)計(jì)工具 FPGA 萊迪思 | 2024-07-17

help, 44b0+fpga拖死cpu

sandman555 | 2005-02-05

萊迪思推出全新安全控制FPGA系列產(chǎn)品，具備先進(jìn)的加密敏捷性和硬件可信根

嵌入式系統(tǒng) 萊迪思安全控制 FPGA 加密敏捷性硬件可信根 | 2024-06-27

基于SD7502構(gòu)成的FPGA-ASK電路圖

設(shè)計(jì)方案基于 SD7502 構(gòu)成 FPGA-ASK 電路圖 | 2011-07-13

FPGA是實(shí)現(xiàn)敏捷、安全的工業(yè)4.0發(fā)展的關(guān)鍵

嵌入式系統(tǒng) FPGA 工業(yè)4.0 Lattice 萊迪思 | 2024-05-06

用C/C++語(yǔ)言開(kāi)發(fā)大規(guī)模FPGA [轉(zhuǎn)載于www.fpga.com.cn]

xiaohua | 2002-09-24

LatticeECP3設(shè)計(jì)的視頻協(xié)議板電路圖-FPGA配置

設(shè)計(jì)方案 LatticeECP3 設(shè)計(jì) 視頻協(xié)議電路圖 -FPGA | 2011-06-27

LabVIEW 8.20技術(shù)資料大全簡(jiǎn)介

資源下載 NI LabVIEW 射頻和通信 FPGA | 2007-12-11

LabVIEW FPGA 模塊簡(jiǎn)介

視頻 NI LabVIEW FPGA | 2009-04-01

實(shí)時(shí)的噪聲源定位系統(tǒng)

視頻 NI LabVIEW FPGA | 2009-03-25

ALTERA的PCI_IP Core問(wèn)答集

資源下載 Altera FPGA PCI_IP Core | 2007-12-13

基于FPGA的鎖相環(huán)位同步提取電路

設(shè)計(jì)方案電子電路圖，F(xiàn)PGA 鎖相環(huán) | 2012-07-27

iCE40 LP/HX系列FPGA：萊迪思的創(chuàng)新可編程解決方案

嵌入式系統(tǒng) iCE40 LP/HX FPGA 萊迪思可編程解決方案 | 2024-06-07

Altera公司cyclone系列FPGA-1C6電路圖

設(shè)計(jì)方案 Altera 公司 cyclone 系列 FPGA-1C6 | 2009-07-17

help, 44b0+fpga拖死cpu

sandman555 | 2005-02-05

Altera的FPGA下載常見(jiàn)問(wèn)題經(jīng)驗(yàn)小結(jié)

資源下載 Altera FPGA 常見(jiàn)問(wèn)題經(jīng)驗(yàn) | 2007-12-13

Altera: 采用全系列40-nm收發(fā)器FPGA和ASIC實(shí)現(xiàn)創(chuàng)新

視頻 Altera FPGA ASIC | 2009-07-13

3-DES算法的FPGA高速實(shí)現(xiàn)(Xilinx)

資源下載 Xilinx FPGA 3-DES算法 | 2007-12-13

FPGA比單片機(jī)厲害嗎？

嵌入式系統(tǒng) FPGA 單片機(jī) | 2024-06-13

基于FPGA的數(shù)字信號(hào)處理--什么是定點(diǎn)數(shù)？

嵌入式系統(tǒng) FPGA 數(shù)字信號(hào) 定點(diǎn)數(shù) | 2024-05-11

9種單片機(jī)常用的軟件架構(gòu)

嵌入式系統(tǒng) PCB FPGA 架構(gòu) | 2024-05-21

基于FPGA的可編程數(shù)字濾波器系統(tǒng)

資源下載 Max FPGA 可編程數(shù)字濾波器 | 2007-12-14

采用創(chuàng)新的FPGA 器件來(lái)實(shí)現(xiàn)更經(jīng)濟(jì)且更高能效的大模型推理解決方案

嵌入式系統(tǒng) Achronix FPGA | 2024-06-18

視頻協(xié)議板-FPGA配置基于LatticeECP3的設(shè)計(jì)

設(shè)計(jì)方案視頻協(xié)議 -FPGA 配置基于 LatticeECP3 | 2014-05-20

FPGA如何同DDR3存儲(chǔ)器進(jìn)行接口?

視頻 Altera FPGA DDR3 | 2008-06-18

焦點(diǎn)

推薦視頻

技術(shù)專區(qū)

看屁屁www成人影院,亚洲人妻成人图片,亚洲精品成人午夜在线,日韩在线欧美成人 (function(){ var bp = document.createElement('script'); var curProtocol = window.location.protocol.split(':')[0]; if (curProtocol === 'https') { bp.src = 'https://zz.bdstatic.com/linksubmit/push.js'; } else { bp.src = 'http://push.zhanzhang.baidu.com/push.js'; } var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(bp, s); })();