<meter id="pryje"><nav id="pryje"><delect id="pryje"></delect></nav></meter>

<label id="pryje"></label>

新聞中心

EEPW首頁(yè) > 嵌入式系統(tǒng) > 設(shè)計(jì)應(yīng)用 > 相比GPU和GPP，F(xiàn)PGA是深度學(xué)習(xí)的未來(lái)？

相比GPU和GPP，F(xiàn)PGA是深度學(xué)習(xí)的未來(lái)？

作者：時(shí)間：2017-10-14 來(lái)源：網(wǎng)絡(luò)

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對(duì)面交流
  海量資料庫(kù)查詢

收藏

相比GPU和GPP，FPGA在滿足深度學(xué)習(xí)的硬件需求上提供了具有吸引力的替代方案。憑借流水線并行計(jì)算的能力和高效的能耗，FPGA將在一般的深度學(xué)習(xí)應(yīng)用中展現(xiàn)GPU和GPP所沒(méi)有的獨(dú)特優(yōu)勢(shì)。同時(shí)，算法設(shè)計(jì)工具日漸成熟，如今將FPGA集成到常用的深度學(xué)習(xí)框架已成為可能。未來(lái)，F(xiàn)PGA將有效地適應(yīng)深度學(xué)習(xí)的發(fā)展趨勢(shì)，從架構(gòu)上確保相關(guān)應(yīng)用和研究能夠自由實(shí)現(xiàn)。
作者：Griffin Lacey Graham Taylor Shawaki Areibi 來(lái)源：arxiv
摘要
最近幾年數(shù)據(jù)量和可訪問(wèn)性的迅速增長(zhǎng)，使得人工智能的算法設(shè)計(jì)理念發(fā)生了轉(zhuǎn)變。人工建立算法的做法被計(jì)算機(jī)從大量數(shù)據(jù)中自動(dòng)習(xí)得可組合系統(tǒng)的能力所取代，使得計(jì)算機(jī)視覺(jué)、語(yǔ)音識(shí)別、自然語(yǔ)言處理等關(guān)鍵領(lǐng)域都出現(xiàn)了重大突破。深度學(xué)習(xí)是這些領(lǐng)域中所最常使用的技術(shù)，也被業(yè)界大為關(guān)注。然而，深度學(xué)習(xí)模型需要極為大量的數(shù)據(jù)和計(jì)算能力，只有更好的硬件加速條件，才能滿足現(xiàn)有數(shù)據(jù)和模型規(guī)模繼續(xù)擴(kuò)大的需求。現(xiàn)有的解決方案使用圖形處理單元（GPU）集群作為通用計(jì)算圖形處理單元（GPGPU），但現(xiàn)場(chǎng)可編程門(mén)陣列（FPGA）提供了另一個(gè)值得探究的解決方案。日漸流行的FPGA設(shè)計(jì)工具使其對(duì)深度學(xué)習(xí)領(lǐng)域經(jīng)常使用的上層軟件兼容性更強(qiáng)，使得FPGA更容易為模型搭建和部署者所用。FPGA架構(gòu)靈活，使得研究者能夠在諸如GPU的固定架構(gòu)之外進(jìn)行模型優(yōu)化探究。同時(shí)，F(xiàn)PGA在單位能耗下性能更強(qiáng)，這對(duì)大規(guī)模服務(wù)器部署或資源有限的嵌入式應(yīng)用的研究而言至關(guān)重要。本文從硬件加速的視角考察深度學(xué)習(xí)與FPGA，指出有哪些趨勢(shì)和創(chuàng)新使得這些技術(shù)相互匹配，并激發(fā)對(duì)FPGA如何幫助深度學(xué)習(xí)領(lǐng)域發(fā)展的探討。

1.簡(jiǎn)介
機(jī)器學(xué)習(xí)對(duì)日常生活影響深遠(yuǎn)。無(wú)論是在網(wǎng)站上點(diǎn)擊個(gè)性化推薦內(nèi)容、在智能手機(jī)上使用語(yǔ)音溝通，或利用面部識(shí)別技術(shù)來(lái)拍照，都用到了某種形式的人工智能技術(shù)。這股人工智能的新潮流也伴隨著算法設(shè)計(jì)的理念轉(zhuǎn)變。過(guò)去基于數(shù)據(jù)的機(jī)器學(xué)習(xí)大多是利用具體領(lǐng)域的專(zhuān)業(yè)知識(shí)來(lái)人工地“塑造”所要學(xué)習(xí)的“特征”，計(jì)算機(jī)從大量示例數(shù)據(jù)中習(xí)得組合特征提取系統(tǒng)的能力，則使得計(jì)算機(jī)視覺(jué)、語(yǔ)音識(shí)別和自然語(yǔ)言處理等關(guān)鍵領(lǐng)域?qū)崿F(xiàn)了重大的性能突破。對(duì)這些數(shù)據(jù)驅(qū)動(dòng)技術(shù)的研究被稱(chēng)為深度學(xué)習(xí)，如今正受到技術(shù)界兩個(gè)重要群體的關(guān)注：一是希望使用并訓(xùn)練這些模型、從而實(shí)現(xiàn)極高性能跨任務(wù)計(jì)算的研究者，二是希望為現(xiàn)實(shí)世界中的新應(yīng)用來(lái)部署這些模型的應(yīng)用科學(xué)家。然而，他們都面臨著一個(gè)限制條件，即硬件加速能力仍需加強(qiáng)，才可能滿足擴(kuò)大現(xiàn)有數(shù)據(jù)和算法規(guī)模的需求。
對(duì)于深度學(xué)習(xí)來(lái)說(shuō)，目前硬件加速主要靠使用圖形處理單元（GPU）集群作為通用計(jì)算圖形處理單元（GPGPU）。相比傳統(tǒng)的通用處理器（GPP），GPU的核心計(jì)算能力要多出幾個(gè)數(shù)量級(jí)，也更容易進(jìn)行并行計(jì)算。尤其是NVIDIA CUDA，作為最主流的GPGPU編寫(xiě)平臺(tái)，各個(gè)主要的深度學(xué)習(xí)工具均用其來(lái)進(jìn)行GPU加速。最近，開(kāi)放型并行程序設(shè)計(jì)標(biāo)準(zhǔn)OpenCL作為異構(gòu)硬件編程的替代性工具備受關(guān)注，而對(duì)這些工具的熱情也在高漲。雖然在深度學(xué)習(xí)領(lǐng)域內(nèi)，OpenCL獲得的支持相較CUDA還略遜一籌，但OpenCL有兩項(xiàng)獨(dú)特的性能。首先，OpenCL對(duì)開(kāi)發(fā)者開(kāi)源、免費(fèi)，不同于CUDA單一供應(yīng)商的做法。其次，OpenCL支持一系列硬件，包括GPU、GPP、現(xiàn)場(chǎng)可編程門(mén)陣列（FPGA）和數(shù)字信號(hào)處理器（DSP）。
1.1. FPGA
作為GPU在算法加速上強(qiáng)有力的競(jìng)爭(zhēng)者，F(xiàn)PGA是否立即支持不同硬件，顯得尤為重要。FPGA與GPU不同之處在于硬件配置靈活，且FPGA在運(yùn)行深入學(xué)習(xí)中關(guān)鍵的子程序（例如對(duì)滑動(dòng)窗口的計(jì)算）時(shí)，單位能耗下通常能比GPU提供更好的表現(xiàn)。不過(guò)，設(shè)置FPGA需要具體硬件的知識(shí)，許多研究者和應(yīng)用科學(xué)家并不具備，正因如此，F(xiàn)PGA經(jīng)常被看作一種行家專(zhuān)屬的架構(gòu)。最近，F(xiàn)PGA工具開(kāi)始采用包括OpenCL在內(nèi)的軟件級(jí)編程模型，使其越來(lái)越受經(jīng)主流軟件開(kāi)發(fā)訓(xùn)練的用戶青睞。
對(duì)考察一系列設(shè)計(jì)工具的研究者而言，其對(duì)工具的篩選標(biāo)準(zhǔn)通常與其是否具備用戶友好的軟件開(kāi)發(fā)工具、是否具有靈活可升級(jí)的模型設(shè)計(jì)方法以及是否能迅速計(jì)算、以縮減大模型的訓(xùn)練時(shí)間有關(guān)。隨著FPGA因?yàn)楦叱橄蠡O(shè)計(jì)工具的出現(xiàn)而越來(lái)越容易編寫(xiě)，其可重構(gòu)性又使得定制架構(gòu)成為可能，同時(shí)高度的并行計(jì)算能力提高了指令執(zhí)行速度，F(xiàn)PGA將為深度學(xué)習(xí)的研究者帶來(lái)好處。
對(duì)應(yīng)用科學(xué)家而言，盡管有類(lèi)似的工具級(jí)選擇，但硬件挑選的重點(diǎn)在于最大化提高單位能耗的性能，從而為大規(guī)模運(yùn)行降低成本。所以，F(xiàn)PGA憑借單位能耗的強(qiáng)勁性能，加上為特定應(yīng)用定制架構(gòu)的能力，就能讓深度學(xué)習(xí)的應(yīng)用科學(xué)家受益。
FPGA能滿足兩類(lèi)受眾的需求，是一個(gè)合乎邏輯的選擇。本文考察FPGA上深度學(xué)習(xí)的現(xiàn)狀，以及目前用于填補(bǔ)兩者間鴻溝的技術(shù)發(fā)展。因此，本文有三個(gè)重要目的。首先，指出深度學(xué)習(xí)領(lǐng)域存在探索全新硬件加速平臺(tái)的機(jī)會(huì)，而FPGA是一個(gè)理想的選擇。其次，勾勒出FPGA支持深度學(xué)習(xí)的現(xiàn)狀，指出潛在的限制。最后，對(duì)FPGA硬件加速的未來(lái)方向提出關(guān)鍵建議，幫助解決今后深度學(xué)習(xí)所面臨的問(wèn)題。
2. FPGA
傳統(tǒng)來(lái)說(shuō)，在評(píng)估硬件平臺(tái)的加速時(shí)，必須考慮到靈活性和性能之間的權(quán)衡。一方面，通用處理器（GPP）可提供高度的靈活性和易用性，但性能相對(duì)缺乏效率。這些平臺(tái)往往更易于獲取，可以低廉的價(jià)格生產(chǎn)，并且適用于多種用途和重復(fù)使用。另一方面，專(zhuān)用集成電路（ASIC）可提供高性能，但代價(jià)是不夠靈活且生產(chǎn)難度更大。這些電路專(zhuān)用于某特定的應(yīng)用程序，并且生產(chǎn)起來(lái)價(jià)格昂貴且耗時(shí)。
FPGA是這兩個(gè)極端之間的折中。FPGA屬于一類(lèi)更通用的可編程邏輯設(shè)備（PLD），并且簡(jiǎn)單來(lái)說(shuō)，是一種可重新配置的集成電路。因此，F(xiàn)PGA既能提供集成電路的性能優(yōu)勢(shì)，又具備GPP可重新配置的靈活性。FPGA能夠簡(jiǎn)單地通過(guò)使用觸發(fā)器（FF）來(lái)實(shí)現(xiàn)順序邏輯，并通過(guò)使用查找表（LUT）來(lái)實(shí)現(xiàn)組合邏輯。現(xiàn)代的FPGA還含有硬化組件以實(shí)現(xiàn)一些常用功能，例如全處理器內(nèi)核、通信內(nèi)核、運(yùn)算內(nèi)核和塊內(nèi)存（BRAM）。另外，目前的FPGA趨勢(shì)趨向于系統(tǒng)芯片（SoC）設(shè)計(jì)方法，即ARM協(xié)處理器和FPGA通常位于同一芯片中。目前的FPGA市場(chǎng)由Xilinx主導(dǎo)，占據(jù)超過(guò)85％的市場(chǎng)份額。此外，F(xiàn)PGA正迅速取代ASIC和應(yīng)用專(zhuān)用標(biāo)準(zhǔn)產(chǎn)品（ASSP）來(lái)實(shí)現(xiàn)固定功能邏輯。 FPGA市場(chǎng)規(guī)模預(yù)計(jì)在2016年將達(dá)到100億美元。
對(duì)于深度學(xué)習(xí)而言，F(xiàn)PGA提供了優(yōu)于傳統(tǒng)GPP加速能力的顯著潛力。GPP在軟件層面的執(zhí)行依賴(lài)于傳統(tǒng)的馮·諾依曼架構(gòu)，指令和數(shù)據(jù)存儲(chǔ)于外部存儲(chǔ)器中，在需要時(shí)再取出。這推動(dòng)了緩存的出現(xiàn)，大大減輕了昂貴的外部存儲(chǔ)器操作。該架構(gòu)的瓶頸是處理器和存儲(chǔ)器之間的通信，這嚴(yán)重削弱了GPP的性能，尤其影響深度學(xué)習(xí)經(jīng)常需要獲取的存儲(chǔ)信息技術(shù)。相比較而言，F(xiàn)PGA的可編程邏輯原件可用于實(shí)現(xiàn)普通邏輯功能中的數(shù)據(jù)和控制路徑，而不依賴(lài)于馮·諾伊曼結(jié)構(gòu)。它們也能夠利用分布式片上存儲(chǔ)器，以及深度利用流水線并行，這與前饋性深度學(xué)習(xí)方法自然契合?，F(xiàn)代FPGA還支持部分動(dòng)態(tài)重新配置，當(dāng)FPGA的一部分被重新配置時(shí)另一部分仍可使用。這將對(duì)大規(guī)模深度學(xué)習(xí)模式產(chǎn)生影響，F(xiàn)PGA的各層可進(jìn)行重新配置，而不擾亂其他層正在進(jìn)行的計(jì)算。這將可用于無(wú)法由單個(gè)FPGA容納的模型，同時(shí)還可通過(guò)將中間結(jié)果保存在本地存儲(chǔ)以降低高昂的全球存儲(chǔ)讀取費(fèi)用。
最重要的是，相比于GPU，F(xiàn)PGA為硬件加速設(shè)計(jì)的探索提供了另一個(gè)視角。GPU和其它固定架構(gòu)的設(shè)計(jì)是遵循軟件執(zhí)行模型，并圍繞自主計(jì)算單元并行以執(zhí)行任務(wù)搭建結(jié)構(gòu)。由此，為深度學(xué)習(xí)技術(shù)開(kāi)發(fā)GPU的目標(biāo)就是使算法適應(yīng)這一模型，讓計(jì)算并行完成、確保數(shù)據(jù)相互依賴(lài)。與此相反，F(xiàn)PGA架構(gòu)是為應(yīng)用程序?qū)ｉT(mén)定制的。在開(kāi)發(fā)FPGA的深度學(xué)習(xí)技術(shù)時(shí)，較少?gòu)?qiáng)調(diào)使算法適應(yīng)某固定計(jì)算結(jié)構(gòu)，從而留出更多的自由去探索算法層面的優(yōu)化。需要很多復(fù)雜的下層硬件控制操作的技術(shù)很難在上層軟件語(yǔ)言中實(shí)現(xiàn)，但對(duì)FPGA執(zhí)行卻特別具有吸引力。然而，這種靈活性是以大量編譯（定位和回路）時(shí)間為成本的，對(duì)于需要通過(guò)設(shè)計(jì)循環(huán)快速迭代的研究人員來(lái)說(shuō)這往往會(huì)是個(gè)問(wèn)題。
除了編譯時(shí)間外，吸引偏好上層編程語(yǔ)言的研究人員和應(yīng)用科學(xué)家來(lái)開(kāi)發(fā)FPGA的問(wèn)題尤為艱難。雖然能流利使用一種軟件語(yǔ)言常常意味著可以輕松地學(xué)習(xí)另一種軟件語(yǔ)言，但對(duì)于硬件語(yǔ)言翻譯技能來(lái)說(shuō)卻非如此。針對(duì)FPGA最常用的語(yǔ)言是Verilog和VHDL，兩者均為硬件描述語(yǔ)言（HDL）。這些語(yǔ)言和傳統(tǒng)的軟件語(yǔ)言之間的主要區(qū)別是，HDL只是單純描述硬件，而例如C語(yǔ)言等軟件語(yǔ)言則描述順序指令，并無(wú)需了解硬件層面的執(zhí)行細(xì)節(jié)。有效地描述硬件需要對(duì)數(shù)字化設(shè)計(jì)和電路的專(zhuān)業(yè)知識(shí)，盡管一些下層的實(shí)現(xiàn)決定可以留給自動(dòng)合成工具去實(shí)現(xiàn)，但往往無(wú)法達(dá)到高效的設(shè)計(jì)。因此，研究人員和應(yīng)用科學(xué)家傾向于選擇軟件設(shè)計(jì)，因其已經(jīng)非常成熟，擁有大量抽象和便利的分類(lèi)來(lái)提高程序員的效率。這些趨勢(shì)使得FPGA領(lǐng)域目前更加青睞高度抽象化的設(shè)計(jì)工具。

FPGA深度學(xué)習(xí)研究里程碑：
1987VHDL成為IEEE標(biāo)準(zhǔn)
1992GANGLION成為首個(gè)FPGA神經(jīng)網(wǎng)絡(luò)硬件實(shí)現(xiàn)項(xiàng)目（Cox et al.）
1994Synopsys推出第一代FPGA行為綜合方案
1996VIP成為首個(gè)FPGA的CNN實(shí)現(xiàn)方案（Cloutier et al.）
2005FPGA市場(chǎng)價(jià)值接近20億美元
2006首次利用BP算法在FPGA上實(shí)現(xiàn)5 GOPS的處理能力
2011Altera推出OpenCL，支持FPGA
出現(xiàn)大規(guī)模的基于FPGA的CNN算法研究（Farabet et al.）
2016在微軟Catapult項(xiàng)目的基礎(chǔ)上，出現(xiàn)基于FPGA的數(shù)據(jù)中心CNN算法加速（Ovtcharov et al.）
4. 未來(lái)展望
深度學(xué)習(xí)的未來(lái)不管是就FPGA還是總體而言，主要取決于可擴(kuò)展性。要讓這些技術(shù)成功解決未來(lái)的問(wèn)題，必須要拓展到能夠支持飛速增長(zhǎng)的數(shù)據(jù)規(guī)模和架構(gòu)。FPGA技術(shù)正在適應(yīng)這一趨勢(shì)，而硬件正朝著更大內(nèi)存、更少的特征點(diǎn)數(shù)量、更好的互連性發(fā)展，來(lái)適應(yīng)FPGA多重配置。英特爾收購(gòu)了Altera，IBM與Xilinx合作，都昭示著FPGA領(lǐng)域的變革，未來(lái)也可能很快看到FPGA與個(gè)人應(yīng)用和數(shù)據(jù)中心應(yīng)用的整合。另外，算法設(shè)計(jì)工具可能朝著進(jìn)一步抽象化和體驗(yàn)軟件化的方向發(fā)展，從而吸引更廣技術(shù)范圍的用戶。
4.1. 常用深度學(xué)習(xí)軟件工具
在深度學(xué)習(xí)最常用的軟件工具中，有些工具已經(jīng)在支持CUDA的同時(shí)，認(rèn)識(shí)到支持OpenCL的必要性。這將使得FPGA更容易實(shí)現(xiàn)深度學(xué)習(xí)的目的。雖然據(jù)我們所知，目前沒(méi)有任何深度學(xué)習(xí)工具明確表示支持FPGA，不過(guò)下面的表格列出了哪些工具正朝支持OpenCL方向發(fā)展：
Caffe，由伯克利視覺(jué)與學(xué)習(xí)中心開(kāi)發(fā)，其GreenTea項(xiàng)目對(duì)OpenCL提供非正式支持。Caffe另有支持OpenCL的AMD版本。
Torch，基于Lua語(yǔ)言的科學(xué)計(jì)算框架，使用范圍廣，其項(xiàng)目CLTorch對(duì)OpenCL提供非正式支持。
Theano，由蒙特利爾大學(xué)開(kāi)發(fā)，其正在研發(fā)的gpuarray后端對(duì)OpenCL提供非正式支持。
DeepCL，由Hugh Perkins開(kāi)發(fā)的OpenCL庫(kù)，用于訓(xùn)練卷積神經(jīng)網(wǎng)絡(luò)。
對(duì)于剛進(jìn)入此領(lǐng)域、希望選擇工具的人來(lái)說(shuō)，我們的建議是從Caffe開(kāi)始，因?yàn)樗殖Ｓ?，支持性好，用戶界面?jiǎn)單。利用Caffe的model zoo庫(kù)，也很容易用預(yù)先訓(xùn)練好的模型進(jìn)行試驗(yàn)。
4.2. 增加訓(xùn)練自由度
有人或許以為訓(xùn)練機(jī)器學(xué)習(xí)算法的過(guò)程是完全自動(dòng)的，實(shí)際上有一些超參數(shù)需要調(diào)整。對(duì)于深度學(xué)習(xí)尤為如此，模型在參數(shù)量上的復(fù)雜程度經(jīng)常伴隨著大量可能的超參數(shù)組合。可以調(diào)整的超參數(shù)包括訓(xùn)練迭代次數(shù)、學(xué)習(xí)速率、批梯度尺寸、隱藏單元數(shù)和層數(shù)等等。調(diào)整這些參數(shù)，等于在所有可能的模型中，挑選最適用于某個(gè)問(wèn)題的模型。傳統(tǒng)做法中，超參數(shù)的設(shè)置要么依照經(jīng)驗(yàn)，要么根據(jù)系統(tǒng)網(wǎng)格搜索或更有效的隨機(jī)搜索來(lái)進(jìn)行。最近研究者轉(zhuǎn)向了適應(yīng)性的方法，用超參數(shù)調(diào)整的嘗試結(jié)果為配置依據(jù)。其中，貝葉斯優(yōu)化是最常用的方法。
不管用何種方法調(diào)整超參數(shù)，目前利用固定架構(gòu)的訓(xùn)練流程在某種程度上局限了模型的可能性，也就是說(shuō)，我們或許只在所有的解決方案中管窺了一部分。固定架構(gòu)讓模型內(nèi)的超參數(shù)設(shè)置探究變得很容易（比如，隱藏單元數(shù)、層數(shù)等），但去探索不同模型間的參數(shù)設(shè)置變得很難（比如，模型類(lèi)別的不同），因?yàn)槿绻鸵粋€(gè)并不簡(jiǎn)單符合某個(gè)固定架構(gòu)的模型來(lái)進(jìn)行訓(xùn)練，就可能要花很長(zhǎng)時(shí)間。相反，F(xiàn)PGA靈活的架構(gòu)，可能更適合上述優(yōu)化類(lèi)型，因?yàn)橛肍PGA能編寫(xiě)一個(gè)完全不同的硬件架構(gòu)并在運(yùn)行時(shí)加速。
4.3. Low power compute clusters低耗能計(jì)算節(jié)點(diǎn)集群
深度學(xué)習(xí)模型最讓人著迷的就是其拓展能力。不管是為了從數(shù)據(jù)中發(fā)現(xiàn)復(fù)雜的高層特征，還是為數(shù)據(jù)中心應(yīng)用提升性能，深度學(xué)習(xí)技術(shù)經(jīng)常在多節(jié)點(diǎn)計(jì)算基礎(chǔ)架構(gòu)間進(jìn)行拓展。目前的解決方案使用具備Infiniband互連技術(shù)的GPU集群和MPI，從而實(shí)現(xiàn)上層的并行計(jì)算能力和節(jié)點(diǎn)間數(shù)據(jù)的快速傳輸。然而，當(dāng)大規(guī)模應(yīng)用的負(fù)載越來(lái)越各不相同，使用FPGA可能會(huì)是更優(yōu)的方法。FPGA的可編程行允許系統(tǒng)根據(jù)應(yīng)用和負(fù)載進(jìn)行重新配置，同時(shí)FPGA的能耗比高，有助于下一代數(shù)據(jù)中心降低成本。

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

關(guān)鍵詞： 機(jī)器學(xué)習(xí) FPGA GPU GPP

評(píng)論

相關(guān)推薦

萊迪思全新推出邏輯優(yōu)化的通用FPGA拓展其小型FPGA產(chǎn)品組合

嵌入式系統(tǒng) 萊迪思 FPGA 小型FPGA | 2024-07-23

help, 44b0+fpga拖死cpu

sandman555 | 2005-02-05

實(shí)時(shí)的噪聲源定位系統(tǒng)

視頻 NI LabVIEW FPGA | 2009-03-25

FPGA如何同DDR3存儲(chǔ)器進(jìn)行接口?

視頻 Altera FPGA DDR3 | 2008-06-18

恩智浦與NVIDIA合作：將TAO工具套件與eIQ開(kāi)發(fā)環(huán)境無(wú)縫集成，加速人工智能部署！

智能計(jì)算機(jī)器學(xué)習(xí) 開(kāi)發(fā)環(huán)境模型部署 | 2024-07-18

LatticeECP3設(shè)計(jì)的視頻協(xié)議板電路圖-FPGA配置

設(shè)計(jì)方案 LatticeECP3 設(shè)計(jì) 視頻協(xié)議電路圖 -FPGA | 2011-06-27

視頻協(xié)議板-FPGA配置基于LatticeECP3的設(shè)計(jì)

設(shè)計(jì)方案視頻協(xié)議 -FPGA 配置基于 LatticeECP3 | 2014-05-20

LabVIEW FPGA 模塊簡(jiǎn)介

視頻 NI LabVIEW FPGA | 2009-04-01

利用強(qiáng)大的軟件設(shè)計(jì)工具為FPGA開(kāi)發(fā)者賦能

嵌入式系統(tǒng) 軟件設(shè)計(jì)工具 FPGA 萊迪思 | 2024-07-17

LabVIEW 8.20技術(shù)資料大全簡(jiǎn)介

資源下載 NI LabVIEW 射頻和通信 FPGA | 2007-12-11

基于FPGA的可編程數(shù)字濾波器系統(tǒng)

資源下載 Max FPGA 可編程數(shù)字濾波器 | 2007-12-14

高速ADC與內(nèi)置嵌入式串行收發(fā)器的FPGA接口

視頻 Altera FPGA ADC Linear 串行收發(fā)器 | 2009-05-19

消息稱(chēng)英偉達(dá)曾向臺(tái)積電詢問(wèn)建設(shè)廠外 CoWoS 先進(jìn)封裝專(zhuān)線可能，遭拒絕

EDA/PCB 英偉達(dá) GPU 封裝工藝臺(tái)積電 | 2024-07-23

打破NVIDIA壟斷！英國(guó)公司實(shí)現(xiàn)CUDA軟件在AMD GPU上無(wú)縫運(yùn)行

智能計(jì)算 NVIDIA CUDA軟件 AMD GPU | 2024-07-22

Altera公司cyclone系列FPGA-1C6電路圖

設(shè)計(jì)方案 Altera 公司 cyclone 系列 FPGA-1C6 | 2009-07-17

Meta訓(xùn)練Llama 3遭遇頻繁故障

智能計(jì)算 Meta Llama 3 英偉達(dá) H100 顯卡 GPU | 2024-07-29

基于SD7502構(gòu)成的FPGA-ASK電路圖

設(shè)計(jì)方案基于 SD7502 構(gòu)成 FPGA-ASK 電路圖 | 2011-07-13

摩根士丹利：僅 GB200 AI 服務(wù)器業(yè)務(wù)，就為英偉達(dá)創(chuàng)造 2100 億美元年收入

智能計(jì)算 GB200 AI 英偉達(dá) GPU | 2024-07-26

高通新中端芯片驍龍7s Gen 3曝光：采用Adreno 810 GPU，下月發(fā)布

EDA/PCB 高通中端芯片驍龍7s Gen 3 Adreno 810 GPU | 2024-07-23

3-DES算法的FPGA高速實(shí)現(xiàn)(Xilinx)

資源下載 Xilinx FPGA 3-DES算法 | 2007-12-13

Altera: 采用全系列40-nm收發(fā)器FPGA和ASIC實(shí)現(xiàn)創(chuàng)新

視頻 Altera FPGA ASIC | 2009-07-13

目標(biāo)完全替代閉源驅(qū)動(dòng)，英偉達(dá)宣布全面轉(zhuǎn)向開(kāi)源 GPU 內(nèi)核模塊

嵌入式系統(tǒng) 閉源驅(qū)動(dòng) 英偉達(dá) 開(kāi)源 GPU 內(nèi)核模塊 Linux | 2024-07-22

Altera的FPGA下載常見(jiàn)問(wèn)題經(jīng)驗(yàn)小結(jié)

資源下載 Altera FPGA 常見(jiàn)問(wèn)題經(jīng)驗(yàn) | 2007-12-13

基于FPGA的鎖相環(huán)位同步提取電路

設(shè)計(jì)方案電子電路圖，F(xiàn)PGA 鎖相環(huán) | 2012-07-27

s3c2410+fpga 做視頻無(wú)線傳輸

herbertwj | 2004-08-15

用C/C++語(yǔ)言開(kāi)發(fā)大規(guī)模FPGA [轉(zhuǎn)載于www.fpga.com.cn]

xiaohua | 2002-09-24

help, 44b0+fpga拖死cpu

sandman555 | 2005-02-05

ALTERA的PCI_IP Core問(wèn)答集

資源下載 Altera FPGA PCI_IP Core | 2007-12-13

help, 44b0+fpga拖死cpu

sandman555 | 2005-02-05

什么是 DLSS，值得嗎？

智能計(jì)算 DLSS gpu NVIDIA | 2024-07-17

焦點(diǎn)

推薦視頻

技術(shù)專(zhuān)區(qū)

看屁屁www成人影院,亚洲人妻成人图片,亚洲精品成人午夜在线,日韩在线欧美成人 (function(){ var bp = document.createElement('script'); var curProtocol = window.location.protocol.split(':')[0]; if (curProtocol === 'https') { bp.src = 'https://zz.bdstatic.com/linksubmit/push.js'; } else { bp.src = 'http://push.zhanzhang.baidu.com/push.js'; } var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(bp, s); })();