<meter id="pryje"><nav id="pryje"><delect id="pryje"></delect></nav></meter>
          <label id="pryje"></label>

          新聞中心

          EEPW首頁 > 嵌入式系統(tǒng) > 業(yè)界動態(tài) > 加速云基于FPGA的加速解決方案搞定高算力AI應(yīng)用場景

          加速云基于FPGA的加速解決方案搞定高算力AI應(yīng)用場景

          作者:左小木 時間:2018-04-19 來源:電子產(chǎn)品世界 收藏

          人工智能()和的不斷發(fā)展帶來對超高計算力的需求,使得相應(yīng)硬件組成和算法架構(gòu)也在不斷在創(chuàng)新中尋求突破,以達到新應(yīng)用所需的計算能力。

          本文引用地址:http://www.ex-cimer.com/article/201804/378661.htm

          就近幾年的發(fā)展來看,高計算能力的處理器從硬件架構(gòu)上基本可以分為三個陣營——GPU、和ASIC。相較于GPU、ASIC而言,的低延時、確定延時、高性能功耗比、靈活可配置計算精度、高速通信互聯(lián)I/O接口等特性,為其在產(chǎn)品設(shè)計及性能對比中屢屢拿下可觀戰(zhàn)績。

          近日,致力于異構(gòu)和業(yè)務(wù)卸載的方案供應(yīng)商杭州云信息技術(shù)有限公司基于推出兩大系列硬件產(chǎn)品——SC-OPS和SC-VPX,兩個IP庫——FDNN(深度學習庫)和FBLAS(數(shù)字加速庫),以及三大解決方案——深度學習解決方案、高性能計算機數(shù)字信號處理解決方案和邊緣計算解決方案。

          兩大系列硬件加速產(chǎn)品

          SC-OPS是加速云推出的全球首張Intel Stratix 10 FPGA加速卡,采用Intel最新14nm工藝的Stratix10GX2800 FPGA器件,集成了2753K LE和9.2T FLOPS單精度浮點處理能力,板載8組DDR4 2133MHz72bit顆粒,支持ECC,支持32GB內(nèi)存容量和1092Gbps的訪問帶寬。單板支持12個200維雙精度線性方程求解,運算時間為466μs,其性能是x86系統(tǒng)的60~120倍;采用AlexNet卷積神經(jīng)網(wǎng)絡(luò),單卡可以實現(xiàn)4500幀/s以上圖像分類,廣泛應(yīng)用于數(shù)據(jù)中心、云計算、機器視覺、深度學習、高性能計算、仿真、金融等領(lǐng)域。

          SC-VPX是一款超高計算密度的VPX刀片加速平臺,采用Intel Stratix 10 GX2800器件,兼容GX1650,6U整機可以支持92T/50TFLOPS單精度浮點運算能力,整機可以通過交互版互聯(lián)構(gòu)筑更大的系統(tǒng),同時系統(tǒng)可以擴展各種接口卡和存儲卡(單卡4TB容量,2GB讀寫性能),可以通過各種卡組合擴展各種應(yīng)用?;赟C-VPX加速平臺可以構(gòu)造業(yè)界先進、靈活、高效的信號處理和深度學習架構(gòu),主要定位高校研究所等單位的雷達,通信,深度學習相關(guān)領(lǐng)域的產(chǎn)品原型快速搭建和算法開發(fā)與應(yīng)用。

          兩大IP庫

          深度學習加速庫FDNN是國內(nèi)首個支持通用卷積神經(jīng)網(wǎng)絡(luò)的FPGA加速庫,基于RTL級代碼,包含卷積、池化、全連接、非線性函數(shù)等參數(shù)可配置的深度學習基礎(chǔ)庫,兼容CAFFE/TensorFlow模型數(shù)據(jù)的參數(shù)可配置的CNN/DNN/RNN庫,后向更新算法、隨機初始化算法及SGD算法的參數(shù)可配置的深度學習訓(xùn)練庫,以及VGG 16、GoogleNet、LeNet、YOLO、SSD、ResNet、Faster-RCNN各種常見模型??梢蕴峁┖芨叩男阅芎挽`活配置特性。

          而高性能計算加速庫FBLAS是業(yè)界高性能的RTL級數(shù)學加速庫,含有矩陣運算、線性方程求解、微分方程求解、傅里葉變換(FFT)、三角函數(shù)、超越函數(shù)等多種運算可供直接調(diào)用,同時兼容OpenBlas庫接口。

          三大解決方案

          深度學習加速解決方案。由于FPGA具有很高的性能功耗比,而且基于門級電路設(shè)計使得FPGA是一個超低延時和確定延時的方案,F(xiàn)PGA可編程及動態(tài)可重構(gòu)可以適應(yīng)深度學習未來算法變化,IO可編程性可以滿足更多業(yè)務(wù)需求。為此,加速云推出一整套基于FPGA的深度學習加速方案,包括SC-OPM/SC-OPF/SC-OPS加速卡及FDNN加速庫,滿足客戶對深度學習高性能、靈活性加速要求。為了方便客戶使用高層語言開發(fā),加速云提供基于FPGA完整的OpenCL異構(gòu)開發(fā)環(huán)境,快速實現(xiàn)用戶自定義的深度學習加速方案。同時加速云也提供快速深度神經(jīng)網(wǎng)絡(luò)定制加速服務(wù)。如下圖所示為某電商平臺采用加速云深度學習解決方案的OCR(Optical CharacterRecognition,光學字符識別)方案。

          數(shù)字信號處理解決方案。加速云的SC-OPS和SC-OPX產(chǎn)品針對5G通信和雷達等數(shù)字信號處理系統(tǒng)的要求,結(jié)合Intel最新14nm工藝的 Stratix10 FPGA系列,提供了一套完整的硬件和軟件相結(jié)合的數(shù)字信號處理解決方案,借助于自家的FBLAS數(shù)據(jù)加速庫,能夠?qū)崿F(xiàn)高性能矩陣運算(矩陣乘、轉(zhuǎn)置、求逆、QR分解)和超高速FFT,以及具有高性能算法參數(shù)可配置的特點實現(xiàn)了多重信號分類(MUSIC)和自適應(yīng)數(shù)字波束形成(ADBF)的核心算法,提高了5G通信和雷達抗干擾能力。另外,為了方便客戶使用高層語言開發(fā),加速云提供基于FPGA完整的OpenCL異構(gòu)開發(fā)環(huán)境,快速實現(xiàn)用戶自定義的信號處理加速方案。如下圖為采用加速云數(shù)字信號解決方案的ADBF(自適應(yīng)數(shù)字波束形成)解決方案的相關(guān)性能。

          邊緣計算解決方案?,F(xiàn)在工業(yè)控制領(lǐng)域面臨著三大趨勢:日益復(fù)雜的控制算法、低延時和高帶寬的工業(yè)控制總線,以及人工智能的工業(yè)應(yīng)用,這對工業(yè)控制處理系統(tǒng)提出了包括高計算性能、強實時性、多IO接口能力等更高的要求。針對此,加速云采用高性能Intel Arria10 GX660器件的智能工控解決方案具有模塊化設(shè)計、強實時特性、高性能的算法IP加速和完整的OpenCL異構(gòu)開發(fā)環(huán)境,可以實現(xiàn)新一代高性能邊緣計算網(wǎng)關(guān),應(yīng)用于各種工業(yè)環(huán)境。

          基于FPGA的異構(gòu)計算將是計算架構(gòu)的未來趨勢

          加速云創(chuàng)始人兼CEO鄔剛表示:“人工智能已經(jīng)進入我們的生活,但是未來發(fā)展還存在瓶頸,需要硬件技術(shù)和算法方面的突破。異構(gòu)計算是計算架構(gòu)的未來趨勢,而FPGA 是實現(xiàn)異構(gòu)計算的完美選擇。加速云創(chuàng)新的異構(gòu)計算加速平臺解決方案,具有高性能、高效率、低延時特性以及可編程性和遠程可重構(gòu)能力,非常適合云上的彈性業(yè)務(wù)的需求。我們希望能夠通過我們的技術(shù),幫助更多的企業(yè)實現(xiàn)深度學習,在時代贏得先機?!?/p>



          關(guān)鍵詞: FPGA 加速 AI 大數(shù)據(jù)

          評論


          相關(guān)推薦

          技術(shù)專區(qū)

          關(guān)閉
          看屁屁www成人影院,亚洲人妻成人图片,亚洲精品成人午夜在线,日韩在线 欧美成人 (function(){ var bp = document.createElement('script'); var curProtocol = window.location.protocol.split(':')[0]; if (curProtocol === 'https') { bp.src = 'https://zz.bdstatic.com/linksubmit/push.js'; } else { bp.src = 'http://push.zhanzhang.baidu.com/push.js'; } var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(bp, s); })();