眾廠商談邊緣AI的技術(shù)與產(chǎn)品策略
高精度的FPGA架構(gòu)
本文引用地址:http://www.ex-cimer.com/article/201811/395028.htm無論是作為協(xié)處理器、獨立的處理單元亦或是簡單的橋接,只要客戶尋求的價值定位是創(chuàng)新、快速上市、低延遲、靈活的IO以及可編程性,F(xiàn)PGA就有其獨特的優(yōu)勢。靈活I(lǐng)O可以在不同的應(yīng)用場景支持不同類別的傳感器,甚至處理多個傳感器交互和融合。AI目前還在初步階段,萊迪思預(yù)計神經(jīng)網(wǎng)絡(luò)引擎需要可編程性持續(xù)演進和優(yōu)化。通用的MCU功耗和延遲一般會較高,加入固化的加速器雖然可以改善當下的性能,在未來幾年內(nèi)不能持續(xù)優(yōu)化的缺陷會是個很大的限制。在新一版的CNN加速器IP,萊迪思針對了神經(jīng)網(wǎng)絡(luò)的需求來優(yōu)化了DRAM存儲器帶寬,使得ECP5的推理性能最多提升至2倍。
隨著AI不斷火熱,IoT和智能傳感器市場將持續(xù)增長。物聯(lián)網(wǎng)世界的多樣性也將是FPGA靈活架構(gòu)大放異彩的機會。因此在超低功耗、低成本、小尺寸的iCE40 UltraPlus上,萊迪思也推出了輕量化CNN來滿足更靈活的性能、精度、功耗的平衡與取舍。盡管輕量化CNN比之前推出的二值神經(jīng)網(wǎng)絡(luò)(BNN)功耗稍高,但是其精度和性能也更優(yōu)秀,CNN在業(yè)界的接受度也比BNN更為廣泛。
更高性能的邊緣應(yīng)用
Achronix的FPGA產(chǎn)品和技術(shù)專注于邊緣應(yīng)用上的多種人工智能(AI)需求,例如汽車傳感器融合、目標檢測和識別、AI和機器學(xué)習(xí),以及360度環(huán)繞視圖系統(tǒng)等需要在邊緣上本地處理數(shù)據(jù)的應(yīng)用。
可編程邏輯提供了使計算更加以數(shù)據(jù)為中心的能力。雖然傳統(tǒng)的處理器都要求數(shù)據(jù)通過復(fù)雜的高速緩存層級被送到其流水線中,而可編程邏輯則能夠構(gòu)建數(shù)據(jù)流水線。借助由定制邏輯電路和數(shù)字信號處理器(DSP)引擎組成的數(shù)據(jù)單元來在數(shù)據(jù)通過時操控它們,數(shù)據(jù)可以從一個節(jié)點到另一個節(jié)點無縫流動;每個單元都已準備好把數(shù)據(jù)轉(zhuǎn)發(fā)到需要它們的下一個節(jié)點。隨著需求的變化,其中的邏輯陣列可以輕松地重新連線形成新的配置。與更適合處理控制密集型代碼的微處理器相比,這種邏輯陣列可以為以數(shù)據(jù)為中心的應(yīng)用提供更好的支持。然而,獨立FPGA芯片通常會產(chǎn)生更大的功耗,這是因為需要將數(shù)據(jù)頻繁地移入和移出更專用的ASIC芯片中。
嵌入式FPGA(eFPGA)技術(shù)提供了一種方法,可以在一個封裝芯片中滿足邊緣計算應(yīng)用的能效、性能、延遲和面積限制。結(jié)合eFPGA技術(shù),可以把平時部署在獨立的ASIC芯片中的常用功能在定制硬件中實現(xiàn)集成,以帶來更高的性能和密度。對于機器學(xué)習(xí)應(yīng)用,這些功能可以是用于卷積內(nèi)核或最大池計算的專用處理器陣列。通過在同一芯片上集成可編程邏輯和定制邏輯,可以避免在芯片外傳輸數(shù)據(jù),從而節(jié)省大量功耗。
有關(guān)開發(fā)環(huán)境和技術(shù)方面內(nèi)容如下:
Speedcore?嵌入式FPGA:它是經(jīng)流片驗證的高密度、高性能eFPGA半導(dǎo)體知識產(chǎn)權(quán)(IP)產(chǎn)品。
Speedchip? FPGA合封芯片:FPGA合封芯片專為嵌入到先進的系統(tǒng)級封裝(SiP)解決方案進行了優(yōu)化,如通過硅介電層或有機基板實現(xiàn)了2.5D封裝。
Speedster?22i FPGA:這是一系列高性能和高密度FPGA芯片,帶有適用于通信應(yīng)用的嵌入式系統(tǒng)IP,包括10 G / 100 G以太網(wǎng)、100 G Interlaken、PCIe Gen3×8和DDR3等。
PCIe Accelerator-6D加速板:它們是具有業(yè)界最高存儲器帶寬的、基于FPGA的PCIe附加卡,適用于高速加速應(yīng)用。
Achronix?的自動化設(shè)計(CAD)環(huán)境被稱為ACE,它與行業(yè)標準的邏輯綜合工具配合使用,使FPGA設(shè)計人員能夠輕松地將其設(shè)計映射到Achronix FPGA芯片中。
支持生態(tài)系統(tǒng)與AI的開發(fā)和應(yīng)用
Imagination的業(yè)務(wù)是為半導(dǎo)體芯片提供必要的內(nèi)核構(gòu)建模塊。Imagination主要以自己的嵌入式圖形(GPU)技術(shù)和神經(jīng)網(wǎng)絡(luò)加速器(NNA)技術(shù)而聞名,并將這些技術(shù)授權(quán)給全球領(lǐng)先的芯片供應(yīng)商。他們的半導(dǎo)體芯片廣泛應(yīng)用于多種產(chǎn)品和服務(wù),因此Imagination在市場中擁有非常獨特的地位,因為Imagination可以支持整個生態(tài)系統(tǒng)參與人工智能(AI)的開發(fā)和應(yīng)用。
GPU和NNA現(xiàn)在是邊緣AI的必要元素。隨著眾多企業(yè)開始認識到在各種任務(wù)(從自然語言處理到圖像分類)中應(yīng)用神經(jīng)網(wǎng)絡(luò)的潛力,引入人工智能元素的產(chǎn)品數(shù)量也開始穩(wěn)步增加。同時,這些任務(wù)的處理正在從傳統(tǒng)的基于云架構(gòu)轉(zhuǎn)移向設(shè)備端本身,基于硬件的專用神經(jīng)網(wǎng)絡(luò)加速器現(xiàn)在可嵌入至半導(dǎo)體芯片中,以實現(xiàn)本地的AI處理。從可監(jiān)控前方道路的先進駕駛輔助系統(tǒng)(ADAS)到虛擬助手等聲控的消費性電子產(chǎn)品,關(guān)于集成的、基于神經(jīng)網(wǎng)絡(luò)AI的機會正在向多個細分市場延伸。
不可否認,AI正在成為許多應(yīng)用的必要元素。但是,仍然有很多挑戰(zhàn)。其中之一就是在邊緣和云之間平衡處理負載,并找到放置AI本身的最佳位置。例如,邊緣AI可用于消費性設(shè)備上的本地語音識別,比如識別“喚醒詞”或簡單指令,但是依然有必要在云端進行大部分的語音AI處理,以便利用那些無法在設(shè)備端存儲的龐大知識庫。現(xiàn)在許多設(shè)備都標榜帶有AI,但實際上,除了依靠云端去給人智能的印象以外,就僅僅只是在本地做了簡單的模式匹配和識別而已。
半導(dǎo)體工藝不斷演進,為在邊緣設(shè)備上進行更多的AI處理創(chuàng)造了機會。例如,Imagination將看到能夠監(jiān)控特定事件的智能安全攝像頭。它們將使用邊緣AI處理來識別視頻流中的特征,例如道路上的車輛或鏡頭中的人臉,然后觸發(fā)特定事件,例如計算車輛的數(shù)量或允許授權(quán)人員訪問。他們甚至可以通過減少“誤報”的數(shù)量來節(jié)省成本,因為攝像頭中的邊緣AI可以識別正常行為和可疑行為之間的差異。
另一個挑戰(zhàn)是,盡管AI應(yīng)用的數(shù)量在不斷增加,但這并不一定意味著集成了AI加速功能的SoC是所有應(yīng)用場景的前進方向。的確,如果Imagination考慮AI去覆蓋大部分細分市場,那么由于使用該技術(shù)的各種產(chǎn)品具有截然不同的工藝要求,碎片化會自然而然地發(fā)生。碎片化的市場對于使用專用SoC提供服務(wù)具有挑戰(zhàn)性,所以“一應(yīng)俱全”的方法不會始終適用。雖然諸如手機或ADAS(高級駕駛員輔助系統(tǒng))等一些市場為SoC供應(yīng)商提供了大量機會,但許多以人工智能應(yīng)用為目標的市場將自然呈現(xiàn)出低銷量前景。例如,一些產(chǎn)品可能需要AI進行語音處理或圖像識別,但不是兩者都需要;同樣,智能家居供應(yīng)商不大可能只為將AI功能嵌入他們的控制面板而去使用原本為智能手機設(shè)計的SoC,因為這不符合成本效益。這個難題的解決方案就是打造專用的AI芯片,其可以作為輔助芯片與主應(yīng)用處理器一起使用,去卸載通常由主應(yīng)用處理器中的NNA內(nèi)核處理的AI推理任務(wù)。這樣做的優(yōu)勢是SoC供應(yīng)商可以提供一系列具有不同性能水平的邊緣AI芯片;同時,原始設(shè)備制造商(OEM)可以根據(jù)他們希望在自己的特定應(yīng)用中所處理的AI處理開銷來選擇適當?shù)財U展產(chǎn)品解決方案。
RISC-V適合AI、物聯(lián)網(wǎng)等創(chuàng)新
有人預(yù)言,RISC-V或?qū)⑹抢^Intel和Arm之后的第三大主流處理器體系。實際上,三年前RISC-V基金會剛剛成立,如今已有200余家會員,會員遍布27個國家,得到了來自中國、印度、俄羅斯等國政府、高校、企業(yè)界的支持。RISC-V為何在短時間內(nèi)受歡迎?
相比Intel和Arm,RISC-V有三大特點。
首先,從微處理器角度看,RISC-V的Core(核)設(shè)計得非常精巧、簡單、有效,允許運行基本的操作系統(tǒng)。
其次,允許可擴展,由非營利組織——RISC-V基金會運營的,不像過去Intel和Arm等是由一家公司運營的,RISC-V核是大家(Community)運營的,只要加入基金會,成為基金會成員,就可以用。RISC-V的可擴充性允許開發(fā)者加自己新的指令,而且允許開發(fā)者的設(shè)計是開源的,也可以不開源,也可以用來賺錢,也可以做研究……這種靈活的模式帶來了微處理器的革命。實際上,RISC-V是第一個硬件開源的,開源了ISA。ISA指令集是硬件與軟件的接口。
第三,帶來很多創(chuàng)新。在微處理器產(chǎn)品里,從IT和IC領(lǐng)域里,很長時間里被Intel壟斷的,之后有Arm。由于知識產(chǎn)權(quán)的限制,其他公司不能使用Intel或Arm的ISA指令來做自己事情,除非得到授權(quán)。因此,多年來,很少有開發(fā)者在架構(gòu)方面做創(chuàng)新。不過,RISC-V開了一扇門,允許公司、高校師生、研究機構(gòu)等做產(chǎn)品或進行研究。有個形象的比喻,過去只有一種榔頭,做任何事都要用這個榔頭,現(xiàn)在允許大家開發(fā)各種各樣的榔頭。
值得指出的是,RISC-V并不是比Intel和Arm好。因為Intel和Arm也是非常優(yōu)秀的公司,投入了大量資金和努力,開發(fā)了很好的產(chǎn)品。區(qū)別在于那兩種芯片/架構(gòu)是私人所有的,不是開放、免費的,RISC-V是第一個在微處理器領(lǐng)域里把ISA指令架構(gòu)開放,這是一場革命,帶來了全新的商業(yè)形態(tài)和創(chuàng)新環(huán)境。
原來的商業(yè)模式,Intel和Arm把產(chǎn)品做好了,無法改變。但市場上應(yīng)用場景在變,目前已經(jīng)超越PC和手機時代了。在很多應(yīng)用場景,例如AI、物聯(lián)網(wǎng)和區(qū)塊鏈等有很多創(chuàng)新的應(yīng)用,對架構(gòu)有新的要求,老是用一套做是不行的,RISC-V允許核本身不動,基本ISA由community(社區(qū))統(tǒng)一管理,允許加不同的東西進來,這樣可以把很多事情做好。
RISC-V的ISA是開放和免費的。有三種模式:1.有可能開源社區(qū)獲得免費的設(shè)計,像Linux;2.商業(yè)模式方面,有的是像致象爾、SiFive、晶心科技等公司,利用ISA設(shè)計芯片,銷售IP和設(shè)計,出售證書(licensing)或royality(版權(quán));3.賣芯片。由表1可見,Arm不做芯片,只做設(shè)計。Intel不賣設(shè)計,只出售芯片。RISC-V在這三個方面都可以。
參考文獻:
[1] 任澤坤.芯片廠商引領(lǐng)廣電的人工智能化[J],電子產(chǎn)品世界,2017(10);19~23
[2] 王瑩.人工智能的進展及發(fā)展建議[J],電子產(chǎn)品世界,2017(2);19~23
[3] 有鵬,劉勇,楊林莉,等. 基于物聯(lián)網(wǎng)的圖像監(jiān)控系統(tǒng)[J],電子產(chǎn)品世界,2017(7);37~40
本文來源于《電子產(chǎn)品世界》2018年第12期第11頁,歡迎您寫論文時引用,并注明出處。
評論