<meter id="pryje"><nav id="pryje"><delect id="pryje"></delect></nav></meter>
          <label id="pryje"></label>

          新聞中心

          EEPW首頁 > 專題 > 為什么某些嵌入式AI處理器比其它更智能 

          為什么某些嵌入式AI處理器比其它更智能 

          作者:Liran Bar 時間:2018-04-26 來源:電子產(chǎn)品世界 收藏
          編者按:介紹了嵌入式AI處理器性能差異的原因,及人工智能處理前端化至關重要的功能及解決方案。

          作者 / Liran Bar CEVA產(chǎn)品營銷總監(jiān)

          本文引用地址:http://www.ex-cimer.com/article/201804/379032.htm

          摘要:介紹了嵌入式處理器性能差異的原因,及人工智能處理前端化至關重要的功能及解決方案。

            移動設備上的人工智能()已經(jīng)不再依賴于云端連接,今年CES最熱門的產(chǎn)品演示和最近宣布的旗艦智能手機都論證了這一觀點。人工智能已經(jīng)進入終端設備,并且迅速成為一個市場賣點。包括安全、隱私和響應時間在內(nèi)的這些因素,使得該趨勢必將繼續(xù)擴大到更多的終端設備上。為了滿足需求,幾乎每個芯片行業(yè)的玩家都推出了不同版本、不同命名的人工智能處理器,像深度學習引擎、神經(jīng)處理器、人工智能引擎等。

            然而,并非所有的人工智能處理器都是一樣的?,F(xiàn)實是,許多所謂的人工智能引擎就是傳統(tǒng)的嵌入式處理器(利用CPU和GPU)加上一個矢量向量處理單元()。單元是專門為高效執(zhí)行與計算機視覺及深度學習相關的繁重計算負載而設計的。雖然擁有一個強大的、低功耗的是嵌入式人工智能的重要組成部分,但這不是故事的全部。VPU是組成一個出色的人工智能處理器的眾多組件之一。VPU雖然經(jīng)過精心設計,也確實提供了所需的靈活性,但它不是一個處理器。這里還有一些其它功能對于人工智能處理前端化至關重要。

          1 優(yōu)化嵌入式系統(tǒng)的

            在云計算處理過程中,采用浮點計算進行訓練,定點計算進行推理,從而實現(xiàn)最大的準確性。用大型服務器群組進行數(shù)據(jù)處理,能耗和大小必須考慮,但他們相較于有邊緣約束的處理幾乎是無限的。在移動設備上,功耗、性能和面積(PPA)的可行性設計至關重要。因此在嵌入式SoC芯片上,優(yōu)先采用更有效的定點計算。當將網(wǎng)絡從浮點轉換為定點時,會不可避免地損失掉一些精度。然而正確的設計可以優(yōu)化精度損失,從而達到與原始訓練網(wǎng)絡幾乎相同的結果。

            控制精度的方法之一是在8位和16位整數(shù)精度之間做出選擇。雖然8位精度可以節(jié)省帶寬和計算資源,但是許多商用的神經(jīng)網(wǎng)絡仍然需要采用16位精度以保證準確性。神經(jīng)網(wǎng)絡的每一層都有不同的約束和冗余,因此為每一層選擇更高的精度是至關重要的。

            針對開發(fā)人員和SoC設計者,一個工具可以自動輸出優(yōu)化的圖形編譯器和可執(zhí)行文件,例如CEVA網(wǎng)絡生成器,從上市時間的角度來看是一個巨大的優(yōu)勢。此外,保持為每一層選擇更高精度(8位或16位)的靈活性也是很重要的。這使每一層都可以在優(yōu)化精度和性能之間進行權衡,然后一鍵生成高效和精確的嵌入式網(wǎng)絡推理,如圖3所示。

          2 專用硬件來處理真正的人工智能算法

            VPU使用靈活,但許多常見的神經(jīng)網(wǎng)絡需要的大量帶寬通道對標準處理器指令集提出了挑戰(zhàn)。因此,必須有專門的硬件來處理這些復雜的計算。

            例如NeuPro AI處理器包括專用的引擎處理矩陣乘法、完全連接層、激活層和匯聚層。這種先進的專用AI引擎結合完全可編程工作的NeuPro VPU,可以支持所有其它層類型和神經(jīng)網(wǎng)絡拓撲,如圖4所示。這些模塊之間的直接連接允許數(shù)據(jù)無縫交換,不再需要寫入內(nèi)存。此外,優(yōu)化的DDR帶寬和先進的DMA控制器采用動態(tài)流水線處理,可以進一步提高速度,同時降低功耗。

          3 明天未知的人工智能算法

            人工智能仍然是一個新興且快速發(fā)展的領域。神經(jīng)網(wǎng)絡的應用場景快速增加,例如目標識別、語音和聲音分析、5G通信等。保持一種適應性的解決方案,滿足未來趨勢是確保芯片設計成功唯一途徑。因此,滿足現(xiàn)有算法的專用硬件肯定是不夠的,還必須搭配一個完全可編程的平臺。在算法一直不斷改進的情況下,計算機模擬仿真是基于實際結果進行決策的關鍵工具,并且減少了上市時間。CDNN PC仿真包允許SoC設計人員在開發(fā)真實硬件之前,就可以使用PC環(huán)境權衡自己的設計。

            另一個滿足未來需求的寶貴特征是可擴展性。NeuPro AI產(chǎn)品家族可以應用于廣泛的目標市場,從輕量型的物聯(lián)網(wǎng)和可穿戴設備(2 TOPs)到高性能的行業(yè)監(jiān)控和自動駕駛應用(12.5 TOPs)。

            在移動端實現(xiàn)旗艦AI處理器的競賽已經(jīng)開始。 許多人快速趕上了這一趨勢,使用人工智能作為自己產(chǎn)品的賣點,但并不是所有產(chǎn)品里都具備相同的智能水平。如果想要創(chuàng)建一個在不斷發(fā)展的人工智能領域保持“聰明”的智能設備,應該確保在選擇AI處理器時,檢查上述提到的所有特性。

            本文來源于《電子產(chǎn)品世界》2018年第5期第18頁,歡迎您寫論文時引用,并注明出處。



          關鍵詞: AI 工作負載 VPU 201805

          評論


          相關推薦

          技術專區(qū)

          關閉
          看屁屁www成人影院,亚洲人妻成人图片,亚洲精品成人午夜在线,日韩在线 欧美成人 (function(){ var bp = document.createElement('script'); var curProtocol = window.location.protocol.split(':')[0]; if (curProtocol === 'https') { bp.src = 'https://zz.bdstatic.com/linksubmit/push.js'; } else { bp.src = 'http://push.zhanzhang.baidu.com/push.js'; } var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(bp, s); })();