<meter id="pryje"><nav id="pryje"><delect id="pryje"></delect></nav></meter>

<label id="pryje"></label>

新聞中心

EEPW首頁 > 智能計算 > 業(yè)界動態(tài) > 大數據重塑新芯片架構 AI處理器尋求突破

大數據重塑新芯片架構 AI處理器尋求突破

作者：時間：2017-06-02 來源：eettaiwan

加入技術交流群
- 掃碼加入
  和技術大咖面對面交流
  海量資料庫查詢

收藏

　　業(yè)界共同的愿景是開發(fā)一款人工智能(AI)處理器，它可為神經網絡處理訓練與推理等任務，甚至可能出現一些新的自我學習技術;這種AI處理器還必須能透過大規(guī)模的平行化方式提供強大的性能，同時具有高功效且易于編程...

本文引用地址：http://www.ex-cimer.com/article/201706/359968.htm

　　由亞馬遜(Amazon)、Google和Facebook等網絡巨擘所收集的大量數據集，正推動處理這些巨量數據的新芯片復興。預計在六月底的年度計算機架構大會上將亮相其中兩項最新成果。

　　史丹佛大學(Stanford University)的研究人員將介紹一種可重配置處理器——Plasticine，它可支持比FPGA更高近100倍的每瓦特性能，同時也更易于編程。此外，Nvidia的兩名資深設計人員定義了一款推理處理器，可提供較現有組件更高2倍性能與能源效率。

　　這些芯片象征著這項任務的冰山一角。過去一年來，英特爾(Intel)收購了三家機器學習創(chuàng)業(yè)公司。而其競爭對手——三星(Samsung)則連手Dell EMC投資英國公司Graphcore，這是該領域的六家獨立新創(chuàng)公司之一。

　　Nvidia正致力于推動其GPU作為神經網絡訓練引擎的銷售。同時，該公司也正調整其芯片架構，使其得以更有效地處理這些任務。

　　Google則聲稱其龐大的x86 CPU叢集以及Nvidia的GPU均不足以勝任這項處理任務。因此，Google推出了自家的兩款加速器版本——Tensor處理器(TPU)。

　　Graphcore執(zhí)行長Nigel Toon說：“如今正是“運算2.0”(Compute 2.0)的時代，它象征著一個全新的運算世界。 Google最終將使用以TPU為基礎的機架結構，幾乎不使用任何CPU，因為它有98%的營收都來自搜尋——這正是機器學習的理想應用。 ”

　　最終，機器學習芯片將出現在廣泛的嵌入式系統(tǒng)中。以汽車每年賣出1，800萬輛和服務器約1，000萬套的年銷售量來看，Toon說：“自動駕駛車應用可望為這項技術帶來一個比云端更大的市場，而且是一個以往從未存在過的市場。 ”

　　如今業(yè)界共同的愿景是開發(fā)一款人工智能(AI)處理器，它可為神經網絡處理訓練與推理等任務，甚至可能出現一些新的自我學習技術。這種AI處理器還必須能透過大規(guī)模的平行化方式提供強大的性能，同時具有高功效且易于編程。

　　即使是這項開發(fā)任務的基本數學也引發(fā)熱烈討論。 Toon認為，16位浮點乘法與32位累加運算的組合，能夠帶來優(yōu)化精確度以及最小誤差。

　　這正是Nvidia Volta架構導入的Tensor核心所使用的途徑，同時也是Graphcore將在今年10月出樣給早期合作伙伴的高階芯片。該新創(chuàng)公司正專注于開發(fā)一款采用新內存與互連的大型芯片，該芯片并可外接至各種單元與叢集。

　　后多核心時代的靈活性

　　由Kunle Olukotun帶領的史丹佛大學研究團隊也有類似的目標，不過，他們采取了一條與Plasticine不一樣的道路。

　　Olukotun說：“多核心時代即將結束…… 我們正處于一個現代應用程序(app)改變運算模式的時代。 ”Olukotun曾經協(xié)助一家新創(chuàng)公司率先打造出多核心設計，該技術最終成為Oracle基于Sparc處理器的一部份。

　　“對于機器學習的統(tǒng)計模型，真正需要的運算方式與古典的確定性運算途徑截然不同，所以這將帶來一個真正的機會。 ”

　　如同英國布里斯托的競爭對手Graphcore一樣，史丹佛大學研究團隊摒棄了共享一致的快取等傳統(tǒng)思維。史丹佛大學數據科學計劃執(zhí)行總監(jiān)Stephen Eglash認為，Plasticine“最令人興奮之處在于硬件可在運行時重新配置，為特定計算方式實現優(yōu)化。 ”

　　Olukotun說：“我們的目標在于讓擁有專業(yè)知識的任何人都能建立可生產的機器學習系統(tǒng)，而不一定得由機器學習或硬件領域的專家來做。 ”

　　為了實現這一目標，史丹佛大學定義了一種新的語言Spatial，可將算法的各部份映像至平行處理器的各部份。 Olukotun說：“我們擁有完整的編譯程序流程，從高層級的Tensor Flow架構到硬件呈現。..。.. 事實上，它具有比FPGA更高10倍每瓦特性能，也更易于編程100倍。 ”

　　Spatial類似于Nvidia的Cuda GPU編程語言，但應該更易于使用。它能將諸如分散/收集或MapReduce等功能映像至硬件中的外顯內存階層架構，經由DRAM和SRAM實現串流數據集。

　　因此，Pasticine處理器“是一項軟件至上的計劃，”Olukotun說。

　　Eglash認為在物聯(lián)網的邊緣節(jié)點正需要這樣的技術。 “我們所產生的數據將會比傳送至云端的更龐大，所以必須采用一些分布式的本地運算。 ”

　　短期來看，機器學習將為智能型手機帶來“超級個性化”，針對用戶的喜好自動量身打造。別再為密碼和指紋傷腦筋了。 Eglash說：“你的手機可能在幾秒內就知道你是不是本尊。 ”

　　在工業(yè)物聯(lián)網(IIoT)，推理任務已經被分配至網關了。 GE Digital云端工程主管Darren Haas說，“我們所打造的一切都可以被劃分成較小的裝置，甚至是Raspberry Pi 。.. 我們在云端建立了大規(guī)模的模型，并使其得以在邊緣執(zhí)行于輕量級硬件上。 ”

　　史丹佛大學的Plasticine架構

　　史丹佛大學的Plasticine是一種全新的架構，可能是Graphcore等新創(chuàng)公司將會采用的技術。它充份利用了平行模式和高層級抽象，以擷取有關數據位置、內存存取模式和控制流程等細節(jié)，從而在“一系列的密集與稀疏應用上進行操作”。

　　在該芯片核心采用16×8的交錯式圖形運算單元(PCU)數組與圖形內存單元(PMU)，透過3個互連信道利用3種控制協(xié)議進行連接。這款尺寸為113mm2的芯片采用Spatial將應用映像至數組上;相較于采用類似28nm制程打造的FPGA，該芯片可提供更高95倍的性能以及高達77倍的每瓦性能。

　　Plasticine在1GHz頻率頻率下的功耗高達49W，支持12.3TFlops的峰值浮點運算性能，以及16 MB的芯片容量。

　　PCU是執(zhí)行巢狀模式之可重配置SIMD功能單元的多級管線。 PMU使用庫存的緩存器內存和專用尋址邏輯與地址譯碼器。

運算2.0時代 AI芯片尋求突破

　　Plasticine采用16×8的PCU與PMU數組，以及地址產生器和交換盒

　　這些主單元和其他周邊組件透過字級純量、多字符向量和位級控制互連進行連接，且全部都采用相同的拓撲結構。各個連接都采用分布式的分層控制機制，以盡可能減少使用同步單元，從而實現序列、流水線或串流的執(zhí)行。

　　該途徑簡化了編譯程序映像并可提高執(zhí)行效率。 “每個Plasticine組件均用于映像應用的特定部份：本地地址計算在PMU中完成，DRAM地址運算發(fā)生在DRAM地址管理單元，其余的數據運算則在PCU中進行。 ”

　　Olukotun解釋說：“本質上，它是一組高度庫存的內存，支持專用地址單元產生附近的地址。只需執(zhí)行計算，即可讓內存在正確的時間將數據串流至運算單元，而無需解譯指令。 ”

　　該芯片采用四個DDR信道外接DRAM，并進行緩沖和管理，以盡可能減少芯片外處理。

　　Olukotun說：“許多機器學習都專注于建置卷積神經網絡(CNN)，但我們的目標是打造更靈活且涵蓋稀不斷變化中的疏密集算法，讓開發(fā)人員可以將其設計想法傳達給硬件。 ”

　　研究人員采用周期精確仿真來合成設計的RTL，為線性代數、機器學習、數據分析與圖形分析等任務產生基準。他說：“我們希望這些設計概念能直接用于芯片上，并計劃在6到18個月內進行芯片設計。 ”

　　

運算2.0時代 AI芯片尋求突破

　　Plasticine與英特爾28nm Stratix-V的性能比較 (來源：Stanford)

　　Nvidia研究人員打造稀疏推理引擎

　　另一組由9名研究人員組成的研究團隊(其中有7人來自Nvidia)將介紹稀疏卷積神經網絡(SCNN)推理加速器。該研究團隊包括資深的微處理器設計人員Joel Emer(曾協(xié)助定義同步多線程)，以及Nvdia首席科學家William Dally。

　　相較于同級配置的密集CNN加速器，SCNN可提供更高2.7倍的性能和2.3倍的能源效率。該芯片采取較以往的研究更先進的途徑，可消除無關緊要的數學運算，并專注于以最高效的方法處理CNN權重與啟動。

　　此外，它采用了一種新的數據流，可在壓縮編碼過程中保持稀疏權重與啟動，從而避免不必要的數據傳輸以及減少儲存的需求。此外，“SCNN數據流有助于將這些權重與啟動有效地傳遞到乘法器數組，并在此廣泛重復使用。 ”

　　該途徑可讓“較大CNN的所有操作量保留在各層間的芯片緩沖區(qū)，完全不必使用大規(guī)模網絡所需的高成本跨層DRAM參考資源。 ”

運算2.0時代 AI芯片尋求突破

　　SCNN使用處理元素(PE)數組，處理權重以及輸入/輸出啟動 (來源：Nvidia)

　　該芯片的處理元素(PE)采用支持權重和啟動向量的乘法器數組。該芯片采用16nm制程技術，將64個PE與16個乘法器封裝于7.4mm2模塊中，使其尺寸略大于類似的密集CNN加速器。

　　該論文并比較了SCNN與其他研究中的芯片。然而，Dally猜測這款芯片“比商用推理加速器的效率更高，因為它利用的是稀疏設計途徑。 ”

　　如同Plasticine一樣，目前的研究成果是以仿真為基礎，尚未制造芯片。 Dally說：“我們正為這款設計進行布局以及時序收斂。 ”

　　Nvidia尚未宣布商用化SCNN技術的任何計劃，但在研究論中指出，“我們正持續(xù)在這個領域的研發(fā)工作。 ”

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

關鍵詞：芯片 AI

評論

相關推薦

用MAX610系列AC／DC芯片構成的小功率無變壓器穩(wěn)壓電源

設計方案 MAX610 系列芯片構成功率變壓器穩(wěn)壓電源 | 2009-07-06

SK 海力士加大環(huán)保投入，在芯片生產工藝中使用氟氣替代三氟化氮

EDA/PCB SK 海力士芯片生產工藝氟氣三氟化氮 | 2024-07-25

DS2413 1-Wire 雙通道尋址開關

資源下載 Maxim 雙通道尋址開關 DS2413 1-Wire 芯片 | 2007-03-20

2021春晚黑科技，火爆全網的\"打工牛\"是什么來頭？

視頻 AI 機器人 | 2021-02-26

大嘴業(yè)話：俄烏戰(zhàn)爭關“芯”幾何

視頻俄烏戰(zhàn)爭芯片 | 2022-06-21

國際奧委會：最大限度發(fā)揮 AI 工具影響力，體育人才選拔方式有望得到革新

智能計算 AI 奧運會體育 | 2024-07-26

[原創(chuàng)]集成光學/IC模塊 -- 將系統(tǒng)級芯片提高到新水平

Gao | 2002-07-01

可編程快速充電管理芯片MAX712/ MAX713電路

設計方案可編程快速充電管理芯片 MAX712 MAX713 | 2009-07-06

AI 芯片：一場燒錢的瘋狂競賽

智能計算 AI 芯片 | 2024-07-24

am29lv160db芯片燒寫/擦除判斷位d7不夠可靠?!

seasoblue | 2002-05-24

消息稱 OpenAI 公司 2024 年資金缺口達到 50 億美元

智能計算 OpenAI ChatGPT AI | 2024-07-25

基于D類功放專用驅動芯片驅動的高保真純正弦波逆變器

設計方案基于功放專用驅動芯片高保真正弦波逆變器 | 2009-07-06

摩根士丹利：僅 GB200 AI 服務器業(yè)務，就為英偉達創(chuàng)造 2100 億美元年收入

智能計算 GB200 AI 英偉達 GPU | 2024-07-26

加大調整力度，教育部支持高校布局集成電路、AI 等專業(yè)

智能計算教育 AI 集成電路 | 2024-07-25

AI當靠山軟件大廠SAP裁員擴大至上萬

智能計算 AI 軟件 SAP 裁員 | 2024-07-24

HBM4持續(xù)加速：AI時代競爭新焦點

網絡與存儲 HBM AI 內存 | 2024-07-25

AI驅動的嵌入式聲音和振動識別

視頻 ADI AI 嵌入式 OtoSense | 2018-10-23

川普批中國臺灣偷走美芯片 CNN抱不平揭真相

國際視野川普芯片 CNN 臺積電 | 2024-07-24

基于D類功放專用驅動芯片驅動的高保真純正弦波逆變器1

設計方案基于功放專用驅動芯片高保真正弦波逆變器 | 2009-07-06

高效、節(jié)能、高集成，新一代電源管理芯片產品的技術特征

視頻 EEPW 電源芯片 | 2014-06-12

預測：全球通信芯片市場2003年將反彈

hpnet | 2002-05-25

Meta發(fā)布“前沿級”開源AI模型扎克伯格：不怕競爭者使用

智能計算 Meta 開源 AI 模型扎克伯格 | 2024-07-24

ep7312芯片原理及應用

資源下載 Cirrus Logic 公司 ARM 芯片 EP7312 嵌入式內存映射 | 2007-02-16

KS8999 以太網絡交換機芯片

資源下載 KS8999 以太網絡交換機芯片 | 2007-02-28

經驗點滴之二：燒寫器PICKIT

jackwang | 2002-06-19

先進的鋰電池線性充電管理芯片BQ2057充電電路

設計方案先進鋰電池線性充電管理芯片 BQ2057 電路 | 2009-07-06

s3c4510 芯片手冊

資源下載 s3c4510 芯片手冊 | 2007-02-28

“破局AI開發(fā)，釋放邊緣算力開發(fā)者訪談”，干貨滿滿！

視頻 intel AI OpenVINO | 2021-06-10

保證航天飛機起飛 NASA到處尋找8086芯片

hpnet | 2002-05-17

Dallas實時時鐘（RTC)芯片DS1306硬件手冊

資源下載 MAXIM INTEGRATED PRODUCTS Dallas 實時時鐘（RTC)芯片 DS1306 | 2007-02-09

焦點

推薦視頻

技術專區(qū)

關閉

看屁屁www成人影院,亚洲人妻成人图片,亚洲精品成人午夜在线,日韩在线欧美成人 (function(){ var bp = document.createElement('script'); var curProtocol = window.location.protocol.split(':')[0]; if (curProtocol === 'https') { bp.src = 'https://zz.bdstatic.com/linksubmit/push.js'; } else { bp.src = 'http://push.zhanzhang.baidu.com/push.js'; } var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(bp, s); })();