<meter id="pryje"><nav id="pryje"><delect id="pryje"></delect></nav></meter>

<label id="pryje"></label>

新聞中心

EEPW首頁 > 智能計算 > 編輯觀點 > Habana攜超強AI芯片入局，向CPU、GPU大鱷亮劍

Habana攜超強AI芯片入局，向CPU、GPU大鱷亮劍

作者：王瑩時間：2019-06-21 來源：電子產(chǎn)品世界

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢

收藏

初創(chuàng)公司以色列Habana Labs從隱身變?yōu)楦哒{(diào)，近日在京舉辦新聞發(fā)布會，首席商務官Eitan Medina介紹了兩款AI芯片及解決方案，分別用于推理和訓練，適合數(shù)據(jù)中心、自動駕駛等應用，競爭目標直指用AI領域最高性能的CPU和英偉達GPU，號稱性能同比高三四倍，延遲更低，且擴展性超強，集成度更高。

本文引用地址：http://www.ex-cimer.com/article/201906/401790.htm

照片：Habana首席商務官Eitan Medina

Habana的AI芯片推出周期為9個月，2018年9月宣布推理芯片Goya，2019年6月宣布訓練處理器Gaudi。

該公司盡管2016年成立，已有兩輪投資，第二輪投資由Intel等參與，現(xiàn)在有約1.2億美元資金，主要用于招募眾多優(yōu)秀的DSP、處理器人才。公司已有一百余人，大部分為開發(fā)人員。公司開始做軟件和算法，積累兩年后，于2018年9月推出第一代芯片Goya。兩代芯片皆采用16 nm工藝，在臺積電流片。

1 Goya：高性能的AI推理處理器

Goya有基于PCIe的卡，用于服務器的推理和預測。通過和CPU、英偉達GPU相比，Goya性能有3倍的優(yōu)勢，功耗和延遲也很低，可以實時處理圖片。

圖片4.png

迄今，Goya仍是市場上最強性能的產(chǎn)品。3片Goya卡相當于8片Tesla（特斯拉）V100 GPU，169個CPU服務器。

圖片5.png

那么，為何Habana的芯片性能領先？通常有兩種方式可以保證領先，一種是架構(gòu)，另一種靠工藝。Goya屬于前者，依靠架構(gòu)。首先，不像GPU，Goya是完全針對AI和全可編程設計的，并且有Tensor（張量）處理核心（TPC）。

圖片6.png

AI的性能主要體現(xiàn)在兩方面：計算能力和延遲。batch size直接影響了處理器性能。在數(shù)據(jù)中心中，GPU的batch size要定得很大，否則會影響性能。為了實現(xiàn)大的batch size，需要把很大數(shù)量的數(shù)據(jù)讀到內(nèi)存中，這帶來了延遲。Goya可以用較小的batch size，甚至一張圖片即可，因此延遲低，這特別適合自動駕駛這類實時性強的應用。

推理的一個重要指標是精度。在整形化（quantization）方面，Goya由于很強的算法團隊，2018年在國際學報上曾發(fā)布了四篇論文。

在生態(tài)方面，很多客戶過去是在GPU和CPU上做的算法，現(xiàn)在轉(zhuǎn)到Goya也很容易，Habana公司有軟件堆棧（SynapseAI），支持客戶在不同處理器（GPU、CPU、FPGA等）上的訓練，然后在Goya上運行。

很多人不相信Habana這家小公司，但實際上Goya產(chǎn)品非常成熟，有很多客戶采用，例如facebook開源了Glow，并在官網(wǎng)上認可了Goya，因為Goya為Glow機器學習編譯器實現(xiàn)后端開源。另外，Goya把驅(qū)動提供給了Linux，獲得了Linux的支持。

圖片7.png

盡管現(xiàn)在很多客戶在用CPU和GPU，但是正在尋找更好的處理器，因此Goya還可以給客戶提供定制化的產(chǎn)品，因此要給客戶最大權(quán)限的開放。

總之，Goya讓客戶在CPU和GPU上實現(xiàn)AI的推理和預測工作，可以容易地移植到Goya上。過去90%的推理和預測是在CPU和GPU上做的，現(xiàn)在有了專用的AI推理處理器。

2 Gaudi：處理能力強大4倍的AI訓練處理器

Gaudi性能是最新的英偉達GPU的4倍，且在很小的batch size情況下實現(xiàn)的。

圖片8.png

支持RDMA是AI訓練芯片的下一代發(fā)展方向。為此，AI訓練處理器的領頭羊——英偉達已于2019年3月收購了Habana的老鄉(xiāng)——以色列Mellanox公司，以獲得RDMA技術(shù)，使之可以運行在以太網(wǎng)環(huán)境中。Gaudi更進一步，集成了RDMA over Converged Ethernet（即RoCE v2）功能，從而讓AI系統(tǒng)能夠使用標準以太網(wǎng)擴展至任何規(guī)模。不僅如此，Gaudi的獨特之處是集成了10個RDMA，而英偉達需要外接一個PCIe switch（如下圖）。

圖片9.png

Gaudi有芯片、卡（子卡和PCIe卡）及系統(tǒng)方案，通過PCIe，可以做垂直及橫向擴展，使性能倍增。例如，Habana推出了一款名為HLS-1的8-Gaudi系統(tǒng)，與英偉達DCX-1（注：英偉達已出DCX-2）比較，基于Gaudi的HLS-1系統(tǒng)在擴展性、總線效率等方面最高的。

圖片10.png

應用案例，可以16個Gaudi芯片并用；或通過數(shù)據(jù)并行化和層級化處理提高處理效率，因此可以建立1千片Gaudi芯片的系統(tǒng)。在AI中，除了數(shù)據(jù)的并行化處理之外，還有模型的并行化處理，把大模型分成多個小模型，挑戰(zhàn)是之間的通訊，由于Gaudi有很多通訊接口，因此保證了通訊帶寬。而英偉達GDX-2沒有這么強的能力，因為英偉達的通訊接口有限，且采用了私有的協(xié)議。而Gaudi采用了內(nèi)置的RDMA方案，可以靈活擴展，例如2千個芯片連接。因此，可以單機或幾百芯片互聯(lián)，進行大型模型的訓練，可謂沒有應用的邊界。而傳統(tǒng)CPU很難超過16個互聯(lián)。

另外建議客戶不要用私有協(xié)議互聯(lián)，而在通用協(xié)議下，這樣可以在AI生態(tài)圈里選擇更多的處理器。

圖片11.png

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

關鍵詞： AI 數(shù)據(jù)中心

評論

相關推薦

北電和EMC等聯(lián)手與思科爭奪備份數(shù)據(jù)中心市場

hpnet | 2003-04-16

蘋果承認：AI模型使用谷歌定制芯片訓練

智能計算蘋果 AI 谷歌定制芯片 | 2024-07-30

EEPW2018年6月刊(5G)

資源下載 5G AI | 2018-06-11

Meta發(fā)布“前沿級”開源AI模型扎克伯格：不怕競爭者使用

智能計算 Meta 開源 AI 模型扎克伯格 | 2024-07-24

AI驅(qū)動的嵌入式聲音和振動識別

視頻 ADI AI 嵌入式 OtoSense | 2018-10-23

AI當靠山軟件大廠SAP裁員擴大至上萬

智能計算 AI 軟件 SAP 裁員 | 2024-07-24

開放的網(wǎng)絡對于創(chuàng)新和效率來說不可或缺

設計方案網(wǎng)絡開放 SDN 數(shù)據(jù)中心 | 2015-08-04

樓宇自動化

視頻 Littelfuse 通信，樓宇自動化，數(shù)據(jù)中心，云基礎設施 | 2021-03-24

AI 芯片：一場燒錢的瘋狂競賽

智能計算 AI 芯片 | 2024-07-24

WTC-AI太陽能熱水器電路圖

設計方案 WTC-AI 太陽能熱水器電路圖 | 2012-07-24

加大調(diào)整力度，教育部支持高校布局集成電路、AI 等專業(yè)

智能計算教育 AI 集成電路 | 2024-07-25

新架構(gòu)支撐下一代數(shù)據(jù)中心快速前行

設計方案 MetaFabric QFX5100 數(shù)據(jù)中心 | 2015-09-04

GPRS/CDMA數(shù)據(jù)采集系統(tǒng)中數(shù)據(jù)中心的IP地址問題

藍盒子 | 2007-09-22

GPRS/CDMA數(shù)據(jù)采集系統(tǒng)中數(shù)據(jù)中心的IP地址問題

黃品冠 | 2007-09-16

WTC-AI型太陽能熱水器電路圖

設計方案電子電路圖，WTC-AI 太陽能熱水器電路熱水器 | 2012-07-30

HBM4持續(xù)加速：AI時代競爭新焦點

網(wǎng)絡與存儲 HBM AI 內(nèi)存 | 2024-07-25

安華高科技數(shù)據(jù)中心網(wǎng)絡

視頻 Avago 數(shù)據(jù)中心 | 2012-09-24

電子元件培訓教材

資源下載 NBA 電子元件識別電阻識別電容識別 AI MI SMT DIP 靜電防護 | 2008-09-20

數(shù)據(jù)中心和云基礎設施

視頻 Littelfuse 通信，樓宇自動化，數(shù)據(jù)中心，云基礎設施 | 2021-03-24

鐵通數(shù)據(jù)中心，國家級機房

gzcfeng | 2006-03-15

2021春晚黑科技，火爆全網(wǎng)的\"打工牛\"是什么來頭？

視頻 AI 機器人 | 2021-02-26

消息稱 OpenAI 公司 2024 年資金缺口達到 50 億美元

智能計算 OpenAI ChatGPT AI | 2024-07-25

國家數(shù)據(jù)局：“東數(shù)西算”工程 10 個國家數(shù)據(jù)中心集群算力總規(guī)模超 146 萬標準機架

智能計算東數(shù)西算數(shù)據(jù)中心云計算 | 2024-07-22

iCAN-4017 AI功能模塊

資源下載周立功單片機功能模塊 iCAN-4017 AI | 2007-03-30

CSR8670CSR8675智能語音Alexa藍牙方案開發(fā)

資源下載 AI 智能語音 | 2017-12-14

甲骨文推出整合客戶信息“客戶數(shù)據(jù)中心”軟件

jisedse | 2005-11-03

萬家樂JSYZ5-AI燃氣熱水器電路圖

設計方案電路圖熱水器燃氣 JSYZ5-AI 萬家樂 | 2013-01-17

摩根士丹利：僅 GB200 AI 服務器業(yè)務，就為英偉達創(chuàng)造 2100 億美元年收入

智能計算 GB200 AI 英偉達 GPU | 2024-07-26

國際奧委會：最大限度發(fā)揮 AI 工具影響力，體育人才選拔方式有望得到革新

智能計算 AI 奧運會體育 | 2024-07-26

EEPW2018年3月刊(工業(yè)物聯(lián)網(wǎng))

資源下載工業(yè)物聯(lián)網(wǎng) AI | 2018-03-12

焦點

推薦視頻

技術(shù)專區(qū)

關閉

看屁屁www成人影院,亚洲人妻成人图片,亚洲精品成人午夜在线,日韩在线欧美成人 (function(){ var bp = document.createElement('script'); var curProtocol = window.location.protocol.split(':')[0]; if (curProtocol === 'https') { bp.src = 'https://zz.bdstatic.com/linksubmit/push.js'; } else { bp.src = 'http://push.zhanzhang.baidu.com/push.js'; } var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(bp, s); })();