ASIC AI,巨頭才玩得起的游戲?未必
人工智能芯片主要包括GPU、FPGA、ASIC以及類腦芯片。在人工智能時(shí)代,它們各自發(fā)揮優(yōu)勢(shì),呈現(xiàn)出百花齊放的狀態(tài)?,F(xiàn)在,人工智能已經(jīng)不再局限于機(jī)器學(xué)習(xí)上,而且更多可以以更快的速度運(yùn)行AI系統(tǒng)的新型架構(gòu)正在被開(kāi)發(fā)出來(lái)。英偉達(dá)、高通、英特爾、IBM、谷歌、Facebook和其它公司正在加速涌入這個(gè)領(lǐng)域。
本文引用地址:http://www.ex-cimer.com/article/201711/372059.htm實(shí)際上,這些器件并不是真正的芯片,而是一種系統(tǒng)級(jí)封裝。它們通常包含一顆或者兩顆具有大規(guī)模處理能力的基于最新半導(dǎo)體制造工藝(16nm及以下)的ASIC,和大容量的超高帶寬內(nèi)存(比如HBM2堆棧),所有這些芯片都通過(guò)先進(jìn)封裝技術(shù)集成在一起。
隨著NVIDIA將GPU重新定位成為云端AI引擎角色下,也確定帶動(dòng)ASIC業(yè)務(wù)跟進(jìn)發(fā)展,如Google如今已推出第二代TPU、英特爾在買下Nervana公司后也取得自有Nervana芯片,另外由多名前Google TPU員工創(chuàng)辦的新創(chuàng)企業(yè)Groq,近日也宣布將在2018年初推出自有下一代AI芯片等等。
Google的TPU,是專門為其深度學(xué)習(xí)算法Tensor Flow設(shè)計(jì)的,TPU也用在了AlphaGo系統(tǒng)中。今年發(fā)布的第二代Cloud TPU理論算力達(dá)到了180T Flops,能夠?qū)C(jī)器學(xué)習(xí)模型的訓(xùn)練和運(yùn)行帶來(lái)顯著的加速效果,其實(shí)也是一款A(yù)SIC芯片。選擇做ASCI定制化研發(fā),一方面是資金不愁,另一方面也是出于Google所需提供的服務(wù)考慮。包括Google圖像搜索、照片,云視覺(jué)API、Google翻譯等產(chǎn)品和服務(wù)都需要用到深度神經(jīng)網(wǎng)絡(luò)。Google有這個(gè)需求以及能力去開(kāi)發(fā)一種專門的芯片并具備規(guī)模化應(yīng)用(大量分?jǐn)傃邪l(fā)成本)的可能。
Nervana由英特爾購(gòu)并后,計(jì)劃在2017年底前推出第一款A(yù)I專用化Nervana神經(jīng)網(wǎng)絡(luò)處理器(NNP)。Nervana NNP也是一款A(yù)SIC芯片,能以極高運(yùn)算效率從事深度學(xué)習(xí)演算法的訓(xùn)練與執(zhí)行。英特爾舍棄了CPU上常見(jiàn)的快取,改由特殊軟件負(fù)責(zé)特定演算法的芯片存儲(chǔ)器管理,希望能借此將芯片的運(yùn)算密度與性能提升到新的層次。
由前Google TPU員工創(chuàng)辦的新創(chuàng)企業(yè)Groq打算在2018年發(fā)布第一代AI芯片。這款芯片對(duì)標(biāo)英偉達(dá)的GPU,是專門為人工智能重新定制一款芯片。官網(wǎng)資料顯示,這款芯片的運(yùn)算速度將可以達(dá)到400萬(wàn)億次每秒,每瓦特能進(jìn)行8萬(wàn)億次的運(yùn)算。而谷歌最新一代的TPU才達(dá)到每秒180萬(wàn)億次運(yùn)算,Groq芯片的性能將會(huì)是谷歌TPU的兩倍多。
聯(lián)發(fā)科也將有所動(dòng)作。聯(lián)發(fā)科共同CEO蔡力行表示,ASIC的布局聯(lián)發(fā)科會(huì)發(fā)揮既有資源,通過(guò)現(xiàn)有團(tuán)隊(duì)實(shí)力,配合客戶需求積極開(kāi)發(fā)ASIC領(lǐng)域。但畢竟才剛開(kāi)始,現(xiàn)階段不會(huì)太挑客戶,還是以整體業(yè)務(wù)成長(zhǎng)為優(yōu)先考慮。
全球AI芯片首個(gè)獨(dú)角獸寒武紀(jì),走的也是ASIC路線。
事實(shí)上,由于定制化、低功耗等好處,在AI領(lǐng)域ASIC正在被越來(lái)越多地采用,帶動(dòng)了ASIC設(shè)計(jì)及市場(chǎng)快速增長(zhǎng)。根據(jù)Semico Research的最新調(diào)查報(bào)告,在2021年以前,人工智能聲控裝置ASIC的設(shè)計(jì)預(yù)計(jì)將以接近20%的年復(fù)合成長(zhǎng)率成長(zhǎng),幾乎達(dá)到2016年至2021年間所有ASIC設(shè)計(jì)成長(zhǎng)率(10.1%)的兩倍,去年全球ASIC出貨量增長(zhǎng)為7.7%,明年物聯(lián)網(wǎng)ASIC單位出貨量將超過(guò)18億個(gè)單位。Semico Research指出,ASIC增長(zhǎng)主要?jiǎng)恿?lái)自于工業(yè)與消費(fèi)市場(chǎng)的成長(zhǎng),由于市場(chǎng)飽和加上需求減少,許多傳統(tǒng)終端應(yīng)用的成長(zhǎng)速度開(kāi)始減慢,而與物聯(lián)網(wǎng)有關(guān)的應(yīng)用正在起飛。
Semico Research指出,除了物聯(lián)網(wǎng)和人工智能以外,與智能電網(wǎng)、穿戴式電子產(chǎn)品、固態(tài)硬盤、無(wú)人機(jī)、工業(yè)物聯(lián)網(wǎng)、先進(jìn)駕駛輔助系統(tǒng)(ADAS)和5G基礎(chǔ)設(shè)施相關(guān)的ASIC產(chǎn)品成長(zhǎng)率預(yù)計(jì)也將較廣泛的市場(chǎng)更迅速。在2021年以前,消費(fèi)電子領(lǐng)域的基礎(chǔ)SoC設(shè)計(jì)專案將以19%的CAGR成長(zhǎng),而工業(yè)物聯(lián)網(wǎng)ASIC設(shè)計(jì)專案則將成長(zhǎng)25%。
ASIC設(shè)計(jì)研發(fā)成本難以負(fù)荷,設(shè)計(jì)服務(wù)浴火重生
盡管如此,ASIC在AI領(lǐng)域的應(yīng)用還是面臨著不少難題。
ASIC是依照產(chǎn)品需求不同而定制化的集成電路,由特定用戶需求和特定電子系統(tǒng)的需求而設(shè)計(jì)、制造。一般來(lái)說(shuō),ASIC在特定功能上進(jìn)行了專項(xiàng)強(qiáng)化,可以根據(jù)需要進(jìn)行復(fù)雜的設(shè)計(jì),可實(shí)現(xiàn)更高處理速度和更低功耗,相對(duì)地,ASIC的設(shè)計(jì)、制造成本也非常高。一般的IC公司很難承擔(dān)為深度學(xué)習(xí)開(kāi)發(fā)專門處理器ASIC芯片的成本的風(fēng)險(xiǎn)。首先未來(lái)為了性能必須使用最好的半導(dǎo)體工藝制程,而現(xiàn)在用最新的工藝制造芯片一次性成本就要幾百萬(wàn)美元,非常貴。就算有錢,還需要組建一個(gè)團(tuán)隊(duì)從零開(kāi)始設(shè)計(jì),設(shè)計(jì)周期往往也非常長(zhǎng),可以說(shuō)time to market時(shí)間太長(zhǎng),風(fēng)險(xiǎn)很大。且ASIC芯片還將必須不斷升級(jí)以跟上新技術(shù)及工藝水平,加上ASIC芯片設(shè)計(jì)者在開(kāi)發(fā)過(guò)程初期便已固定其邏輯,因此若在AI這類快速演進(jìn)的領(lǐng)域有新想法出現(xiàn),ASIC芯片將無(wú)法對(duì)此快速做出反應(yīng)。如果無(wú)法實(shí)現(xiàn)規(guī)?;膽?yīng)用,就算開(kāi)發(fā)成功也美元實(shí)際應(yīng)用價(jià)值。所以,IC公司一般傾向于采用通用芯片如CPU、GPU,或者半定制化芯片F(xiàn)PGA。
顯然,隨著工藝的不停升級(jí),ASIC的流片費(fèi)用已經(jīng)抬高了ASIC保底的最少芯片銷售量,到最后全球也就為數(shù)不多的幾家ASIC廠商能夠承受這種巨額的ASIC流片成本和失敗風(fēng)險(xiǎn)。借此,ASIC設(shè)計(jì)服務(wù)再次回到業(yè)界關(guān)注焦點(diǎn)。
例如,美國(guó)無(wú)晶圓廠FinFET級(jí)ASIC設(shè)計(jì)服務(wù)企業(yè)eSilicon日前宣布,成功將自有深度學(xué)習(xí)ASIC送交制造所發(fā)布,eSilicon提到這款A(yù)SIC采定制IP、先進(jìn)2.5D封裝工藝以及為業(yè)界大型芯片之一,并為該公司首款采用臺(tái)積電2.5D CoWoS封裝技術(shù)的量產(chǎn)芯片。
臺(tái)積電業(yè)務(wù)發(fā)展副總裁BJ Woo博士指出,臺(tái)積電CoWoS封裝技術(shù)是針對(duì)滿足這類芯片設(shè)計(jì)深度學(xué)習(xí)應(yīng)用的需求,此先進(jìn)封裝解決方案可實(shí)現(xiàn)高性能及整合需求,以達(dá)到eSilicon的設(shè)計(jì)目標(biāo)。前文中提到的Google TPU、Nervana NNP、Groq即將推出的第一代AI芯片,均是由ASIC公司所送交制造,并交由臺(tái)積電制造。
目前,人工智能類ASIC的發(fā)展仍處于早期。其根本原因是,ASIC一旦設(shè)計(jì)制造完成后電路就固定了,只能微調(diào),無(wú)法大改。而硬件的研發(fā)設(shè)計(jì)與生產(chǎn)成本很高,如果應(yīng)用場(chǎng)景是否為真市場(chǎng)尚不清晰,企業(yè)很難貿(mào)然嘗試。此外,能設(shè)計(jì)出適用于人工智能芯片的公司必然是要既具備人工智能算法又擅長(zhǎng)芯片研發(fā)的公司,進(jìn)入門檻較高。因此,AI算法+ASIC設(shè)計(jì)服務(wù)+代工的商業(yè)模式的發(fā)展得宜,可以讓愈來(lái)愈多AI ASIC得以陸續(xù)問(wèn)世及開(kāi)發(fā)。
代工廠這邊,全球有很多代工廠,但是因?yàn)殡y度太高,能做AI系統(tǒng)封裝的廠商并不多,臺(tái)積電、三星和格芯都在榜單之列。那么,是哪些廠商在設(shè)計(jì)AI系統(tǒng)封裝呢?你需要看看哪些廠商真正擅長(zhǎng)2.5D集成和擁有設(shè)計(jì)所需的關(guān)鍵IP(比如HBM2物理層接口和高速SerDes)。HBM2 PHY和高速SerDes模塊執(zhí)行該封裝系統(tǒng)內(nèi)多個(gè)組件之間的任務(wù)關(guān)鍵性通信。這些都是模擬設(shè)計(jì)中非常苛刻的挑戰(zhàn),從ASIC供應(yīng)商那里購(gòu)買IP可以把風(fēng)險(xiǎn)降至最低。上面提到的三項(xiàng)關(guān)鍵技術(shù)eSilicon都有涉及。擅長(zhǎng)這些領(lǐng)域的ASIC廠商并不多,不過(guò)由于人工智能市場(chǎng)可能會(huì)出現(xiàn)爆炸性增長(zhǎng),所以這些ASIC廠商將會(huì)受益匪淺。
臺(tái)灣也有眾多IC設(shè)計(jì)服務(wù)企業(yè),在人工智能市場(chǎng)驅(qū)動(dòng)下,ASIC生意再度好起來(lái),且業(yè)者預(yù)期這波榮景可望持續(xù)很久。臺(tái)積電大膽預(yù)言,2020年高性能計(jì)算(HPC)、AI相關(guān)芯片業(yè)績(jī)將高達(dá)150億美元,創(chuàng)意及世芯、智原亦看好來(lái)自全球AI客戶對(duì)于ASIC芯片的需求熱潮,可望自2017年起延續(xù)好一陣子,尤其是強(qiáng)調(diào)先進(jìn)制程技術(shù)、極度復(fù)雜芯片設(shè)計(jì)、高效能與低功耗等,將是IC設(shè)計(jì)服務(wù)業(yè)者的新藍(lán)海市場(chǎng)。
評(píng)論