從智能手機(jī)到無人車,AI芯片在爆發(fā)
芯片戰(zhàn)爭未曾停歇。飛速發(fā)展的自動駕駛為芯片廠商帶來了新的機(jī)會,IC設(shè)計商嘗試推出更適用于AI場景的芯片,晶圓與封測廠商圖加速換代生產(chǎn)線,以便趕上下一波AI時代的“潮流”。為了更直觀的理解AI芯片,我們需要“拆解”兩部iPhone。
本文引用地址:http://www.ex-cimer.com/article/201902/398024.htm揭開iPhone 4后蓋,卸下主板PCB,可以看到一塊拇指大小黑色塑料片。這是蘋果第一代自家產(chǎn)的SoC(片上系統(tǒng)),名為A4處理器,它被焊接在iPhone 4主板背部,曾與喬幫主一同站在2010發(fā)布會舞臺上。如今蘋果自產(chǎn)SoC升級到了A12X,除了運算能力的增長,其內(nèi)核架構(gòu)也隨著工業(yè)界芯片制造工藝進(jìn)化而日趨精湛。
8年前的A4處理器撐起了iPhone的市場地位,這塊搭載ARM核心、內(nèi)部脈沖震蕩可以飆升至1GHZ的芯片,僅一半的計算能力就可把上個世紀(jì)登月的阿波羅飛船甩在幾條街后,而大部分用戶只需用它打電話、收發(fā)郵件、偶爾玩一玩《憤怒的小鳥》。A系芯片演進(jìn)到今天,蘋果推出搭載最新處理器A12x的iPad Pro,庫克試圖說服人們一款不足6毫米厚度的電子設(shè)備就可勝任生活工作的全部需求,從而不在需要攜帶厚重的筆記本,確實有他的道理。
A12X代表著消費電子處理器已到達(dá)前所未有的高度。這款A(yù)12X內(nèi)置模擬人腦神經(jīng)元的集成電路,可以在人眼不可察覺的瞬間完成神經(jīng)引擎、圖像處理、數(shù)據(jù)處理的工作(FaceID),這在幾年前還是科幻電影的元素。
我們沒有辦法展示A12X的照片,但可以參照A11,視覺化蘋果移動端SoC集成度變化。
今天再來對比兩款芯片:兩張單薄晶體板下方隱藏著一道巨大的技術(shù)鴻溝,從硅晶打磨、光刻、再到封裝技術(shù),背后是多年來理論學(xué)者與芯片工程師的嘗試,以及全球芯片巨頭間的角逐結(jié)果。如果不是制造工藝的進(jìn)步、整個芯片的社會生產(chǎn)力不斷提升,誰也不會想到會有類似科幻元素的產(chǎn)品觸達(dá)我們的生活,影響到我們的感官體驗。
國內(nèi)華為也有自己的SoC系統(tǒng):麒麟980。為證明最新麒麟980的實力,華為號召了幾位大學(xué)生,設(shè)計出一套可以預(yù)裝在榮耀Magic2上便可操縱車輛的駕駛程序,佐證了麒麟980計算能力。
這是一次創(chuàng)新式的嘗試,但手機(jī)能夠處理的道路信息還是非常有限,為了提供安全可靠的自動駕駛體驗,我們需要更快、更靈活、更低功耗的的AI芯片。
在未來,無人駕駛汽車將集成諸多算法。想象一下,用戶可以在手機(jī)App上“召喚”一輛附近空閑的無人車。無人車啟動“大腦”,開始獲得實時路況信息,這幾乎占用了目前無人車“大腦”的運算帶寬。每一秒鐘,攝像頭采集車附近360度視野圖像,實時地運行卷積神經(jīng)網(wǎng)絡(luò)來區(qū)分行人與車輛。
與此同時,毫米波雷達(dá)收集到距離信息為車載決策層準(zhǔn)確的判斷依據(jù):是繼續(xù)直線行駛,還是轉(zhuǎn)向避讓?決策層需要在不到50毫秒的時間內(nèi)反應(yīng),控制車輛動力及轉(zhuǎn)向控制器,下位機(jī)繼而將指令轉(zhuǎn)化成PWM脈沖信號,指揮毫無思考能力的方向電機(jī)和動力電機(jī)。
幾分鐘后,無人車戰(zhàn)勝了復(fù)雜的路況、穿過嘈雜街道,??吭诘骄珳?zhǔn)的目標(biāo)位置,等待乘客上車。隨后,通過車載語音交互模塊,無人車可獲知用戶的目的地。根據(jù)最新的高精度地圖信息,再結(jié)合車身上的全方位傳感器感知周遭情況,最終安全的抵達(dá)目的地。這一套流程,重復(fù)而單一,會使人類司機(jī)感到疲憊。
所以不難看出,AI芯片有三大要求:大吞吐,低延時,低能耗。對于廠商來講,只要能占據(jù)更大的無人駕駛市場,錢不是問題。
為實現(xiàn)這一目標(biāo),Nvidia在2016年推出K字頭運算GPU加速器,黃仁勛試圖討好馬斯克以便擠掉以色列公司Mobileye,但顯然后者不吃這一套,選擇表面合作暗地卻從AMD挖高管,打算自己搞AI芯片。只不過事實證明,最新的Model 3依然使用Nvidia的處理器,自研芯片之路還很長。
目前在業(yè)界中,有一種說法是AI芯片將沿「CPU-GPU-FPGA-ASIC」的路線演進(jìn)。CPU曾在PC、服務(wù)器端時代統(tǒng)領(lǐng)江山,卻不及GPU的大吞吐特性而淪為輔助,Nvidia曾在Drive Xavier架構(gòu)上投入30億美元,2018年CES上展示出了一款能夠以500瓦的能耗代價實現(xiàn)每秒320萬億次運算。500瓦的能耗水平非常低,滿載的車內(nèi)空調(diào)大約在5千瓦時左右,占用傳統(tǒng)燃油車2匹馬力。
然而未來國內(nèi)能源屬性趨勢來看,無人駕駛模塊將限制車輛的續(xù)航里程,500瓦的功耗還是太高。
中國一家名為深鑒科技創(chuàng)業(yè)公司在去年被國際FPGA巨頭賽靈思(xilinx)收購,深鑒科技的一篇論文曾在FPGA 2017大會上評為最佳,在論文中他們設(shè)計的模型可以在XCKU060(一款FPGA芯片)上運行更高精度的語音識別效果,而且擁有更低的功耗。矛盾在于FPGA屬于半定制化的工業(yè)產(chǎn)品,成本相對較高,XCKU060單片價格在4000美元左右。在相同計算力下,F(xiàn)PGA價格不占優(yōu)勢。谷歌旗下的Waymo目前使用的KU115(一款來自賽靈思的FPGA芯片),單片價格在5400美元左右,雖然換掉了早年使用的英特爾Xeon系列服務(wù)器芯片,運算性能不斷提升,但整車價格也一路高歌猛進(jìn)。
評論