中國的ARM構(gòu)架處理器:打敗Intel頂級(jí)芯片
在剛剛結(jié)束的Hotchips 2015會(huì)議上,一家成立不久的中國企業(yè)公布了一顆代號(hào)”火星”的ARM指令集64核心處理器。令人震驚的是,這顆由中國團(tuán)隊(duì)開發(fā)的CPU擁有媲美Intel公司最頂級(jí)服務(wù)器芯片的性能,毫無疑問是目前ARM陣營最強(qiáng)大的處理器。
本文引用地址:http://www.ex-cimer.com/article/279389.htm
Phytium,中文名飛騰,是一家成立于2012年的年輕CPU研發(fā)企業(yè)。然而光是從公司名稱和所在地——廣州,我們就可以知道這家企業(yè)的真實(shí)身份。飛騰公司是中國國防科技大學(xué)高性能處理器研究團(tuán)隊(duì)建立的企業(yè),而國防科大在IT界最為人熟知的作品就是天河2A超級(jí)計(jì)算機(jī)——連續(xù)五屆奪得世界超算排行榜性能冠軍。天河2A的部分芯片采用了國防科大自主開發(fā)的Sparc指令集CPU,飛騰1500。顯然,飛騰公司的名稱就是取自這款產(chǎn)品。公司選址在廣州也是為了靠近廣州超級(jí)計(jì)算中心,也就是天河2A的所在地。
與中科院計(jì)算所知名的龍芯處理器團(tuán)隊(duì)不同,國防科大的CPU研發(fā)機(jī)構(gòu)在公眾眼中沒什么名氣。事實(shí)上,早在十年前業(yè)內(nèi)就有傳聞指國防科大正在逆向山寨Intel的IA64體系處理器安騰。后來安騰CPU在市場上舉步維艱,NUDT(國防科大英文縮寫)也停止了對其模仿的工作,轉(zhuǎn)而開發(fā)采用Sparc指令集的高性能芯片。經(jīng)過數(shù)年的努力,NUDT先后研制出飛騰1000、飛騰1500兩款服務(wù)器處理器,開始逐漸為業(yè)界所知。
天河系列超算開始在全球超算領(lǐng)域嶄露頭角后,國防科大將眼光放到了更遠(yuǎn)的未來。天河2A和之前的一系列國產(chǎn)超級(jí)計(jì)算機(jī)均采用Intel、NVIDIA、AMD等美國企業(yè)生產(chǎn)的處理器,其計(jì)算能力、軟件編寫嚴(yán)重依賴這些外國公司。若想自己掌控超級(jí)計(jì)算機(jī)的研發(fā)節(jié)奏,研制自主知識(shí)產(chǎn)權(quán)的高性能處理器是必經(jīng)之路。此時(shí),學(xué)校的CPU團(tuán)隊(duì)經(jīng)過幾代產(chǎn)品的研發(fā)已經(jīng)頗具實(shí)力,他們便擔(dān)負(fù)起了設(shè)計(jì)有著世界一流水平的CPU的重任。
如今,NUDT的努力結(jié)出了碩果。Hotchips 2015大會(huì)上,飛騰公司介紹了他們的”火星”,一顆兼容ARMv8指令集,四發(fā)射亂序執(zhí)行,擁有多達(dá)64個(gè)核心,主頻達(dá)到2GHZ的服務(wù)器CPU。
在標(biāo)準(zhǔn)測試集Spec 2006中,”火星”的多核整數(shù)分?jǐn)?shù)高達(dá)672,浮點(diǎn)分?jǐn)?shù)585。相比之下,Intel目前最強(qiáng)的處理器Xeon E7-8890v3和Xeon E5-2699v3的整數(shù)、浮點(diǎn)成績分別是680和460,"火星”的性能足以與它們媲美。
“火星”的核心代號(hào)為”小米”,這個(gè)名字足夠令許多人浮想聯(lián)翩了。不過取這個(gè)名字很可能只是巧合,因?yàn)轱w騰公司與制造智能設(shè)備的小米公司并沒有任何關(guān)聯(lián)?!毙∶住焙诵氖堑湫偷默F(xiàn)代高性能處理器微架構(gòu)設(shè)計(jì),四發(fā)射、兩個(gè)浮點(diǎn)單元,不長的流水線和三級(jí)緩存方案。它顯然并不是為密集浮點(diǎn)運(yùn)算設(shè)計(jì)的產(chǎn)物,單周期雙精度浮點(diǎn)輸出只有4Flop。
但是"小米"核心的訪存結(jié)構(gòu)設(shè)計(jì)很激進(jìn),192個(gè)寄存器、單核心512K L2、2M L3的設(shè)計(jì)非常像Intel的Haswell微架構(gòu)?!被鹦恰辈捎枚Smesh多核互聯(lián)結(jié)構(gòu),每8顆”小米”核心組成一個(gè)陣列,每個(gè)陣列有一個(gè)雙通道DDR3-1600內(nèi)存控制器;8個(gè)陣列組成”火星”芯片,總共64個(gè)核心、32M二級(jí)緩存、128M三級(jí)緩存和16通道內(nèi)存,205G/s理論內(nèi)存帶寬。芯片上還有32個(gè)PCIe 3.0通道。
“火星”的理論浮點(diǎn)計(jì)算能力是512G DP Flops,采用28nm制造工藝,主頻2GHZ,核心運(yùn)行電壓不足1v。雖然整個(gè)芯片面積達(dá)到了嚇人的640平方毫米,但是滿載功耗只有120w,甚至比使用22nm先進(jìn)工藝,性能相當(dāng)?shù)腦eon E5-2699v3、E7-8890v3都低一截。ARM陣營性能功耗比較強(qiáng)的優(yōu)勢過去僅僅體現(xiàn)在移動(dòng)設(shè)備使用的低功耗芯片上,而飛騰公司證明了即使在高性能服務(wù)器處理器領(lǐng)域,兼容ARM指令集的處理器也能取得對同時(shí)代Intel頂級(jí)產(chǎn)品的功耗優(yōu)勢。
“火星”的量產(chǎn)版本預(yù)計(jì)會(huì)在2016年推出,預(yù)計(jì)會(huì)首先用在國防科大下一代超級(jí)計(jì)算機(jī)(可能命名為天河3)上。不久前,國防科大展示了一款用來取代Intel Xeon Phi浮點(diǎn)運(yùn)算芯片的計(jì)算卡Matrix 2000,預(yù)計(jì)下一代天河會(huì)使用”火星”和Matrix 2000的組合來搭建。
除了”火星”,飛騰公司還展望了他們針對主流市場開發(fā)的”地球”處理器。”地球”顯然是”火星”的簡化版,核心數(shù)量可能減至4-16個(gè),面向桌面PC、低功耗服務(wù)器等市場。從”火星”單核心Spec測試集成績來看,8核心的”地球”就可以提供與Intel Core i7 四核處理器接近的多線程性能,而功耗可能還有優(yōu)勢。而兼容ARMv8指令集意味著無論是”火星”還是”地球”都可以輕易運(yùn)行安卓、Linux系統(tǒng)和市面上無數(shù)的應(yīng)用,甚至可能兼容微軟的Windows 10。性能差距不復(fù)存在后,ARM陣營進(jìn)軍桌面PC和服務(wù)器市場挑戰(zhàn)x86的地位也就有了足夠的底氣。飛騰公司不僅僅做到了世界一流水平,更為重要的是他們?yōu)檎麄€(gè)ARM陣營建立了信心:
從此之后,再也無人能質(zhì)疑ARM指令集是否能開發(fā)出高性能產(chǎn)品了,x86體系在PC、服務(wù)器市場稱雄二十年后,終于遇到了強(qiáng)大的對手。
而值得國人驕傲的是,這一歷史性時(shí)刻是一家之前默默無聞的中國企業(yè)創(chuàng)造的。自從2006年Intel發(fā)布酷睿2處理器以來,十年時(shí)間里除了老牌巨頭IBM,未曾有任何企業(yè)挑戰(zhàn)Intel性能冠軍的寶座。
如今,第一個(gè)向老大哥扔出巨斧的不是AMD,不是NVIDIA,也不是一眾歐美企業(yè),而是幾年前還背著”山寨”惡名的中國團(tuán)隊(duì)。即使是業(yè)界最老資格的前輩,此刻也應(yīng)向年輕的飛騰致以敬意。
毫無疑問,”火星”的發(fā)布會(huì)大大刺激ARM陣營的發(fā)展,直接影響未來數(shù)年的CPU產(chǎn)業(yè)格局。照此趨勢發(fā)展下去,我們很快就會(huì)在桌面、高性能服務(wù)器領(lǐng)域看到ARM與x86的直接對抗。當(dāng)Intel的神話不再閃耀,IT產(chǎn)業(yè)又會(huì)迎來一個(gè)高度競爭的全新時(shí)代。
評(píng)論