揭秘太湖之光:純國(guó)產(chǎn)如何稱雄TOP500?
第1篇:超算界的角斗場(chǎng):TOP500是什么?
本文引用地址:http://www.ex-cimer.com/article/201607/294145.htm1946年,由美國(guó)軍方定制的電子計(jì)算機(jī)“ENIAC”面世,當(dāng)時(shí)的這個(gè)“大家伙”每秒可執(zhí)行5000次加法或400次乘法運(yùn)算。經(jīng)過了70年的發(fā)展,超算的運(yùn)行速度已經(jīng)達(dá)到億億次/秒級(jí)別。在今年6月的ISC 2016上,TOP500公布了新一屆世界冠軍:神威·太湖之光。有人不禁會(huì)問,這款超算究竟有何能力超過天河二號(hào)?國(guó)產(chǎn)處理器申威26010,又是怎樣的秘密武器?
神威·太湖之光
超算界的角斗場(chǎng):TOP500
自1993年以來,國(guó)際TOP500組織每年都會(huì)按照Linpack測(cè)試性能公布全球已部署的前500臺(tái)超算,每年會(huì)有兩次排名,旨在促進(jìn)超算領(lǐng)域的交流和合作,推廣應(yīng)用。由于在2002年之前,中國(guó)HPC(高性能計(jì)算)未曾向國(guó)際申報(bào)過Linpack結(jié)果,因此沒有被列入TOP500。后來,隨著相關(guān)機(jī)構(gòu)陸續(xù)開放測(cè)試,中國(guó)開始在國(guó)際超算市場(chǎng)嶄露頭角,迅速成為前10名的???。
Linpack最早在1974年4月被使用,是當(dāng)前最流行的用于測(cè)試高性能計(jì)算機(jī)系統(tǒng)浮點(diǎn)性能的基準(zhǔn),通過超算求解N元一次稠密線性代數(shù)方程組的方式做出評(píng)估。Linpack測(cè)試包括Linpack100、Linpack1000和HPL。其中,HPL被稱為高度并行計(jì)算基準(zhǔn)測(cè)試,是針對(duì)現(xiàn)代并行計(jì)算機(jī)提出的測(cè)試方式,應(yīng)用范圍更廣。
計(jì)算峰值是衡量計(jì)算機(jī)性能的一個(gè)重要指標(biāo),所謂的浮點(diǎn)計(jì)算峰值分為理論值和實(shí)測(cè)值,前者是計(jì)算機(jī)理論上每秒能完成浮點(diǎn)計(jì)算的最大次數(shù),主要由CPU主頻決定,后者是Linpack測(cè)試值,即在計(jì)算機(jī)上運(yùn)行Linpack測(cè)試程序,通過一系列調(diào)校得到的最優(yōu)測(cè)試結(jié)果。
在德國(guó)法蘭克福舉行的第47屆國(guó)際超算大會(huì)上,一串帶有中國(guó)特色的英文“TaiHuLight”成了全場(chǎng)焦點(diǎn),它的官方名稱是“神威·太湖之光”。這款超算以93Petaflops的Linpack峰值性能力壓天河二號(hào),領(lǐng)跑TOP500,與它一起出名的,還有國(guó)產(chǎn)處理器申威26010。值得一提的是,中國(guó)上榜的HPC數(shù)量(167臺(tái))也首次超過了美國(guó)(165臺(tái))。
太湖之光登頂TOP500
除了排在前兩位的太湖之光和天河二號(hào),第四至十名的超算依次為泰坦、Sequoia紅杉、日本K京、Mira、Trinity、Piz Daint、Hazel Hen和Shaheen II。根據(jù)官方的說法,中國(guó)是繼美國(guó)、日本之后,全球第三個(gè)采用自主CPU建成千萬億級(jí)別超級(jí)計(jì)算機(jī)的國(guó)家。
作為曾經(jīng)的TOP500六冠王,這里也有必要提一下天河二號(hào),其由國(guó)防科大研發(fā),落戶在廣州超算中心,搭載英特爾Xeon處理器,運(yùn)行的是基于Linux的麒麟系統(tǒng),創(chuàng)新性地采用了異構(gòu)融合體系結(jié)構(gòu)。天河二號(hào)的計(jì)算節(jié)點(diǎn)能耗約為18兆瓦,加上散熱系統(tǒng)的整體能耗在20兆瓦以上。
第2篇:太湖之光首秀奪冠 軟硬件實(shí)現(xiàn)國(guó)產(chǎn)化
初識(shí)“太湖之光”
事實(shí)上,今年的ISC并非是神威家族的首秀,2011年曾經(jīng)有一個(gè)神威藍(lán)光系統(tǒng),被安裝在濟(jì)南的國(guó)家超級(jí)計(jì)算中心,當(dāng)時(shí)在TOP500上排名第14,所使用的申威SW1600是第三代16核芯片。上線五年之后,在863計(jì)劃的支持下,中國(guó)國(guó)家并行計(jì)算機(jī)工程技術(shù)國(guó)家研究中心(NRCPC)推出了更強(qiáng)大的申威SW26010處理器,幫助太湖之光奪取了冠軍。
太湖之光搭載申威26010眾核處理器,運(yùn)行速度超過10億億次/秒,峰值性能12.54億億次/秒,持續(xù)性能達(dá)到9.3億億次/秒,功耗比達(dá)到每瓦特60.51億次運(yùn)算。與天河二號(hào)相比,持續(xù)計(jì)算速度提升了近3倍,測(cè)試功耗卻更低(15371KW,天河二號(hào)為17808KW)。在Linpack測(cè)試中,太湖之光用4個(gè)小時(shí)就完成了天河二號(hào)20多個(gè)小時(shí)才能完成的運(yùn)算任務(wù)。
申威26010處理器,主板為雙節(jié)點(diǎn)(圖片來自Jack Dongarra)
太湖之光的整機(jī)效率達(dá)到74.16%,相比之下泰坦為65.19%、天河二號(hào)為55.83%,這在性能愈強(qiáng)、規(guī)模愈大的情況下,是很不容易的。性能功耗比方面,太湖之光的成績(jī)?yōu)?G/W,泰坦為2.143G/W,天河二號(hào)為1.95G/W。此外,太湖之光在Green500也躋身三甲,考慮到排在前兩位的超算搭載的是低功耗英特爾E5,因此這一成績(jī)值得肯定。
整體來看,太湖之光的架構(gòu)應(yīng)該是沿用了藍(lán)光的MPP(大規(guī)模并行處理)分布式方案,更符合傳統(tǒng)的HPC應(yīng)用,效率更高。太湖之光由40個(gè)計(jì)算機(jī)柜組成,每個(gè)機(jī)柜有4個(gè)SuperNode(256個(gè)節(jié)點(diǎn)組成),共擁有40960個(gè)節(jié)點(diǎn),每個(gè)節(jié)點(diǎn)單CPU有260個(gè)核心,主板為雙節(jié)點(diǎn)設(shè)計(jì),每個(gè)CPU固化的板載內(nèi)存為32GB DDR3-2133。
太湖之光機(jī)柜組成(圖片來自Jack Dongarra)
評(píng)論