揭秘太湖之光:純國產如何稱雄TOP500?
第3篇:申威26010揚名 擺脫國外技術依賴
本文引用地址:http://www.ex-cimer.com/article/201607/294145.htm國產申威26010的秘密武器
除了太湖之光奪冠,其實更令人興奮的是其采用了國產處理器申威26010,可以說有著一定的歷史意義。2015年4月,美國商務部發(fā)布公告,決定禁止英特爾向四家國家超級計算機中心出售Xeon Phi處理器。而在此之前,曾經的TOP500冠軍天河二號采用的就是Xeon系列處理器。這意味著,天河二號將無法繼續(xù)使用英特爾提供的用于升級系統(tǒng)的新款芯片。
然而,申威26010的出現擊碎了外界對于國產化的質疑。與此同時,這款處理器也帶來了一個“新名詞”:眾核。超算界早已對以GPU、眾核為代表的異構計算持開明態(tài)度,GPU應用的場景越來越多,在算法上也有了更多的支持。從長遠來看,異構集群對超算的重要性會加大,在確保靈活性和軟件兼容性的前提下,追求更高的性能和更低的功耗。
一直以來,HPC的發(fā)展離不開軍用和科研,太湖之光也不例外。事實上,申威在業(yè)內早有耳聞,但為什么外界鮮有人知呢?主要原因或許就是軍方背景。申威系列芯片的研發(fā)單位是江南計算機所(即總參某部56所),而申威26010就是在國家高性能集成電路(上海)設計中心生產,被部署于無錫國家超級計算中心。總參某部56所創(chuàng)建于1951年6月,位于無錫。
申威最初的技術來源是DEC公司開發(fā)的Alpha 21164,后者在1995面世,采用0.5um制造工藝,主頻為200MHz。不過,隨著技術研發(fā)的深耕,江南所拓展出了自主的申威-64指令集,擺脫了Alpha的影子。
申威26010采用了“CPU+加速器”的方案(管理核心+運算核心),為64位RISC(主頻1.45GHz),擁有260個處理核心和4個內存控制器。處理器內包括四個核心組,每組有65個內核,由8×8 Mesh架構計算集群(CPE)、一個管理單元(MPE)、一個內存控制器(MC)組成。其中,MPE和MC也可以被當作獨立的處理核心,前者負責系統(tǒng)管理和通訊,后者則用于浮點運算,單個內存(128bit的DDR3)帶寬為34GB/s,因此整個處理器提供了136.5GB/s的帶寬。
申威26010核心組結構(圖片來自Jack Dongarra)
申威26010支持264位的矢量指令集,內置各32KB的L1指令緩存和數據緩存,以及256KB L2緩存,沒有L3緩存。對于CPE來說,單條處理管線使得每個主頻周期可進行8次浮點運算,浮點性能為11.6GFLOPS,而MPE則約為CPE的兩倍。
申威26010節(jié)點基礎設計(圖片來自Jack Dongarra)
此外,申威26010可能并非采用NUMA(非統(tǒng)一內存訪問架構)架構,這使得處理器組內之間的內容共享成為可能,在硬件方面沒有緩存的一致性需求,由軟件負責同步。相比之下,英特爾Kight Landing則是將緩存一致性(Cache Coherence)都交給硬件。從性能來看,申威26010的雙精浮點峰值為3.06TFlops,與Kight Landing處在同一水平線。
不過,作為完全自主的國產處理器,申威26010也面臨著一些問題。首先就是制造工藝,有人猜測28nm,盡管并不是官方說法,但相較英特爾的14nm還是有些落后。其次,太湖之光的HPCG(High Performance Conjugate Gradients)成績也一般,峰值效率為0.3%,低于天河二號的1.1%。
太湖之光的HPCG成績不理想(圖片來自Jack Dongarra)
對于HPCG測試,可能是內存和互聯(lián)寬帶拖了后腿。前面提到過,申威26010采用的是DDR3,而英特爾Kight Landing已經用上六通道DDR4,Xeon Phi的內存帶寬達到了512GB。雖然太湖之光在Linpack上大幅領先,但在HPC的適用性方面就會有些下降。總的來說,申威26010在計算能力上的優(yōu)勢有目共睹,不過由于更偏向軍用,因此部分功能經過了特殊調校,應用范圍有一定的局限。
第4篇:太湖之光應用貢獻大 照亮中國超算
超算之路不平坦 太湖之光只是開始
從天河系列的70%國產化,到神威藍光的85%以上,再到如今完全自主、耗時三年研制的神威太湖之光,中國超算在美國芯片禁運的“倒逼”下,已經跨出了歷史性的一步。值得一提的是,基于太湖之光系統(tǒng)的三項全機應用還入圍了有超算界諾貝爾之稱的“戈登貝爾獎”。該獎項自1987年設立以來,中國團隊從未入圍過。
在國家863計劃的支持下,作為“國之重器”的超級計算機在工業(yè)制造、航天、軍事、醫(yī)學、科研等領域將發(fā)揮更大的作用,并且會助推深度學習、人工智能的發(fā)展。未來,太湖之光將在四個方向發(fā)揮作用:全球高分辨率模擬,為氣候變化研究提供量化研究的基礎;先進制造,助力“中國制造”轉向“中國創(chuàng)造”;生命科學,為研發(fā)新藥和探索生命奧秘提供支撐;大數據分析。
舉例來說,國家超級計算無錫中心與清華大學、北京師范大學合作,在太湖之光上進行了CAM全球大氣模式的重構與優(yōu)化,以及全球超高分辨率大氣模式實驗框架。其中,大氣模式實驗框架已初步實現了3公里精度,僅次于日本NICAM 870米的分辨率。清華大學計算機科學與技術系副教授薛巍表示:“有了這套計算機系統(tǒng),我們可以在30天內完成未來100年的地球氣候模擬,全面提升我國應對極端氣候事件和自然災害時的減災防災能力?!?/p>
大氣模式實驗框架(圖片來自國家超級計算無錫中心)
借助太湖之光,國家計算流體力學實驗室對“天宮一號”返回路徑進行了數值模擬計算,將為其返回提供精確預測;上海藥物所開展的藥物篩選和疾病機理研究,兩周內就完成了原本需要10個月的計算,加速了白血病、癌癥、禽流感等疾病的藥物設計進度;此外,太湖之光還將在“高分辨率海浪數值模擬”和“鈦合金微結構演化相場模擬”方面做出巨大貢獻。截至目前,國家超級計算無錫中心已經與北京大學、中科院軟件所、中船重工702所、遠景能源、清華大學、國家計算流體力學實驗室等國內30多家機構或單位建立了應用合作關系。
除了國家級研究機構的貢獻,以聯(lián)想、曙光等為代表的中國企業(yè)也在超算領域有著很好的表現。最新一期TOP500中,聯(lián)想就以92套獲得了全球超算份額第二、中國第一的成績。未來,超算將朝著高性能、低功耗的方向繼續(xù)拓展,芯片設計、任務分配、算法優(yōu)化、應用范圍、散熱系統(tǒng)等依然是努力的重點。
評論