高性能計算的金字塔式進化
剛剛更新的HPC TOP500榜單再次點燃了人們的激情。對專業(yè)人士來說,這份來自國際超級計算大會的權(quán)威成果預(yù)示著高性能計算的新風(fēng)向。即便是普通讀者,這份榜單也絕非無關(guān)緊要,計算能力躍升意味著我們能更快地找到石油、更準確地預(yù)測天氣和自然災(zāi)害、更清楚地了解生命的奧秘……
本文引用地址:http://www.ex-cimer.com/article/85514.htm從科研向商用普及
相較以往,此次公布的榜單似乎動靜更大些。這半年來,計算能力再上了一個數(shù)量級,考量依據(jù)首次引入能效數(shù)據(jù)、四核快速成為絕對主流,集群、Infiniband等技術(shù)主題詞的優(yōu)勢也進一步擴大,英特爾更是以其IA架構(gòu)(至強與安騰)占據(jù)75%的份額理所當(dāng)然地拔得頭籌。眾多表象背后,我們試圖聚焦于平臺及生態(tài)系統(tǒng)層面,榜單背后還有哪些值得我們?nèi)リP(guān)注?
高性能市場是典型的金字塔結(jié)構(gòu),最下端的基石部分是龐大的工作組級,系統(tǒng)一般為6~64個節(jié)點,中間部分就是所謂的行業(yè)大單,一般有256~512個節(jié)點,甚至更大。頂部技術(shù)最尖端,也最吸引眼球,它一定是大規(guī)模并行架構(gòu)方面的創(chuàng)新者和推動者,但份額極小。
英特爾服務(wù)器產(chǎn)品經(jīng)理顧凡表示,高性能計算市場的熱點集中在兩端,一個是頂端的技術(shù)突破,擁有更大的計算能力去滿足尖端領(lǐng)域的性能需求;另一個是底端的應(yīng)用普及,它的關(guān)鍵在于提供商要能把突破性技術(shù)以更低的成本向下灌輸。金字塔的中間部分是最為成熟的,標準化的集群架構(gòu)非常普及且標準化,未來只是應(yīng)用刀片解決方案之類的提高能效的問題。
從對上榜系統(tǒng)用戶的統(tǒng)計上看,HPC從科研走向商用化的趨勢非常明顯,關(guān)注點也由過去的追求性能到解決問題的高生產(chǎn)力。以中國為例,我國內(nèi)地上榜的12套系統(tǒng)中有6套用于石油行業(yè)的勘探作業(yè)。另6套高性能計算系統(tǒng)分別為電信、氣象、地理和物流等行業(yè)用戶采用。相比全球發(fā)展來看,中國目前仍有多個行業(yè)尚未開啟其高性能進程,如金融行業(yè),華爾街在其風(fēng)險模型的預(yù)測方面應(yīng)用高性能計算,在做投資產(chǎn)品組合時快速響應(yīng),降低風(fēng)險,搶占先機;再比如生命科學(xué)領(lǐng)域,高性能計算也在高速成長。這些都是中國亟待開墾的高性能計算沃土。
軟硬件的協(xié)同力量
此次TOP500上榜系統(tǒng)的總體計算能力獲得了空前提升,本次榜單中排名最后的系統(tǒng)性能在上一次榜單公布中還可以名列第200名。這樣的性能提升與采用多核處理器密不可分。
在系統(tǒng)采用的處理器中,剛發(fā)布7個月的英特爾至強5400是最耀眼的明星,它同時也推動了四核成為HPC的絕對主流。至強5400被161臺系統(tǒng)采用,占總數(shù)的32.20%,同時,在首次引入的能效考量體系中,也以最高為265Mflop/s/W的表現(xiàn)位居x86架構(gòu)系統(tǒng)的首位。這樣的表現(xiàn)主要歸功于45nm制造工藝給其絕對性能和能效帶來的提升。顧凡表示,待Nehalem微架構(gòu)推出,內(nèi)存帶寬等方面的改善將使基于該架構(gòu)處理器的系統(tǒng)獲得更大的性能提升,能效也將進一步提高。
有了先進的處理器,性能卻未必一定會提升很高,因為軟件上還存在著巨大的調(diào)優(yōu)空間。英特爾在HPC生態(tài)系統(tǒng)中,就從事著這樣的軟件支持工作。其實,軟件與硬件可謂英特爾的左右手,它在軟件方面有大量調(diào)試工具,針對高性能計算有專門的軟件包,如編譯器、數(shù)學(xué)函數(shù)庫等工具,這些是幫用戶把高性能計算應(yīng)用好的核心。英特爾所做的工作就是針對用戶的應(yīng)用軟件做優(yōu)化,解決并行瓶頸,以更好地應(yīng)用線程并行,這樣才能把整個集群的能力激發(fā)出來,甚至?xí)岣邤?shù)倍的整體性能。
記者了解到,英特爾設(shè)在美國的高性能計算中心由軟件與解決方案事業(yè)部管理,其職責(zé)是幫助HPC解決方案供應(yīng)商、甚至最終用戶做分析與調(diào)優(yōu),他們最早接觸英特爾的高性能產(chǎn)品,有足夠的技術(shù)實力在新一代架構(gòu)上進行調(diào)優(yōu)。
蓄勢千萬億數(shù)量級
IBM基于CELL和皓龍?zhí)幚砥鞯腞oadrunner此次位列榜首,并將計算數(shù)量級突破了千萬億次(1 Petaflops)。同樣是沖擊最高端,英特爾的產(chǎn)品規(guī)劃與技術(shù)準備的情況如何?混合架構(gòu)是否是沖擊千萬億次計算的必經(jīng)之路?
英特爾高性能計算方案架構(gòu)師張曉軍與記者進行了交流。他認為,在最高端領(lǐng)域,英特爾正穩(wěn)步走在正確軌道上。“英特爾在高性能計算產(chǎn)品線上的布局非常完整,既有服務(wù)于集群架構(gòu)的至強,也有服務(wù)于大內(nèi)存容量需求的安騰,未來高端的還有Many Core(眾核)架構(gòu)去服務(wù)HPC的金字塔尖部分。”他列舉了兩個重要事件佐證觀點,一是4月28日,Cray宣布聯(lián)合英特爾共同開發(fā)下一代高性能計算機;二是NASA(美國航空航天管理局)與英特爾、SGI宣布將共同為NASA在2009年前開發(fā)出峰值性能為千萬億次的計算系統(tǒng),2012年將這一數(shù)字提高到萬萬億次,服務(wù)于NASA航空航天的研究包括氣象預(yù)測的研究。“這些重量級的合作伙伴為什么會選擇與英特爾長期合作?這表明他們看到并認可英特爾在HPC領(lǐng)域未來長遠的發(fā)展藍圖。” 張曉軍表示。
在技術(shù)層面,英特爾2006年就開始做單芯片的萬億次研究,它將成為千萬億次計算的基石組件。張曉軍介紹說,英特爾已為此開展了100多個研究項目,去探索在未來的超大規(guī)模并行計算中,除了處理器之外,在服務(wù)器平臺、內(nèi)存架構(gòu)、高帶寬I/O、軟件編程等各個方面遇到的難題,都以研究項目覆蓋解決。“英特爾堅信,高性能計算一定會走向多核化,我們更傾向于未來更輕量的小核實現(xiàn)并行化,這個核的指令集、計算、管道都不用那么復(fù)雜,這也會帶來能量節(jié)省。”
談及混合架構(gòu),張曉軍認為,加速器盡管對性能提升的影響較大,但卻只適用于應(yīng)用的特定部分,對其他部分意義并不大。而對于大多數(shù)用戶的實際應(yīng)用來說,他們首先要考慮軟件調(diào)優(yōu)帶來的大幅度性能提升,這才具有更為普遍的意義。張曉軍表示,輕量小核才是未來的必經(jīng)之路。“當(dāng)然,只靠多核也不能走向千萬億次,還需要有能力做平臺研發(fā)和軟件方面的嘗試和突破,這正是英特爾的核心價值所在。”
評論