Kalray MPPA解決方案實現(xiàn)無處不在的低功耗、實時單芯片超算
超級計算,對很多人來說并不陌生但仿佛又離得很遠,或許大家對它的了解也僅僅限于“天河”超級計算機。其實,隨著越來越多的應用對實時數(shù)值計算和數(shù)據(jù)處理提出極高的要求,超級計算正在越來越多地出現(xiàn)在與人類生活息息相關的領域。尤其是近些年來,隨著云計算、大數(shù)據(jù)等IT新概念和新技術的出現(xiàn),以及先進無損音視頻處理和自動駕駛設備等嵌入式高性能計算的興起,使很多原有應用迎來了突破性進展,并促使很多新的IT應用模式出現(xiàn)。而在這些應用背后,許多廠商正在全力實現(xiàn)的“嵌入式”實時超級計算解決方案,可以提供芯片級的高性能數(shù)據(jù)運算和處理能力。為此,北京華興萬邦管理咨詢有限公司走訪了業(yè)內率先實現(xiàn)單芯片超算(Supercomputing on a Chip)商用的法國Kalray公司,為大家一探“片上超算”給行業(yè)帶來的新機會。
本文引用地址:http://www.ex-cimer.com/article/281003.htm面向超級計算的多核處理器
為了完成普通PC或服務器無法完成的大量、復雜的計算任務,超級計算機要求擁有為數(shù)眾多的處理器。然而,隨著對運算速度越來越高的追求,單核處理器已經無法滿足超級計算的要求,因為無休止地增加單核處理器的數(shù)量不但會造成成本和功耗的大量增加,而且性能也無法呈現(xiàn)幾何級數(shù)的增長。于是,多核技術開始被大量應用于超級計算當中。以中國的“天河二號”超級計算機為例,其使用的主處理器和協(xié)處理器目前均為Intel公司的多核處理器。
目前,市場上研發(fā)并供應多核處理器芯片的廠商為數(shù)眾多,以Intel和AMD兩大處理器廠商為首,不同的多核處理器所面向的應用領域也不盡相同。除了面向PC應用的2核、4核處理器和面向手機和平板電腦的4核、8核處理器外,一些供應商推出的8核、16核處理器也已實現(xiàn)全面的商用,例如XMOS公司的xCORE系列多核處理器已被高解析度音頻、千兆網(wǎng)速物聯(lián)網(wǎng)等領域中的產品、解決方案所采用,該公司全新的xCORE-200多核微控制器通過在單一器件上集成16個或更多高性能32位RISC處理器內核,成為了高性能用戶、專業(yè)音頻與新興千兆網(wǎng)速物聯(lián)網(wǎng)(IoT)應用的完美可編程平臺。
在眾多的多核處理器供應商中,有一家面向超級計算相關應用的廠商正在越來越多地引起業(yè)界的關注,這就是全球首家可以提供256核以上處理器芯片的廠商——法國公司Kalray。Kalray公司是在單芯片上實現(xiàn)超級計算(Supercomputing on a Chip™)的發(fā)明者,其大規(guī)模并行處理器陣列芯片MPPA®(Massively Parallel Processor Array)處理器采用臺積電(TSMC)的28nm工藝制程,擁有超過256個可以進行C/C++編程的內核。該公司的單芯片超算解決方案可以為兩大類應用提供高性能、低功耗和實時等特性,一類是在數(shù)據(jù)中心、視頻處理等應用中卸載主處理器的任務,另一類是需要較大量數(shù)據(jù)處理、高實時性和低功耗的嵌入式應用。下面為您具體介紹該公司的解決方案及其商業(yè)應用。
Kalray公司的256核MPPA處理器芯片
低功耗256核處理器芯片和標準C/C++編程環(huán)境
Kalray公司是一家成立于2008年的無晶圓廠半導體公司,它是開發(fā)多核處理器解決方案的先鋒廠商。該公司創(chuàng)新的MPPA架構獨一無二地提供單芯片超算解決方案,其可以為視頻、網(wǎng)絡、電信、大數(shù)據(jù)等領域的云計算應用實現(xiàn)實時加速,還可以為航空航天、國防、汽車等領域的嵌入式應用提供嵌入式高性能運算能力。Kalray公司的總部位于法國,包括位于巴黎和歐洲硅谷格勒諾布爾市(Grenoble)兩個地點的辦公室,此外,其在美國加州和日本東京還設有分公司。
Kalray公司的完整解決方案包括MPPA系列多核處理器、PCIe Gen3加速卡、提供網(wǎng)絡加速支持的開源網(wǎng)絡接口卡(Open NIC),以及軟件開發(fā)工具包。該解決方案可以提供行業(yè)領先的低計算功耗,具有時間可預測性和低延遲性,以及獨一無二的處理擴展性和系統(tǒng)密度,可以在同一塊片芯上實現(xiàn)多種異構的應用,同時擁有很好的可編程性(包括標準C/C++和OpenCL)。
MPPA多核處理器包括Andey MPPA和Bostan MPPA兩款產品。其中Andey為第一代MPPA處理器,已于2013年第1季度開始供貨。它擁有超過256個可以進行32位超長指令字C/C++編程的內核,單精度浮點運算速度可以達到210 GFLOPS(每秒十億次浮點運算),雙精度浮點運算速度可達70 GFLOPS,運算速度可達0.7 TOPS(每秒萬億次運算)。該處理器擁有兩塊帶寬為12.8GB/s的64位DDR3內存,以及兩個由DMA支持的PCIe Gen3×8接口。Bostan為該公司即將推出的第二代MPPA處理器,目前已完成流片及樣片的封裝,將于2015年第4季度向先期客戶供貨。它的單精度浮點運算速度可以達到840 GFLOPS,雙精度浮點運算速度可達420 GFLOPS,運算速度可達1.4 TOPS,其他性能相比Andey MPPA有較大幅度的提升。
MPPA多核處理器采用Kalray獨一無二的架構設計。每個處理器芯片擁有4個四核主CPU和 16個計算集群,每個計算集群中又包括16個用戶核和1個系統(tǒng)核,每個用戶核則采用Kalray擁有專利的超長指令字架構進行設計。同時,其片上的DDR存儲器和以太網(wǎng)及PCIe接口模塊支持了數(shù)據(jù)的低延遲處理,并使芯片的整體功耗遠遠低于通用的多芯片組功耗,Andey MPPA處理器的典型功耗為12W,Bostan MPPA處理器的功耗為11W-30W。
Kalray公司獨一無二的處理器架構
為了驗證其MPPA處理器的高性能、低功耗特性,并推動其芯片產品的商用化,Kalray推出了采用MPPA處理器的系列網(wǎng)絡卡。Kalray的PCIe Gen3加速卡包括TurboCard2和TurboCard3兩款產品。TurboCard2加載了4塊Andey MPPA芯片,浮點運算速度可以達到0.9 TFLOPS(每秒萬億次浮點運算),存儲容量高達32GB,擁有8塊DDR3內存(總帶寬達80GB/s),并配有C/C++ GNU編譯器環(huán)境。TurboCard3是TurboCard2的下一代產品,將于2015年底供貨,其加載了4塊Bostan MPPA芯片,浮點運算速度可以達到3.4 TFLOPS。Kalray的開源網(wǎng)絡接口卡ONIC80也將于2015年底開始供貨,它是完全可編程的網(wǎng)卡,運行Bostan MPPA芯片,擁有PCIe Gen3×16接口和8GB存儲容量,其大小與普通圖形加速單元類似,功耗為40W,可以使數(shù)據(jù)中心變得更加緊湊和冷靜。
Kalray公司的PCIe Gen3加速卡TurboCard2
開發(fā)工具體系是處理器生態(tài)體系中另一項非常重要的指標。為了便于工程師針對不同的應用開發(fā)自己的超算解決方案,Kalray提供了方便易用、內容豐富的軟件開發(fā)工具包,包括標準C/C++編程環(huán)境,模擬器、編譯器、調試器和系統(tǒng)跟蹤,第三方實時操作系統(tǒng)(如Linux、風河)和設備驅動程序,面向CPU的基礎C編程和Lib編程,面向DSP的POSIX多線程編程,以及面向GPU的OpenCL編程。可以說,該軟件開發(fā)工具包提供了眾多高性能應用所需求的軟件,工程師不需要針對該系列處理器進行大量重新學習就可以上手,并力求最大限度地發(fā)揮MPPA多核處理器的全部性能。
Kalray公司的軟件開發(fā)工具包
目標市場:數(shù)據(jù)中心和關鍵任務型嵌入式應用
通過上述對Kalray公司各種硬件產品性能的描述可以看出,它們能夠在很多對數(shù)據(jù)運算和處理有高要求的應用領域發(fā)揮重要作用,加上軟件開發(fā)工具包提供的強力支持,其整體解決方案擁有非常廣闊的應用空間。該公司的銷售和營銷副總裁Jean-Pierre Demange向分析師介紹:“在數(shù)據(jù)中心的工作過程中,隨著大量應用轉向云端,數(shù)據(jù)通信量的激增,以及新數(shù)據(jù)中心體系的進一步虛擬化需求,開始出現(xiàn)一種逐漸增長的需求,即從主流處理器(x86)向高性能、低功耗、低延遲、完全可編程的協(xié)處理器進行集中、實時卸載處理的需求。Kalray的處理器和PCI卡可以提供獨一無二的解決方案來幫助數(shù)據(jù)中心實現(xiàn)這一功能,主要應用范圍包括智能網(wǎng)卡、智能存儲、運算加速、視頻編碼等。”
“除數(shù)據(jù)中心外,我們的解決方案還有一個重要的目標應用市場,那就是關鍵任務型嵌入式應用。”Kalray公司的銷售和營銷副總裁Jean-Pierre Demange繼續(xù)說道。“關鍵任務型嵌入式應用市場要求在固定的占板面積上提供越來越高的計算能力,以及在同一塊片芯上擁有越來越高的功能集成度,同時還要保留實時性支持和安全規(guī)范,而目前其他現(xiàn)有的多核架構尚無法滿足這些規(guī)范和要求的認證。Kalray是全球首家可以為關鍵任務型嵌入式應用提供全認證多核解決方案的公司,我們可以為航空航天、國防、自動汽車、機器人和多軸飛行器等應用領域提供支持。”
Kalray公司的銷售與營銷副總裁Jean-Pierre Demange、首席執(zhí)行官Eric Baissus和商務總監(jiān)Stephane Cordova(從左至右)向華興萬邦分析師展示其產品
目前,Kalray公司已對其后續(xù)產品進行了合理的規(guī)劃,該公司的首席執(zhí)行官Eric Baissus介紹道:“我們正在對第三代MPPA多核處理器Coolidge制定技術規(guī)范,這款芯片的單精度浮點運算速度預計將高于1200 GFLOPS,雙精度浮點運算速度預計將高于600 GFLOPS,計劃2017年初生產樣片,2017年年內實現(xiàn)量產。”此外,關于未來對中國市場的開發(fā),Eric Baissus先生也表達了自己的觀點:“目前,我們與中國企業(yè)的合作還較少,我們希望下一步能夠加強與中國市場的聯(lián)系,并愿意為中國的超算中心和高性能嵌入式應用提供支持。”
c++相關文章:c++教程
評論