中國服務器芯片迎來高光時刻
最近,中國本土服務器芯片出現兩大亮點:首先,RISC-V 又進一步,特別是以山東大學部署的采用 RISC-V CPU 的服務器為代表,十分引人關注;其次,基于自研架構的高性能芯片繼續取得本土客戶的認可,凸出代表就是華為和龍芯自研的 CPU,特別是華為的服務器芯片,市場接受度進一步提升。
本文引用地址:http://www.ex-cimer.com/article/202311/452945.htm中國 RISC-V 芯片和系統進展
RISC-V 指令集架構是免費、開源的,提供了一種更快、更便宜的芯片設計方案,而且,RISC-V 的結構使其非常適用于處理各種應用和復雜計算需求的云原生環境。近些年,RISC-V 對英特爾和 AMD 使用的 x86 架構,以及亞馬遜、蘋果、三星和高通等公司使用的 Arm 架構的威脅越來越大,雖然短期內還無法實現替代,但長期發展前景非常好。也正是因為如此,國內外多家廠商和科研機構都在 RISC-V 技術和產品研發方面加大投入。
在中國大陸市場,還存在減少對西方芯片技術依賴的問題,在此情況下,RISC-V 的優勢就更凸出了。
10 月,山東大學部署了一個采用 RISC-V CPU 的服務器集群,該系統共有 3072 個核,有 48 個 64 位 RISC-V CPU 節點。阿里巴巴生態系統總監陳大偉在加利福尼亞州圣克拉拉舉行的 RISC-V 峰會上發表演講時表示,這是 RISC-V 集群在云端的首次部署,目前,該系統主要用于山東大學的教學和科研項目,部分功能也可用于商用云計算。
據悉,山東大學的 RISC-V 系統采用了國內某公司的 SG2042 芯片,該芯片主頻為 2GHz,緩存為 64MB。系統支持 PCIe Gen 4 接口。今年早些時候,該公司發布了 RISC-V 芯片,阿里巴巴與其合作將 Linux 操作系統引入該服務器集群。不過,目前的 RISC-V 軟件生態系統還比較弱,需要時間去培育。
目前,中國已經實現流片的 RISC-V 芯片主要采用 110nm 和 28nm 制程工藝,但相關產品和系統僅用于科學研究,未完全達到商用水平。
今年,中國科技部資助了多個 RISC-V 芯片的研發工作,許多大學和科研院所都開始專注于 RISC-V 芯片開發。
中國科學院 (CAS) 正在與阿里巴巴、騰訊和中興通訊等中國本土頂尖企業合作開發名為「香山-v3」的 RISC-V 芯片,同時,相關的新型操作系統也在開發過程中。CAS 希望該芯片的性能能與 Arm 于 2021 年發布的 Neoverse-N2 服務器 CPU 相當。據悉,中國相關企業和科研機構正在開發專門用于 RISC-V 芯片設計的開源 EDA 工具。
經過這些年的推廣和積累,中國相關企業和科研機構已經成為全球 RISC-V 芯片和解決方案的主要貢獻者。2022 年,全球生產了 100 億顆 RISC-V 芯片,其中,一半在中國制造。
國際廠商在 RISC-V 方面的進展
十年前,當 RISC-V 問世后,迅速獲得了包括蘋果公司在內的國際芯片大廠的支持,最近幾年,英特爾也很看好 RISC-V 的發展前景,并加大了投入。
如前文所述,RISC-V 的軟件生態系統比較弱,針對于此,英特爾的 Codeplay 軟件部門發布了 OneAPI 套件,其中包括供開發人員在 x86 PC 上的模擬 RISC-V 環境中測試代碼的工具。該套件的標志性功能是支持 SYCL,它允許編碼人員在不同的硬件架構上編譯應用程序。該套件包括對英特爾 DPC++/C++編譯器的支持,允許重新編譯 C++代碼,可以跨多個硬件架構使用。
如果沒有硬件和軟件協同設計的架構,編碼人員就會習慣性地使用 x86 和 Arm 系統。對此,英特爾的做法是:在芯片發布之前就提供 Linux 驅動程序,以確保硬件與最新版本的操作系統兼容。
開發人員還可以在類似 Raspberry Pi 的開發板或 Milk-V、StarFive 等公司的系統上測試 RISC-V 代碼,這兩家公司都提供支持 Linux 的 64 位 RISC-V 系統。
目前來看,一些 RISC-V 軟件包(如 Pytorch、GCC、TensorFlow 和 OpenJDK)可以正常工作,但尚未完全得到支持,近些年,對 LibreOffice 和 Firefox 等開源應用程序的支持正在建立過程中。廠商方面,谷歌正在加速對 RISC-V 上的 AOSP(Android 開源項目)的支持,這將是下一個架構規范的重要組成部分。
RISC-V 服務器芯片制造商 Esperanto Technologies 和 Ventana Micro Systems 已經推出了用于云計算的芯片,其中,Esperanto 已將 Meta 的 Open Pre-Trained Transformer 模型移植到其 RISC-V 服務器上。不過,總體來看,這兩家公司涉及軟件支持和編程模型的產品和服務并不多。
負責開發和推進 RISC-V 標準的 RISC-V International 正在研發架構規范,試圖通過建立 RISC-V 軟件生態系統(稱為 RISE),為 RISC-V 系統創建底層軟件工具和中間件,該項目的支持者包括谷歌、英特爾、英偉達、高通、三星和 Ventana 等公司。
在歐洲,英特爾正在與巴塞羅那超級計算中心(BSC)合作,為超級計算機制造 RISC-V 芯片。BSC 希望高性能 RISC-V 處理器能盡早商用,他們希望利用 Chiplet(小芯片)技術,將 RISC-V 內核整合到 Chiplet 架構中,這正是英特爾的強項,未來,英特爾將會制造越來越多的 Chiplet 架構芯片,以增加設計靈活性,因為它能將 CPU、GPU、I/O、內存、電源管理和其它電路功能放入同一個封裝中。如果能將 RISC-V 與內存通過 Chiplet 架構封裝在一起,則可以降低眼下的內存帶寬瓶頸,從而拓寬 RISC-V 在機器學習應用領域的發展道路。
最近,Meta 也推出了一款基于 RISC-V 架構的 AI 推理芯片。
由于中國已經是全球 RISC-V 產業的重要組成部分,因此,國際產業界一直在呼吁加強與中國的合作。RISC-V International 首席執行官 Calista Redmond 表示:「健康的合作和競爭可以推動最先進技術向前發展。我想強調一點,正確的全球標準支撐著我們在歷史進程中所見過的最重要的技術,無論是 USB 還是以太網,以及 HTTPS 等網絡協議。這些東西可以創造公平的競爭環境,讓我們能夠創新?!?/p>
業界普遍反對政府對 RISC-V 開發與合作的限制和干擾,美國業界人士表示:「任何限制都只會減少美國對一項重要新興技術的參與,同時鞏固 Arm 作為現有嵌入式 CPU 壟斷供應商的地位?!?/p>
RISC-V 距離規模商用依然較遠
目前來看,RISC-V 處理器在高性能計算領域的應用和研究依然處于探索階段。軟件生態系統、芯片、電路板和系統的可靠性問題并沒有解決。除了技術,商業問題也很凸出。
目前,RISC-V 處理器僅能滿足嵌入式應用場景,對于高性能服務器來說,還無法承擔那樣的性能負荷,不要說服務器,就目前而言,RISC-V 還不能滿足 PC 的應用要求。
就目前的發展階段和性能來看,RISC-V 并不適合做高性能 CPU。RISC-V 標準指令集非常精簡,32 位基礎指令是 47 條,64 位基礎指令是 15 條,基礎指令共 62 條,加上并入標準的擴展指令,總數在 300 條左右,而 Arm 的指令數超過 2000 條,x86 則更多。由于 RISC-V 的功能比較簡單,用 RISC-V 和龍芯實現同樣的功能(GCC 編譯器),RISC-V 會比龍芯多用 20% 的指令。
雖然 RISC-V 允許拓展指令集,但這并不能解決一切問題,因為軟件生態系統支持不足的話,單靠拓展指令集是遠遠不夠的,因為商家自己拓展的不是 RISC-V 標準指令集,很容易產生碎片化問題,缺乏統一性的話,軟件生態系統建設就會缺乏錨點,很難讓一套軟件生態滿足所有拓展出的 RISC-V 指令要求。
中國本土 CPU 新勢力崛起
除了 RISC-V 處理器,近期,中國本土其它架構高性能計算產品也在不斷突破應用極限,華為、龍芯等都有好消息傳出。
2022 年底,英偉達的高性能 GPU 芯片 H100(全球人工智能應用系統的首選處理器)被禁止銷往中國大陸,那之后,中國本土企業只能購買降低了內存帶寬的版本,也就是 H800 和 A800,但是,近期,這些降速版本的 GPU 也被禁售了。
在這樣的背景下,華為自研的昇騰 910 和昇騰 310 處理器,特別是性能更高的昇騰 910,及其最新版本芯片得到了越來越多中國本土 IT 系統設備和互聯網大廠的青睞,訂單量持續提升。這兩款芯片是華為在 2018 年發布的,同期還推出了神經網絡計算架構、開發工具包和跨 AI 的云訓練框架。
今年 8 月,中國人工智能公司科大訊飛董事長劉慶峰高度評價了華為開發的處理器,將它比作英偉達的 A100。劉慶峰表示,科大訊飛正在與華為合作進行硬件開發。當然,不止科大訊飛一家,有幾家中國本土頭部 IT 和互聯網大廠都在與華為合作,開發高性能計算系統。
英偉達在 2020 年和 2022 年分別推出了 A100 和 H100 芯片,憑借多年的技術積累,以及先發優勢,英偉達占據了全球 AI 芯片市場的最大份額,而生成式 AI 的興起進一步鞏固了該公司的行業地位。在生態系統方面,華為要想與英偉達競爭,最大的劣勢是人工智能軟件生態,這方面,英偉達已經非常完善了,需要后來者付出幾倍的努力才有趕超希望。
近些年,華為也在建設自己的人工智能生態系統,被稱為 CANN。不過,據專家介紹,與英偉達的生態系統相比,華為在訓練 AI 模型方面存在局限性,需要補的課還很多。
除了華為,龍芯是另一大看點。
近期,龍芯確認,將在 11 月底正式推出處理器 3A6000,測試數據顯示,3A6000 的 SPEC 性能達到了英特爾 10 代酷睿 4 核處理器的水準。
雖然龍芯一直受到質疑,但是,其每一代處理器的性能提升確是肉眼可見的。這次,3A6000 依然基于該公司自研的 LoongArch 指令集架構,工藝制程依舊是 12nm,內核升級為 LA664,也就是 64 位。3A6000 為 4 核處理器,所以擁有 4 個 LA664 核心,支持 128 位向量處理擴展指令(LSX)和 256 位高級向量處理擴展指令(LASX)。
另外,3A6000 的一個非常大的變化是首次支持同步多線程技術,也就是超線程技術,所以,3A6000 實際為 4C8T。頻率依舊是 2.5GHz,L3 為 16MB,支持 DDR4-3200 內存。
龍芯還推出了服務器 CPU 芯片 3C6000 和 3D6000,以及具有較高性價比的桌面級 CPU 芯片 2K3000,可用于上網本、工控、迷你主機等。
龍芯也在 GPU 方面發力,近期推出了 9A1000,對標 AMD 的 RX 550 顯卡,計劃在 2024 年第三季度流片。9A1000 支持科學計算加速和 AI 加速。
結語
目前,PC 和手機應用發展已經達到瓶頸期,未來幾年,主要拼存量市場,對增量市場已經沒有什么期待了。因此,在處于成長階段的中國大陸半導體市場,特別是各個系統必需的 CPU、GPU 等處理器,必需要以有巨大增量市場為主要目標,而高性能計算和 AI 的發展前景非常廣闊。
在這樣的大背景下,中國本土相關企業和科研院所正在加大對擁有較大發展潛力的技術領域的投入,這其中就包括 RISC-V,同時,也不能放下自主處理器架構的開發,只有兩條腿走路,一條充分與國際接軌,另一條立足于自主,才能在未來的競爭中擁有更多籌碼。
中國本土企業之間,以及與相關的科研院所,也需要進一步加強溝通與合作,這樣可以提升芯片和系統研發效率。
評論