<meter id="pryje"><nav id="pryje"><delect id="pryje"></delect></nav></meter>
          <label id="pryje"></label>

          新聞中心

          EEPW首頁 > 智能計算 > 市場分析 > CPU+GPU 異構計算成芯片巨頭新寵

          CPU+GPU 異構計算成芯片巨頭新寵

          作者: 時間:2023-03-22 來源:半導體產業(yè)縱橫 收藏

          近年來,隨著 AI 應用的快速發(fā)展,引發(fā)一場算力革命,也站在風口浪尖。

          本文引用地址:http://www.ex-cimer.com/article/202303/444766.htm

          主要是指使用不同類型指令集和體系架構的計算單元組成系統的計算方式。常見的計算單元類別包括 、、DSP、ASIC、FPGA 等。目前「+」以及「+FPGA」都是受業(yè)界關注的平臺。

          近日,英特爾宣布將在未來一年半內取消多款服務器 產品的發(fā)布計劃,其中包括 HPC 級的 Rialto Bridge GPU,以全力開發(fā)基于 Falcon Shores 的混合芯片。英特爾新一代 Falcon Shores 專為超級計算應用而設計,將 CPU 和 GPU 技術結合到一個芯片封裝中,屆時將作為純 GPU 架構面世。

          值得注意的是,AMD 的 Instinct MI300 和英偉達的 Grace Hopper 超級芯片也是采用「CPU+GPU」的異構形式。

          CPU 與 GPU 的區(qū)別

          CPU 即中央處理器(Central Processing Unit),作為計算機系統的運算和控制核心,主要負責多任務管理、調度,具有很強的通用性,是計算機的核心領導部件,好比人的大腦。不過其計算能力并不強,更擅長邏輯控制。

          GPU 即圖形處理器(Graphics Processing Unit),采用數量眾多的計算單元和超長的流水線,擅長進行圖像處理、并行計算。對于復雜的單個計算任務來說,CPU 的執(zhí)行效率更高,通用性更強;對于圖形圖像這種矩陣式多像素點的簡單計算,更適合用 GPU 來處理。AI 領域中用于圖像識別的深度學習、用于決策和推理的機器學習以及超級計算都需要大規(guī)模的并行計算,因此更適合采用 GPU 架構。

          多核 CPU 與 GPU 的計算網格(圖中綠色方格為計算單元)

          CPU 和 GPU 還有一個很大的區(qū)別就是:CPU 可單獨作用,處理復雜的邏輯運算和不同的數據類型,但當需要處理大量類型統一的數據時,則可調用 GPU 進行并行計算。但 GPU 無法單獨工作,必須由 CPU 進行控制調用才能工作。

          CPU+GPU 架構的優(yōu)勢及應用

          當 CPU 和 GPU 協同工作時,因為 CPU 包含幾個專為串行處理而優(yōu)化的核心,而 GPU 則由數以千計更小、更節(jié)能的核心組成,這些核心專為提供強勁的并行運算性能而設計。程序的串行部分在 CPU 上運行,而并行部分則在 GPU 上運行。GPU 已經發(fā)展到成熟階段,可輕松執(zhí)行現實生活中的各種應用程序,而且程序運行速度已遠遠超過使用多核系統時的情形。因此,CPU 和 GPU 的結合剛好可以解決深度學習模型訓練在 CPU 上耗時長的問題,提升深度學習模型的訓練效率。

          隨著 CPU 與 GPU 的結合,其相較于單獨 CPU 與 GPU 的應用場景也不斷拓寬。

          第一,CPU+GPU 架構適用于處理高性能計算。伴隨著高性能計算類應用的發(fā)展,驅動算力需求不斷攀升,但目前單一計算類型和架構的處理器已經無法處理更復雜、更多樣的數據。數據中心如何在增強算力和性能的同時,具備應對多類型任務的處理能力,成為全球性的技術難題。CPU+GPU 的異構并行計算架構作為高性能計算的一種主流解決方案,受到廣泛關注。

          第二,CPU+GPU 架構適用于處理數據中心產生的海量數據。數據爆炸時代來臨,使用單一架構來處理數據的時代已經過去。比如:個人互聯網用戶每天產生約 1GB 數據,智能汽車每天約 50GB,智能醫(yī)院每天約 3TB 數據,智慧城市每天約 50PB 數據。數據的數量和多樣性以及數據處理的地點、時間和方式也在迅速變化。無論工作任務是在邊緣還是在云中,不管是人工智能工作任務還是存儲工作任務,都需要有正確的架構和軟件來充分利用這些特點。

          第三,CPU+GPU 架構可以共享內存空間,消除冗余內存副本來改善問題。在此前的技術中,雖然 GPU 和 CPU 已整合到同一個芯片上,但是芯片在運算時要定位內存的位置仍然得經過繁雜的步驟,這是因為 CPU 和 GPU 的內存池仍然是獨立運作。為了解決兩者內存池獨立的運算問題,當 CPU 程式需要在 GPU 上進行部分運算時,CPU 都必須從 CPU 的內存上復制所有的資料到 GPU 的內存上,而當 GPU 上的運算完成時,這些資料還得再復制回到 CPU 內存上。然而,將 CPU 與 GPU 放入同一架構,就能夠消除冗余內存副本來改善問題,處理器不再需要將數據復制到自己的專用內存池來訪問/更改該數據。統一內存池還意味著不需要第二個內存芯片池,即連接到 CPU 的 DRAM。

          因此,通過 CPU+GPU 異構并行計算架構組成的服務器,正成為服務器市場中的一匹黑馬?,F在已有多家芯片廠商開始跟進。

          芯片巨頭的香餑餑?

          英特爾的 Falcon Shores

          英特爾的 Falcon Shores XPU 專為超級計算應用而設計,其將 CPU 和 GPU 合并到一個混合匹配芯片包中。Falcon Shores 代表了英特爾異構架構設計的延續(xù),其最終目標是每瓦性能提高 5 倍,x86 插槽計算密度提高 5 倍以及現有服務器芯片的內存容量和帶寬提高 5 倍。英特爾的高性能計算 CPU 和 GPU 路線圖與 Falcon Shores 匯合,表明這些芯片將在未來同時發(fā)揮這兩個作用。

          英特爾超級計算集團副總裁兼總經理杰夫·麥克維(Jeff McVeigh)說,延遲推出的 Falcon Shores 將在 2025 年首次推出 GPU 內核,但尚未表明何時將 CPU 內核集成到設計中。因此,英特爾以 HPC 為中心的設計將落后于競爭對手數年。

          英偉達的 Grace Hopper 超級芯片

          2021 年,英偉達推出解決 HPC 和大規(guī)模人工智能應用程序的 Grace Hopper 超級芯片。這是一款完全專為大規(guī)模 AI 和高性能計算應用打造的突破性加速 CPU。它通過英偉達 NVLink-C2C 技術將 Grace 和 Hopper 架構相結合,為加速 AI 和 HPC 應用提供 CPU+GPU 相結合的一致內存模型。

          英偉達官方表示,使用 NVLink-C2C 互連,Grace CPU 將數據傳輸到 Hopper GPU 的速度比傳統 CPU 快 15 倍。另外,采用 CPU+GPU 的 Grace Hopper 核心數減半,LPDDR5X 內存也只有 512GB,但多了顯卡的 80GB HBM3 內存,總帶寬可達 3.5TB/s,代價是功耗 1000W,每個機架容納 42 個節(jié)點。

          英偉達 Grace Hopper 超級芯片計劃于 2023 年上半年推出。

          AMD 的 Instinct MI300

          在近日的 CES 2023 展會上,AMD 披露了面向下一代數據中心的 APU 加速卡產品 Instinct MI300。這顆芯片采用多芯片、多 IP 整合封裝設計,5nm 先進制造工藝,晶體管數量多達 1460 億個。它同時集成 CDNA3 架構的 GPU 單元 (具體核心數量未公開)、Zen4 架構的 24 個 CPU 核心、大容量的 Infinity Cache 無限緩存,還有 8192-bit 位寬、128GB 容量的 HBM3 高帶寬內存。

          在技術方面,MI300 支持第四代 Infinity Fabric 總線、CXL 3.0 總線、統一內存架構、新的數學計算格式,號稱 AI 性能比上代提升多達 8 倍,可滿足百億億次計算需求。

          AMD CEO 蘇姿豐近日確認,Instinct MI300 將在今年下半年正式推出。

          英特爾的 Falcon Shores XPU 是與英偉達的 Grace Hopper 超級芯片和 AMD Instinct MI300 數據中心 APU 競爭的關鍵。英偉達的 Grace 和 AMD 的 MI300 都將于今年推出。值得注意的是,三家均選擇了 Chiplet 技術。

          未來押注超異構計算

          關于異構計算,英特爾中國研究院院長宋繼強曾表示:「在 2023 年,大家已經完全接受了要通過異構計算解決未來系統的設計和優(yōu)化問題。在 2020 年的時候,市場還在討論異構集成是怎么一回事。而在 2023 年,大家都會基于功能的有效性、設計的難易程度、成本等方面的考量,自覺采用異構計算的方式?!?/span>

          關于對當下的算力演進方向的新判斷,宋繼強還提到:「傳統異構計算并不能滿足現在計算的要求。而「超異構計算」,已逐漸成為業(yè)界思考的一個趨勢」。

          從實際來看,英特爾也確實正在押注「超異構計算」這條道路。

          英特爾提出的「超異構計算」概念,在一定程度上可以理解為通過封裝技術所實現的模塊級系統集成,即通過先進封裝技術將多個 Chiplet 裝配到一個封裝模塊當中,既簡化了 SOC 的復雜技術,更加靈活,又避免了 PCB 板級集成的性能和功耗瓶頸。

          英特爾的「超異構計算」路線以「Foveros」3D 封裝技術為基礎。相比 SiP 只能實現邏輯芯片與內存的集成,「Foveros」可以在邏輯芯片與邏輯芯片之間實現真正的三維集成,使得芯片面積更小,同時保證芯片間的帶寬更大、速度更快、功耗更低。

          不過,英特爾的「超異構計算」的創(chuàng)新之處并不僅局限于 3D 封裝這一個層面。事實上,在制程、架構、內存、互連、安全、軟件等多個層面均具有領先優(yōu)勢。「超異構計算」的實現是建立在整合其多層面技術優(yōu)勢基礎上的。

          除了英特爾之外,英偉達也已經在執(zhí)行層面全面行動。英偉達在云、網、邊、端等復雜計算場景,基本上都有重量級的產品和非常清晰的迭代路線圖。



          關鍵詞: GPU CPU 異構計算

          評論


          相關推薦

          技術專區(qū)

          關閉
          看屁屁www成人影院,亚洲人妻成人图片,亚洲精品成人午夜在线,日韩在线 欧美成人 (function(){ var bp = document.createElement('script'); var curProtocol = window.location.protocol.split(':')[0]; if (curProtocol === 'https') { bp.src = 'https://zz.bdstatic.com/linksubmit/push.js'; } else { bp.src = 'http://push.zhanzhang.baidu.com/push.js'; } var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(bp, s); })();