<meter id="pryje"><nav id="pryje"><delect id="pryje"></delect></nav></meter>
          <label id="pryje"></label>

          新聞中心

          EEPW首頁 > 智能計算 > 市場分析 > 摩爾線程CEO張建中:萬卡集群是AI主戰(zhàn)場上的標(biāo)配

          摩爾線程CEO張建中:萬卡集群是AI主戰(zhàn)場上的標(biāo)配

          作者: 時間:2024-07-11 來源:半導(dǎo)體產(chǎn)業(yè)縱橫 收藏

          「從今天起,世界徹底改變了。」這是 GPT-3 算法的發(fā)明人埃德·萊昂·克林格在 GPT-3 出現(xiàn)時說的一句話。

          本文引用地址:http://www.ex-cimer.com/article/202407/460864.htm

          這是一個 AI 的時代,這是一個算力的時代。

          今日,重磅宣布其 AI 旗艦產(chǎn)品夸娥(KUAE)智算集群解決方案實現(xiàn)重大升級,從當(dāng)前的千卡級別大幅擴展至萬卡規(guī)模。

          同時,聯(lián)合中國移動通信集團(tuán)青海有限公司、中國聯(lián)通青海公司、北京德道信科集團(tuán)、中國能源建設(shè)股份有限公司總承包公司、桂林華崛大數(shù)據(jù)科技有限公司,分別就三個萬卡集群項目進(jìn)行了戰(zhàn)略簽約,多方聚力共同構(gòu)建好用的國產(chǎn) GPU 集群。

          此外,我們從現(xiàn)場也看到的產(chǎn)品能力和強大的生態(tài)鏈接力。與來自清華系兩家公司無問芯穹和清程極智已經(jīng)開始深度合作,無問芯穹是由清華大學(xué)電子工程系系主任汪玉教授發(fā)起的,清程極智由清華大學(xué)計算機系鄭緯民院士發(fā)起的。還有京東、360、智平方等多家國內(nèi)企業(yè),夸娥智算集群助力其在大模型訓(xùn)練、大模型推理、具身智能等不同場景和領(lǐng)域的創(chuàng)新。

          萬卡是最低標(biāo)配

          大模型自問世以來,關(guān)于其未來的走向和發(fā)展趨勢亟待時間驗證,但從當(dāng)前來看,幾種演進(jìn)趨勢值得關(guān)注,使得其對算力的核心需求也愈發(fā)明晰。

          第一,Scaling Law 將持續(xù)奏效。需要單點規(guī)模夠大并且通用的算力才能快速跟上技術(shù)演進(jìn)。第二,Transformer 架構(gòu)不能實現(xiàn)大一統(tǒng),和其他架構(gòu)會持續(xù)演進(jìn)并共存,形成多元化的技術(shù)生態(tài)。第三,AI、3D 和 HPC 跨技術(shù)與跨領(lǐng)域融合不斷加速,大模型的訓(xùn)練和應(yīng)用環(huán)境更加復(fù)雜多元。

          隨著計算量不斷攀升,大模型訓(xùn)練亟需超級工廠,即一個「大且通用」的加速計算平臺,以縮短訓(xùn)練時間。以 Llama 3 為例,在它問世之際,Meta 就公布了其基礎(chǔ)設(shè)施詳情:「我們在兩個定制的 24K GPU 集群上做訓(xùn)練?!?/span>

          摩爾線程創(chuàng)始人張建中提出了一個標(biāo)準(zhǔn):「AI 主戰(zhàn)場,萬卡是最低標(biāo)配?!?/span>

          國產(chǎn)萬卡萬 P 萬億大模型訓(xùn)練平臺

          夸娥(KUAE)是摩爾線程智算中心全棧解決方案,是以全功能 GPU 為底座,軟硬一體化、完整的系統(tǒng)級算力解決方案,包括以夸娥計算集群為核心的基礎(chǔ)設(shè)施、夸娥集群管理平臺(KUAE Platform)以及夸娥大模型服務(wù)平臺(KUAE ModelStudio),旨在以一體化交付的方式解決大規(guī)模 GPU 算力的建設(shè)和運營管理問題。

          基于對 AI 算力需求的深刻洞察和前瞻性布局,摩爾線程夸娥智算集群可實現(xiàn)從千卡至萬卡集群的無縫擴展,旨在滿足大模型時代對于算力「規(guī)模夠大+計算通用+生態(tài)兼容」的核心需求,通過整合超大規(guī)模的 GPU 萬卡集群、極致的計算效率優(yōu)化以及高度穩(wěn)定的運行環(huán)境,以萬卡智算集群的新超級工程,重新定義國產(chǎn)集群計算能力的新標(biāo)準(zhǔn)。

          夸娥萬卡智算解決方案具備多個核心特性:

          • 超大算力,萬卡萬 P。浮點運算能力達(dá)到 10Exa-Flops,大幅提升單集群計算性能,能夠為萬億參數(shù)級別大模型訓(xùn)練提供堅實算力基礎(chǔ)。

          • 超高穩(wěn)定,月級長穩(wěn)訓(xùn)練。在集群穩(wěn)定性方面,摩爾線程夸娥萬卡集群平均無故障運行時間超過 15 天,最長可實現(xiàn)大模型穩(wěn)定訓(xùn)練 30 天以上,周均訓(xùn)練有效率在 99% 以上,遠(yuǎn)超行業(yè)平均水平。

          • 極致優(yōu)化,超高 MFU:實現(xiàn)大模型的高效率訓(xùn)練,MFU 最高可達(dá)到 60%。在系統(tǒng)軟件層面,基于極致的計算和通訊效率優(yōu)化等技術(shù)手段,大幅提升集群的執(zhí)行效率和性能表現(xiàn)。

          • 全能通用,生態(tài)友好:可加速 LLM、MoE、多模態(tài)、Mamba 等不同架構(gòu)、不同模態(tài)的大模型。s 同時,基于高效易用的 MUSA 編程語言、完整兼容 CUDA 能力和自動化遷移工具 Musify,加速新模型「Day0」級遷移,實現(xiàn)生態(tài)適配「Instant On」,助力客戶業(yè)務(wù)快速上線。

          構(gòu)建萬卡集群并非一萬張 GPU 卡的簡單堆疊,而是一項高度復(fù)雜的超級系統(tǒng)工程。它涉及到超大規(guī)模的組網(wǎng)互聯(lián)、高效率的集群計算、長期穩(wěn)定性和高可用性等諸多技術(shù)難題。

          張建中也感嘆到:「萬卡集成的難度比登喜馬拉雅山還難。」

          共建大模型應(yīng)用生態(tài)

          根據(jù)《2023~2024 年中國人工智能計算力發(fā)展評估報告》,中國智能算力規(guī)模正處于高速增長狀態(tài)。預(yù)計到 2027 年,中國智能算力規(guī)模將達(dá) 1117.4EFLOPS,2022~2027 年期間的年復(fù)合增長率為 33.9%。

          萬卡集群的建設(shè)需要產(chǎn)業(yè)界的齊心協(xié)力,為實現(xiàn)大模型創(chuàng)新應(yīng)用的快速落地,讓國產(chǎn)算力「為用而建」。

          在今日的發(fā)布會線程,摩爾線程攜手中國移動通信集團(tuán)青海有限公司、中國聯(lián)通青海公司、北京德道信科集團(tuán)、中國能源建設(shè)股份有限公司總承包公司、桂林華崛大數(shù)據(jù)科技有限公司,分別就青海零碳產(chǎn)業(yè)園萬卡集群項目、青海高原夸娥萬卡集群項目、廣西東盟萬卡集群項目進(jìn)行了戰(zhàn)略簽約。

          今年 5 月,摩爾線程與無問芯穹正式完成基于國產(chǎn)全功能 GPU 千卡集群的 3B 規(guī)模大模型實訓(xùn)。該模型名為「MT-infini-3B」。MT-infini-3B 模型訓(xùn)練總用時 13.2 天,經(jīng)過精度調(diào)試,實現(xiàn)全程穩(wěn)定訓(xùn)練不中斷,集群訓(xùn)練穩(wěn)定性達(dá)到 100%,千卡訓(xùn)練和單機相比擴展效率超過 90%。在行業(yè)內(nèi)率先開啟了國產(chǎn)大語言模型與國產(chǎn) GPU 千卡智算集群深度合作的新范式。

          清程極智與摩爾線程合作的過程中,發(fā)現(xiàn)其硬件架構(gòu)、指令集、編譯器、MUSA 軟件棧等設(shè)計非常優(yōu)秀,極具潛力。清程極智將與摩爾線程強強聯(lián)合,攜手打造世界水平的大模型基礎(chǔ)設(shè)施。

          此外,摩爾線程還與360、京東云、智平方等多家國內(nèi)企業(yè)合作。

          結(jié)語

          隨著今年「AI+」首次被寫入兩會工作報告,AI 算力成為新質(zhì)生產(chǎn)力的重要引擎。

          智算中心不應(yīng)只是硬件的堆積,更是對軟硬一體化的 GPU 智算系統(tǒng)整合能力的考驗,GPU 分布式計算系統(tǒng)的適配、算力集群的管理和高效推理引擎的應(yīng)用等,都是提高算力中心可用性的重要因素。

          四年多的潛心發(fā)展,摩爾線程在 AI GPU 方面具備了強勁的實力,構(gòu)建起了一張包括芯片、板卡、服務(wù)器、集群和軟件棧的全棧 AI 產(chǎn)品版圖,并且已經(jīng)多點實現(xiàn)落地。

          正如摩爾線程創(chuàng)始人兼 CEO 張建中所言:「當(dāng)前,我們正處在生成式人工智能的黃金時代,技術(shù)交織催動智能涌現(xiàn),GPU 成為加速新技術(shù)浪潮來臨的創(chuàng)新引擎??涠鹑f卡智算集群作為摩爾線程全棧 AI 戰(zhàn)略的一塊重要拼圖,可為各行各業(yè)數(shù)智化轉(zhuǎn)型提供澎湃算力,不僅有力彰顯了摩爾線程在技術(shù)創(chuàng)新和工程實踐上的實力,更將成為推動 AI 產(chǎn)業(yè)發(fā)展的新起點?!?/span>




          關(guān)鍵詞: 摩爾線程

          評論


          相關(guān)推薦

          技術(shù)專區(qū)

          關(guān)閉
          看屁屁www成人影院,亚洲人妻成人图片,亚洲精品成人午夜在线,日韩在线 欧美成人 (function(){ var bp = document.createElement('script'); var curProtocol = window.location.protocol.split(':')[0]; if (curProtocol === 'https') { bp.src = 'https://zz.bdstatic.com/linksubmit/push.js'; } else { bp.src = 'http://push.zhanzhang.baidu.com/push.js'; } var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(bp, s); })();