<meter id="pryje"><nav id="pryje"><delect id="pryje"></delect></nav></meter>
          <label id="pryje"></label>

          新聞中心

          EEPW首頁 > 業(yè)界動態(tài) > 以AI芯片架構(gòu)創(chuàng)新,迎接算力增長新拐點

          以AI芯片架構(gòu)創(chuàng)新,迎接算力增長新拐點

          —— 億鑄科技CEO熊大鵬
          作者: 時間:2024-10-24 來源:EEPW 收藏

          在灣芯展SEMiBAY2024《HBM與存儲器技術(shù)與應(yīng)用論壇》上,億鑄科技創(chuàng)始人、董事長兼CEO熊大鵬發(fā)表了題為《超越極限:大算力芯片面臨的技術(shù)挑戰(zhàn)和解決策略》的演講。

          本文引用地址:http://www.ex-cimer.com/article/202410/463959.htm

          熊大鵬博士提出,在AI大模型技術(shù)的推動下,算力迎來需求拐點,硬件架構(gòu)將成為滿足算力需求的關(guān)鍵路徑之一,未來算力增長將以存儲單元為中心。

          1729737991849239.png

          大模型時代的機(jī)遇與挑戰(zhàn)

          在AI大模型時代,隨著數(shù)據(jù)、算力、參數(shù)量的不斷提升,模型能力顯著增強(qiáng)。熊大鵬博士指出,大模型已經(jīng)從量變逐漸演變?yōu)橘|(zhì)變,當(dāng)模型體量足夠大時,會出現(xiàn)類似人類“開悟”的涌現(xiàn)能力,大模型的推理能力將顯著提升。這一變化預(yù)示著AI應(yīng)用的最后一公里即將打通,業(yè)務(wù)落地將推動對AI計算能力的需求迎來拐點。

          Omdia最新報告《云計算和數(shù)據(jù)中心人工智能處理器預(yù)測》顯示,用于云計算和數(shù)據(jù)中心人工智能的GPU和其他加速芯片的市場規(guī)模已從2022年的不到100億美元增長到2024年的780億美元,并預(yù)計到2029年將達(dá)到1510億美元。然而,2026年市場可能會出現(xiàn)一個明顯的拐點,增長動力將從技術(shù)采用轉(zhuǎn)向人工智能應(yīng)用需求的變化。

          此外,IDC預(yù)測,未來的人工智能服務(wù)器將注重提高計算能力和處理效率(能效比),以適應(yīng)更復(fù)雜、更大規(guī)模的人工智能應(yīng)用。預(yù)計到2027年,用于推理的AI算力占比將達(dá)到72.6%,未來有望達(dá)到95%為推理,5%為訓(xùn)練。

          應(yīng)用落地需要硬件架構(gòu)突破

          然而,現(xiàn)有的芯片硬件性能提升速度已難以滿足算法模型急劇增長的算力需求。摩爾定律,這個曾經(jīng)指導(dǎo)半導(dǎo)體行業(yè)發(fā)展的黃金法則,如今正面臨前所未有的挑戰(zhàn)。國信證券經(jīng)濟(jì)研究所報告指出,大模型參數(shù)規(guī)模每18個月增長35倍,而摩爾定律下的芯片僅增長2倍。因此,探索和發(fā)展新的硬件架構(gòu)成為算力突破的關(guān)鍵路徑之一。

          熊大鵬博士強(qiáng)調(diào),在現(xiàn)有的硬件架構(gòu)下,目前AI芯片面臨著“三堵墻”問題:存儲墻、能耗墻和編譯墻。存儲墻是指存儲器的數(shù)據(jù)訪問速度跟不上計算單元的數(shù)據(jù)處理速度,導(dǎo)致性能瓶頸的問題。

          同時,由于存儲墻的存在則帶來了能耗墻和編譯墻的問題。能耗墻是指隨著芯片性能的提升,能耗和散熱問題成為限制進(jìn)一步性能提升的主要因素。編譯墻則是隨著AI模型的復(fù)雜性增加,編譯器需要處理的數(shù)據(jù)量和計算任務(wù)也急劇增加,這使得靜態(tài)編譯優(yōu)化變得非常困難,手動優(yōu)化又消耗了大量時間和成本。

          1729738027974805.png

          存算一體開啟算力第二增長曲線

          面對這一挑戰(zhàn),億鑄科技選擇創(chuàng)新,用“存算一體超異構(gòu)”架構(gòu)這一全新的芯片設(shè)計思路,極大地減少了數(shù)據(jù)搬運的延遲,提升了整體的計算效率和能效比。

          熊大鵬博士指出,想要打破AI芯片“三堵墻”,就需要從算力的第一性原理(阿姆達(dá)爾定律)來著手,將數(shù)據(jù)搬運量大幅下降,使得F值接近于0,才能保證有效算力密度線性增長。目前業(yè)內(nèi)主要存在兩種解決方式:一種是存內(nèi)計算,另一種是近存計算。

          存內(nèi)計算是通過將存儲和計算功能融合,減少數(shù)據(jù)搬運延遲,提升性能和能效。在理想狀態(tài)下,F(xiàn)=0,能夠?qū)崿F(xiàn)存儲與計算無縫融合。近存計算則是將存儲單元和計算單元通過先進(jìn)封裝集成在一起,增加訪存帶寬、減少數(shù)據(jù)搬移時延,以提升整體計算效率。

          熊大鵬博士強(qiáng)調(diào),通過存算一體架構(gòu)等技術(shù),可以突破傳統(tǒng)計算模式的瓶頸,實現(xiàn)更高的有效算力,打破有效算力的天花板。未來,以算力單元為中心的時代即將結(jié)束,算力第二增長曲線將以存儲單元為中心。

          結(jié)語

          熊大鵬博士表示,億鑄科技自成立以來,始終致力于通過存算一體,提供貢獻(xiàn)更具性價比、更高能效比、更大算力發(fā)展空間的AI大算力芯片發(fā)展新路徑。2023年3月,面對ChatGPT等大模型帶來的AI算力挑戰(zhàn),億鑄科技首次提出“存算一體超異構(gòu)”,為大模型時代AI大算力芯片發(fā)展提供全新思路。

          未來,隨著AI技術(shù)的不斷進(jìn)步,算力的需求也在不斷增長。億鑄科技將通過創(chuàng)新的存算一體架構(gòu),為AI芯片的發(fā)展提供新的方向。在大模型時代,億鑄科技的技術(shù)和產(chǎn)品將為AI技術(shù)的發(fā)展提供強(qiáng)大的支持,推動整個行業(yè)向前發(fā)展。隨著億鑄科技技術(shù)的不斷成熟和應(yīng)用的不斷擴(kuò)展,我們有理由期待,AI芯片技術(shù)將迎來一個新的發(fā)展階段,為科技進(jìn)步做出更大的貢獻(xiàn)!



          關(guān)鍵詞:

          評論


          相關(guān)推薦

          技術(shù)專區(qū)

          關(guān)閉
          看屁屁www成人影院,亚洲人妻成人图片,亚洲精品成人午夜在线,日韩在线 欧美成人 (function(){ var bp = document.createElement('script'); var curProtocol = window.location.protocol.split(':')[0]; if (curProtocol === 'https') { bp.src = 'https://zz.bdstatic.com/linksubmit/push.js'; } else { bp.src = 'http://push.zhanzhang.baidu.com/push.js'; } var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(bp, s); })();