<meter id="pryje"><nav id="pryje"><delect id="pryje"></delect></nav></meter>

<label id="pryje"></label>

新聞中心

EEPW首頁 > 智能計算 > 業界動態 > 算力芯片，終局之戰？

算力芯片，終局之戰？

作者：焉知汽車時間：2024-01-02來源：搜狐科技收藏

今天這篇文章的時候，我內心是焦慮的，甚至有點悲觀。

本文引用地址：http://www.ex-cimer.com/article/202401/454374.htm

中國的芯片界同仁，不可謂不努力：充滿艱難險阻的工作，數十年如一日的煎熬，直面國際巨頭的競爭。在芯片具體產品層面，別人有性能優勢，我們有價格優勢。不敢說能打個你來我往，但至少還有還手之力。

然而，在計算生態方面，我們則完全沒有招架之力。計算生態就像一只無形的手，抹去了我們僅有的一點可能的機會，阻擋著我們前進的步伐，讓我們距離世界先進越來越遠。

更令人焦慮的是未來：一方面，計算生態的作用在不斷地加強；另一方面，不同領域不同處理器的計算生態有進一步融合的趨勢，逐漸形成新的超級生態。兩相疊加，一旦超級生態逐步建立，后進者再無翻身的可能。

未來5-10年，大算力芯片，將迎來終局之戰。

1 計算架構的發展趨勢

1.1 計算架構的發展階段

隨著算力需求越來越高，同構CPU的業務場景越來越少，基于GPU或AI等DSA處理器的異構計算已經成為主流。從發展的角度看，隨著大模型等算力場景的持續挑戰，未來會進一步從異構計算走向異構融合計算。

如果按照處理器類型的數量進行分類，可以分為三個階段：

第一階段，單個處理器，即CPU同構計算階段。
第二階段，兩個處理器，即CPU+GPU或CPU+其他專用加速處理器的異構計算階段。
第三階段，三個或三個以上處理器，即多異構或異構融合計算階段。

行業在創新處理器的設計和實現方面進行了很多探索，比如存算一體、重構計算、類腦計算、量子計算等等。這些新型的計算架構設計或實現方法，從系統指令復雜度的視角，可以歸屬到DSA或ASIC的范疇。因此，這些創新，沒有跳脫異構融合計算的大框架。

以我目前淺薄的認識，個人覺得：異構融合計算，將是計算架構的終極形態。

1.2 CPU同構，單個處理器，單個生態

雖然僅僅只有一個處理器，但其計算生態已經是地獄級難度。

Intel x86架構的優勢，是在眾多處理器架構的廝殺中逐步確立的。隨著x86的優勢地位確立，基于x86架構的軟件生態逐漸成熟，即便是Intel自己，也無法改變這一局面。

Intel的64位安騰（Itanium）處理器，是一個非常典型的失敗的案例。安騰是Intel于2001年推出的64位架構的CPU處理器，Intel對之寄予厚望。雖然是Intel的親兒子，雖然是功能強大的64位CPU架構，雖然安騰的架構和微架構設計非常優秀，但因為和x86的不兼容，完全一個新的生態，不可避免的走向了失?。?021年7月29日是安騰處理器最后的出貨日期，英特爾正式告別了這款使用IA-64指令集的純64位處理器）。

與此形成鮮明對比的，是AMD64的成功。2003年，AMD推出了業界首款 64 位處理器 Athlon 64，帶來了AMD64（x86-64）指令集，即x86指令集的64位擴展超集，具備向下兼容的特點。因為向下兼容，繼承性地往前發展，最終成就了AMD64的成功。

1.3 GPU異構，兩個處理器，兩個生態融合

相對于Intel的x86 CPU計算生態是百家爭鳴的勝者，NVIDIA GPU的CUDA生態，則是數年孤獨后的一鳴驚人。

在NVIDIA GPGPU之前，GPU真的就只是GPU，即專用于圖形計算的加速卡。這一時期的GPU，符合DSA的定義規范，可以當作是專用于圖像領域的G-DSA。直到NVIDIA GPGPU的出現。

2006年，NVIDIA發布GPGPU。NVIDIA發現，圖像處理有很多并行處理的部件，于是決定將這些專用的處理完全改造成通用的高效能小CPU核，于是GPGPU誕生了。雖然此時，GPGPU已經足夠通用，但其編程難度很高，于是NVIDIA又貼心地開發了CUDA計算框架。即便如此，早期的CUDA功能并不強大，開發仍然不夠友好。很多開發者并不看好，認為CPU多核才是正確的發展道路。

直到2012年，Alexnet的問世，深度學習時代的來臨，NVIDIA GPU+CUDA才成了熱門的計算平臺，助推著NVIDIA市值超越一眾競爭對手，成為全球市值第一的芯片公司。再緊接著，2018年，AI大模型逐漸流行。進一步把這股浪潮推向高潮，NVIDIA GPU一時間“洛陽紙貴”，同時，NVIDIA的市值突破了萬億美金大關。

我們再來看CPU和GPU的融合。

2022年初，NVIDIA正式宣布，收購ARM失敗。假如，NVIDIA收購ARM成功，這場大算力芯片的“戰爭”，基本上可以提前給出結果：NVIDIA獲勝，其他家永無出頭之日。好在這件事情沒有成行，算力芯片“戰爭”的結果，仍存在變數，這場“戰爭”仍在繼續。

之后，NVIDIA退而求其次，與ARM的深度合作，開發了Grace系列高性能CPU，以及CPU+GPU整合的Grace Hopper系列超級芯片。

2 計算生態的極端重要性

在之前，我一直以為Transformer之所以能夠脫穎而出的最大原因就是那篇論文的標題：“Attention is all you need”，優勢來源于算法本身。最近一段時間，跟好幾位AI領域的專家交流下來，他們的觀點是：有很大一部分原因是因為，Transformer比較好的實現了并行處理，能夠最大限度的利用GPU并行的算力，因此才能夠實現更大參數規模的大模型，進而獲得更好的智能體驗。

這個案例可以得到這樣一個結論：只有NVIDIA GPU+CUDA生態親和的模型才能最終走出來；如果不是NVIDIA GPU+CUDA架構和生態友好的模型，哪怕實際效果再好，也受限于模型效率、參數規模和成本等方面的劣勢，無法脫穎而出。

或者說，大模型發展，強依賴于NVIDIA的GPU+CUDA計算生態。

在我的個人觀點里，一直以來，都是非常重視生態的難度和重要性的。但最近幾年，隨著認識的進一步加深，我的想法得到了進一步修正。計算生態很重要，但過去10年左右的發展，使得計算生態的重要性，比我們大家想象的要更加重要：

一方面，業務快速發展迭代的壓力，使得大家更加依賴已有生態的持續優化，而很難遷移到新的平臺和生態。
另一方面，計算從單機計算走向集群跨集群的分布式計算，計算生態的作用得到進一步放大。一是不同計算節點工作任務之間的協同，二是計算任務在集群內部不同計算節點之間可遷移，這些原因進一步強化了計算生態的“強者更強，弱者更弱”。
還有一方面，隨著異構計算和異構融合計算的發展，處理器之間的協同效應逐漸產生并進一步增大。不同處理器的單個計算生態開始發生化學反應，逐步會形成融合的超級生態。

我們定性分析一下：

芯片的難度很高，但生態的難度更高。
假設，在十幾年之前，2010年前后，芯片的重要性和難度是1，計算生態的重要性和難度則為10。
假設，隨著系統規模的增大，未來5-10年，也就是2030年前后，單個處理器芯片的重要性和難度可能上升到10。受業務迭代越來越快的影響，計算生態的重要性和難度需要再增加一個數量級，其值約為1,000。
在考慮集群/跨集群以及云網邊端融合成為主流計算方式的影響下，計算生態的重要性和難度再增加一個數量級，其值進一步上升到10,000。
再隨著異構的處理器越來越多，不同處理器計算生態的協同效應凸顯，計算生態的重要性和計算難度再增加一個數量級，其值達到100,000。
最終，芯片和計算生態的重要性和難度比例變成10:100,000，或者是1:10,000。

3 算力芯片，終局之戰

3.1 多異構融合，更多生態的融合

我們來分析一下Intel在多（超）異構和未來異構融合計算的布局：

首先是各類處理器。CPU生態，Intel首屈一指；GPU生態，Intel也有自己的產品，也在積極的布局；DSA類的生態，Intel有IPU和IPDK進一步整合和增強。
然后是Intel在多異構融合、跨平臺，完全可編程和開放生態方面都進行了布局。Intel于2019年提出超異構計算概念，隨后Intel布局了OneAPI框架、OpenVINO計算套件、IPDK計算框架，還發起了OPI開放計算聯盟等。目前，Intel的多異構或異構融合的芯片解決方案還沒有公開發布，拭目以待。

Intel目前面臨的挑戰是：上面列出的很多內容，Intel提出之后，并沒有非常有競爭力的產品去承載。

（注：圖片為Altan結構框圖，Thor和Altan一致）

NVIDIA在汽車CCU方面，已經布局了Thor超級芯片，其核心計算部分由數據中心架構的Grace CPU、Ampere GPU、Bluefield DPU組成。一方面算力強勁，把汽車變成了一臺超級計算機；另一方面，其架構跟數據中心處理器架構完全一致，為未來云邊端融合提供了堅實的物理基礎。

據說，NVIDIA在數據中心的CPU、GPU和DPU三芯片集成的、多種異構融合計算架構的超級芯片，已經在研發中。

3.2 異構融合，最后一場戰役

在GPU領域，NVIDIA構建了牢不可破的CUDA計算生態；在DPU領域，NVIDIA擁有全球最好的DPU芯片，以及功能強大的DOCA計算框架；高性能網絡可以看做DPU的一個重要的功能子集，NVIDIA擁有全球最好的高性能網絡RDMA和獨一無二的Infiniband技術，高性能網絡是AI大模型訓練集群的核心技術；在CPU領域，NVIDIA和ARM深度合作，搶占了比較有利的生態位。

一根筷子，輕輕地就會被折斷；十雙筷子，則牢牢地抱成一團，幾乎牢不可破：

同構計算的時代，面臨的僅僅是一個計算生態的挑戰；生態劣勢的廠家，仍然有翻盤的可能。
異構計算的時代，面臨的則有兩個計算生態的挑戰，還有兩個處理器協同生態的挑戰；這個時候，生態劣勢的廠家，面對計算生態的無形之手，已經有點力不從心。
異構融合計算時代，計算平臺預計會多達5-10個處理器，面臨的不僅僅是5-10個計算生態的挑戰，更要面臨這些處理器組成的融合計算超級計算生態的挑戰；這個時候，會進一步放大計算生態的“強者恒強，弱者恒弱”效應，生態劣勢的廠家，不但無法翻盤，甚至連微小的一點市場份額都很難維持。

在未來5-10年，隨著生態的極端重要性進一步凸顯，大算力芯片，即將迎來“終局之戰”。

4 唯一可能的破局之道：開放

回到現實，大算力芯片的計算生態之爭，“唯一可能”的破局之道：開放?！拔ㄒ弧笔钦f，有且僅有這一個辦法；“可能”指的是，這個方法雖然存在贏的幾率，但幾率很低很低。

4.1 異構融合計算，架構必須收斂

指令復雜度越高，單個處理器引擎覆蓋的場景就會越小，全場景覆蓋所需的引擎種類就會越多。從CPU到ASIC，處理器引擎越來越碎片化，構建生態越來越困難。

異構融合計算時代，集成的處理引擎類型和數量越來越多，處理引擎架構越來越多，芯片平臺的數量也越來越多，所處的位置（云網邊端）也越來越豐富。

解決辦法只有一個：讓架構收斂。每一個類型或子類型的處理器，全球全行業能夠形成標準的架構和接口。

不確定的是，未來是走向封閉的一家通吃？還是行業形成共識，大家基于開放架構做產品，行業走向基于產品競爭力的、真正的“公平”競爭？

4.2 除了最強者，開放是其他家的唯一選擇

只要你不是第一，第二名能做的也只能是開放。

開放陣營，不僅僅會包括行業里的二線、三線芯片公司，以及廣大的Startup公司，還會包括目前仍處于一線大廠的眾多知名公司。

從目前看可見的未來，NVIDIA會是最后贏者通吃最有優勢的那個。那么，這個陣營包括Intel、AMD、高通、博通、Marvell等知名芯片公司，也包括互聯網巨頭等芯片的大客戶，如蘋果、谷歌、微軟、華為、阿里、騰訊等，也包括OpenAI等AI/AGI新貴。對抗巨頭的唯一做法，唯有凝聚共識，開源開放。

4.3 開放，讓大家回到同一起跑線

我們設想一個烏托邦的時代，在這個時代里：

CPU領域，已經是形成共識的開放架構成為主流，比如RISCv占據90%以上市場份額；
GPU領域，也出現了全行業形成共識的開放架構和相應的開源的開發框架；
AI、網絡、存儲等領域也是如此，均形成了各自開放的架構和行業生態。
并且，進一步的，行業形成了開源開放的統一的異構融合計算框架。

那么，這個時候，大家會回到同一個起跑線：靠產品能力說話，而不是依靠無形的手——生態的力量。

關鍵詞： 算力芯片

評論

相關推薦

算力芯片，終局之戰？

智能計算算力芯片 | 2024-01-02

技術專區

關閉

看屁屁www成人影院,亚洲人妻成人图片,亚洲精品成人午夜在线,日韩在线欧美成人 (function(){ var bp = document.createElement('script'); var curProtocol = window.location.protocol.split(':')[0]; if (curProtocol === 'https') { bp.src = 'https://zz.bdstatic.com/linksubmit/push.js'; } else { bp.src = 'http://push.zhanzhang.baidu.com/push.js'; } var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(bp, s); })();