超越 SoC 范式：下一代移動 AI 芯片將走向何方？

作者：trendforce 時間：2023-05-24 來源：半導(dǎo)體產(chǎn)業(yè)縱橫

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢

本文引用地址：http://www.ex-cimer.com/article/202305/446908.htm

圍繞 ChatGPT 的熱度已經(jīng)開啟了生成 AI 的新時代。這種新鮮的技術(shù)旋風(fēng)正在徹底改變一切，從基于云的人工智能服務(wù)器一直到智能手機(jī)的邊緣計算。

鑒于生成式 AI 具有培育新應(yīng)用和提高用戶生產(chǎn)力的巨大潛力，智能手機(jī)已成為 AI 技術(shù)的重要工具也就不足為奇了。盡管終端設(shè)備的計算能力無法與云相提并論，但它具有降低總體計算成本和保護(hù)用戶隱私的雙重好處。這就是智能手機(jī) OEM 幾年前開始使用 AI 芯片探索和實現(xiàn)新功能的主要原因。

不過，近期 Oppo 關(guān)閉其芯片設(shè)計公司哲庫的決定，讓智能手機(jī) OEM 廠商自研芯片的未來產(chǎn)生了一些疑慮，智能手機(jī) AI 芯片市場成為焦點(diǎn)。

急需加速 AI 芯片迭代

業(yè)界目前在終端設(shè)備上運(yùn)行生成式 AI 模型的方法包括兩個方面：軟件側(cè)重于減小模型的大小以減輕芯片的負(fù)擔(dān)和能耗，而硬件側(cè)則致力于提高計算能力和優(yōu)化通過流程收縮和架構(gòu)升級來減少能源使用。

IC 設(shè)計公司，如高通及其 Snapdragon8 Gen.2，現(xiàn)在正加緊開發(fā)能夠運(yùn)行這些生成式 AI 基礎(chǔ)模型的 SoC 產(chǎn)品。

不過，這是棘手的部分：模型以遠(yuǎn)遠(yuǎn)超過 SoC 開發(fā)周期的速度不斷發(fā)展——像 GPT 這樣的更新每六個月進(jìn)行一次。硬件迭代和新的 AI 模型進(jìn)步之間的差距可能只會越來越大，使得計算需求的快速擴(kuò)展成為硬件解決方案提供商需要解決的主要痛點(diǎn)。

頂級 OEM 開創(chuàng)了附加 AI 加速器

很明顯，在這場 AI 計算能力的競賽中，過去對 SoC 的依賴正在受到挑戰(zhàn)。頂級智能手機(jī) OEM 不再僅僅依賴 SoC 供應(yīng)商的標(biāo)準(zhǔn)產(chǎn)品。相反，他們正在積極采用 AI 加速器芯片來填補(bǔ)計算空白。

集成和附加 AI 加速器的方法最早見于 2017 年：

集成：該策略的代表是華為的 Kirin970 和 Apple 的 A11 Bionic，它們在 SoC 中集成了 AI 引擎。
Add-on：最初由 Google Pixel 2 實現(xiàn)，它使用定制的 Pixel Visual Core 芯片和 Snapdragon 835。直到 2021 年的 Pixel 6 系列引入了 Google 自研的 Tensor SoC，才直接集成了加速單元進(jìn)入張量。

顯然，具備自研 SoC+能力的 OEM 廠商，通常會在設(shè)計階段就將其模型嵌入到 AI 加速器中。這種硬件-軟件協(xié)同作用為特定的 AI 場景提供所需的計算能力。

史詩般的戰(zhàn)斗：崛起的新戰(zhàn)略模式

對于沒有自主研發(fā)能力的 OEM 廠商來說，SoC 開發(fā)的高昂成本讓他們不得不依賴芯片廠商的 SoC 迭代。然而，他們還在供應(yīng)鏈中應(yīng)用新戰(zhàn)略以跟上快速變化的步伐。

這是有趣的部分，品牌正在利用更簡單的專用芯片來推動支持 AI 的應(yīng)用程序，使像 ISP（圖像信號處理器）這樣的獨(dú)立 IC 成為攝影和顯示新功能的關(guān)鍵。與此同時，我們也看到了生產(chǎn)力工具領(lǐng)域的潛在進(jìn)步，從語音助手到照片編輯人們認(rèn)真考慮實施小型 ASIC 來滿足計算需求。

從小米與 Altek 的合作以及 Vivo 與 Novatek 共同開發(fā) ISP 來看，ASIC 開發(fā)的前景一片光明，為小型 IC 設(shè)計和 IP 服務(wù)提供商打開了機(jī)會。

為應(yīng)對這一趨勢，SoC 領(lǐng)導(dǎo)者聯(lián)發(fā)科正在采用開放式 5G 架構(gòu)戰(zhàn)略，通過許可和定制服務(wù)擴(kuò)展市場。不過，有猜測稱，OEM 可能會用自主開發(fā)的 IP 取代聯(lián)發(fā)科的標(biāo)準(zhǔn) IP，以實現(xiàn)更深層次的產(chǎn)品差異化。

如此看來，AI 芯片之爭顯然還在繼續(xù)，智能手機(jī) AI 芯片產(chǎn)品加速迭代并無勝算。

人工智能服務(wù)器的高成本和復(fù)雜性不可避免地限制了其開發(fā)僅限于大型制造商。HPE 和戴爾這兩家領(lǐng)先的公司采取了不同的策略進(jìn)入市場：

HPE 不斷加強(qiáng)與谷歌的合作，計劃到 2022 年將所有產(chǎn)品轉(zhuǎn)化為服務(wù)形式。它還于 2023 年 1 月收購了初創(chuàng)公司 Pachyderm，推出基于云的超級計算服務(wù)，讓訓(xùn)練和開發(fā)大型模型變得更加容易。
2023 年 3 月，戴爾推出了最新的 PowerEdge 系列服務(wù)器，提供配備 NVIDIA H100 或 A100 Tensor Core GPU 和 NVIDIA AI Enterprise 的選項。他們采用第四代英特爾至強(qiáng)可擴(kuò)展處理器，引入戴爾軟件 Smart Flow，滿足數(shù)據(jù)中心、大型公有云、人工智能、邊緣計算等不同需求。

隨著 AIGC 應(yīng)用程序市場的蓬勃發(fā)展，我們似乎離以完全虛擬化內(nèi)容為中心的未來元宇宙又近了一步。然而，硬件基礎(chǔ)設(shè)施是否能跟上激增的需求仍不明朗。這種持久的挑戰(zhàn)將繼續(xù)考驗云服務(wù)器制造商平衡成本和性能的能力。

考慮到芯片開發(fā)所需的大量資源和智能手機(jī)市場的飽和，保持芯片相關(guān)戰(zhàn)略為 OEM 增加了一層不確定性。隨著 Oppo 停止芯片研發(fā)，其他品牌如 vivo 和小米可能會重新考慮他們的游戲計劃，因此，未來值得密切關(guān)注。