AIGC手機處理器與傳統AP揮手告別
近年來,隨著大模型技術的迅猛發展,手機廠商紛紛亮相大模型應用,成為手機發布會上的焦點。從OPPO的語音助手升級到vivo的官方宣布自研手機AI大模型,再到小米將大模型直接整合到手機系統中,各廠商的競爭可謂激烈異常。這一切的背后,是智能終端已然成為各類AIGC(AI Generated Content)應用的新戰場。
首先,大模型的應用范圍不斷擴展,從圖像生成到文本生成,各類應用層出不窮。國內廠商推出的文心一言、智譜清言APP,以及國外的OpenAI移動版ChatGPT、Llama 2手機版等,都是大模型在手機上的典型應用。這使得智能終端逐漸成為大模型應用的新灘頭。
智能終端芯片拼什么
算力
在將大模型引入手機時,算力是首當其沖的問題。高通在其《混合AI是AI的未來》白皮書中談到:“面對每日超過 100 億次的搜索量且移動端搜索占比超過 60%的情況,生成式 AI 的應用將推動所需算力的實質性增長,尤其是來自智能手機端的搜索請求。由于基于生成式 AI 的查詢能夠提供更令人滿意的答案,用戶的搜索方式已經開始發生轉變?!备咄ǖ牡谌旪?移動平臺通過強調硬件加速器,如Hexagon NPU,實現在手機上運行100億參數大模型。此外,它還改進了傳感器中樞,通過Sensing Hub有助于大模型在手機端的“定制化”,提升了AI處理效率。
內存和能耗
限制大模型進入手機的第二道關卡是有限的內存和電池壓力。聯發科表示:“雖然大模型可以帶來更好的生產力,但本地運行13B的體量就意味著需要占用約 13GB 的內存,再加上安卓本身的 4GB和其他APP內存,已經超過了大多數手機16G的內存容量。天璣 9300 使用的內存硬件壓縮技術,通過量化和壓縮把大模型的內存占用降低,只有這樣才能讓大多數用戶在日常跑得起大模型應用?!?/p>
高通在第三代驍龍8中采用LPDDR5X內存,提高了數據傳輸速度和帶寬,支持更大更復雜的AI模型。同時,AI引擎的升級,如Hexagon NPU性能提高了98%,功耗降低了40%,在內存和能耗平衡上實現了更好的性能。聯發科也不甘示弱,天璣 9300 集成了 MediaTek 第七代 AI 處理器 APU 790,專為生成式 AI 而設計,其性能和能效相較上一代得到顯著提升,整數運算和浮點運算的性能是前一代的兩倍,功耗降低了45%。
互聯
目前,AI 已廣泛應用于各種物聯網垂直領域,包括零售、安全、能源和公共設施、供應鏈和資產管理。AI 依靠近乎實時的數據采集和分析改進決策質量,優化運營效率,并賦能創新以打造差異化競爭優勢。通過生成式 AI,物聯網細分領域將進一步從 AI 的應用中受益。在高通的Snapdragon Seamless技術展示了智能終端的互聯。這一技術能夠在不同設備之間無縫傳輸數據,為用戶提供更加便捷的跨終端操作體驗。這種互聯不僅使得大模型應用在不同設備之間實現共享,也為AI解決方案的跨平臺適用性提供了可能。
AIGC手機AP亮眼之處
專注AI任務處理
移動AIGC手機AP相比傳統手機AP更專注于處理AI相關任務。例如vivo的自研芯片、高通的驍龍平臺以及蘋果M3都是為了提供更出色的AI推理處理而專門設計的,突顯了其在AI任務處理方面的專業性。
多核心異構處理
為了更好地處理不同類型和規模的AI模型,移動AIGC手機AP可能會支持多核心異構處理。讓我們簡單回顧手機處理器到目前為止的提升歷史,初期性能的提升主要是依靠CPU內核架構(比如從Arm Cortex-A5~A15)、提升CPU主頻、同類CPU內核數量。但問題也隨之浮現, CPU內核性能及數量的提升帶來的功耗也越來越大,比如單純的依靠四核A15/A17內核的處理器,如果用到移動平臺,都已經出現了嚴重的功耗問題。而為了解決這一問題,Arm在2011年就研發了全新的big-Little架構,即通過大核CPU+小核CPU的組合來平衡性能和功耗問題。
在此之后,三星和聯發科都一次推出了“大小核”架構的手機處理器,新的變革出現在2017年,Arm正式發布了全新的有針對人工智能及機器學習進行優化的DynamIQ技術。而新的DynamIQ big-little將允許在單一計算集群上進行大小核配置,將可配置性提升到了一個新的臺階。同時,DynamIQ big.LITTLE還可以對每一個處理器進行獨立的頻率控制以及開、關、休眠三種狀態的控制,可以實現在不同任務間絲滑切換的處理器。2019年,Google博客公布的Pixel Visual Core結構圖中就顯示了AIGC手機AP中需要多核異構,這顆芯片內部集成了8個圖像處理核心(lmage Processing Unit,簡稱:IPU),一顆來自ARM的A53核心,同時還擁有MIPI/LPDDR4/PCle控制器。
此后,包括聯發科在內的眾多手機芯片廠商開始全面采用八核“三叢集”架構設計,很多手機處理器廠商也紛紛效仿。比如,高通最新推出的驍龍8 Gen3采用的就是采1+5+2的八核“三叢集”架構。聯發科的天璣9300則首次采用了“全大核”CPU設計,即1個3.25GHz Cortex-X4超大核+3個2.85GHz Cortex-X4超大核+4個主頻2.0GHz Cortex-A720 大核。
更低功耗和高效能
AI 創業公司 Hugging Face 和卡內基梅隆大學的研究人員分析了 13 種生成式 AI 任務的耗能,除了生成圖像和文本,還有摘要、對象檢測、文本分類等。每項任務研究人員都會運行 1000 個提示詞,收集期間消耗的電力。結果顯示圖像生成最高,文本分類最低。生成圖像的平均耗電量為 0.007 度電(KWh),是文本分類的三倍以上(0.002 度電)。
因此,移動AIGC手機AP需要在AI任務執行時提供高效的性能,但同時要求較低的功耗。這是為了確保在移動設備上能夠實現可持續的性能,同時維持較長的電池壽命。
靈活的軟硬件結合
移動AIGC手機AP可能會支持靈活的軟硬件結合,以便在不同的AI任務場景下進行適應性優化。這可以通過軟件更新來改進AI處理的效能,使手機能夠不斷適應新的AI算法和模型。例如,高通的AI 硬件加速和簡化開發的軟件解決方案(比如高通 AI 軟件棧),已經在引領終端側 AI 推理。聯發科則提供了生成式AI開發套件NeuroPilot,支持快速部署生成式AI模型并在APU上高效運行,同時提供全面的工具鏈以供開發豐富的AI應用程序。
AIGC手機AP的挑戰與機遇
在AI模型需求高算力和高功耗的大背景下,智能終端芯片的評判標準已經發生了變化,小模型對處理器提出了更具體的技術需求,尤其在移動端應用場景下。與傳統手機AP相比,移動AIGC手機AP更專注于提供高效的AI推理處理,注重多核心異構處理、低功耗和高效能的設計。這種技術差異使得移動設備能夠更好地滿足未來AI應用對于移動終端處理器的不斷提升的需求,為用戶提供更出色的人工智能體驗。
評論