蘋果表示其AI模型是在谷歌的定制芯片上訓(xùn)練的
蘋果在論文中表示,支持其Apple Intelligence AI系統(tǒng)的人工智能模型是在谷歌設(shè)計(jì)的處理器上預(yù)訓(xùn)練的,這表明大科技公司在訓(xùn)練前沿AI時(shí)正在尋找替代Nvidia的方法。
本文引用地址:http://www.ex-cimer.com/article/202407/461513.htm蘋果選擇谷歌自家設(shè)計(jì)的Tensor Processing Unit(TPU)進(jìn)行訓(xùn)練,這在公司剛剛發(fā)布的技術(shù)論文中有詳細(xì)說明。蘋果周一還發(fā)布了Apple Intelligence的預(yù)覽版。
Nvidia昂貴的圖形處理單元(GPU)在高端AI訓(xùn)練芯片市場占據(jù)主導(dǎo)地位,過去幾年需求旺盛,以至于很難以所需數(shù)量采購到。OpenAI、微軟和Anthropic都在使用Nvidia的GPU進(jìn)行模型訓(xùn)練,而其他科技公司,包括谷歌、Meta、甲骨文和特斯拉,也在大量采購這些芯片來構(gòu)建他們的AI系統(tǒng)和產(chǎn)品。
Meta首席執(zhí)行官馬克·扎克伯格和Alphabet首席執(zhí)行官桑達(dá)爾·皮查伊上周都表示,他們的公司和行業(yè)中的其他公司可能在AI基礎(chǔ)設(shè)施上過度投資,但承認(rèn)不這樣做的商業(yè)風(fēng)險(xiǎn)太高。
“落后的壞處在于,你在未來10到15年最重要的技術(shù)上處于不利位置,”扎克伯格在與彭博社的Emily Chang的播客中說。
蘋果在其47頁的論文中沒有提到谷歌或Nvidia,但確實(shí)提到其Apple Foundation Model(AFM)和AFM服務(wù)器是在“云TPU集群”上訓(xùn)練的。這意味著蘋果租用了云提供商的服務(wù)器來進(jìn)行計(jì)算。
“該系統(tǒng)使我們能夠高效、可擴(kuò)展地訓(xùn)練AFM模型,包括AFM-on-device、AFM-server和更大模型,”蘋果在論文中說。
蘋果和谷歌的代表沒有回應(yīng)置評請求。
健康的AI懷疑態(tài)度對技術(shù)行業(yè)有益,Light Street的Glen Kacher說健康的AI懷疑態(tài)度對技術(shù)行業(yè)有益,Light Street的Glen Kacher說
蘋果比許多同行更晚披露其AI計(jì)劃,這些同行在OpenAI于2022年底推出ChatGPT后很快就大聲宣布了生成性AI的擁抱。周一,蘋果推出了Apple Intelligence。該系統(tǒng)包括幾個(gè)新功能,例如Siri的新外觀、更好的自然語言處理以及文本字段中的AI生成摘要。
在接下來的一年中,蘋果計(jì)劃推出基于生成性AI的功能,包括圖像生成、表情符號生成以及可以訪問用戶個(gè)人信息并在應(yīng)用程序內(nèi)執(zhí)行操作的增強(qiáng)版Siri。
在周一的論文中,蘋果表示,AFM-on-device是在一個(gè)由2048個(gè)TPU v5p芯片協(xié)同工作的一片“切片”上訓(xùn)練的。這是最先進(jìn)的TPU,首次發(fā)布于去年12月。AFM-server是在8192個(gè)TPU v4芯片上訓(xùn)練的,這些芯片通過數(shù)據(jù)中心網(wǎng)絡(luò)配置為八片切片協(xié)同工作。
根據(jù)谷歌的網(wǎng)站,谷歌最新的TPU在提前預(yù)訂三年的情況下,每小時(shí)使用成本低于2美元。谷歌首次在2015年推出其TPU用于內(nèi)部工作負(fù)載,并于2017年向公眾開放。它們現(xiàn)在是專為人工智能設(shè)計(jì)的最成熟的定制芯片之一。
盡管如此,谷歌仍是Nvidia的頂級客戶之一。它在自己的TPU上使用Nvidia的GPU進(jìn)行AI系統(tǒng)訓(xùn)練,還在其云端出售Nvidia技術(shù)的訪問權(quán)限。
蘋果此前曾表示,推理,即使用預(yù)訓(xùn)練的AI模型生成內(nèi)容或做出預(yù)測,將部分在其數(shù)據(jù)中心的蘋果自家芯片上進(jìn)行。
這是蘋果發(fā)布的關(guān)于其AI系統(tǒng)的第二篇技術(shù)論文,此前在6月發(fā)布了一版更為通用的版本。蘋果當(dāng)時(shí)表示,在開發(fā)其AI模型時(shí)使用了TPU。
蘋果計(jì)劃在周四交易結(jié)束后公布季度業(yè)績。
評論