亞馬遜宣布推出新的AI芯片,加深與Nvidia的合作關(guān)系
亞馬遜網(wǎng)絡(luò)服務(wù)(Amazon Web Services,AWS)宣布推出Trainium2芯片,用于訓(xùn)練人工智能模型,并將提供對(duì)Nvidia最新一代H200 Tensor Core圖形處理單元的訪問。
本文引用地址:http://www.ex-cimer.com/article/202312/453488.htmAWS將為客戶和Nvidia提供一個(gè)專用的計(jì)算集群。 目前,AWS客戶可以開始測(cè)試新的通用Graviton4芯片。
亞馬遜AWS云部門宣布推出新的芯片,供客戶構(gòu)建和運(yùn)行人工智能應(yīng)用程序,并計(jì)劃提供對(duì)Nvidia最新芯片的訪問。
亞馬遜網(wǎng)絡(luò)服務(wù)正努力成為一家提供各種經(jīng)濟(jì)實(shí)惠選擇的云服務(wù)提供商。然而,它不僅僅銷售便宜的亞馬遜品牌產(chǎn)品。與其在線零售市場(chǎng)一樣,亞馬遜的云服務(wù)將包括其他供應(yīng)商的頂級(jí)產(chǎn)品,包括來(lái)自頂級(jí)AI芯片制造商N(yùn)vidia的備受追捧的GPU。
自從初創(chuàng)公司OpenAI去年推出其ChatGPT聊天機(jī)器人以來(lái),對(duì)Nvidia GPU的需求飆升,該機(jī)器人以其總結(jié)信息和生成類似人類文本的能力而讓人印象深刻。這導(dǎo)致Nvidia芯片供不應(yīng)求,因?yàn)楣緺?zhēng)相將類似的生成式AI技術(shù)納入其產(chǎn)品中。
亞馬遜采用了建設(shè)自己的芯片和讓客戶訪問Nvidia最新芯片的雙管齊下策略,可能有助于對(duì)抗其最大的云計(jì)算競(jìng)爭(zhēng)對(duì)手微軟。本月早些時(shí)候,微軟采取了類似的方式,推出了其首個(gè)AI芯片Maia 100,并表示Azure云將配備Nvidia H200 GPU。
這些公告是在拉斯維加斯的Reinvent大會(huì)上宣布的。具體而言,AWS表示將提供對(duì)Nvidia最新的H200人工智能圖形處理單元的訪問。它還宣布了新的Trainium2人工智能芯片和通用Graviton4處理器。
新的Nvidia GPU是H100的升級(jí)版,而H100芯片是OpenAI用來(lái)訓(xùn)練其最先進(jìn)的大型語(yǔ)言模型GPT-4的芯片。各大公司、初創(chuàng)公司和政府機(jī)構(gòu)都在爭(zhēng)奪這些芯片的有限供應(yīng),這意味著有很高的需求從云服務(wù)提供商如亞馬遜租用它們。Nvidia表示,H200將生成輸出速度幾乎是H100的兩倍。
亞馬遜自家的Trainium2芯片專為訓(xùn)練人工智能模型而構(gòu)建,包括像OpenAI的ChatGPT及其競(jìng)爭(zhēng)對(duì)手運(yùn)行的那種AI聊天機(jī)器人。初創(chuàng)公司Databricks和亞馬遜支持的Anthropic(OpenAI的競(jìng)爭(zhēng)對(duì)手)計(jì)劃使用新的Trainium2芯片構(gòu)建模型,其性能將比原始模型提高四倍,亞馬遜表示。
Graviton4處理器基于Arm架構(gòu),比Intel或AMD的芯片消耗更少的能源。Graviton4承諾比現(xiàn)有的Graviton3芯片性能提高30%,實(shí)現(xiàn)AWS所說(shuō)的更高性價(jià)比的輸出。通貨膨脹一直高于平時(shí),激發(fā)了央行加息的沖動(dòng)。希望在繼續(xù)使用AWS的同時(shí)降低云服務(wù)費(fèi)用以更好地應(yīng)對(duì)經(jīng)濟(jì)的組織,可能希望考慮轉(zhuǎn)向Graviton。
亞馬遜表示,已有超過50,000名AWS客戶正在使用Graviton芯片。
最后,作為與Nvidia合作加深的一部分,AWS表示將運(yùn)營(yíng)超過16,000個(gè)Nvidia GH200 Grace Hopper Superchips,其中包含Nvidia GPU和Nvidia的基于Arm的通用處理器。Nvidia自己的研發(fā)團(tuán)隊(duì)和AWS客戶都將能夠利用這一基礎(chǔ)設(shè)施。
自2006年發(fā)布EC2和S3服務(wù)以來(lái),AWS推出了200多種云產(chǎn)品。其中并非所有都取得了成功。有些長(zhǎng)時(shí)間沒有更新,極少數(shù)被停止,使亞馬遜能夠重新分配資源。然而,該公司繼續(xù)投資于Graviton和Trainium計(jì)劃,表明亞馬遜感覺到了需求。
AWS并未宣布帶有Nvidia H200芯片的虛擬機(jī)實(shí)例或依賴其Trainium2硅片的實(shí)例的發(fā)布日期。在未來(lái)幾個(gè)月內(nèi),客戶可以開始測(cè)試Graviton4虛擬機(jī)實(shí)例,然后這些實(shí)例將商業(yè)化。
評(píng)論