亞馬遜云科技與英偉達(dá)擴(kuò)展合作 持續(xù)推進(jìn)生成式AI創(chuàng)新
亞馬遜云科技將提供基于NVIDIA Grace Blackwell GPU的Amazon EC2實(shí)例和NVIDIA DGX Cloud,以加速構(gòu)建及運(yùn)行數(shù)萬(wàn)億參數(shù)的規(guī)模大型語(yǔ)言模型的性能
本文引用地址:http://www.ex-cimer.com/article/202403/456563.htmAmazon Nitro系統(tǒng)、Elastic Fabric Adapter加密,以及與Blackwell加密集成的Amazon KMS密鑰管理服務(wù),為客戶提供從訓(xùn)練數(shù)據(jù)到模型權(quán)重的端到端控制,為客戶在亞馬遜云科技上的AI應(yīng)用提供更強(qiáng)的安全保障
“Ceiba項(xiàng)目”——一臺(tái)完全依托亞馬遜云科技搭建、采用DGX Cloud的AI超級(jí)計(jì)算機(jī),搭載了20,736顆GB200 Superchips芯片,能夠提供414 exaflops的處理能力,專為NVIDIA自身的AI研發(fā)工作設(shè)計(jì)
Amazon SageMaker與NVIDIA NIM推理微服務(wù)集成,以幫助客戶進(jìn)一步優(yōu)化在GPU上運(yùn)行基礎(chǔ)模型的性價(jià)比
亞馬遜云科技與英偉達(dá)之間的合作加速了在醫(yī)療保健和生命科學(xué)領(lǐng)域的AI創(chuàng)新
北京——2024年3月20日,亞馬遜云科技和英偉達(dá)宣布,英偉達(dá)在2024年GTC大會(huì)上推出的新一代NVIDIA Blackwell GPU平臺(tái)即將登陸亞馬遜云科技。亞馬遜云科技將提供NVIDIA GB200 Grace Blackwell Superchip和 B100 Tensor Core GPU,這一舉措延續(xù)了雙方長(zhǎng)期的戰(zhàn)略合作伙伴關(guān)系,旨在為客戶提供安全、先進(jìn)的基礎(chǔ)設(shè)施、軟件及服務(wù),助力客戶開(kāi)啟新一代生成式AI的能力。
英偉達(dá)與亞馬遜云科技繼續(xù)匯聚各自的領(lǐng)先技術(shù),包括具備英偉達(dá)最新多節(jié)點(diǎn)系統(tǒng)的下一代NVIDIA Blackwell平臺(tái)和AI軟件,以及亞馬遜云科技的Nitro系統(tǒng)、具備領(lǐng)先安全性的Amazon KMS密鑰管理服務(wù)、千萬(wàn)億比特級(jí)的Elastic Fabric Adapter(EFA)網(wǎng)絡(luò)和Amazon EC2 UltraCluster超大規(guī)模集群等技術(shù)?;谏鲜黾夹g(shù)打造的基礎(chǔ)設(shè)施和工具,使客戶能夠在Amazon EC2上以更快速度、更大規(guī)模、更低成本地對(duì)其構(gòu)建和運(yùn)行數(shù)萬(wàn)億參數(shù)的大型語(yǔ)言模型(LLMs)進(jìn)行實(shí)時(shí)推理,性能相較于配備前一代英偉達(dá)GPU的EC2實(shí)例有顯著改進(jìn)。
亞馬遜云科技首席執(zhí)行官Adam Selipsky表示:“我們雙方的深入合作可以追溯到13年前,當(dāng)時(shí)我們共同推出了世界上第一個(gè)亞馬遜云科技上的GPU云實(shí)例,而今天我們?yōu)榭蛻籼峁┝俗顝V泛的英偉達(dá)GPU解決方案。英偉達(dá)的下一代Grace Blackwell處理器是生成式AI和GPU計(jì)算領(lǐng)域的標(biāo)志性事件。當(dāng)結(jié)合亞馬遜云科技強(qiáng)大的EFA網(wǎng)絡(luò)、Amazon EC2 UltraClusters的超大規(guī)模集群功能,以及我們獨(dú)有的Amazon Nitro高級(jí)虛擬化系統(tǒng)及其安全功能時(shí),我們就能夠使客戶更快、更大規(guī)模且更安全地構(gòu)建和運(yùn)行具有數(shù)萬(wàn)億參數(shù)的大型語(yǔ)言模型。”
英偉達(dá)創(chuàng)始人兼首席執(zhí)行官黃仁勛表示:“人工智能正在以前所未有的速度推動(dòng)新應(yīng)用、新商業(yè)模式和跨行業(yè)的創(chuàng)新。我們與亞馬遜云科技的合作正在加速新的生成式AI能力的發(fā)展,并為客戶提供前所未有的計(jì)算能力,以開(kāi)創(chuàng)無(wú)限可能?!?/p>
亞馬遜云科技與英偉達(dá)的新合作將顯著加快超萬(wàn)億參數(shù)前沿大型語(yǔ)言模型的訓(xùn)練
亞馬遜云科技將提供配置GB200 NVL72的英偉達(dá)Blackwell平臺(tái),它配備72顆Blackwell GPU和36顆Grace CPU,通過(guò)第五代NVIDIA NVLink?互連。當(dāng)與亞馬遜云科技強(qiáng)大的EFA網(wǎng)絡(luò)、Amazon Nitro高級(jí)虛擬化系統(tǒng)和Amazon EC2 UltraClusters超大規(guī)模集群等技術(shù)結(jié)合時(shí),客戶能夠輕松擴(kuò)展至數(shù)千個(gè)GB200 Superchips。英偉達(dá)Blackwell在亞馬遜云科技上的應(yīng)用,使得該平臺(tái)在應(yīng)對(duì)資源密集型和數(shù)萬(wàn)億參數(shù)語(yǔ)言模型等推理工作負(fù)載加速方面實(shí)現(xiàn)了巨大飛躍。
基于此前搭載英偉達(dá)H100的Amazon EC2 P5實(shí)例的成功(客戶短期使用這些實(shí)例可通過(guò)Amazon EC2 Capacity Blocks for ML功能),亞馬遜云科技計(jì)劃提供配備B100 GPUs新的Amazon EC2實(shí)例,并支持在Amazon EC2 UltraClusters中部署以加速超大規(guī)模生成式AI的訓(xùn)練和推理。GB200也將在NVIDIA DGX? Cloud上可用,這是一個(gè)在亞馬遜云科技上雙方共同開(kāi)發(fā)的AI平臺(tái),為企業(yè)開(kāi)發(fā)者提供了構(gòu)建和部署先進(jìn)生成式AI模型所需的專用基礎(chǔ)設(shè)施和軟件。在亞馬遜云科技上推出的基于Blackwell的DGX Cloud實(shí)例將加速前沿生成式AI和超過(guò)1萬(wàn)億參數(shù)的大語(yǔ)言模型的開(kāi)發(fā)。
提升AI安全性:亞馬遜云科技Nitro系統(tǒng)、Amazon KMS、EFA加密與Blackwell加密技術(shù)緊密集成
隨著AI技術(shù)應(yīng)用越來(lái)越廣泛,企業(yè)需要確信,在整個(gè)訓(xùn)練流程中,他們的數(shù)據(jù)都得到了安全的處理。保護(hù)模型權(quán)重的安全至關(guān)重要,模型權(quán)重是模型在訓(xùn)練過(guò)程中學(xué)習(xí)到的參數(shù),對(duì)于模型做出預(yù)測(cè)的能力至關(guān)重要。確保模型權(quán)重的安全對(duì)保護(hù)客戶的知識(shí)產(chǎn)權(quán)、防止模型被篡改以及維護(hù)模型的完整性都是非常重要的。
亞馬遜云科技的AI基礎(chǔ)設(shè)施和服務(wù)已經(jīng)實(shí)現(xiàn)了安全特性,使客戶能夠控制其數(shù)據(jù),并確保數(shù)據(jù)不會(huì)與第三方模型提供者共享。Amazon Nitro系統(tǒng)和英偉達(dá)GB200的結(jié)合將能夠阻止未授權(quán)個(gè)體訪問(wèn)模型權(quán)重,從而把AI安全性提升到新的高度,。GB200支持對(duì)GPU之間NVLink連接進(jìn)行物理加密,以及對(duì)Grace CPU到Blackwell GPU的數(shù)據(jù)傳輸進(jìn)行加密,同時(shí)EFA也能夠?qū)Ψ?wù)器之間的分布式訓(xùn)練和推理過(guò)程的數(shù)據(jù)進(jìn)行加密。GB200還將受益于Amazon Nitro系統(tǒng),該系統(tǒng)將主機(jī)CPU/GPU的I/O功能卸載至專門的硬件上,以提供更加一致的性能,其增強(qiáng)的安全性可以在客戶端和云端全程保護(hù)客戶的代碼和數(shù)據(jù)在處理過(guò)程中的安全。這一獨(dú)有的功能已經(jīng)獲得了領(lǐng)先的網(wǎng)絡(luò)安全公司 NCC Group 的獨(dú)立驗(yàn)證。
通過(guò)在Amazon EC2上使用GB200,亞馬遜云科技將使客戶能夠使用Amazon Nitro Enclaves和Amazon KMS,在其EC2實(shí)例旁創(chuàng)建一個(gè)可信執(zhí)行環(huán)境。Amazon Nitro Enclaves允許客戶使用Amazon KMS控制下的密鑰來(lái)加密他們的訓(xùn)練數(shù)據(jù)和權(quán)重。從GB200實(shí)例內(nèi)部可以加載安全區(qū)(enclave),并且可以直接與GB200 Superchip通信。這使得Amazon KMS能夠以加密安全的方式直接與安全區(qū)通信,并直接傳遞密鑰材料。然后,安全區(qū)可以將該材料傳遞給GB200,這樣做能夠保護(hù)客戶實(shí)例中的數(shù)據(jù),防止亞馬遜云科技操作人員訪問(wèn)密鑰或解密訓(xùn)練數(shù)據(jù)或模型權(quán)重,從而賦予客戶對(duì)其數(shù)據(jù)的無(wú)與倫比的控制權(quán)。
“Ceiba項(xiàng)目”利用Blackwell在亞馬遜云科技上推動(dòng)英偉達(dá)未來(lái)生成式AI創(chuàng)新
在2023年亞馬遜云科技re:Invent大會(huì)上宣布的“Ceiba項(xiàng)目”,是英偉達(dá)與亞馬遜云科技合作建造的世界上最快的AI超級(jí)計(jì)算機(jī)之一。這臺(tái)專為英偉達(dá)自身的研究和開(kāi)發(fā)而設(shè)的超級(jí)計(jì)算機(jī),獨(dú)家托管在亞馬遜云科技上。這臺(tái)首創(chuàng)的擁有20,736顆GB200 GPU的超級(jí)計(jì)算機(jī),采用新型NVIDIA GB200 NVL72配置構(gòu)建,其特有的第五代NVLink將連接10,368顆NVIDIA Grace CPU。系統(tǒng)通過(guò)亞馬遜云科技第四代EFA網(wǎng)絡(luò)進(jìn)行擴(kuò)展,為每個(gè)Superchip提供高達(dá)800 Gbps的低延遲、高帶寬網(wǎng)絡(luò)吞吐量——能夠處理高達(dá)414 exaflops的AI計(jì)算量,與之前計(jì)劃在Hopper架構(gòu)上構(gòu)建Ceiba相比,性能提升了6倍。英偉達(dá)的研發(fā)團(tuán)隊(duì)將利用Ceiba推進(jìn)大語(yǔ)言模型、圖形(圖像/視頻/3D生成)與仿真、數(shù)字生物學(xué)、機(jī)器人技術(shù)、自動(dòng)駕駛汽車、NVIDIA Earth-2氣候預(yù)測(cè)等領(lǐng)域的AI技術(shù),以幫助英偉達(dá)推動(dòng)未來(lái)生成式AI的創(chuàng)新。
亞馬遜云科技與英偉達(dá)的合作推動(dòng)生成式人工智能應(yīng)用開(kāi)發(fā)及醫(yī)療健康與生命科學(xué)領(lǐng)域的應(yīng)用進(jìn)展。
亞馬遜云科技與英偉達(dá)聯(lián)手,通過(guò)Amazon SageMaker與NVIDIA NIM推理微服務(wù)的整合,提供了高性能、低成本的生成式AI推理解決方案,該服務(wù)作為NVIDIA AI企業(yè)版的一部分提供??蛻艨梢岳眠@一組合在Amazon SageMaker中快速部署和運(yùn)行已預(yù)編譯且對(duì)NVIDIA GPU進(jìn)行優(yōu)化的基礎(chǔ)模型,縮短生成式AI應(yīng)用的推出時(shí)間。
亞馬遜云科技與英偉達(dá)還在利用計(jì)算機(jī)輔助的藥物發(fā)現(xiàn)領(lǐng)域進(jìn)行合作拓展,推出了新的NVIDIA BioNeMo?基礎(chǔ)模型,用于生成化學(xué)、蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè),以及理解藥物分子與目標(biāo)的相互作用。這些新模型將很快在Amazon HealthOmics上提供,這是一個(gè)專為幫助醫(yī)療保健和生命科學(xué)組織存儲(chǔ)、查詢和分析基因組、轉(zhuǎn)錄組及其他組學(xué)數(shù)據(jù)而設(shè)計(jì)的專用服務(wù)。
Amazon HealthOmics和英偉達(dá)醫(yī)療保健團(tuán)隊(duì)還合作推出生成式AI微服務(wù),以推進(jìn)藥物發(fā)現(xiàn)、醫(yī)療技術(shù)和數(shù)字健康領(lǐng)域的發(fā)展,該服務(wù)提供一個(gè)新的GPU加速的云端服務(wù)目錄,涵蓋生物學(xué)、化學(xué)、成像和醫(yī)療保健數(shù)據(jù),以便醫(yī)療企業(yè)能夠在亞馬遜云科技上利用生成式AI的最新成果。
關(guān)于亞馬遜云科技
自2006年以來(lái),亞馬遜云科技(Amazon Web Services)一直以技術(shù)創(chuàng)新、服務(wù)豐富、應(yīng)用廣泛而享譽(yù)業(yè)界。亞馬遜云科技一直不斷擴(kuò)展其服務(wù)組合以支持幾乎云上任意工作負(fù)載,目前提供超過(guò)240項(xiàng)全功能的服務(wù),涵蓋計(jì)算、存儲(chǔ)、數(shù)據(jù)庫(kù)、網(wǎng)絡(luò)、數(shù)據(jù)分析、機(jī)器學(xué)習(xí)與人工智能、物聯(lián)網(wǎng)、移動(dòng)、安全、混合云、媒體,以及應(yīng)用開(kāi)發(fā)、部署與管理等方面;基礎(chǔ)設(shè)施遍及33個(gè)地理區(qū)域的105個(gè)可用區(qū),并已公布計(jì)劃在馬來(lái)西亞、墨西哥、新西蘭、沙特阿拉伯和泰國(guó)等新建6個(gè)區(qū)域、18個(gè)可用區(qū)。全球數(shù)百萬(wàn)客戶,包括發(fā)展迅速的初創(chuàng)公司、大型企業(yè)和領(lǐng)先的政府機(jī)構(gòu),都信賴亞馬遜云科技,通過(guò)亞馬遜云科技的服務(wù)支撐其基礎(chǔ)設(shè)施,提高敏捷性,降低成本。要了解更多關(guān)于亞馬遜云科技的信息,請(qǐng)?jiān)L問(wèn):www.amazonaws.cn。
評(píng)論