NEC開始打造日本國內(nèi)規(guī)模最大的AI研究超級計算機
為了在全球人工智能(AI)開發(fā)的激烈競爭中擁有更大的優(yōu)勢,NEC開始打造用于AI研究的超級計算機,預(yù)計將于2023年3月啟動日本國內(nèi)企業(yè)中規(guī)模最大(注1)的超過580PFLOPS(注2)的系統(tǒng)。NEC的數(shù)百名AI研究人員已經(jīng)開始使用一部分系統(tǒng)(100PFLOPS),再加上今后將構(gòu)建480PFLPOS系統(tǒng),基于國內(nèi)最頂尖的AI專業(yè)研發(fā)環(huán)境,將有助于更高級的先進AI的快速開發(fā)。未來,NEC的目標(biāo)是通過與客戶及合作伙伴的共創(chuàng),創(chuàng)造先進的社會價值,成為AI研究的卓越中心。
本文引用地址:http://www.ex-cimer.com/article/202205/434372.htm近年來,作為AI核心技術(shù)的深度學(xué)習(xí)飛速發(fā)展,應(yīng)用領(lǐng)域更加廣泛。深度學(xué)習(xí)的開發(fā)所需的運算量也在不斷擴大。為了推進整個社會的數(shù)字化轉(zhuǎn)型,需要大規(guī)模的計算資源,以便可以迅速創(chuàng)造出多種多樣的先進人工智能。
AI超級計算機機房效果圖
NEC將投資數(shù)十億日元,來設(shè)計和打造可供公司數(shù)百名AI研究人員使用的AI超級計算機。該系統(tǒng)由116臺每節(jié)點搭載8個高端GPU“NVIDIA A100 80GB Tensor核心GPU”的最新GPU服務(wù)器(Super Micro公司產(chǎn)品)以及搭載16PB以上EXAScaler高性能并列文件系統(tǒng)(DataDirect Networks公司產(chǎn)品)的存儲應(yīng)用構(gòu)成。理論上的處理性能將超過580 PFLOPS,幾分鐘就可以學(xué)習(xí)上千萬張圖像。此外,其網(wǎng)絡(luò)采用高速以太網(wǎng)交換機“NVIDIA Spectrum SN3700”,以200GbE連接所有服務(wù)器,通過RoCE(RDMA over Converged Ethernet,注3)v2進行超高速、低時延通信,實現(xiàn)高速分布式學(xué)習(xí)。
NEC以開源容器管理技術(shù)Kubernetes(注4)為核心,通過獨創(chuàng)的構(gòu)建技術(shù)將尖端硬件和軟件群緊密結(jié)合,實現(xiàn)高性能且高便利性的系統(tǒng)。
NEC致力于開發(fā)可實時、動態(tài)地應(yīng)對VUCA(注5)時代社會課題的先進人工智能,提高社會的數(shù)字化轉(zhuǎn)型、人類活動的智力和身體的創(chuàng)造力及生產(chǎn)力,實現(xiàn)可持續(xù)發(fā)展的地球環(huán)境。為此,NEC將利用該系統(tǒng)構(gòu)建AI研究的卓越中心,匯聚客戶、合作伙伴以及NEC的AI研究人員,共同創(chuàng)造先進的社會價值。NEC在2025年中期經(jīng)營計劃中提出的重點業(yè)務(wù)——電子政務(wù)/數(shù)字金融、全球5G、核心DX等各領(lǐng)域創(chuàng)造安全、安心、公平、高效的社會價值的同時,還將創(chuàng)造出實現(xiàn)未來藍圖NEC 2030 VISION的下一個支柱型成長業(yè)務(wù)。
NVIDIA日本代表兼美國總公司副社長大崎真孝先生表示:“在先進人工智能研發(fā)中,計算資源是競爭力的源泉。通過與NEC的AI超級計算機所采用的NVIDIA GPU進行互聯(lián),可以加速大規(guī)模的計算處理。從事社會最重要課題研究的研究人員通過利用這款最先進的AI超級計算機,相信一定能推動人工智能在社會上的應(yīng)用?!?/p>
NEC執(zhí)行役員兼研發(fā)部門負責(zé)人山田昭雄先生表示:“NEC擁有各種先進人工智能技術(shù),包括世界最高水平的生物識別技術(shù)、圖像/影像識別、數(shù)據(jù)分析、控制技術(shù)等。我們將通過打造日本國內(nèi)企業(yè)中規(guī)模最大的AI超級計算機來提升競爭優(yōu)勢,通過與客戶及合作伙伴的共創(chuàng)來創(chuàng)造出先進的社會價值。”
(注1)根據(jù)截至2022年4月18日的NEC調(diào)查。
(注2)是表示計算機處理性能的單位之一。Peta表示1,000兆,表示在1PFLOPS下每秒可以進行1,000兆次的浮點運算。
(注3)實現(xiàn)在以太網(wǎng)的低時延、高吞吐量通信的Remote Direct Memory Access(直接存儲器訪問)技術(shù)。
(注4)容器編排的平臺,用于自動部署和管理容器化應(yīng)用。
(注5)V(Volatility:波動性)、U(Uncertainty:不確定性)、C(Complexity:復(fù)雜性)、A(Ambiguity:曖昧性)的首字母組合詞。表示一種前景不明朗、很難預(yù)測未來的狀態(tài)。
評論