NVIDIA發(fā)表新款A(yù)I平臺 將HPC數(shù)據(jù)中心停機(jī)時(shí)間降到最低
NVIDIA今日宣布將推出 NVIDIA Mellanox UFM Cyber-AI 平臺,這款平臺將利用搭載人工智能 (AI) 的分析功能來偵測安全威脅和運(yùn)作問題,以及預(yù)測網(wǎng)絡(luò)故障等情況,進(jìn)而將 InfiniBand 數(shù)據(jù)中心的停機(jī)時(shí)間降到最低。
NVIDIA指出,過去使用 UFM 平臺產(chǎn)品組合來管理 InfiniBand 系統(tǒng),已有近十年的時(shí)間,而這款最新產(chǎn)品加入 AI 技術(shù),運(yùn)用實(shí)時(shí)與歷史遙測及作業(yè)負(fù)載數(shù)據(jù),學(xué)習(xí)數(shù)據(jù)中心的運(yùn)行節(jié)奏和網(wǎng)絡(luò)工作量處理模式。此平臺在這個(gè)基礎(chǔ)上追蹤系統(tǒng)健全及網(wǎng)絡(luò)修改情況,以及偵測效能表現(xiàn)下降、使用情況和配置文件的變化情形。
新平臺會提醒管理員系統(tǒng)與應(yīng)用程序的異常行為,以及潛在的系統(tǒng)故障和威脅,并且執(zhí)行修正。如果發(fā)現(xiàn)有黑客企圖進(jìn)入系統(tǒng),以運(yùn)行不受歡迎的應(yīng)用程序(例如加密貨幣挖礦等情況)等安全情況,也會通知管理員。如此便降低了數(shù)據(jù)中心的停機(jī)時(shí)間,ITIC 指出通常停機(jī)一小時(shí)的成本高達(dá) 30 萬美元。
NVIDIA Mellanox 網(wǎng)絡(luò)部門營銷資深副總裁 Gilad Shainer 表示:「UFM Cyber-AI 平臺可以判斷數(shù)據(jù)中心獨(dú)特的生命征象,用它們來辨識效能下降、零組件故障和異常使用模式。它讓系統(tǒng)管理員能夠快速偵測和因應(yīng)潛在的安全威脅,解決即將出現(xiàn)的故障情況,進(jìn)而節(jié)省成本與確保提供客戶一致的服務(wù)。」
澳洲國家計(jì)算基礎(chǔ)設(shè)施(NCI)副主任(服務(wù)和技術(shù))Allan Williams說:「 NCI在國家研究領(lǐng)域中起著舉足輕重的作用。我們的超級運(yùn)算基礎(chǔ)架構(gòu)可為5,000名研究人員提供服務(wù),服務(wù)重要的國家和全球活動。 UFM使我們能夠有效地管理超級計(jì)算機(jī)并優(yōu)化效能。我們期待利用UFM Cyber-AI的新功能來進(jìn)一步提高我們的超級運(yùn)算利用率并提高投資回報(bào)率?!?/p>
美國俄亥俄州超級計(jì)算機(jī)中心副主任 Douglas Johnson 說:「我們的 InfiniBand 數(shù)據(jù)中心多年來一直在使用 UFM 平臺,UFM 加上 Mellanox 網(wǎng)絡(luò)團(tuán)隊(duì)的專業(yè)長才是我們管理網(wǎng)絡(luò)與維持網(wǎng)絡(luò)穩(wěn)定運(yùn)作的基本要素。我們見到 UFM Cyber-AI 平臺有著無比的優(yōu)點(diǎn)。
評論