NVIDIA擴(kuò)大AI推理優(yōu)勢(shì) 在Arm服務(wù)器上獲突破

作者：時(shí)間：2021-09-27 來源：ZOL

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對(duì)面交流
  海量資料庫查詢

根據(jù)近日發(fā)布的基準(zhǔn)測(cè)試結(jié)果，NVIDIA在使用x86及Arm CPU進(jìn)行AI推理時(shí)取得了最佳成績(jī)。這是NVIDIA連續(xù)第三次在MLCommons推理測(cè)試中創(chuàng)造性能和能效紀(jì)錄。MLCommons是一家成立于2018年5月的行業(yè)基準(zhǔn)測(cè)試組織。

本文引用地址：http://www.ex-cimer.com/article/202109/428515.htm

這場(chǎng)測(cè)試是第一次在Arm系統(tǒng)上進(jìn)行數(shù)據(jù)中心類別的測(cè)試，這使用戶在部署AI這一目前最具變革性的技術(shù)時(shí)有了更多的選擇。

領(lǐng)先的性能

在最新一輪測(cè)試中，由NVIDIA AI平臺(tái)驅(qū)動(dòng)的系統(tǒng)在所有七項(xiàng)推理性能測(cè)試中都名列前茅，這些系統(tǒng)來自NVIDIA和其九家生態(tài)系統(tǒng)合作伙伴，包括阿里巴巴、戴爾科技、富士通、技嘉、慧與、浪潮、聯(lián)想、寧暢和超微。

NVIDIA是唯一一家在本輪和迄今為止每一輪測(cè)試中取得所有MLPerf測(cè)試結(jié)果的公司。

推理（Inference）指計(jì)算機(jī)通過運(yùn)行AI軟件來識(shí)別對(duì)象或進(jìn)行預(yù)測(cè)。在這個(gè)過程中，計(jì)算機(jī)使用深度學(xué)習(xí)模型來過濾數(shù)據(jù)，進(jìn)而發(fā)現(xiàn)人類所無法捕捉的結(jié)果。

MLPerf推理基準(zhǔn)測(cè)試基于當(dāng)今最常用的AI工作負(fù)載和場(chǎng)景，涵蓋計(jì)算機(jī)視覺、醫(yī)學(xué)影像、自然語言處理、推薦系統(tǒng)、強(qiáng)化學(xué)習(xí)等。

因此，無論用戶部署何種AI應(yīng)用，都可以通過NVIDIA創(chuàng)造自己的紀(jì)錄。

為什么性能十分重要

隨著AI用例從數(shù)據(jù)中心擴(kuò)展到邊緣和其他領(lǐng)域，AI模型和數(shù)據(jù)集將不斷增加。就是為什么用戶需要既可靠又能靈活部署的性能。

MLPerf讓用戶有信心做出明智的購買決定。該組織得到了幾十家行業(yè)領(lǐng)導(dǎo)者的支持，包括阿里巴巴、Arm、百度、谷歌、英特爾和NVIDIA，因此這些測(cè)試是透明的和客觀的。

將Arm靈活應(yīng)用于企業(yè)AI

憑借在能效性能上的不斷增長(zhǎng)和不斷擴(kuò)展的軟件生態(tài)系統(tǒng)，Arm架構(gòu)正在向全球各地的數(shù)據(jù)中心進(jìn)軍。

最新基準(zhǔn)測(cè)試表明，作為GPU加速的平臺(tái)，在AI推理工作中，使用Ampere Altra CPU的Arm服務(wù)器與具有類似配置的X86服務(wù)器提供的性能幾乎相同。事實(shí)上，在其中的一項(xiàng)測(cè)試中，Arm服務(wù)器的性能甚至超過了類似配置的x86系統(tǒng)。

NVIDIA一直以來支持所有類型的CPU架構(gòu)，十分高興地看到Arm在同行評(píng)審的行業(yè)基準(zhǔn)測(cè)試中能夠證明其AI性能。

Arm高性能計(jì)算和工具高級(jí)總監(jiān)DavidLecomber表示：“作為MLCommons的創(chuàng)始成員，Arm致力于通過創(chuàng)建標(biāo)準(zhǔn)和基準(zhǔn)來更好地應(yīng)對(duì)挑戰(zhàn)并激發(fā)加速計(jì)算行業(yè)的創(chuàng)新。”

“最新推理結(jié)果表明，Arm CPU和NVIDIA GPU驅(qū)動(dòng)的Arm系統(tǒng)已能夠應(yīng)對(duì)數(shù)據(jù)中心中的各種AI工作負(fù)載。”

NVIDIA合作伙伴展示其AI性能

NVIDIA AI技術(shù)得到了廣大和日益擴(kuò)展的生態(tài)系統(tǒng)的支持。

在最新基準(zhǔn)測(cè)試中，七家OEM廠商共提交了22個(gè)GPU加速的平臺(tái)。

這些服務(wù)器中的大多數(shù)型號(hào)都是NVIDIA認(rèn)證系統(tǒng)，經(jīng)驗(yàn)證可以運(yùn)行多種加速工作負(fù)載，而且其中很多型號(hào)都支持上個(gè)月正式發(fā)布的NVIDIA AI Enterprise軟件。

參與本輪測(cè)試的合作伙伴包括戴爾科技、富士通、慧與、浪潮、聯(lián)想、寧暢、超微以及云服務(wù)提供商阿里巴巴。

軟件的力量

NVIDIA能夠在所有AI用例中取得成功的一個(gè)關(guān)鍵因素是其完整的軟件棧。

在推理方面，這包括針對(duì)各種用例的預(yù)訓(xùn)練AI模型。NVIDIA TAO Toolkit運(yùn)用遷移學(xué)習(xí)為特定應(yīng)用定制這些模型。

NVIDIA TensorRT軟件對(duì)AI模型進(jìn)行了優(yōu)化，使其能夠最有效地運(yùn)用內(nèi)存并且實(shí)現(xiàn)更快的運(yùn)行速度。NVIDIA經(jīng)常使用該軟件進(jìn)行MLPerf測(cè)試，該軟件可用于X86和Arm的系統(tǒng)。

在這些基準(zhǔn)測(cè)試中，NVIDIA還采用了NVIDIA Triton推理服務(wù)器軟件和多實(shí)例GPU（MIG）功能。它們?yōu)樗虚_發(fā)者提供了通常需要專家級(jí)程序員才能實(shí)現(xiàn)的性能。

隨著該軟件棧的不斷改進(jìn)，與四個(gè)月前的MLPerf推理基準(zhǔn)測(cè)試相比，NVIDIA提升了高達(dá)20%的性能和15%的能效。

NVIDIA在最新測(cè)試中所使用的所有軟件都可以從MLPerf資源庫中獲得，因此任何人都可以重現(xiàn)NVIDIA的基準(zhǔn)測(cè)試結(jié)果。NVIDIA會(huì)陸續(xù)將這些代碼添加到NVIDIA的深度學(xué)習(xí)框架和容器中，用戶可在NVIDIA的GPU應(yīng)用軟件中心NGC上獲得這些框架和容器。

其作為全棧式AI平臺(tái)的一部分，支持所有主要的處理器架構(gòu)，已在最新行業(yè)基準(zhǔn)測(cè)試中得到了驗(yàn)證，并可通過多家合作伙伴獲取，助力客戶應(yīng)對(duì)當(dāng)今的實(shí)際AI工作任務(wù)。

新聞中心

NVIDIA擴(kuò)大AI推理優(yōu)勢(shì) 在Arm服務(wù)器上獲突破

評(píng)論

相關(guān)推薦

技術(shù)專區(qū)