<meter id="pryje"><nav id="pryje"><delect id="pryje"></delect></nav></meter>
          <label id="pryje"></label>

          新聞中心

          EEPW首頁 > 智能計(jì)算 > 業(yè)界動(dòng)態(tài) > NVIDIA擴(kuò)大AI推理優(yōu)勢(shì) 在Arm服務(wù)器上獲突破

          NVIDIA擴(kuò)大AI推理優(yōu)勢(shì) 在Arm服務(wù)器上獲突破

          作者: 時(shí)間:2021-09-27 來源:ZOL 收藏

          根據(jù)近日發(fā)布的基準(zhǔn)測(cè)試結(jié)果,在使用x86及Arm CPU進(jìn)行時(shí)取得了最佳成績(jī)。這是連續(xù)第三次在MLCommons推理測(cè)試中創(chuàng)造性能和能效紀(jì)錄。MLCommons是一家成立于2018年5月的行業(yè)基準(zhǔn)測(cè)試組織。

          本文引用地址:http://www.ex-cimer.com/article/202109/428515.htm

                這場(chǎng)測(cè)試是第一次在Arm系統(tǒng)上進(jìn)行數(shù)據(jù)中心類別的測(cè)試,這使用戶在部署AI這一目前最具變革性的技術(shù)時(shí)有了更多的選擇。

                領(lǐng)先的性能

                在最新一輪測(cè)試中,由 AI平臺(tái)驅(qū)動(dòng)的系統(tǒng)在所有七項(xiàng)推理性能測(cè)試中都名列前茅,這些系統(tǒng)來自NVIDIA和其九家生態(tài)系統(tǒng)合作伙伴,包括阿里巴巴、戴爾科技、富士通、技嘉、慧與、浪潮、聯(lián)想、寧暢和超微。

                NVIDIA是唯一一家在本輪和迄今為止每一輪測(cè)試中取得所有MLPerf測(cè)試結(jié)果的公司。

                推理(Inference)指計(jì)算機(jī)通過運(yùn)行AI軟件來識(shí)別對(duì)象或進(jìn)行預(yù)測(cè)。在這個(gè)過程中,計(jì)算機(jī)使用深度學(xué)習(xí)模型來過濾數(shù)據(jù),進(jìn)而發(fā)現(xiàn)人類所無法捕捉的結(jié)果。

                MLPerf推理基準(zhǔn)測(cè)試基于當(dāng)今最常用的AI工作負(fù)載和場(chǎng)景,涵蓋計(jì)算機(jī)視覺、醫(yī)學(xué)影像、自然語言處理、推薦系統(tǒng)、強(qiáng)化學(xué)習(xí)等。

                因此,無論用戶部署何種AI應(yīng)用,都可以通過NVIDIA創(chuàng)造自己的紀(jì)錄。

                為什么性能十分重要

                隨著AI用例從數(shù)據(jù)中心擴(kuò)展到邊緣和其他領(lǐng)域,AI模型和數(shù)據(jù)集將不斷增加。就是為什么用戶需要既可靠又能靈活部署的性能。

                MLPerf讓用戶有信心做出明智的購買決定。該組織得到了幾十家行業(yè)領(lǐng)導(dǎo)者的支持,包括阿里巴巴、Arm、百度、谷歌、英特爾和NVIDIA,因此這些測(cè)試是透明的和客觀的。

                將Arm靈活應(yīng)用于企業(yè)AI

                憑借在能效性能上的不斷增長(zhǎng)和不斷擴(kuò)展的軟件生態(tài)系統(tǒng),Arm架構(gòu)正在向全球各地的數(shù)據(jù)中心進(jìn)軍。

                最新基準(zhǔn)測(cè)試表明,作為GPU加速的平臺(tái),在工作中,使用Ampere Altra CPU的與具有類似配置的X86服務(wù)器提供的性能幾乎相同。事實(shí)上,在其中的一項(xiàng)測(cè)試中,的性能甚至超過了類似配置的x86系統(tǒng)。

                NVIDIA一直以來支持所有類型的CPU架構(gòu),十分高興地看到Arm在同行評(píng)審的行業(yè)基準(zhǔn)測(cè)試中能夠證明其AI性能。

                Arm高性能計(jì)算和工具高級(jí)總監(jiān)DavidLecomber表示:“作為MLCommons的創(chuàng)始成員,Arm致力于通過創(chuàng)建標(biāo)準(zhǔn)和基準(zhǔn)來更好地應(yīng)對(duì)挑戰(zhàn)并激發(fā)加速計(jì)算行業(yè)的創(chuàng)新。”

                “最新推理結(jié)果表明,Arm CPU和NVIDIA GPU驅(qū)動(dòng)的Arm系統(tǒng)已能夠應(yīng)對(duì)數(shù)據(jù)中心中的各種AI工作負(fù)載。”

                NVIDIA合作伙伴展示其AI性能

                NVIDIA AI技術(shù)得到了廣大和日益擴(kuò)展的生態(tài)系統(tǒng)的支持。

                在最新基準(zhǔn)測(cè)試中,七家OEM廠商共提交了22個(gè)GPU加速的平臺(tái)。

                這些服務(wù)器中的大多數(shù)型號(hào)都是NVIDIA認(rèn)證系統(tǒng),經(jīng)驗(yàn)證可以運(yùn)行多種加速工作負(fù)載,而且其中很多型號(hào)都支持上個(gè)月正式發(fā)布的NVIDIA AI Enterprise軟件。

                參與本輪測(cè)試的合作伙伴包括戴爾科技、富士通、慧與、浪潮、聯(lián)想、寧暢、超微以及云服務(wù)提供商阿里巴巴。

                軟件的力量

                NVIDIA能夠在所有AI用例中取得成功的一個(gè)關(guān)鍵因素是其完整的軟件棧。

                在推理方面,這包括針對(duì)各種用例的預(yù)訓(xùn)練AI模型。NVIDIA TAO Toolkit運(yùn)用遷移學(xué)習(xí)為特定應(yīng)用定制這些模型。

                NVIDIA TensorRT軟件對(duì)AI模型進(jìn)行了優(yōu)化,使其能夠最有效地運(yùn)用內(nèi)存并且實(shí)現(xiàn)更快的運(yùn)行速度。NVIDIA經(jīng)常使用該軟件進(jìn)行MLPerf測(cè)試,該軟件可用于X86和Arm的系統(tǒng)。

                在這些基準(zhǔn)測(cè)試中,NVIDIA還采用了NVIDIA Triton推理服務(wù)器軟件和多實(shí)例GPU(MIG)功能。它們?yōu)樗虚_發(fā)者提供了通常需要專家級(jí)程序員才能實(shí)現(xiàn)的性能。

                隨著該軟件棧的不斷改進(jìn),與四個(gè)月前的MLPerf推理基準(zhǔn)測(cè)試相比,NVIDIA提升了高達(dá)20%的性能和15%的能效。

                NVIDIA在最新測(cè)試中所使用的所有軟件都可以從MLPerf資源庫中獲得,因此任何人都可以重現(xiàn)NVIDIA的基準(zhǔn)測(cè)試結(jié)果。NVIDIA會(huì)陸續(xù)將這些代碼添加到NVIDIA的深度學(xué)習(xí)框架和容器中,用戶可在NVIDIA的GPU應(yīng)用軟件中心NGC上獲得這些框架和容器。

                其作為全棧式AI平臺(tái)的一部分,支持所有主要的處理器架構(gòu),已在最新行業(yè)基準(zhǔn)測(cè)試中得到了驗(yàn)證,并可通過多家合作伙伴獲取,助力客戶應(yīng)對(duì)當(dāng)今的實(shí)際AI工作任務(wù)。



          關(guān)鍵詞: NVIDIA AI推理 Arm服務(wù)器

          評(píng)論


          相關(guān)推薦

          技術(shù)專區(qū)

          關(guān)閉
          看屁屁www成人影院,亚洲人妻成人图片,亚洲精品成人午夜在线,日韩在线 欧美成人 (function(){ var bp = document.createElement('script'); var curProtocol = window.location.protocol.split(':')[0]; if (curProtocol === 'https') { bp.src = 'https://zz.bdstatic.com/linksubmit/push.js'; } else { bp.src = 'http://push.zhanzhang.baidu.com/push.js'; } var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(bp, s); })();