<meter id="pryje"><nav id="pryje"><delect id="pryje"></delect></nav></meter>
          <label id="pryje"></label>

          新聞中心

          EEPW首頁 > 智能計(jì)算 > 進(jìn)階指南 > 不用寫程序也能輕松上手─DL Workbench圖形化接口工具(中)

          不用寫程序也能輕松上手─DL Workbench圖形化接口工具(中)

          作者: 時(shí)間:2021-06-01 來源:英特爾 收藏

          工作流程

          本文引用地址:http://www.ex-cimer.com/article/202106/426071.htm

          在開始實(shí)際操作前,先大致說明一下整個(gè)的工作流程,方便后面理解實(shí)際操作項(xiàng)目,如Fig.3所示。

          1622526201794119.jpg

          1622526229833651.jpg

          Fig.3 工作流程圖。(OmniXRI Mar.2021整理制作)

          1.安裝(Install):前面已經(jīng)介紹過,除了可直接一步一步安裝在計(jì)算機(jī)上,也可支持使用Docker映像方式安裝DL Workbench。另外也支持以Dev-Could方式安裝,方便沒有采購硬件的人,先利用Intel提供的云端測試平臺來選擇合適的硬件。

          2.模型(Model):不會設(shè)計(jì)AI模型的人可通過內(nèi)建的模型下載器(Model Downloader)選用Intel已預(yù)訓(xùn)練好參數(shù)的模型(Pre-Trained Open Model Zoo),或者使用公開模型(Public)。當(dāng)然也可支持自己開發(fā)并訓(xùn)練好的模型。不過這里只支持Caffe,MXNet,ONNX,TensorFlow和PyTorch格式的模型轉(zhuǎn)換,最后會都轉(zhuǎn)換成支持的中間表示(Intermediate Representation,IR)格式模型網(wǎng)絡(luò)描述及權(quán)重文件(*.xml,*.bin)。

          3.準(zhǔn)備模型(Prepare Model):由于導(dǎo)入的模型有可能過大,因此可通過OpenVINO內(nèi)建的優(yōu)化工具(Optimizer)協(xié)助處理網(wǎng)絡(luò)架構(gòu)調(diào)整以減少計(jì)算量。另外,一般訓(xùn)練好的模型參數(shù)(網(wǎng)絡(luò)權(quán)重)多半都是使用32位浮點(diǎn)數(shù)(FP32)來表示,為實(shí)現(xiàn)更好的推理效果,這里也可協(xié)助校正(Calibration),將32位浮點(diǎn)數(shù)(FP32)轉(zhuǎn)換到16位浮點(diǎn)數(shù)(FP16),甚至是8位整數(shù)(INT8)。雖然在不同場景下可能會損失幾個(gè)百分點(diǎn)的推理精度,但好處是參數(shù)所需內(nèi)存可縮小至1/2到1/4間,而指令周期則可增加2到3倍。

          4.數(shù)據(jù)集(Dataset):為了測試選用的模型,這里可以導(dǎo)入(Import)自行準(zhǔn)備符合常見的公開數(shù)據(jù)集(如ImageNet,Pascal VOC,MS COCO等)格式的數(shù)據(jù)集?;蛘呤褂蒙?Generate)高斯噪聲變相產(chǎn)生小型數(shù)據(jù)集來輔助簡易性測試,但請注意這種方式僅適用圖像分類模型測試,且因不含標(biāo)注數(shù)據(jù),所以不適用精確度測量及校準(zhǔn)工作。如果手上沒有現(xiàn)成的數(shù)據(jù)集,亦可參考官網(wǎng)[3]說明,下載常見的ImageNet,Pascal VOC,Microsoft COCO等公開數(shù)據(jù)集。

          5.建立基準(zhǔn)(Benchmark):準(zhǔn)備好模型、數(shù)據(jù)集及選用欲執(zhí)行的硬件環(huán)境后,便可根據(jù)平行流(Parallel Streams)及批次數(shù)量(Batch Size)設(shè)置值開始進(jìn)行推理并建立一個(gè)基準(zhǔn)點(diǎn)(如Fig.4a),其內(nèi)容包含產(chǎn)出速度(Throughout,Frame Per Second,FPS)、延遲(Latency,ms)。若不滿意推理結(jié)果,則可重新調(diào)整上述參數(shù),建立多個(gè)基準(zhǔn)點(diǎn),方便后續(xù)比較哪種組合的效果更好。

          6.分析(Analyze):為了更容易理解模型每個(gè)環(huán)節(jié)的工作負(fù)擔(dān),這里提供了許多可視化表格及圖形來幫助理解,包含模型主要執(zhí)行耗時(shí)分布(Execution Time by Layer)圓餅圖(如Fig.4b)、每一層(Layers)的結(jié)構(gòu)、名稱、推理耗時(shí)、輸出精確度(如Fig.4c),模型整體網(wǎng)絡(luò)節(jié)點(diǎn)連接關(guān)系圖,模型優(yōu)化前后(IR及nGraph)的網(wǎng)絡(luò)結(jié)構(gòu)(如Fig.4d),另外還會搭配顏色表示各節(jié)點(diǎn)耗時(shí),方便后續(xù)模型建立者調(diào)整結(jié)構(gòu)及進(jìn)一步的參數(shù)。

          7.部署(Deploy):待反復(fù)步驟5和6找到最佳效能點(diǎn)后,便可打包部署到實(shí)際硬件上執(zhí)行,如此就能輕松完成模型分析、優(yōu)化、部署工作。不過要注意的是這項(xiàng)功能目前僅提供Ubuntu(Linux)使用。


          1622526264870706.jpg

          Fig.4 DL Workbench可視化工具

          (a)輸出速度/延遲時(shí)間基準(zhǔn)點(diǎn)圖

          (b)各層運(yùn)行時(shí)間圓餅圖

          (c)各層信息表

          (d)網(wǎng)絡(luò)結(jié)構(gòu)圖及耗時(shí)表示



          評論


          相關(guān)推薦

          技術(shù)專區(qū)

          關(guān)閉
          看屁屁www成人影院,亚洲人妻成人图片,亚洲精品成人午夜在线,日韩在线 欧美成人 (function(){ var bp = document.createElement('script'); var curProtocol = window.location.protocol.split(':')[0]; if (curProtocol === 'https') { bp.src = 'https://zz.bdstatic.com/linksubmit/push.js'; } else { bp.src = 'http://push.zhanzhang.baidu.com/push.js'; } var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(bp, s); })();