<meter id="pryje"><nav id="pryje"><delect id="pryje"></delect></nav></meter>
          <label id="pryje"></label>

          新聞中心

          EEPW首頁 > 嵌入式系統(tǒng) > 設計應用 > 在米爾FPGA上實現Tiny YOLO V4,助力AIoT應用

          在米爾FPGA上實現Tiny YOLO V4,助力AIoT應用

          —— 后摩爾時代的創(chuàng)新
          作者: 時間:2024-11-22 來源:EEPW 收藏
          編者按:學習如何在 MYIR 的 ZU3EG FPGA 開發(fā)板上部署 Tiny YOLO v4,對比 FPGA、GPU、CPU 的性能,助力 AIoT 邊緣計算應用。


          本文引用地址:http://www.ex-cimer.com/article/202411/464883.htm

          1732268119329936.jpeg

          一、為什么選擇FPGA:應對7nm制程與AI限制

          在全球半導體制程限制和高端 GPU 受限的大環(huán)境下,FPGA 成為了中國企業(yè)發(fā)展的重要路徑之一。它可支持靈活的 AIoT 應用,其靈活性與可編程性使其可以在國內成熟的 28nm 工藝甚至更低節(jié)點的制程下實現高效的硬件加速。

          憑借其可重構架構為 AI 和計算密集型任務提供了支持,同時避免了 7nm 工藝對國產芯片設計的制約。通過在 上部署 Tiny YOLO v4,我們可以為智能家居、智慧城市等 AIoT 應用提供高效的解決方案。

          1732268141326366.png

          1732268160274210.png

          CPU GPU FPGA架構對比

          二、了解Tiny YOLO模型及其適用性

          YOLO(You Only Look Once)是一種實時物體檢測模型,它通過一次性掃描整個圖像,實現高效的對象識別。

          而其簡化版 Tiny YOLO v4 更適合嵌入式設備,具有較少的層數和參數。其輕量化特性更適合在資源受限的設備上運行,尤其在低功耗、實時檢測的邊緣計算設備中表現出色。

          相比傳統(tǒng) GPU,FPGA 能在小面積和低功耗下實現類似的推理性能,非常契合 AIoT 應用。像 這樣的 FPGA ,通過底板和豐富接口的載板設計,非常適合高效的嵌入式低功耗數據處理。

          1732268181293638.png

          Yolo V4網絡結構圖

          1732268202159337.png

          Tiny Yolo V4網絡結構圖

          (通過優(yōu)化網絡結構和參數,保持較高檢測精度的同時,降低模型的計算量和內存占用)

          三、獲取數據集和模型

          可下載開源訓練集或預訓練模型。為了確保兼容性,建議將模型轉換為 ONNX 格式,以便后續(xù)能在 FPGA 上完成優(yōu)化。

          1.下載Tiny YOLO v4模型:從 Darknet 的 GitHub 倉庫 獲取 Tiny YOLO 的預訓練權重,或者在 COCO 等數據集上自行訓練模型。自定義的模型適用于特定應用場景(如車輛檢測、人臉檢測等)。

          2.數據準備:若要自定義模型,可使用 LabelImg 等工具對數據集進行標注,將數據轉為 YOLO 格式。之后,可將 YOLO 格式轉換為 ONNX 格式,以便兼容 FPGA 優(yōu)化工具鏈。

          1732268228212265.png

          Tiny YOLO在Darknet上訓練的截圖

          四、通過Vivado HLS為FPGA準備模型

          要將模型部署到 FPGA,需要將神經網絡操作轉換為硬件級描述。使用 Xilinx 的 Vitis HLS(高級綜合)可以將 Tiny YOLO v4 的 C++ 模型代碼的轉化為 Verilog RTL(寄存器傳輸級)代碼,從而將模型從軟件世界帶入硬件實現。

          詳細步驟:

          1.模型層映射和優(yōu)化:

          ●   將YOLO的每一層(如卷積層、池化層)映射為硬件友好的 C/C++ 結構。例如,將卷積映射為乘累加(MAC)數組,通過流水線實現并行化。

          2.算子加速與指令優(yōu)化:

          ●   流水線(Pipelining)利用流水線來處理多項操作并行,減少延遲。

          ●   循環(huán)展開(Loop Unrolling):展開循環(huán),以每周期處理更多數據,尤其在卷積操作中有效。

          ●   設置 DATAFLOW 指令,使層間獨立處理。

          3.量化與位寬調整:

          ●   將激活值和權重量化為定點精度(例如 INT8),而非浮點數。這在維持準確度的同時顯著降低計算量,尤其適合 FPGA 的固定點運算支持。

          1732268267296858.png

          Tiny YOLO模型在Vivado HLS中的層層轉化流程圖

          五、使用Vivado綜合與部署Verilog到的ZU3EG FPGA

          當HLS生成的RTL代碼準備就緒后,可以使用Vivado將模型部署到FPGA。

          1.Vivado中的設置:

          ●   將HLS輸出的RTL文件導入Vivado。

          ●   在Vivado中創(chuàng)建模塊設計,包括連接AXI接口與ZU3EG的ARM核連接。

          2.I/O 約束與時序:

          ●   定義 FPGA 的 I/O 引腳約束,以匹配 ZU3EG 板的特定管腳配置。配置時鐘約束以滿足合適的數據速率(如視頻數據 100-200 MHz)。

          ●   進行時序分析,確保延遲和響應速度達到實時要求。

          3.生成比特流并下載到 ZU3EG:

          ●   生成的比特流可以直接通過 JTAG 或以太網接口下載到 ZU3EG。

          1732268298737443.png

          將Tiny YOLO處理模塊連接到米爾ZU3EG開發(fā)板的外設和接口

          六、在FPGA上測試并運行推理

          現在Tiny YOLO已部署,可以驗證其實時對象檢測性能。

          1.數據采集:

          ●   通過連接的相機模塊捕捉圖像或視頻幀,或者使用存儲的測試視頻。

          ●   使用ZU3EG的ARM核上的OpenCV對幀進行預處理,再將它們傳入FPGA預處理后進行推理。

          2.后處理與顯示:

          ●   模型檢測對象后,輸出邊框和類別標簽。使用 OpenCV 將邊框映射回原始幀,并在每個檢測到的對象周圍顯示類別和置信度。

          3.性能測試:

          ●   測量幀速率(FPS)和檢測準確度。微調量化位寬或數據流參數,以優(yōu)化實時需求。

          1732268320392519.png

          Tiny YOLO模型在ZU3EG上顯示檢測結果的實時輸出,視頻幀中標注了檢測到的對象

          七、性能優(yōu)化與調試技巧

          為提高性能,可以進行以下調整:

          ●   內存訪問:設計數據存儲方式,最大限度利用緩存并減少數據傳輸,降低內存瓶頸。

          ●   降低延遲:重新評估關鍵路徑延遲。若延遲過高,調整Vitis HLS中的流水線深度,并驗證層間的數據依賴性。

          ●   量化改進:嘗試INT8量化。Xilinx的Vitis AI可幫助微調量化參數,以平衡準確性與速度。

          1732268348876567.png

          不同優(yōu)化配置對資源使用的影響

          1732268370701548.png

          圖 米爾MYC-CZU3EG/4EV/5EV-V2核心板及開發(fā)板

          在MYIR 的 ZU3EG 開發(fā)平臺上提供了一種高效的解決方案。利用 FPGA 獨特的靈活性和低功耗優(yōu)勢,助力未來 AIoT 設備的普及和智能升級。

          關注米爾電子公眾號,后臺回復FPGA,獲取完整Tiny Yolo V4教程。

          1732268398169332.png



          評論


          相關推薦

          技術專區(qū)

          關閉
          看屁屁www成人影院,亚洲人妻成人图片,亚洲精品成人午夜在线,日韩在线 欧美成人 (function(){ var bp = document.createElement('script'); var curProtocol = window.location.protocol.split(':')[0]; if (curProtocol === 'https') { bp.src = 'https://zz.bdstatic.com/linksubmit/push.js'; } else { bp.src = 'http://push.zhanzhang.baidu.com/push.js'; } var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(bp, s); })();