可用于自動駕駛領域的神經網(wǎng)絡及深度學習
CEVA 汽車市場營銷主管 Jeff VanWashenova
本文引用地址:http://www.ex-cimer.com/article/201809/389078.htm高級輔助駕駛系統(tǒng) (ADAS) 可提供解決方案,用以滿足駕乘人員對道路安全及出行體驗的更高要求。諸如車道偏離警告、自動剎車及泊車輔助等系統(tǒng)廣泛應用于當前的車型,甚至是功能更為強大的車道保持、塞車輔助及自適應巡航控制等系統(tǒng)的配套使用也讓未來的全自動駕駛車輛成為現(xiàn)實。
如今,車輛的很多系統(tǒng)使用的都是機器視覺。機器視覺采用傳統(tǒng)信號處理技術來檢測識別物體。對于正熱衷于進一步提高拓展 ADAS 功能的汽車制造業(yè)而言,深度學習神經網(wǎng)絡開辟了令人興奮的研究途徑。為了實現(xiàn)從諸如高速公路全程自動駕駛儀的短時輔助模式到專職無人駕駛旅行的自動駕駛,汽車制造業(yè)一直在尋求讓響應速度更快、識別準確度更高的方法,而深度學習技術無疑為其指明了道路。
以知名品牌為首的汽車制造業(yè)正在深度學習神經網(wǎng)絡技術上進行投資,并向先進的計算企業(yè)、硅谷等技術引擎及學術界看齊。在中國,百度一直在此技術上保持領先。百度計劃在 2019 年將全自動汽車投入商用,并加大全自動汽車的批量生產力度,使其在 2021 年可廣泛投入使用。汽車制造業(yè)及技術領軍者之間的密切合作是嵌入式系統(tǒng)神經網(wǎng)絡發(fā)展的催化劑。這類神經網(wǎng)絡需要滿足汽車應用環(huán)境對系統(tǒng)大小、成本及功耗的要求。
輕型嵌入式神經網(wǎng)絡
卷積式神經網(wǎng)絡 (CNN) 的應用可分為三個階段:訓練、轉化及 CNN 在生產就緒解決方案中的執(zhí)行。要想獲得一個高性價比、針對大規(guī)模車輛應用的高效結果,必須在每階段使用最為有利的系統(tǒng)。
訓練往往在線下通過基于 CPU 的系統(tǒng)、圖形處理器 (GPU) 或現(xiàn)場可編程門陣列 (FPGA) 來完成。由于計算功能強大且設計人員對其很熟悉,這些是用于神經網(wǎng)絡訓練的最為理想的系統(tǒng)。
在訓練階段,開發(fā)商利用諸如 Caffe 等的框架對 CNN 進行訓練及優(yōu)化。參考圖像數(shù)據(jù)庫用于確定網(wǎng)絡中神經元的最佳權重參數(shù)。訓練結束即可采用傳統(tǒng)方法在 CPU、GPU 或 FPGA 上生成網(wǎng)絡及原型,尤其是執(zhí)行浮點運算以確保最高的精確度。
作為一種車載使用解決方案,這種方法有一些明顯的缺點。運算效率低及成本高使其無法在大批量量產系統(tǒng)中使用。
CEVA 已經推出了另一種解決方案。這種解決方案可降低浮點運算的工作負荷,并在汽車應用可接受的功耗水平上獲得實時的處理性能表現(xiàn)。隨著全自動駕駛所需的計算技術的進一步發(fā)展,對關鍵功能進行加速的策略才能保證這些系統(tǒng)得到廣泛應用。
利用被稱為 CDNN 的框架對網(wǎng)絡生成策略進行改進。經過改進的策略采用在高功耗浮點計算平臺上(利用諸如 Caffe 的傳統(tǒng)網(wǎng)絡生成器)開發(fā)的受訓網(wǎng)絡結構和權重,并將其轉化為基于定點運算,結構緊湊的輕型的定制網(wǎng)絡模型。接下來,此模型會在一個基于專門優(yōu)化的成像和視覺 DSP 芯片的低功耗嵌入式平臺上運行。圖 1 顯示了輕型嵌入式神經網(wǎng)絡的生成過程。與原始網(wǎng)絡相比,這種技術可在當今量產型車輛的有限功率預算下帶來高性能的神經處理表現(xiàn),而圖像識別精確度降低不到 1%。
圖 1. CDNN 將通過傳統(tǒng)方法生成的網(wǎng)絡權重轉化為一個定點網(wǎng)絡
一個由低功耗嵌入式平臺托管的輸入大小為 224x224、卷積過濾器分別為 11x11、5x5 及 3x3 的 24 層卷積神經網(wǎng)絡, 其性能表現(xiàn)幾乎是一個在典型的 GPU/CPU 綜合處理引擎上運行的類似 CNN 的三倍,盡管其所需的內存帶寬只是后者的五分之一且功耗大幅降低。
下一代深度學習神經網(wǎng)絡
汽車制造業(yè)進入神經網(wǎng)絡領域所習得的經驗不斷推動技術的發(fā)展,并因此開發(fā)出了更先進的網(wǎng)絡架構及更復雜的拓撲,如每級多層拓撲、多入/多出及全卷積網(wǎng)絡。新推出的重要網(wǎng)絡類型不僅可用來識別物體,也可用來識別場景,從而提供用以解決汽車領域應用程序(如自動駕駛功能)所需的圖像分割。
當然,中國 40 家左右的汽車制造商并不會在此道路上踽踽獨行。他們會與百度等技術公司進行密切合作。技術公司是這些網(wǎng)絡和架構發(fā)展的核心。CNN 網(wǎng)絡生成器功能的完善也為新的網(wǎng)絡架構和拓撲提供了支持,如 SegNet 及 GoogLeNet 與 ResNet 等其它網(wǎng)絡結構以及高級網(wǎng)絡層(圖 2)。此外,一鍵啟用也讓預訓網(wǎng)絡轉換成優(yōu)化的實時網(wǎng)絡執(zhí)行更為便捷。為確保給常用的網(wǎng)絡生成器提供支持,CDNN 框架與 Caffe 和 TensorFlow (谷歌的機器學習軟件庫)都有合作。
圖 2網(wǎng)絡生成器的發(fā)展為新網(wǎng)絡層及更深的架構提供了支持
由于最新推出的嵌入式處理平臺在可擴展性及靈活性上都有了很大改進,因此嵌入式部署也可以利用這些改進來完善自身。由于深度學習領域的發(fā)展越來越多樣化,因此擁有一個不僅能滿足當今處理需求,也具有適應未來的技術創(chuàng)新的靈活架構非常重要。
鋪好路
第一批神經網(wǎng)絡應用程序將專注于視覺處理,以支持諸如自動行人、交通信號或道路特征識別等功能。由于這些系統(tǒng)的性能不斷改進,例如處理越來越大的來自高分辨率相機的數(shù)據(jù)集,因此神經網(wǎng)絡也有望在未來的汽車中發(fā)揮更大的作用。這些作用將包括承擔系統(tǒng)中其它復雜的信號處理任務,例如雷達模塊及語音識別系統(tǒng)。
隨著神經網(wǎng)絡首次應用于車載自動駕駛系統(tǒng),(據(jù)報道,某些國家將在 2019-2020 年型的新車輛中使用神經網(wǎng)絡,)對同時兼具安全性及可靠性的系統(tǒng)的需求會越來越大。中國政府計劃在 2021 至 2025 年推出自動駕駛車輛。要讓此類系統(tǒng)具備可讓客戶使用的條件,汽車制造商必須同時確保其符合相關的安全標準,如 ISO 26262 功能安全性。這需要硬件、軟件及系統(tǒng)的綜合發(fā)展。
由于這些系統(tǒng)變得越來越復雜,因此確保系統(tǒng)可靠安全且能滿足處理需求也成為汽車制造商所面臨的越來越大的挑戰(zhàn)。
結論
機器學習神經網(wǎng)絡將沿著一條挑戰(zhàn)高效處理性能的發(fā)展道路繼續(xù)闊步前進。先進的神經網(wǎng)絡架構已經顯現(xiàn)出優(yōu)于人類的識別精確性。用于生成網(wǎng)絡的最新框架,如 CDNN2,正在推動輕型、低功耗嵌入式神經網(wǎng)絡的發(fā)展。這種神經網(wǎng)絡將使目前的高級輔助駕駛系統(tǒng)具有較高的精確性及實時處理能力。
評論