FPGA技術協(xié)助嵌入式系統(tǒng)競逐于機器學習之路
機器學習技術是人工智能的一個重要科學發(fā)展,透過在經(jīng)驗學習中改善具體算法的效能,而且用來訓練的數(shù)據(jù)越多,所學習出來的結果越好,為了處理分析大量圖像或是語音等辨識的機器學習算法數(shù)據(jù),需要采用GPU芯片所打造的高速平行運算處理的類神經(jīng)網(wǎng)絡超級計算機,利用諸如Tensorflow、Caffe等深度學習框架(Framework)等工具,來發(fā)展有效的算法。
本文引用地址:http://www.ex-cimer.com/article/201710/365483.htm一旦得到算法之后,對嵌入式系統(tǒng)的設計而言,迅速將算法應用到云端數(shù)據(jù)中心,或是直接到終端的邊緣運算(Edge CompuTIng)裝置上,就是目前人工智能應用成果發(fā)揮的展示場。由于嵌入式系統(tǒng)本身的運算效能與低功率消耗的功能不斷提升,所構建的智能功能、軟硬件解決方案,非常有助于開創(chuàng)前所未有的人工智能的應用。
機器學習的技術已廣泛應用于數(shù)據(jù)探勘、計算機視覺、自然語言處理、生物特征識別、搜索引擎、醫(yī)學診斷、檢測信用卡欺詐、證券市場分析、語音和手寫識別、戰(zhàn)略游戲與機器人等應用領域。
可程序設計門陣列(FPGA)的解決方案,利用其可程序設計性的優(yōu)勢,已經(jīng)廣為業(yè)界所認知,賽靈思(Xilinx)做為FPGA解決方案的主要供貨商而言,密切關注機器學習所帶領的產(chǎn)業(yè)趨勢,以及重要的應用范例。賽靈思亞太區(qū)工業(yè)及醫(yī)療市場的高級經(jīng)理羅霖(Andy Luo)先生接受專訪時,針對Xilinx產(chǎn)品進入機器學習的領域,提綱契領直指兩個主要的應用領域。
賽靈思亞太區(qū)工業(yè)及醫(yī)療市場的高級經(jīng)理羅霖(Andy Luo)
首先,在云端機房與數(shù)據(jù)中心的應用領域,透過跨國性大型搜索引擎與社群媒體巨擘的緊密合作,以大陸市場為例,Xilinx與百度(Baidu)的搜索引擎加速器合作,具有重要的指標性,由于機器學習在高效能運算(HPC)平臺上,使用的類神經(jīng)網(wǎng)絡模型與多層次架構(Training Framework)來訓練算法,一旦將結果應用于數(shù)據(jù)中心的加速卡設計時,往往需要進行細部的調整與開發(fā),所以彈性變更邏輯線路的設計要求下,FPGA的可程序化(Programmable)的能力就益行重要。
Xilinx的解決方案之所以迅速攫取多數(shù)大廠用戶的目光,端賴兩項重要的誘因,也就是低功率消耗與高度靈活的硬件平臺,提供數(shù)據(jù)中心專用加速器性能上的優(yōu)勢,并支持數(shù)據(jù)中心業(yè)者,打造更快速的創(chuàng)新應用與技術。
Xilinx推出可重組加速堆棧(Reconfigurable AcceleraTIon Stack)技術,針對機器學習、大數(shù)據(jù)分析和視頻串流直播(Video Streaming)等三大新興計算密集型應用,借助所提供各種應用鏈接庫、開發(fā)工具和參考設計,有效的降低設計工程師開發(fā)FPGA通用的程序設計門坎,迅速解決數(shù)據(jù)中心中工作負載快速增長的挑戰(zhàn),并加速云端服務產(chǎn)品上市進程。
第二個重要的應用領域,就是在邊緣運算裝置的部署,因為大量的視訊鏡頭的使用,使得嵌入式視覺(Embedded Vision)技術可以因為采用機器學習的算法,而帶來更多智能型的應用。
但是嵌入式系統(tǒng)考慮功率消耗需求,無法企求使用32或64位的高效能處理器,因此開發(fā)出一種技術,讓多半使用32-bit或16-bit的浮點運算(FloaTIng Point)所設計的算法,可以放在8位整數(shù)運算處理器的智能終端裝置上,Xilinx的解決方案在這類的應用上,保持算法在嵌入式系統(tǒng)上有效的準確度,所以使用機器學習所訓練而獲得的算法,當部署到低耗電與低運算密度的系統(tǒng)時,仍能完成人工智能的應用。
智能終端運算應用隨著空拍機與自動駕駛汽車的發(fā)展,尤其是先進駕駛輔助系統(tǒng)(ADAS)中的自動識別、路線規(guī)劃,以及無人機上自動避開空中障礙,或是視訊監(jiān)控與辨識分析等新興功能,帶領令人高度期待的應用,也推增FPGA的市場占有率。
另一個重點就是工業(yè)4.0的應用,這利用傳感器融合(Sensor Fusion)的裝置,將工業(yè)場域所收集的控制數(shù)據(jù),做線性規(guī)劃與數(shù)據(jù)分類,以掌握工業(yè)設備目前的狀態(tài)。選擇Xilinx的FPGA組件能在單一芯片上提供廣泛的高速界面,能以低成本獲得更高效能,并因為各種開發(fā)環(huán)境整合到同一平臺上而節(jié)省開發(fā)資源,讓客戶得以專注于開發(fā)差異化功能的產(chǎn)品,取得市場先機。
低功率消耗與快速反應速度 FPGA獨擅勝場
和GPU為主的解決方案相比,羅霖分析FPGA的主要優(yōu)勢,首推低功耗的設計,通常3瓦的功耗的設計足以支撐整個加速卡的效能,第二個重要的優(yōu)勢,是反應速度快速,以微秒等級的反應速度,特別適合在空拍機或是自駕車應用的領域,因為反應速度決定人身安全的重要訴求。
但是FPGA也有弱點,羅霖持平而論,也就是工程師的開發(fā)FPGA的時間較長,因為需要熟悉使用邏輯線路分析、布局布線等EDA工具才能設計FPGA線路,雖然FPGA現(xiàn)在也可以利用OpenCL和C 語言以類似軟件的流程來程序設計,但是不可諱言的,其工程設計門坎還是比GPU的使用設計要高,羅霖強調Xilinx對于FPGA在機器學習方面組成開發(fā)者社群,并開發(fā)豐富的工具和鏈接庫的,已經(jīng)可以大大提升設計效率。
羅霖指出Xilinx的FPGA解決方案,在全球主要通信系統(tǒng)機房中,一直是用來做為主要通訊系統(tǒng)的設計,利用密集型計算應用,做為處理通信標準中信號處理與應用,幾乎占了Xilinx的50%的主要收入來源,但是配合機器學習所帶領的數(shù)據(jù)中心加速卡與邊緣運算終端的應用,涵蓋更多的無人空拍機、智能型視訊影像監(jiān)控系統(tǒng)、自駕車的應用,目前已經(jīng)貢獻Xilinx另外的40%的營業(yè)收入來源,前景非常具有爆發(fā)式成長動能。
展望2017的目標,第一,Xilinx設定工業(yè)物聯(lián)網(wǎng)(IIoT)的應用,從工業(yè)設備常用的PLC應用,以及透過IEEE TSN、OPC-UA的工業(yè)通訊協(xié)議的整合,以掌握實時性的信息,開發(fā)工業(yè)應用,第二,面對機器學習的算法與相關的FPGA設計工具的加強,加快協(xié)助客戶做到人工智能功能的快速部署,以達到更卓越的效能需求,并能同時降低開發(fā)成本。
評論