異構(gòu)計(jì)算帶來(lái)AI視覺(jué)新突破
作者 王瑩 王金旺 《電子產(chǎn)品世界》編輯
本文引用地址:http://www.ex-cimer.com/article/201706/361120.htm摘要:近年來(lái),隨著圖像處理及識(shí)別等關(guān)鍵研究領(lǐng)域的突破,使人工智能在視覺(jué)應(yīng)用上獲得了前所未有的進(jìn)步,成為AI大規(guī)模應(yīng)用推廣的第一個(gè)場(chǎng)景。為此,筆者采訪了華夏芯(北京)通用處理器技術(shù)有限公司首席執(zhí)行官李科奕先生,并就相關(guān)內(nèi)容進(jìn)行了解答。
視覺(jué)成為AI首推應(yīng)用場(chǎng)景
在所有機(jī)器處理的感知系統(tǒng)中,機(jī)器視覺(jué)系統(tǒng)包含的信息量最大,也是計(jì)算機(jī)應(yīng)用中最復(fù)雜和最具挑戰(zhàn)的研究領(lǐng)域之一。近年來(lái),隨著圖像處理及識(shí)別等關(guān)鍵研究領(lǐng)域的突破,包括卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)技術(shù)的成熟,以及大規(guī)模集成電路技術(shù)發(fā)展所帶來(lái)的處理性能的大幅度提升,使人工智能(Artificial Intelligence,AI)在視覺(jué)應(yīng)用上獲得了前所未有的進(jìn)步,成為AI大規(guī)模應(yīng)用推廣的第一個(gè)場(chǎng)景。例如,特定環(huán)境下的人臉識(shí)別、車(chē)輛識(shí)別、場(chǎng)景識(shí)別等技術(shù),不管從識(shí)別準(zhǔn)確度還是識(shí)別速度都已取得了驚人的成就,離理想的商業(yè)應(yīng)用已經(jīng)不遠(yuǎn)了,如廣州的高鐵安檢已經(jīng)開(kāi)始使用人臉識(shí)別與身份證信息對(duì)照對(duì)乘客進(jìn)行身份確認(rèn)。
由于視覺(jué)在人類(lèi)的生產(chǎn)、生活中扮演著重要的角色,AI視覺(jué)的應(yīng)用一直是AI研發(fā)最活躍的領(lǐng)域之一,隨著相關(guān)技術(shù)的突破,未來(lái)的AI視覺(jué)技術(shù)將會(huì)在安防監(jiān)控、汽車(chē)輔助/自動(dòng)駕駛、無(wú)人機(jī)/機(jī)器人視覺(jué)領(lǐng)域得到廣泛應(yīng)用。
AI視覺(jué)面臨的挑戰(zhàn)
AI視覺(jué)當(dāng)下面臨著眾多挑戰(zhàn),從技術(shù)角度來(lái)看包括視頻圖像識(shí)別與處理算法、大數(shù)據(jù)分析、更先進(jìn)的傳感器、通訊網(wǎng)絡(luò)與覆蓋、存儲(chǔ)及軟硬件平臺(tái)等。同時(shí),針對(duì)大規(guī)模公眾性AI視覺(jué)應(yīng)用,還需要解決包括信息安全、個(gè)人隱私、運(yùn)營(yíng)與服務(wù)品質(zhì)等一系列問(wèn)題。假如上述問(wèn)題陸續(xù)得到解決,可以預(yù)期在未來(lái)數(shù)年中,AI視覺(jué)產(chǎn)品與應(yīng)用將無(wú)所不在。
另外,華夏芯首席執(zhí)行官李科奕還特別指出,芯片設(shè)計(jì)架構(gòu)上的創(chuàng)新和集成電路制造工藝的快速進(jìn)步為AI視覺(jué)的推廣奠定了堅(jiān)實(shí)的硬件基礎(chǔ)。
AI視覺(jué)的訓(xùn)練與推理
在有關(guān)AI視覺(jué)處理芯片的選擇上,華夏芯認(rèn)為是由應(yīng)用場(chǎng)景來(lái)決定。
而從目標(biāo)和任務(wù)角度來(lái)看,AI在視頻應(yīng)用領(lǐng)域的工作可以劃分為訓(xùn)練與推理兩大類(lèi)。
高性能CPU/GPU集群或其它高性能計(jì)算平臺(tái)處理訓(xùn)練
通常情況下,訓(xùn)練工作適合在運(yùn)維平臺(tái)(云端)來(lái)做,目前業(yè)界一般采用英偉達(dá)的GPU與賽靈思的FPGA來(lái)實(shí)現(xiàn)計(jì)算加速,也有采用基于Intel的CPU集群來(lái)實(shí)現(xiàn)的。主要原因在于在典型的訓(xùn)練場(chǎng)景中,功耗、計(jì)算復(fù)雜度、實(shí)時(shí)性響應(yīng)等指標(biāo)雖然也很重要,但都不是要考量的第一要素。最重要的是必須確保算法在各種情況下都能獲得滿意的性能效果,包括動(dòng)態(tài)范圍好,收斂性好,適應(yīng)性好等。為此而耗費(fèi)較多的計(jì)算資源、功耗和時(shí)間對(duì)AI的參數(shù)進(jìn)行迭代與訓(xùn)練,都是非常值得的。
所以,對(duì)于基于大數(shù)據(jù)的AI學(xué)習(xí)與訓(xùn)練來(lái)說(shuō),李科奕表示,很多廠家采用GPU、FPGA、配置矢量處理單元的CPU計(jì)算集群、甚至于針對(duì)特定應(yīng)用更為優(yōu)化設(shè)計(jì)的神經(jīng)網(wǎng)絡(luò)加速器等,這些都不失為良好的學(xué)習(xí)和訓(xùn)練平臺(tái)。盡管如此,每種平臺(tái)都有局限性,存在改進(jìn)和優(yōu)化的空間。
異構(gòu)計(jì)算完成推理
對(duì)于前端嵌入式視頻圖像AI推理芯片主要從以下幾個(gè)方面考慮。第一,從算法角度講,AI推理的結(jié)構(gòu)特性極不規(guī)則,例如,不等長(zhǎng)的、不同維度的、稀疏的矢量計(jì)算、矩陣計(jì)算等,傳統(tǒng)架構(gòu)的CPU、DSP、GPU處理效率不高;第二,前端場(chǎng)景變化多端,圖像質(zhì)量屬性不一,如果要取得AI推理的良好性能,不能僅僅依靠AI算法自身,還需要輔助以更多手段與方法;第三,嵌入式的前端應(yīng)用對(duì)于成本、性能、功耗、編程、生態(tài)、標(biāo)準(zhǔn)化的要求更高,而且同時(shí)存在著控制與加速計(jì)算的需求。這些巨大的挑戰(zhàn)正是為什么目前市場(chǎng)上前端AI視頻芯片方案還非常少、即使已有芯片方案也還存在相當(dāng)局限性的原因。
解決AI視頻前端推理的最好的芯片設(shè)計(jì)理念是新一代的異構(gòu)計(jì)算架構(gòu)。異構(gòu)計(jì)算可以很好地支撐龐大而繁雜的前端智能的廣泛應(yīng)用,并實(shí)現(xiàn)視頻應(yīng)用相關(guān)的人工智能產(chǎn)業(yè)的標(biāo)準(zhǔn)化與規(guī)范化發(fā)展,創(chuàng)建健康的應(yīng)用生態(tài)系統(tǒng)。而現(xiàn)有市場(chǎng)出現(xiàn)的前端智能推理芯片還不能很好地適應(yīng)不規(guī)則的人工智能算法的架構(gòu)特性,同時(shí)滿足高性能、低功耗、易編程優(yōu)化等需求。因此,基于新一代異構(gòu)計(jì)算架構(gòu)的CPU+DSP+硬件加速器的SoC芯片平臺(tái)有可能成為AI視頻的主流方案之一。因?yàn)檫@一方案很好地利用了DSP并行計(jì)算能力突出的特點(diǎn):在大部分視頻應(yīng)用場(chǎng)景中,新一代DSP的計(jì)算能力不亞于GPU與FPGA,但功耗更低、實(shí)時(shí)性更強(qiáng),與單純的神經(jīng)網(wǎng)絡(luò)加速器相比則靈活性更強(qiáng)。
華夏芯獨(dú)特的異構(gòu)計(jì)算架構(gòu)理念
按照傳統(tǒng)理念進(jìn)行分類(lèi)的處理器產(chǎn)品在未來(lái)的芯片應(yīng)用領(lǐng)域的空間會(huì)越來(lái)越小,取而代之的是多種計(jì)算單元融合的異構(gòu)計(jì)算設(shè)計(jì)理念。針對(duì)這一發(fā)展趨勢(shì),華夏芯在業(yè)界提出了“三合一”體系架構(gòu),推出滿足異構(gòu)計(jì)算應(yīng)用的新一代處理器IP,包括指令集、工具鏈以及在單一內(nèi)核中實(shí)現(xiàn)同時(shí)滿足CPU、DSP與GPU的應(yīng)用需求與計(jì)算特征的微架構(gòu)。這樣的異構(gòu)計(jì)算SoC設(shè)計(jì)既降低了用戶二次開(kāi)發(fā)與應(yīng)用實(shí)現(xiàn)的門(mén)檻,又顯著提升了產(chǎn)品的性能、功耗等核心指標(biāo),大幅度降低了用戶在研發(fā)投入方面的成本與規(guī)模。
針對(duì)AI領(lǐng)域的特殊需求,華夏芯研發(fā)了完全自主知識(shí)產(chǎn)權(quán)的處理器IP核,包括獨(dú)特、先進(jìn)的微架構(gòu),并推出了可變長(zhǎng)矢量(矩陣)處理單元,從而很好地滿足了AI算法處理中常出現(xiàn)的多維度、可變長(zhǎng)、高并發(fā)的計(jì)算特征的普遍需求。我們的技術(shù)較傳統(tǒng)的并行計(jì)算架構(gòu)來(lái)說(shuō),不僅僅在時(shí)延、性能、功耗等關(guān)鍵指標(biāo)上顯著提升,更重要的是用戶的編程門(mén)檻大幅度下降。
目前,華夏芯正和本地AI視覺(jué)算法廠商、系統(tǒng)廠商密切合作,即將推出一款基于異構(gòu)計(jì)算融合概念的AI視覺(jué)專(zhuān)用SoC。這款產(chǎn)品既有通用、又有專(zhuān)用處理單元,主要用于對(duì)AI視覺(jué)性能要求很高的安防監(jiān)控、汽車(chē)輔助駕駛、機(jī)器視覺(jué)等應(yīng)用領(lǐng)域,它的定義和開(kāi)發(fā)是完全基于合作伙伴及應(yīng)用廠商的定制化需求,李科奕自信地表示,我們相信這款SoC及配套開(kāi)發(fā)工具將成為理想的國(guó)產(chǎn)AI視覺(jué)開(kāi)發(fā)平臺(tái)。
另外,李科奕稱(chēng),下一步,華夏芯將積極參與推動(dòng)相關(guān)產(chǎn)業(yè)聯(lián)盟的發(fā)展,共建國(guó)產(chǎn)AI處理器推廣應(yīng)用平臺(tái),與業(yè)界同仁一道,加速推動(dòng)我國(guó)AI相關(guān)產(chǎn)業(yè)的發(fā)展。
參考文獻(xiàn):
[1]李韜,網(wǎng)絡(luò)處理器芯片的國(guó)產(chǎn)化之路[J].電子產(chǎn)品世界,2015(1):25-25.
[2]鄭小龍,國(guó)產(chǎn)嵌入式微處理器的探索與開(kāi)拓[J].電子產(chǎn)品世界,2015(8):20-21.
[3]王瑩,“CPU+”異構(gòu)計(jì)算時(shí)代,華夏芯通過(guò)HSA搶占高地[J].電子產(chǎn)品世界, 2016 (9):15-17.
[4]陳俊穎,周順風(fēng),閔華清.基于CAPI FPGA的醫(yī)學(xué)超聲成像算法異構(gòu)加速[J].電子產(chǎn)品世界,2016(10):41-44.
本文來(lái)源于《電子產(chǎn)品世界》2017年第7期第28頁(yè),歡迎您寫(xiě)論文時(shí)引用,并注明出處。
評(píng)論