人工智能探境科技之得“芯”應(yīng)手
1 AI處理平臺的前世今生
人工智能(AI)是當前熱度很高的一個技術(shù)名詞,其技術(shù)應(yīng)用推廣由來已久,曾經(jīng)依托于高度密集計算的通用平臺,主要是基于中央處理器(CPU)的計算器,或是基于數(shù)字信號處理器(DSP)的實時嵌入式系統(tǒng),然后逐步發(fā)展和演化成為深度學(xué)習的有效實現(xiàn)手段,由此對核心處理器平臺提出更高更嚴苛的要求,從而催生了專用AI處理平臺。筆者曾有十多年從事DSP業(yè)務(wù)拓展的經(jīng)歷,對于AI處理平臺創(chuàng)新并開創(chuàng)一個全新的智能化局面充滿了好奇,于是拜訪了北京探境科技有限公司,與魯勇董事長進行探討,對于以神經(jīng)網(wǎng)絡(luò)處理方式來構(gòu)建具有顛覆式AI架構(gòu)有了深度的了解。
首先我們從處理器的基本架構(gòu)談起。眾所周知,CPU的體系是沿用經(jīng)典計算機的馮·諾依曼體系,而DSP則采用哈佛結(jié)構(gòu),且不斷改進。DSP將地址總線和數(shù)據(jù)總線分開以便提高存儲器訪問速度,又增加流水線結(jié)構(gòu),旨在有效提高處理速度,特別有益于以系列乘加為主體的卷積運算,而這正是數(shù)字濾波器的基本結(jié)構(gòu)。語音處理技術(shù)發(fā)展得益于DSP,然而其應(yīng)用卻受制于其通用性,使得包括語音識別在內(nèi)的智能語音應(yīng)用局限性較大。對于智能圖像和智能視頻處理同樣存在這樣的問題,所以構(gòu)建具有針對性的新型AI平臺,最大限度地匹配目標應(yīng)用勢在必行。
圖1 SFA體系架構(gòu)示意圖
2 生根于SFA的芯片架構(gòu)
新型AI平臺必然是一個神經(jīng)網(wǎng)絡(luò)處理器NPU(Neural Processing Unit),魯勇指出業(yè)界芯片最核心的設(shè)計指標是PPA(Perform Power Area),即性能、功耗、還有與成本相關(guān)的芯片面積,AI處理平臺要在架構(gòu)上有重大突破必定要立足于此。探境科技公司初創(chuàng)就確定創(chuàng)立自主的AI架構(gòu),其最終目標是既要有面向神經(jīng)網(wǎng)絡(luò)的通用性,又把重點放在提升數(shù)據(jù)管理和調(diào)度效率的針對性。與DSP解決的計算復(fù)雜度即“算力”問題不同, AI面對處理的對象是龐大的數(shù)據(jù)包,要讓海量數(shù)據(jù)柔和、順利地傳遞到計算單元里來,就要更好地實現(xiàn)存取的匹配。在這過程中解決指數(shù)級增長的存儲問題是關(guān)鍵,有個專業(yè)名稱叫“存儲墻”,只有打破其束縛,才能使AI處理算法游刃有余。探境科技獨創(chuàng)的SFA(Storage First Architecture)存儲優(yōu)先架構(gòu),用存儲來驅(qū)動計算能力,推翻馮·諾依曼體系,完全區(qū)別于之前各類處理器芯片的架構(gòu)。如圖1所示即為SFA體系架構(gòu)示意圖。
實測數(shù)據(jù)表明,SFA體系具有超高能效比,在同等條件下,數(shù)據(jù)訪問可降低10~100倍,存儲子系統(tǒng)功耗下降10倍。采用28 nm工藝,系統(tǒng)能效超過4T+OPS/W。
圖2 基于VOI611的語音識別模組及框圖
3 基于SFA架構(gòu)AI芯片的優(yōu)勢
AI設(shè)計公司的判定標準在于是否有能力設(shè)計AI芯片,這是魯勇所持的觀點,那么代表著技術(shù)高低的絕對判斷就是AI芯片的PPA。基于SFA的AI芯片目前具有語音和圖像兩個分支,語音芯片最重要的關(guān)注點在于A,就是一定性能下的低成本,采用55 nm工藝可以減少投片費用,獲得很高的性價比。而圖像芯片關(guān)注2個P,就是追求高性能下的低功耗,采用能效比較高的28 nm工藝,其實探境科技實現(xiàn)的能力已經(jīng)超過業(yè)界12 nm工藝所達到的水平。
與符合現(xiàn)有AI需求特征的芯片一樣,SFA芯片需要支持各種各樣的神經(jīng)網(wǎng)絡(luò),這些神經(jīng)網(wǎng)絡(luò)則根據(jù)不同的應(yīng)用場景放不同算法。事實上,SFA能夠支持所有已知深度學(xué)習神經(jīng)網(wǎng)絡(luò),等同于GPU的兼容性,對神經(jīng)網(wǎng)絡(luò)的參數(shù)沒有限制,對數(shù)據(jù)類型也沒有限制,其中包括INT4/INT8/INT16/FP16/自定義浮點,還有自適應(yīng)稀疏數(shù)據(jù)處理等。
此外,SFA架構(gòu)真正符合商業(yè)應(yīng)用的AI芯片架構(gòu)的特點在于:①采用成熟設(shè)計方案,無需對底層器件進行修改設(shè)計,商業(yè)化路徑快;②通用性高,芯片面向的場景眾多,必須支持多種算法才可以被商業(yè)化;③易用性高,用戶學(xué)習成本低,模型移植簡單。
在談及SFA芯片開發(fā)的感受,魯勇不無感慨地說,探境科技自2017起零基礎(chǔ)自主創(chuàng)新,沒有可參考的東西。他本人雖有多年Marvell的工作經(jīng)歷,但背景領(lǐng)域卻沒有相通之處。然而,多年的芯片設(shè)計經(jīng)驗使他在技能訓(xùn)練上有共同點,那就是對于結(jié)構(gòu)化算法的理解。關(guān)于芯片開發(fā)的心得,魯勇認為首先是技術(shù)路徑順暢,其次是實現(xiàn)流程嚴謹,所以僅用一年半就開發(fā)完成并一次流片成功。還有,就是市場把握準確,將市場與銷售工作緊密結(jié)合,真正做到AI芯片應(yīng)用的落地。
圖3 前景廣闊的語音識別智能化家電應(yīng)用
4 落地在語音識別智能應(yīng)用
探境科技堅持著“接地氣”的原則,努力使其AI芯片貼近用戶和貼近市場需求,首款通用型AI芯片是音旋風VOI611,是目前業(yè)界綜合性能最好的離在線語音方案,將SFA的NPU與ARM-M3的MCU結(jié)合,并集成音頻Codec和多種接口。VOI611作為針對嵌入式產(chǎn)品的深度學(xué)習語音識別芯片,具有強大的降噪功能,在60 dB環(huán)境噪音下識別率可達到98%以上;雙麥即可實現(xiàn)麥克風陣列的效果,支持10 m遠場識別、噪聲抑制、音源定位等功能;命令識別數(shù)量最高為200個,憑借深度學(xué)習技術(shù),不針對特定人,也不需要持續(xù)更新。
既然定位為以技術(shù)和產(chǎn)品驅(qū)動的AI芯片公司,就需要具備相輔相成的2個能力,即AI芯片創(chuàng)建能力和AI算法構(gòu)建。探境科技不僅提供包含算法的異構(gòu)單片系統(tǒng)(SoC)芯片,也要提供完整“交鑰匙(Turn-Key)”的模組解決方案,從而以全能型選手姿態(tài)來全面符合市場需求。為此,所交付的產(chǎn)品要全面滿足客戶的需要,其技術(shù)核心的七到八成在于客戶對算法語音識別效果的認可。圖2所示為基于VOI611的語音識別模組的實物圖和系統(tǒng)框圖。
在探境科技的實驗室里,魯勇做了語音控制產(chǎn)品演示,特別是在抗擊疫情中發(fā)揮了顯著作用的聲控電梯控制器,全程無需按鍵接觸,體現(xiàn)了語音交互的好處。筆者亦應(yīng)邀體驗了各類智能語音產(chǎn)品,驚喜地感受到不僅是電梯,還有燈具、空調(diào)、風扇等各種各樣電器,都成了“聽話”的智能化設(shè)備。
AI語音識別芯片的另一個重要的應(yīng)用領(lǐng)域就是汽車,這就對技術(shù)指標提出更高的要求,探境語音算法的多項“黑科技”將大顯身手,包括性能優(yōu)異適應(yīng)性強的自研AI降噪算法、高計算強度神經(jīng)網(wǎng)絡(luò)HONN技術(shù)、更強大更具魯棒性的雙麥識別技術(shù),當然必須具備的還有車規(guī)級的芯片標準。
此外,自創(chuàng)立伊始,圖像就是探境志在必得的重要領(lǐng)域。目前,探境科技正在加緊開發(fā)為視覺領(lǐng)域設(shè)計、與量身定制神經(jīng)網(wǎng)絡(luò)相結(jié)合的高度集成AI芯片,并將提供具有智能圖像深度學(xué)習算法的全棧式方案,預(yù)計明年發(fā)布,未來將助力安防監(jiān)控系統(tǒng)、機器視覺系統(tǒng)、汽車自動駕駛,及新型零售系統(tǒng)等領(lǐng)域智能化水平的全面提升。
評論