基于HSA,聯(lián)發(fā)科技用多核異構(gòu)主攻深度學(xué)習(xí)
“2016年全球異構(gòu)計(jì)算HSA峰會”于8月下旬在京拉開帷幕,本次峰會由全球異構(gòu)系統(tǒng)架構(gòu)(HSA)聯(lián)盟和中國半導(dǎo)體行業(yè)協(xié)會(CSIA)共同主辦。聯(lián)發(fā)科技(MTK)公司介紹了其主攻深度學(xué)習(xí)的十核三叢集架構(gòu)技術(shù),以及對HSA的貢獻(xiàn)。會后,筆者采訪了該公司高級技術(shù)總監(jiān)Roy Ju先生。
本文引用地址:http://www.ex-cimer.com/article/201609/296605.htmMTK的異構(gòu)技術(shù)歷程
2015年推出了Device Fusion軟件技術(shù),可以自動地根據(jù)應(yīng)用程序執(zhí)行的特性,觀察適合在CPU、還是在GPU等上面運(yùn)行,或者在CPU和GPU上同時運(yùn)行。
公司今年又首創(chuàng)了十核三叢集架構(gòu),采用大中小核技術(shù),可以平衡性能功耗比,并已將該架構(gòu)應(yīng)用到高端芯片——曦力X20上,再輔以CorePilot3.0,可實(shí)現(xiàn)高性能、低功耗和優(yōu)秀的用戶體驗(yàn)。
展望未來,聯(lián)發(fā)科技將幫助開發(fā)者來進(jìn)行深度學(xué)習(xí)方面的應(yīng)用。深度學(xué)習(xí)可由HSA(異構(gòu)系統(tǒng)架構(gòu))實(shí)現(xiàn),適合多種應(yīng)用領(lǐng)域,諸如物體辨識,人臉/場景/年齡識別、針對性廣告、活動/手勢識別、情景感知計(jì)算等。
深度學(xué)習(xí)的挑戰(zhàn)
由于深度學(xué)習(xí)的運(yùn)算量非常大,需要采用異構(gòu)計(jì)算。因?yàn)槿绻辉趥鹘y(tǒng)的CPU上執(zhí)行,可能達(dá)不到性能需求。通過放到加速器上面,可以使運(yùn)行的效率與功耗有顯著提高,即“CPU+”方法。當(dāng)然選核只是一個開始。
之后,異構(gòu)硬件之間的架構(gòu)要做很多優(yōu)化。由于有了HSA,開發(fā)者就可以用同一個界面,不再會因?yàn)橄旅娴挠布煌鎏貏e的優(yōu)化。HSA能夠很好地將需要大計(jì)算量的應(yīng)用,調(diào)度到諸如GPU和DSP等能效表現(xiàn)更佳的計(jì)算單元上去運(yùn)行,從而避免了總是在能耗更大的CPU上運(yùn)行。因此,用戶能夠同時獲得高性能和低能耗。另外,HSA注重降低GPU的驅(qū)動過載,而且這個特性近來也被應(yīng)用到了一些新型圖像API上,從而有助于提升在線游戲體驗(yàn)。
HSA與聯(lián)發(fā)科技
HSA是在2012年6月正式成立的,由聯(lián)發(fā)科技等六家企業(yè)共同發(fā)起。如果希望不同IP之間能夠有不同的組合,博采眾長,界面就要定義得很清楚。因此,HSA成立之初就廣發(fā)英雄帖,召集天下企業(yè)加盟。因?yàn)镠SA聯(lián)盟如果一開始就很局限,格局就做不大。
加入HSA聯(lián)盟以后,聯(lián)盟成員可以提供一些代碼幫助研制規(guī)格。運(yùn)作過程通常是這樣的:在討論的過程中,代碼通常是不對外公開的。但在規(guī)格完成對外公開后,絕大部分代碼內(nèi)容通常都會批準(zhǔn)公開,最后一關(guān)由董事會批準(zhǔn)。如要得到HSA的LOGO,通常要經(jīng)過測試。
與其他公司相比,聯(lián)發(fā)科技的HSA策略特點(diǎn)是:除了開發(fā)自己的IP外,也集成來自第三方的IP,從系統(tǒng)和平臺層面部署HSA技術(shù)。其實(shí),HSA是一項(xiàng)平臺性技術(shù),需要多個IP模塊的緊密合作以支持平臺上的多個特性,包括共享虛擬內(nèi)存、信號、隊(duì)列語言等。因此,聯(lián)發(fā)科技領(lǐng)導(dǎo)著多廠商(Multi-vendor)工作組,定義和標(biāo)準(zhǔn)化來自不同供應(yīng)商的不同IP模塊間的互操作,通過創(chuàng)造公平的競爭環(huán)境,汲取生態(tài)系統(tǒng)中來自不同IP廠商的技術(shù)精華。
評論