重磅來襲!Imagination發(fā)布 PowerVR NNA神經(jīng)網(wǎng)絡(luò)加速器
2017年9月21日,Imagination Technologies發(fā)布神經(jīng)網(wǎng)絡(luò)(NN)專用PowerVR架構(gòu)實現(xiàn)的PowerVR Series2NX NNA神經(jīng)網(wǎng)絡(luò)加速器,此款NNA具有完整且獨立式的IP,在面積效率、性能運算以及功耗等方面都具有“秒殺”競爭對手的優(yōu)勢。與此同時,Imagination也推出了兩款新一代PowerVR GPU,分別是PowerVR Series9XE和Series9XM,與前一代GPU相比,其圖形應(yīng)用能力與技術(shù)都大幅度提升。
本文引用地址:http://www.ex-cimer.com/article/201709/364691.htmPowerVR 2NX NNA——硬件改變生活
你見過無人機避開物體驚人的反應(yīng)速度嗎?你有想象過1000張照片進行搜索或者排序速度達到過2秒嗎?沒錯,這已經(jīng)成為現(xiàn)實,NNA的出現(xiàn)打破了傳統(tǒng)的認(rèn)知,如果將NNA用于無人機,便可實現(xiàn)1米避開物體的驚人反應(yīng)速度,而且它可以同時運行多個網(wǎng)絡(luò),在避免碰撞的同時識別和跟蹤物體。以1000張照片搜索或者排序能力為標(biāo)準(zhǔn),NNA以2秒的速度遠(yuǎn)超目前的高端GPU。
PowerVR 2NX NNA架構(gòu)的優(yōu)勢
隨著人工智能日益普及,神經(jīng)網(wǎng)絡(luò)或?qū)⒊蔀槲磥戆l(fā)展趨勢。2NX NNA 這樣的專用硬件解決方案——與單純的DSP解決方案相比,它可提供8倍的性能密度提升——將能以最低的功耗與成本達到最高的性能。此外,一直以來,神經(jīng)網(wǎng)絡(luò)非常耗費帶寬,因此內(nèi)存的帶寬需求會隨著神經(jīng)網(wǎng)絡(luò)模型規(guī)模的增長而增加。
2NX NNA能最小化外部DDR內(nèi)存的帶寬需求,確保系統(tǒng)的性能不會受到帶寬的限制。以目前業(yè)界神經(jīng)網(wǎng)絡(luò)的最優(yōu)性能對比,NNA的架構(gòu)將具有低功耗,低帶寬等優(yōu)勢,而且在硬件架構(gòu)的基礎(chǔ)上提供了最全面的系統(tǒng)級的神經(jīng)網(wǎng)絡(luò)解決方案。
Imagination公司PowerVR產(chǎn)品與技術(shù)營銷資深總監(jiān) Chris Longstaff對OFweek電子工程網(wǎng)編輯表示:“神經(jīng)網(wǎng)絡(luò)加速的專用硬件將成為未來SoC的標(biāo)準(zhǔn)IP模塊,就如同CPU和GPU一樣。我們很高興率先向市場推出完整的硬件加速器,能完全支持高精準(zhǔn)度的靈活方式,使神經(jīng)網(wǎng)絡(luò)能以最低的功耗與帶寬運作,并提供優(yōu)于競爭對手方案的絕對性能與單位面積性能。我們提供的工具將能讓開發(fā)人員非??焖俚貑⒂貌?zhí)行其神經(jīng)網(wǎng)絡(luò),因此能快速增加營收。”
獨特的架構(gòu)特性以及廣泛的應(yīng)用領(lǐng)域
作為神經(jīng)網(wǎng)絡(luò)硬件IP,2NX NNA可獨立使用(無須額外的硬件)或是與CPU和GPU等其它的處理器結(jié)合運用。在學(xué)習(xí)能力方面,2NX NNA 在人工智能場景學(xué)習(xí)中采用“離線”訓(xùn)練以及“在線”推理的方式,這對于圖像以及數(shù)據(jù)的處理將做以深度優(yōu)化。
看到這里或許你會想問,它的架構(gòu)以及特性如何呢?要知道在使用過程中,架構(gòu)將成為其最重要的限制因素。目前,2NX NNA支持在前沿SOC中高效推理神經(jīng)的IP內(nèi)核,它擁有可擴展架構(gòu),多核擴展可支持超過2048MAC/clock,且設(shè)計中還支持未來開發(fā)中不同性能特點的內(nèi)核,這似乎意味著有了它,很長時間你將不用再為架構(gòu)的性能而煩惱。
作為一款神經(jīng)網(wǎng)絡(luò)加速器,它最大的作用還是為推理神經(jīng)網(wǎng)絡(luò)提供全硬件加速。在神經(jīng)網(wǎng)絡(luò)層方面,它可以最大限度提高性能以此減輕CPU負(fù)載。2NX NNA可配置MMU,支持Android或者其他復(fù)雜的操作系統(tǒng)。
產(chǎn)品是為了市場而存在的,2NX NNA專為適應(yīng)多種市場的推理引擎所設(shè)計,其高度可擴展架構(gòu)適用于未來的更多應(yīng)用市場。在未來,2NX NNA 這樣的完整硬件解決方案,將逐漸推向移動、智能監(jiān)控、汽車以及家庭娛樂等市場。
秒殺Kirin970以及Apple A11處理器
近期,人工智能處理器市場被傳的沸沸揚揚的當(dāng)屬麒麟970以及蘋果 A11。接下來我將從圖像識別性能以及操作性能方面分別對麒麟970、蘋果 A11以PowerVR 2NX NNA進行對比。
據(jù)華為公司公布的麒麟970性能數(shù)據(jù)顯示,以一分鐘為標(biāo)準(zhǔn),麒麟970可識別2000張照片。消耗1%的電量則可識別5000張照片。而PowerVR 2NX NNA一分鐘可識別30000張圖片,消耗1%的電量可識別438000萬張圖片。這是不是有些逆天呢?感覺我們已經(jīng)不能以常規(guī)的思維去看待2NX NNA這款處理器了。
在今年蘋果發(fā)布會上,蘋果高級副總裁Phil Schiller表示,A11仿生處理器是目前智能手機所搭載的最強勁、最智能的處理器,其擁有低功耗以及優(yōu)秀的深度學(xué)習(xí)能力。據(jù)蘋果公布的數(shù)據(jù)顯示,A11仿生處理器神經(jīng)網(wǎng)絡(luò)引擎可支持6000億每秒的操作運行。而根據(jù)Imagination公司公布的數(shù)據(jù)顯示,PowerVR 2NX NNA則可實現(xiàn)高達4萬億每秒操作運行,是蘋果A11處理器的6.6倍之多。
PowerVR 2NX NNA或?qū)⒂瓉硎袌鰨湫伦兏?/strong>
據(jù)OFweek電子工程網(wǎng)編輯了解,Imagination公司可以為開發(fā)人員提供所有必要的工具,讓他們能快速、輕松地啟用和執(zhí)行其神經(jīng)網(wǎng)絡(luò),并確保運算帶寬能與準(zhǔn)確度完美平衡。PowerVR 2NX的開發(fā)資源包括映射 (mapping) 和微調(diào)工具、樣本網(wǎng)絡(luò)、評估工具與文件。完整的PowerVR NX Mapping Tool 能從業(yè)界標(biāo)準(zhǔn)的機器學(xué)習(xí)框架,包括Caffe和Tensorflow,輕松進行轉(zhuǎn)換。高級的網(wǎng)絡(luò)設(shè)計人員將能在2NX NNA 上設(shè)計與構(gòu)建神經(jīng)網(wǎng)絡(luò),以充分發(fā)揮其硬件特性。
Imagination的新款PowerVR Series2NX神經(jīng)網(wǎng)路加速器(NNA)能使為移動、監(jiān)控、汽車與消費性系統(tǒng)開發(fā)SoC的廠商以非常低的功耗和最小的芯片面積上達到神經(jīng)網(wǎng)絡(luò)的高性能運算。在移動電話這類GPU不可或缺的設(shè)備中,廠商可利用9xe/9xm GPU和powervr 2nx nna協(xié)同處理經(jīng)典的視覺算法及神經(jīng)網(wǎng)絡(luò)模型以此能達成最佳的性價比。因為 PowerVR NNA和GPU的性能密度都很有優(yōu)勢,廠商能在同一芯片中結(jié)合構(gòu)建這兩種處理器,相比業(yè)界獨立式GPU,這將會非常有競爭力。
從目前來看,PowerVR 2NX NNA產(chǎn)品的推出將具有劃時代的意義,或?qū)⒊尚腔鹆窃畡?,迅速進入人工智能市場。
評論